• 请不要在回答技术问题时复制粘贴 AI 生成的内容
NeoWalnut
V2EX  ›  程序员

兄弟们,国产 Code Agent 到底有没有能打的?

  •  
  •   NeoWalnut · 14h 42m ago · 3811 views

    我平时用 Claude Code 和 Codex ,token 消耗完的时候就用国产替代。

    之前试了 GLM 5.1 ,效果还凑活,感觉大概能达到 CC 的 90%,直到有一天,GLM 悄悄的把线上服务给删了!!!太可怕了,没有找我确认,就这么偷偷删了。浪费我大半天的时间匆忙搞起来,环境变量重配太麻烦了。然后就再也不敢用了

    最近 deepseek 降价,又试了 deepseek-v4-pro ,效果远远没有达到预期啊,看网上的宣传,以为至少达到 CC 90%的水平,实际体感连 60% 都到不了。普通任务完不成,需要太多指导,漏洞百出,还经常改坏已有的代码。

    真不知道该用哪个了,兄弟们都用啥啊?

    41 replies    2026-05-27 22:14:15 +08:00
    sentinelK
        1
    sentinelK  
       14h 33m ago   ❤️ 12
    你要分清,什么是 LLM ,什么是订阅套餐,什么是 Agent 。
    honjow
        2
    honjow  
       14h 33m ago   ❤️ 1
    标题你问的 Code Agent,但是正文问的是模型。。
    honjow
        3
    honjow  
       14h 32m ago
    @honjow #2 先分清楚这些吧。。。
    lkk
        4
    lkk  
       14h 30m ago   ❤️ 1
    没一个能打的,小米 mimo 免费用我都不想用了,给我捣乱改坏的代码我还得找 codex 给我修回来。其实 codex 5x pro 也就 700 一个月,耗我那时间还不如直接给官方交钱。要便宜找中转站,0.2 倍率的到处都是,要省心直接官网直付。但最省心的还是 claude opus ,真心好。
    NeoWalnut
        5
    NeoWalnut  
    OP
       14h 12m ago
    @sentinelK @honjow 这些还是能分清的,我是在 CC 中使用 GLM 和 deepseek 的模型,所以就没纠结模型和 agent 了,都融为一体了。
    zhongzhaoguo
        6
    zhongzhaoguo  
       13h 57m ago
    几乎没有 都不好用 deepseek 也是 太拉了 5 块钱没解决的问题 Opus4.7 10%不到的 5 小时时限的消耗就解决了
    billzhuang
        7
    billzhuang  
       13h 32m ago
    CC 和 GLM DS 可能没有想象的那么融为一体。

    人家只给自家模型优化
    NeoWalnut
        8
    NeoWalnut  
    OP
       13h 28m ago
    @billzhuang 那国产模型配合哪个 CLI agent 效果比较好呢
    aes114514gcm
        9
    aes114514gcm  
       13h 22m ago
    @NeoWalnut 谁家的你就用谁,比如阿里云百炼的可以用 qwen code,腾讯混元可以用 codebuddy cli。
    dacapoday
        10
    dacapoday  
       13h 17m ago   ❤️ 1
    一分钱一分货,deepseek 这么持续降价有原因的,市场舆论要维护到融资成功,不然老底漏出来可就亏大了。
    herozzm
        11
    herozzm  
       13h 14m ago   ❤️ 1
    线上吹的欢,线下拉的欢,没一个能打的
    greenteaa
        12
    greenteaa  
       13h 4m ago
    本月中把 Github Copilot 的 Pro+订阅取消后,就转 Codex + Opencode Go 订阅了。
    平时 GPT-5.5 做 Plan ,Deepseek V4 Flash 做 Build ,Deepseek V4 Pro 做 Review ,整体体验没有下滑,反倒是 1M Context 体验好了很多;当然,可能是我做的项目没有那么复杂。
    BTW ,也用 Gemini 3.1 Pro API 按量付费,专门用来修前端问题
    tiezlk443
        13
    tiezlk443  
       12h 0m ago
    100$ codex
    100$ claude code
    tiezlk443
        14
    tiezlk443  
       12h 0m ago
    互相 reivew
    PC9528
        15
    PC9528  
       11h 51m ago
    一般来说, 可以让 opus/gpt5.5 出一个详细文档然后用便宜的模型实施的, 这样省钱
    guidao
        16
    guidao  
       11h 42m ago
    我感觉 deepseek-v4-flash 比 deepseek-v4-pro 还好用。不知道是否是我的幻觉。
    Sundayz
        17
    Sundayz  
       11h 40m ago
    你们到底在搞多难的开发啊,我最近切换回国产的,我发现都能干活啊,成本还少了很多。
    NeoWalnut
        18
    NeoWalnut  
    OP
       11h 11m ago
    @aes114514gcm 👍🏻,我试试去
    NeoWalnut
        19
    NeoWalnut  
    OP
       11h 9m ago
    @Sundayz 可能是你的项目架构比较清晰,抑或逻辑比较简单?感觉大部分人都感觉国产比较拉胯
    Sundayz
        20
    Sundayz  
       10h 51m ago
    @NeoWalnut 差距确实是存在的,但是没有那么大,我觉得价格差距完全能够抹平模型的差距。
    vicazuruhu97
        21
    vicazuruhu97  
       10h 50m ago
    @tiezlk443 说真的,opus 没有 review gpt 的能力,应该是 opus 写 gpt 来审核,如果反过来你会发现,很搞笑。。。。
    KisekiRemi
        22
    KisekiRemi  
       10h 45m ago
    国产都是蒸馏货,一分钱一分货,LLM 这块就这样。想要效果就别太便宜,想要便宜就别要求太高。那张经典的维恩图还在发力
    billzhuang
        23
    billzhuang  
       10h 18m ago
    @NeoWalnut 唯一可能的,除了模型自家的话,就是 opencode 了
    weidaizi
        24
    weidaizi  
       9h 12m ago
    一步一步来且需求拆的够清晰,opencode + deepseek V4 pro 站起来蹬,效果挺好的
    CouleurVVEX
        25
    CouleurVVEX  
       8h 57m ago
    国产那些属于是白给我用,我都嫌浪费时间
    code4world
        26
    code4world  
       8h 55m ago
    测试过 DeepSeeK V4 Pro ,和 Codex 之类比,几乎不能用,差距太大了
    teaguexiao
        27
    teaguexiao  
       8h 52m ago
    deepseek-v4-flash 配 opencode 比 pro 版意外地顺手,把任务拆小、CLAUDE.md 写详细能出不少活。不过涉及复杂重构或跨文件逻辑就别貭了,还是 claude opus 省。
    lujiaosama
        28
    lujiaosama  
       8h 46m ago
    真正难题还是只能 GPT,CLAUDE.DEEPSEEK 用来做不是核心的工作还是不错的。
    NeoWalnut
        29
    NeoWalnut  
    OP
       8h 19m ago
    @code4world 我也是这感觉,差距太大了,心理落差很大,以前看宣传一直以为 deepseek 代码能力很强
    0xdragon
        30
    0xdragon  
       7h 40m ago
    @code4world 那是你们不会用, Claude/CodeX 写代码比较好的原因就是他们 Harness 做的比较好罢了!
    wuxkwnjjwoxk
        31
    wuxkwnjjwoxk  
       7h 28m ago
    @guidao 4pro 思考半天做了个看起来不错的计划,然后又思考半天执行,最后出来个蹩脚半成品会很崩溃。
    shuangchun
        32
    shuangchun  
       7h 26m ago
    @lkk 700/1400 已经很便宜了
    NeoWalnut
        33
    NeoWalnut  
    OP
       7h 20m ago
    @0xdragon 在 CC 中用国产模型,harness 应该不都一样么。我觉得主要原因还是国产模型都是蒸馏模型,东施效颦。
    jaoyina
        34
    jaoyina  
       6h 46m ago
    @NeoWalnut

    如果蒸溜能做出比美国也就落后半年到一年水平的模型。那为什么其他国家没做出来?你是不是把大模型研发想的太简单了。
    catazshadow
        35
    catazshadow  
       6h 45m ago via Android
    @jaoyina 因为其他国家没有封锁,可以直接用美国的产品
    NeoWalnut
        36
    NeoWalnut  
    OP
       6h 29m ago   ❤️ 1
    @jaoyina 这个就别犟了兄弟,是蒸馏的,这个早就石锤了
    hongye
        37
    hongye  
       6h 9m ago
    这个账号的帖子蛮有意思的,可以看看全部的帖子。
    jaoyina
        38
    jaoyina  
       5h 59m ago
    @NeoWalnut

    我没说没有蒸馏,我是说大模型不是靠蒸馏就能做出来的。
    jaoyina
        39
    jaoyina  
       5h 58m ago
    @catazshadow

    你知不知道现在美国很多初创企业都已经偷偷切换国产模型了?他们也没有封锁,性价比摆在那里。
    CuteGirl
        40
    CuteGirl  
       5h 22m ago
    @lkk 小米这个我今天试了下 用了 1M 一个在 next.js 中 markdown 大纲解析都弄不好 十几轮对话后 无奈妥协 手动写了 唉
    NeoWalnut
        41
    NeoWalnut  
    OP
       4h 43m ago
    @jaoyina 这个主要看场景,咱们的 coding 场景应该是比较复杂的了,很多企业做文件搜索,摘要,翻译、客服啥的,对模型能力要求不高的。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1012 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 120ms · UTC 18:57 · PVG 02:57 · LAX 11:57 · JFK 14:57
    ♥ Do have faith in what you're doing.