V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
ccctttwww
V2EX  ›  问与答

是我的幻觉吗,我为什么感觉国产模型现在真的很强, glm5.1

  •  
  •   ccctttwww · 4 days ago · 3135 views

    除了 claude 模型没用过,其他模型都试过了,感觉 glm5.1 真的很强,大部分需求都是一遍过,比如下面这个需求,如果是之前估计怎么也得调试个几次,现在 glm5.1 一次过了

    gemini 和 gpt5.4 感觉都不如 glm5.1 好用,是幻觉还是真的

    34 replies    2026-04-27 16:41:46 +08:00
    coderluan
        1
    coderluan  
       4 days ago   ❤️ 1
    lmarena.ai coding 排第三了,不是幻觉。
    evan1
        2
    evan1  
    PRO
       4 days ago
    看起来确实不错,op 用的哪家的 coding plan ?
    Sezxy
        3
    Sezxy  
       4 days ago
    我 80%以上的编码工作都是 glm5.1 ,剩下的是 codex 或 claude
    Sezxy
        4
    Sezxy  
       4 days ago
    @Sezxy #3 这个是工作上的,因为公司每月只提供 1000 多的报销

    自己的项目用智谱 lite + 腾讯云 lite
    Akitora
        5
    Akitora  
       4 days ago
    GLM 确实挺强的,不过也不便宜
    evan1
        6
    evan1  
    PRO
       4 days ago
    @Akitora #5 我看各个厂家的 lite 套餐不是都挺便宜的么,50 以内。
    PromiseResolve
        7
    PromiseResolve  
       4 days ago   ❤️ 1
    本身就不弱吧,也就在 v 站拉了一点而已

    我 gpt-5.4 和 glm5.1 同时在 claude code 中使用,某些维度 glm5.1 的处理结果比 gpt-5.4 都好,正版 opus 和 sonnet 没用过,不知道有多强大
    cvooc
        8
    cvooc  
       4 days ago
    御三家 minimax2.7 glm5.1 kimi2.6 我都有订阅测试. glm5.1 除了难抢和慢一些(相对其他两家). 能力是没得说, minimax 快但蠢一些, kimi 属于能力也可以,就是订阅量给的真的少, lite 套餐俩问题不到一个小时, 读代码给我读完了,甚至没到改动那步
    cvooc
        9
    cvooc  
       4 days ago
    @PromiseResolve opus 强是真的, 没得说, 断档第一, 就是贵. 之前测试能力, 全程 vibe 一个前端项目, 轮播图效果不对, 跟 glm 和 minimax 对抗了 1 个小时, 始终不满意效果不好. 用三方转发的 oups 接口, 三句话 5 分钟 oups 改的完美的雅痞, 然后我 5 块钱出去了.
    AreYou0k
        10
    AreYou0k  
       4 days ago
    不行的是 5.0, 半成品端上来了, 后面马上来这个 5.1 好多了. 而且这玩意最关键的是算力不够超售, 开局测试算力强聪明, 人一多就特别笨, 4.7 一开始甚至都没有限制 rpm 和购买人数
    c1985382
        11
    c1985382  
       4 days ago
    强可能是强,但我订阅不到啊
    ccctttwww
        12
    ccctttwww  
    OP
       4 days ago   ❤️ 1
    @evan1 #2 腾讯云的 token plan 公司买的
    ccctttwww
        13
    ccctttwww  
    OP
       4 days ago
    @Sezxy #4 我也准备自己买个智谱 lite 套餐 是无限量 只是按照每 5 小时频次限流吗
    ccctttwww
        14
    ccctttwww  
    OP
       4 days ago
    @Akitora 相较于国外的已经算便宜的了
    ccctttwww
        15
    ccctttwww  
    OP
       4 days ago
    @PromiseResolve gpt5.4 我也在用,买的中转,没用 5.1 之前觉得 gpt5.4 还行,现在已经只用 glm5.1 了
    ccctttwww
        16
    ccctttwww  
    OP
       4 days ago
    @c1985382 买大厂的套餐里面包含的
    PromiseResolve
        17
    PromiseResolve  
       4 days ago
    @cvooc #9 以前中转站的 kiro 逆向 claude code 倒是用过,不过没碰到什么只有用逆向 cc 才能做出来的
    Sezxy
        18
    Sezxy  
       4 days ago
    @ccctttwww #13 现在新套餐增加了周限
    cpstar
        19
    cpstar  
       4 days ago
    搭个车,注册 bigmodel.ai 送了几百万 token ,但是 opencode 用了两下怎么就没有了,opencode 上统计不到 10w
    pikachu233
        20
    pikachu233  
       4 days ago
    确实还可以 除了慢 还限流 动不动大几分钟 稍微复杂的 plan20 分钟 30 分钟都有
    defaw
        21
    defaw  
       4 days ago
    glm5.1 本来就很强
    heftyMan
        22
    heftyMan  
       4 days ago
    后面国外的不给蒸馏了,不知道发展会不会受限
    xkloveme
        23
    xkloveme  
       4 days ago
    @AreYou0k 你的头像让我摸了几次屏幕
    HTML001
        24
    HTML001  
       4 days ago
    你们现在是怎么买到套餐的。现在官网每天十点钟发售,但是一到十点官网购买页就一直网络繁忙,根本买不到
    ccctttwww
        25
    ccctttwww  
    OP
       4 days ago
    @HTML001 腾讯云的 token plan
    MoriartyCy
        26
    MoriartyCy  
       4 days ago
    我是 glm coding plan + gpt plus ,小问题扔 glm-5.1 ,但是个人感觉写代码写文档还是得 gpt-5.4 。
    我写代码和文档有交叉验证的习惯(让 AI 查 AI ),内容生成完毕后必须让 gpt-5.4 和 glm-5.1 交叉检查一遍。代码方面 glm-5.1 这个月出现过两次比较严重的 bug ,文档生成几乎每次 glm-5.1 都会漏逻辑。反过来让 glm 查 gpt 从来没有出现过问题
    ninjaJ
        27
    ninjaJ  
       4 days ago
    @xkloveme 你的头像让我鼠标放上去点了一下
    logiczr
        28
    logiczr  
       3 days ago
    好是挺好,但是不卖给我,天天早上守着网页刷新感觉我像个小丑
    yautou
        29
    yautou  
       3 days ago
    我都怀疑我看错了,实测就是一坨啊
    soleils
        30
    soleils  
       3 days ago
    glm5.1 好是好 但用不到啊
    COOOOOOde
        31
    COOOOOOde  
       1 day ago
    @coderluan #1 gpt5.4 high 排名好靠后, 甚至不如 qwen3.6 plus 。我感觉这个榜单没啥参考性了
    coderluan
        32
    coderluan  
       14h 37m ago
    @COOOOOOde 这个榜单不是跑 benchmark ,而是一个问题随机选两个 AI 回答,用户打分,然后再显示用的哪个 AI ,实际上排名就是用户感觉。
    SWALLOWW
        33
    SWALLOWW  
       14h 37m ago
    再一次证明了,好的东西哪轮的上你
    ccctttwww
        34
    ccctttwww  
    OP
       7h 34m ago
    @yautou 你看和谁比了,和 claude 比那肯定不行,跟其他的比算上价格那优势就很明显了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1864 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 304ms · UTC 16:16 · PVG 00:16 · LAX 09:16 · JFK 12:16
    ♥ Do have faith in what you're doing.