• 请不要在回答技术问题时复制粘贴 AI 生成的内容
heyitsme
V2EX  ›  程序员

Qwen3.7 编码排名超过了智谱 GLM5.1,有人用过吗?实际体验怎么样

  •  
  •   heyitsme · 17h 47m ago · 4945 views

    28 replies    2026-05-27 18:52:47 +08:00
    zzahsjlk
        1
    zzahsjlk  
       17h 43m ago   ❤️ 10
    排名没输过,实战没赢过
    drealism
        2
    drealism  
       17h 42m ago
    看了很多测评都说还可以,但是太贵了
    duanxianze
        3
    duanxianze  
       17h 36m ago   ❤️ 1
    我个人是感觉不出这些模型有多大的差别,可能我写的代码太简单了吧
    skuuhui
        4
    skuuhui  
       17h 30m ago
    试了一下,kimi2.5 水平。有不及无之过。甚至不如 3.5plus ,感觉他们只是内部重新打了一个 tag 就端上来了。
    riscv
        5
    riscv  
       17h 24m ago via Android
    @duanxianze 我也是,我感觉随便用一个都能写出比我好的代码,不知道他们比来比去做什么😂
    heyitsme
        6
    heyitsme  
    OP
       17h 19m ago
    @riscv 应该是主要是项目工程能力,再搭配大模型,差距一下子就上来了
    wsbqdyhm
        7
    wsbqdyhm  
       17h 10m ago via iPhone
    @zzahsjlk #1 qwen3.6 开源的系列妥妥的第一,没有之一
    dabbit
        8
    dabbit  
       16h 57m ago
    我在 Qoder 使用 Qwen3.7 ,让它修一个语法问题,它却自顾自的创建了新的文件,自顾自的开始修复其他问题,我不好说是模型问题还是 Agent 问题还是两者都有问题。看了一下它的深度思考过程,它会自顾自的说“The user wants me to also handle the same context issue in ChannelInventoryManager.ets.”或者“The user wants me to also handle the `flutter_inappwebview` plugin. Let me read the relevant files to understand what's needed.”,也不知道是哪个 User 给他下指令了。(我特意清空了 Qoder 的记忆来做测试的)
    dabbit
        9
    dabbit  
       16h 52m ago
    maocat
        10
    maocat  
       16h 52m ago   ❤️ 2
    公司一个月已经买了第三个 1398 块钱的 token plan
    第一个坚持了 10 多天(主用 qwen3.6 plus ),优点速度快,缺点效果差劲
    第二个坚持了 4 天(主用 glm5.1 ),优点速度快,效果合适(感觉上和智普家的还是有差距),缺点 token 使用非常快
    第三个正在使用,第三天,主用( qwen3.7 max ),效果能打,速度快,但是有个问题非常傻逼,明确让他改用一个功能,他在改动的时候非常有想法
    比如:

    Q:顶部的标签数据来源帮我修改为字段 xxA
    A:好的,改完了已将原来的 xxB 改为 xxA ,同时我把 xxB 的数据拼接到了 xxC 前面
    sunsai
        11
    sunsai  
       16h 51m ago   ❤️ 1
    每次写出都无法通过编译的代码, 都是国产大模型搞出来的
    YanSeven
        12
    YanSeven  
       16h 51m ago
    卖给企业吧,普通个人用户还是 deepseek 。
    xiaomushen
        13
    xiaomushen  
       16h 49m ago
    3.7 max 速度很快
    heyitsme
        14
    heyitsme  
    OP
       16h 49m ago
    @dabbit #8 难绷
    nicaiwss
        15
    nicaiwss  
       16h 48m ago
    @dabbit 模型自己加的,只修一个然后无视代码里类似的其他问题的话大家觉得模型太笨,其他模型也会这样,但不一定直接开始修,有些会先问一下
    dabbit
        16
    dabbit  
       16h 40m ago
    @nicaiwss 不仅如此,它说“The user wants me to also handle the same context issue in ChannelInventoryManager.ets”,但是现在根本就不存在 ChannelInventoryManager.ets 这个文件,然后它就自己创建了。
    0x663
        17
    0x663  
       16h 14m ago   ❤️ 2
    Qwen 为跑分而生!
    MK47
        18
    MK47  
       16h 10m ago   ❤️ 1
    结论:依托答辩
    我使用阿里百炼 TOKEN PLAN 在 Qoder 中运行,就效果而言就是答辩,无可置疑的 答辩
    myarsenal
        19
    myarsenal  
       16h 5m ago
    @zzahsjlk 有排名很低体验很好的推荐一个
    dcatfly
        20
    dcatfly  
       16h 2m ago
    @wsbqdyhm qwen3.6 是 35b 激活 3b ,对比 glm5.1 是 744b 激活 40b ,kimi2.6 是 1t 激活 32b
    不过 qwen3.6 可能是个人笔记本勉强能跑起来的最智能的模型了
    DinnyXu
        21
    DinnyXu  
       15h 25m ago
    可以关注抖音的一个博主,ID:Token 就是词元,这个博主我最近刷到的,会用各个模型进行多维度测试,挺有意思的
    Poko
        22
    Poko  
       14h 43m ago
    @MK47 不科学啊,qoder 不是阿里自家的么,本身主要使用的就是 qwen 模型
    ndxxx
        23
    ndxxx  
       13h 55m ago via Android
    逆天,原汤化原食居然化不开🤣

    @dabbit
    MK47
        24
    MK47  
       13h 18m ago
    @Poko 用指定模型 谁用他自家的
    keshawnvan
        25
    keshawnvan  
       13h 4m ago
    和 GLM5.1 差不多,明显强于 DeepSeek 。
    比 Opus4.6 是肯定不如的。
    easing
        26
    easing  
       12h 15m ago
    3.7 max 还可以,比之前的 3.6 好很多了
    me262
        27
    me262  
       10h 0m ago
    我用 qoderwork 和 9 楼一样的情况
    catazshadow
        28
    catazshadow  
       8h 4m ago via Android
    国产做题家只能搞出做题 AI ,问题一变就呆若智障了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1017 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 65ms · UTC 18:57 · PVG 02:57 · LAX 11:57 · JFK 14:57
    ♥ Do have faith in what you're doing.