• 请不要在回答技术问题时复制粘贴 AI 生成的内容
Cheez
V2EX  ›  程序员

阿里的 Qwen3.7-Max 比我想象中差

  •  
  •   Cheez ·
    PRO
    · 1 day ago · 3282 views
    21 replies    2026-06-08 17:29:21 +08:00
    Cheez
        1
    Cheez  
    OP
    PRO
       1 day ago
    说实话才一百多万而已,Qwen 就已经撑不住了。撑不住就算了,也不会自动压缩上下文。用 GLM 5.1 之后开始干活了,结果干到一半,Qoder 显示没额度了,也就是说一个月的额度,连一个最简单的 App (给定接口,进行显示统计信息)都没干完,就已经花光了。
    qxmqh
        2
    qxmqh  
       1 day ago
    Qoder 阿里系的 都是洪水,疯狂消耗,不知道他们这些产品 都是怎么搞的。
    foufoufm
        3
    foufoufm  
       1 day ago
    这段时间软文很多
    coderfee
        4
    coderfee  
       1 day ago via iPhone
    kimi 也这样,一直 read 文件,狂耗额度。
    ZX16815
        5
    ZX16815  
       1 day ago
    有没有可能,这是你本地 agent 调度出问题了,或者 ui 出 bug 了😀
    Cheez
        6
    Cheez  
    OP
    PRO
       1 day ago via Android   ❤️ 1
    @ZX16815 没听懂。Qoder 你用过吗?是阿里版本的 Cursor 。我登录并注册了 Qoder ,在里面输入我需要的,然后它的 Qwen 模型给我的是无限循环,换成 GLM 好了。这不就是它的锅吗?
    lmmlwen
        7
    lmmlwen  
       1 day ago   ❤️ 1
    用不了 codex 和 claude ,用 cursor composer2.5 秒杀这些国产的玩意儿
    MuyuQ
        8
    MuyuQ  
       1 day ago
    无限循环是 qwen 系列不得不品的一环。
    上上个月,我用 3.6Plus ,一会儿的功夫给我写了几 K 行循环代码。
    bowser1701
        9
    bowser1701  
       1 day ago
    这个跟模型没有关系吧?就算有问题,也是推理服务的问题。
    SilenceLL
        10
    SilenceLL  
       1 day ago
    我在 Qoder idea 插件里面用 qwen3.7 的模型,搞了一个小时没搞定的一个问题,用 Codex 两分多钟搞定。涉及输入输出 4K+行的 json 文件和一个 ERP 项目的前后端。最后逼急了他说是我改了数据导致两个接口返回不一致,不是代码问题,Codex 一下子就发现了前端渲染数据方式有问题。
    cpalead
        11
    cpalead  
       1 day ago
    我在 trae 中用 deepseekv4pro 的时候也这样,好几次它问我重复的问题,或者重复做一件事
    kennylam777
        12
    kennylam777  
       1 day ago   ❤️ 1
    @bowser1701 通常都跟模型有關, 長 context 是一種能力, Qwen 的收費版才有 1m context support, 但在 1m 觸發 compact 前就死循環那是長 context 能力不足了。

    雖然我在本地用 Qwen 3.6 27B/35B 都只限在 256k 甚至是 200k, 不太會死循環, 但如果把 Weight 或 KV 壓成 4bit/Q4 就更容易會出現類似錯誤。

    雖然在 inference 時的確能調 repeat penalty 去減少重覆回應, 但我測過能力弱的模型, 要死循環時你如何調也救不回來。
    jjx
        13
    jjx  
       18h 49m ago
    国内的这几个用下来还是 deepseek 最靠谱

    deepseek 需要快出自己的 agent code 工具
    xiangqiankan
        14
    xiangqiankan  
       18h 20m ago
    真实体验太差了,尤其是指令遵循是最差的,qwen 真的是跑分没输过,体验没赢过。阿里的东西和上次那个 happy-horse 一样说世界第一超越 seedance2.0 ,结果实测拉跨打脸
    benfafa
        15
    benfafa  
       17h 54m ago
    我周末一个小时送的 pro 的点数全用完了,
    收费也很离谱
    Tarek911
        16
    Tarek911  
       17h 10m ago
    200 块/月的 TokenPlan 额度,Qwen3.6 蹬了一周才蹬掉 20% ,换了 3.7Max 没到一周就清杯了,也就做了三五个小功能。
    DeepSeek 充了 100 块,库库蹬,比 tmQwen3.6 还省钱,虽然输出规范差了点意思,但胜在偏移能用,智能水平跟 3.6 不相上下,但感觉不如 3.7
    champaulmmc
        17
    champaulmmc  
       16h 55m ago
    这个是伪流式,一般是中转代理为了给不支持流式输出的模型嵌套的,就会出现一直疯狂打印某一个步骤,当然有的 agent 工具对模型适配不行也会这样
    0xD800
        18
    0xD800  
       16h 43m ago
    我相信做过 agent 开发的用户都遇到过无线循环的问题,通常 agent 会设置循环限制,不会无限循环(烧钱),很明显是模型能力不足以及客户端 Agent 不够完善导致。
    gloeaerris
        19
    gloeaerris  
       13h 44m ago
    @lmmlwen 确实,蒸馏的秒杀被蒸馏的。千问 code 确实是不行,跟 minimax 坐一桌,kimi 自己呆一桌或者跟 composer 坐一起,GLM 跟 DeepSeek 配合 claudecode 或者 codex 还算是可以,不过新版的 claudecode 针对 deepseek 负优化,用 codex+deepseek 或者 zed 编辑器+deepseek 效果好很多
    jimrok
        20
    jimrok  
       11h 6m ago
    deepseek 应该已经到达了可用的阶段,而且他们现在资费非常便宜,这样就收集了足够多的数据,每次你用 deepseek 解决完一个问题,他们就会把整个过程变成下一代产品的训练的养料,然后这个飞轮就能启动起来。一旦他们在代码编写上越来越能懂用户的心思,后续完成项目的速度就越快。最终那几个上不了桌的就转去蒸馏 deepseek 。
    yh7gdiaYW
        21
    yh7gdiaYW  
       10h 13m ago
    @Cheez 上周也有 Qoder 里的帖子里说过这个了,Qoder 里你的模型是个阉割版,自家的 qwen 一样阉割,跟 api 里拿到的超过 dsv4pro 水平的 3.7max 不是一个东西
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   961 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 83ms · UTC 19:42 · PVG 03:42 · LAX 12:42 · JFK 15:42
    ♥ Do have faith in what you're doing.