1
Cheez OP PRO 说实话才一百多万而已,Qwen 就已经撑不住了。撑不住就算了,也不会自动压缩上下文。用 GLM 5.1 之后开始干活了,结果干到一半,Qoder 显示没额度了,也就是说一个月的额度,连一个最简单的 App (给定接口,进行显示统计信息)都没干完,就已经花光了。
|
2
qxmqh 1 day ago
Qoder 阿里系的 都是洪水,疯狂消耗,不知道他们这些产品 都是怎么搞的。
|
3
foufoufm 1 day ago
这段时间软文很多
|
4
coderfee 1 day ago via iPhone
kimi 也这样,一直 read 文件,狂耗额度。
|
5
ZX16815 1 day ago
有没有可能,这是你本地 agent 调度出问题了,或者 ui 出 bug 了😀
|
6
Cheez OP PRO @ZX16815 没听懂。Qoder 你用过吗?是阿里版本的 Cursor 。我登录并注册了 Qoder ,在里面输入我需要的,然后它的 Qwen 模型给我的是无限循环,换成 GLM 好了。这不就是它的锅吗?
|
7
lmmlwen 1 day ago 用不了 codex 和 claude ,用 cursor composer2.5 秒杀这些国产的玩意儿
|
8
MuyuQ 1 day ago
无限循环是 qwen 系列不得不品的一环。
上上个月,我用 3.6Plus ,一会儿的功夫给我写了几 K 行循环代码。 |
9
bowser1701 1 day ago
这个跟模型没有关系吧?就算有问题,也是推理服务的问题。
|
10
SilenceLL 1 day ago
我在 Qoder idea 插件里面用 qwen3.7 的模型,搞了一个小时没搞定的一个问题,用 Codex 两分多钟搞定。涉及输入输出 4K+行的 json 文件和一个 ERP 项目的前后端。最后逼急了他说是我改了数据导致两个接口返回不一致,不是代码问题,Codex 一下子就发现了前端渲染数据方式有问题。
|
11
cpalead 1 day ago
我在 trae 中用 deepseekv4pro 的时候也这样,好几次它问我重复的问题,或者重复做一件事
|
12
kennylam777 1 day ago @bowser1701 通常都跟模型有關, 長 context 是一種能力, Qwen 的收費版才有 1m context support, 但在 1m 觸發 compact 前就死循環那是長 context 能力不足了。
雖然我在本地用 Qwen 3.6 27B/35B 都只限在 256k 甚至是 200k, 不太會死循環, 但如果把 Weight 或 KV 壓成 4bit/Q4 就更容易會出現類似錯誤。 雖然在 inference 時的確能調 repeat penalty 去減少重覆回應, 但我測過能力弱的模型, 要死循環時你如何調也救不回來。 |
13
jjx 18h 49m ago
国内的这几个用下来还是 deepseek 最靠谱
deepseek 需要快出自己的 agent code 工具 |
14
xiangqiankan 18h 20m ago
真实体验太差了,尤其是指令遵循是最差的,qwen 真的是跑分没输过,体验没赢过。阿里的东西和上次那个 happy-horse 一样说世界第一超越 seedance2.0 ,结果实测拉跨打脸
|
15
benfafa 17h 54m ago
我周末一个小时送的 pro 的点数全用完了,
收费也很离谱 |
16
Tarek911 17h 10m ago
200 块/月的 TokenPlan 额度,Qwen3.6 蹬了一周才蹬掉 20% ,换了 3.7Max 没到一周就清杯了,也就做了三五个小功能。
DeepSeek 充了 100 块,库库蹬,比 tmQwen3.6 还省钱,虽然输出规范差了点意思,但胜在偏移能用,智能水平跟 3.6 不相上下,但感觉不如 3.7 |
17
champaulmmc 16h 55m ago
这个是伪流式,一般是中转代理为了给不支持流式输出的模型嵌套的,就会出现一直疯狂打印某一个步骤,当然有的 agent 工具对模型适配不行也会这样
|
18
0xD800 16h 43m ago
我相信做过 agent 开发的用户都遇到过无线循环的问题,通常 agent 会设置循环限制,不会无限循环(烧钱),很明显是模型能力不足以及客户端 Agent 不够完善导致。
|
19
gloeaerris 13h 44m ago
@lmmlwen 确实,蒸馏的秒杀被蒸馏的。千问 code 确实是不行,跟 minimax 坐一桌,kimi 自己呆一桌或者跟 composer 坐一起,GLM 跟 DeepSeek 配合 claudecode 或者 codex 还算是可以,不过新版的 claudecode 针对 deepseek 负优化,用 codex+deepseek 或者 zed 编辑器+deepseek 效果好很多
|
20
jimrok 11h 6m ago
deepseek 应该已经到达了可用的阶段,而且他们现在资费非常便宜,这样就收集了足够多的数据,每次你用 deepseek 解决完一个问题,他们就会把整个过程变成下一代产品的训练的养料,然后这个飞轮就能启动起来。一旦他们在代码编写上越来越能懂用户的心思,后续完成项目的速度就越快。最终那几个上不了桌的就转去蒸馏 deepseek 。
|
21
yh7gdiaYW 10h 13m ago
@Cheez 上周也有 Qoder 里的帖子里说过这个了,Qoder 里你的模型是个阉割版,自家的 qwen 一样阉割,跟 api 里拿到的超过 dsv4pro 水平的 3.7max 不是一个东西
|