
1
zzahsjlk 17h 43m ago 排名没输过,实战没赢过
|
2
drealism 17h 42m ago
看了很多测评都说还可以,但是太贵了
|
3
duanxianze 17h 36m ago 我个人是感觉不出这些模型有多大的差别,可能我写的代码太简单了吧
|
4
skuuhui 17h 30m ago
试了一下,kimi2.5 水平。有不及无之过。甚至不如 3.5plus ,感觉他们只是内部重新打了一个 tag 就端上来了。
|
5
riscv 17h 24m ago via Android
@duanxianze 我也是,我感觉随便用一个都能写出比我好的代码,不知道他们比来比去做什么😂
|
8
dabbit 16h 57m ago
我在 Qoder 使用 Qwen3.7 ,让它修一个语法问题,它却自顾自的创建了新的文件,自顾自的开始修复其他问题,我不好说是模型问题还是 Agent 问题还是两者都有问题。看了一下它的深度思考过程,它会自顾自的说“The user wants me to also handle the same context issue in ChannelInventoryManager.ets.”或者“The user wants me to also handle the `flutter_inappwebview` plugin. Let me read the relevant files to understand what's needed.”,也不知道是哪个 User 给他下指令了。(我特意清空了 Qoder 的记忆来做测试的)
|
9
dabbit 16h 52m ago
|
10
maocat 16h 52m ago 公司一个月已经买了第三个 1398 块钱的 token plan
第一个坚持了 10 多天(主用 qwen3.6 plus ),优点速度快,缺点效果差劲 第二个坚持了 4 天(主用 glm5.1 ),优点速度快,效果合适(感觉上和智普家的还是有差距),缺点 token 使用非常快 第三个正在使用,第三天,主用( qwen3.7 max ),效果能打,速度快,但是有个问题非常傻逼,明确让他改用一个功能,他在改动的时候非常有想法 比如: Q:顶部的标签数据来源帮我修改为字段 xxA A:好的,改完了已将原来的 xxB 改为 xxA ,同时我把 xxB 的数据拼接到了 xxC 前面 |
11
sunsai 16h 51m ago 每次写出都无法通过编译的代码, 都是国产大模型搞出来的
|
12
YanSeven 16h 51m ago
卖给企业吧,普通个人用户还是 deepseek 。
|
13
xiaomushen 16h 49m ago
3.7 max 速度很快
|
16
dabbit 16h 40m ago
@nicaiwss 不仅如此,它说“The user wants me to also handle the same context issue in ChannelInventoryManager.ets”,但是现在根本就不存在 ChannelInventoryManager.ets 这个文件,然后它就自己创建了。
|
17
0x663 16h 14m ago Qwen 为跑分而生!
|
18
MK47 16h 10m ago 结论:依托答辩
我使用阿里百炼 TOKEN PLAN 在 Qoder 中运行,就效果而言就是答辩,无可置疑的 答辩 |
20
dcatfly 16h 2m ago
@wsbqdyhm qwen3.6 是 35b 激活 3b ,对比 glm5.1 是 744b 激活 40b ,kimi2.6 是 1t 激活 32b
不过 qwen3.6 可能是个人笔记本勉强能跑起来的最智能的模型了 |
21
DinnyXu 15h 25m ago
可以关注抖音的一个博主,ID:Token 就是词元,这个博主我最近刷到的,会用各个模型进行多维度测试,挺有意思的
|
25
keshawnvan 13h 4m ago
和 GLM5.1 差不多,明显强于 DeepSeek 。
比 Opus4.6 是肯定不如的。 |
26
easing 12h 15m ago
3.7 max 还可以,比之前的 3.6 好很多了
|
27
me262 10h 0m ago
我用 qoderwork 和 9 楼一样的情况
|
28
catazshadow 8h 4m ago via Android
国产做题家只能搞出做题 AI ,问题一变就呆若智障了
|