先抛个砖:GLM5.1 > deepseek v4 > minimax2.7 ≥ mimo v2.5 ≈ kimi2.6
以一个案例来分析这几个的能力:帮我生成一个天气查询H5应用 提示词就这一句,都一样。
glm5.1: https://imgchr.com/i/pehcWCR 天气温度假
kimi2.6:https://imgchr.com/i/pehczKf 天气温度真
minimax2.7:https://imgchr.com/i/pehcBvV 拉完了
mino v2.5 : 第一遍没有给我生成,换提示词:帮我开发一个天气查询H5应用。才继续生成:https://imgchr.com/i/pehgQIJ 天气温度假。 有一个背景下雨的效果
deepseek v4: https://imgchr.com/i/pehcgUJ 温度真
仅针对这个案例的评价:glm5.1,kimi2.6 可以, deepseek v4 ,mino v2.5 次之。 minimax2.7 什么玩意?
大家也可以自己测试下。
1
canyue7897 4 小时 14 分钟前 via iPhone 我觉得 kimi 还可以哈?
没想到这么拉? |
2
onedge 4 小时 8 分钟前
GLM 5.1 > DS v4 = Kimi 2.6 > mimo v2.5 > minimax 2.7
|
3
cookii 4 小时 5 分钟前 via Android
minimax 不配上榜好吧,夸张点说 4B 模型水平
|
5
uqf0663 3 小时 55 分钟前
kimi 我会继续订阅,但是 minimax 就算了,订阅完用了三天我就放弃了,不会再考虑使用。
|
7
ayasealter570 3 小时 44 分钟前
minimax 官方订阅的极速版,智力低到没边了
|
8
huaweii 3 小时 41 分钟前 via Android
@ayasealter570 有没有例子看看,好奇
|
10
junwind OP @canyue7897 实测的这个案例,kimi 还行,不过生成是很慢的
|
11
junwind OP @canyue7897 kimi 不拉,是我个人的武断,实测后还不错
|
12
drealism 3 小时 25 分钟前 via Android
可以把 qwen 系列补一个进去么🤜🤛
|
13
Miofly 2 小时 54 分钟前
https://tools.wflynn.cn/tools/videotools/video-nologo?time=1777197004192 免费去各大平台图片、视频水印,支持小红书,抖音、快手等常用平台,感谢使用,感谢作者大大
|
14
whileFalse 2 小时 49 分钟前
|
15
ebushicao 1 小时 56 分钟前
每次有人说跑分能够说明能力,我就会举出 minimax2.7 这个例子,那真是连 skill 和 tool 都不一定会调用,某些时候我本地部署的 qwen3.5 9b 都比它强。
|
16
aes114514gcm 1 小时 51 分钟前
和我的体感比较接近,glm5.1 略强于 kimi2.6 ,
|
17
zenfsharp 1 小时 46 分钟前
GLM5.1 > deepseek v4 > 其他,起码到这里是同意的。
我刚开了 opencode 的 Go 订阅,在 opencode-cli 里使用同样的 skill 、MCP 、Agent.md ,问 GLM 我项目里的一个业务逻辑,直接一次性揪出来了,而 DS 没有,反复提示了三次才找到。 |
18
zenfsharp 1 小时 45 分钟前
不知道各种公众号是有任务还是怎么回事,一个劲的鼓吹 deepseek v4 ,跟实际体验严重背离。
|
19
lukaktus6768 1 小时 13 分钟前
看到 glm 我就要踩一脚,买谁都不要买他
|
20
Miofly 1 小时 9 分钟前
感觉 DeepSeek 还是编程的神,GLM 真的能排到第一位吗 https://tools.wflynn.cn/tools/videotools/video-nologo?time=1777203245705 免费去各大平台图片、视频水印,支持小红书,抖音、快手等常用平台,感谢使用,感谢作者大大
|
21
anmie 1 小时 7 分钟前
@zenfsharp 自媒体不这么写没人看啊, 但是你看 Deepseek 官方就实在多了,官方在公众号里,明确说了模型在某些方面比 xx 模型要弱,而不是无脑鼓吹遥遥领先。
这么说把,做信息分享类的自媒体,有一个算一个,肯定会夹带私货,在我看来,有一个算一个都是傻逼。 而看自媒体说的就深信不疑的人也是傻逼。 我自始至终,从大模型刚能聊天,到现在 agentic ,Deepseek 虽然不是最强的那个,但是一直都是我的主力,不为别的,我坚定的站在这样一个不焦虑,不浮躁的人和公司这边。(而 minimax 我根本试都没试过,不感兴趣。) |
22
metalvest 1 小时 5 分钟前
GLM5.1 天气温度假,为什么排第一?
|
24
weilongs 52 分钟前
minimax2.7 排不到那个位置.
|
25
Desiree 51 分钟前
暂时只用过 Glm 跟 minimax2.7 挺垃圾的,glm 勉强能用,但是比 cc 跟 codex 还是差一大截,minimax2.7 是完全不能用
|
26
zzz123456qqq 36 分钟前
啊
|