一直以来都用 claude code ,今天听说 kimi thinking 很强,甚至高于 gpt5,我就去付费试了试。
试完以后的结论就是:
这是我使用了一段时间的个人感受,不代表任何客观情况。
希望国产 AI 越做越好
1
ethanwan9 17 天前 差强人意: 表示大体上还可让人满意。
|
2
yanyuechuixue 17 天前
我昨天正好遇到一个 mathematica 画图代码需要从画一条线改成几条线画在一起,kimi 的表现并不如意。
|
3
ethanwan9 17 天前
另: Kimi Thinking
|
6
daweii 16 天前 via iPhone 歪个楼,我现在每次看到“差强人意”我都要停下来想想这用对没🤔。
语言是活的,估计这个词很快就跟“空穴来风”一样,本来正确的意思是有根据,但是大家都在说明没有根据的时候用,最后反倒是错误用法占了上风成了主流意思。 |
8
5ssl 16 天前
用着好像还可以
|
9
Seck 16 天前
v2 不是刚冲进来好几个暗广吗?
一到实战就抓瞎,习惯了 |
10
Bantes 16 天前
TRAE 才搞笑。
|
11
fingerxie OP @lightmanlu 因为用的是 claude code ,只是 kimi 模型
|
13
laminux29 16 天前
我自己感觉,
Kimi 就是比国内的 deepseek 与 豆包 差一点。 Google 的 Gemini 又比 GPT 、Grok 、Claude 差一点。 |
14
KingFong PRO 已经不敢在公开场合使用“差强人意”这个成语了。
|
15
tlerbao 16 天前
国产都是狗屎,我把话放这 ,包括 GLM4.6
|
16
Wenwener 16 天前
kimi 用了七百额度 转 cc 之后 很多 bug 一轮就能修好 kimi 改半天改不好
|
17
ysy950803 16 天前 考试高分的学霸,实操不一定最强,道理就是这么简单。我平时遇到编程难题时,都是各个 LLM 都试一遍,每次满意的可能并不是同一个模型。
|
19
xing7673 16 天前
他的指令遵循能力很差,比如说我定义好的 claude.md ,对他而言没有作用。
这里指的是它完全忽略了规则,还是说它有看到规则但是没有按照规则去执行? 这种情况我之前在 grok fast 那个模型上也看到过 感觉模型对应用环境不敏感 |
20
looplj 16 天前
可以看下是不是开了 thinking 模式,thinking 是要单独开的,不开好像不走 thinking 。
和 MimiMax-M2 不一样,M2 是一定会 thinking 的。 |
21
xiaoming1992 16 天前 via Android
没感觉“差强人意”错多少啊,用在这里表达“勉强还行、过得去、一般般”也说得过去吧
|
22
rick13 16 天前
上午用了下,跟 gemini 简单对比下,差了点,但没差太多,不过都是免费我肯定用更好的
|
23
xiaoming1992 16 天前 via Android
gpt 给的例句:
这次考试成绩差强人意,比上次稍微好一些,但还不是很理想。 他的表演差强人意,总体还可以,但还有提升空间。 跟本 post 语意基本相符。 |
24
PrinceofInj 16 天前
@daweii 空穴来风很容易根据语境来判断正确的意思,但是差强人意就不一样了。本意和误用本来就是达不到预期的意思,只不过本意是基本上还凑活,误用是完全不行。这种没办法根据语境来判断的不可能成为约定俗成的惯用。就像阀值永远不可能成为阈值异体一样。
|
25
clarkethan 16 天前
刷分高手
|
26
usVexMownCzar 16 天前 via iPhone
目前别对国产 ai 抱太大希望。有钱还是 Claude openai Gemini 。国产 ai 目前只能替补,做做简单的工作。
|
27
lisongeee 16 天前
- 差强人意
- 因为 XXX 的原因 我每隔几天就在互联网上能看到这俩 |
28
r6Vm94FFk9u3W6XI 16 天前
我今天也用了一天,我觉得不错,写代码的质量,跟 claude4.5 sonnet 和 gemini 2.5pro 差不多
|
29
RandyLuo 16 天前
你确定开了 thinking?目前感觉还挺好用的(之前一直用 gpt-5-high 和 claude-opus 4.1 )。工具调用能力也很强
|
30
cue 16 天前 via iPhone
V 站卧龙凤雏真多,很多成语就是在使用过程中改变了意思的啊,央视体育频道就经常说一个球员表现不佳说是差强人意,也就比如卧龙凤雏,语言就是用来沟通的,知道表达什么就 OK 了,天天纠结今非昔比、差强人意这些不觉得蛋疼?
另外,kimi 和 minimax 俩真的烂得大相径庭呢。(狗头) |
31
orangleliu624 16 天前 via Android
知道了 不太行
|
32
FlashEcho 16 天前
你是不是看了很多营销号被骗了,kimi k2 刚出来确实有一堆这种宣传,还有 claude 开了 max plan 不直接用 claude code 改用 kimi k2 这种搞笑案例
下次建议看下稍微客观点的评测: https://livebench.ai/#/ https://lmarena.ai/leaderboard |
33
johnnyyeen 16 天前
有没有觉得最近更新的 codex 已经开始要超过 claude code 了。
|
34
saymoon 16 天前
还有一个点是国内这些厂商的编程套餐看似定价便宜,例如 kimi 49/月档对标 CC $20/月档,实际赠送的可以在 Claude 或它自家 Cli 工具的使用额度( Kimi For Coding API Key ) 1024 次/周(还是限时优惠),实际使用不了多长时间,如果中等强度使用大概 1-2 天就用完了,还有 qwen 这个价格刺客。实际算下来并不比 CC 便宜,综合使用成本反而更高。
|
35
bingfengfeifei 15 天前
@xiaoming1992 #21 主要是这个词语误用占大多数,所以当看到这个词的时候,不太清楚作者本意到底想要表达什么。
|
36
bwnjnOEI 15 天前 via iPhone
月之暗面好像没出过 Kimi tinking 这个模型,最近出的是 kimi k2 thinking
|
37
visper 15 天前
差强人意我感觉起来也没觉得用错啊。勉强来说,要求不太高的话,大致上还行。但是没有吹的那么厉害。
|
38
sagnitude 15 天前
让他翻译几个 java bean 到 c++,我已经等了 50 分钟,现在扣了 5 块钱,还没蹦出 10 行有效代码
再等会,等到一个小时再不出东西就关掉换回 cc 了 |