感觉 Kimi tinking 吹的很厉害，使用起来差强人意

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 162 天前的主题，其中的信息可能已经有所发展或是发生改变。

一直以来都用 claude code ，今天听说 kimi thinking 很强，甚至高于 gpt5,我就去付费试了试。

试完以后的结论就是：

他的指令遵循能力很差，比如说我定义好的 claude.md ，对他而言没有作用。
代码能力还行，修改东西还算可以接受
工具运用能力不太行，明明要给我展示一段代码，但是用成了修改代码的工具，吓得我赶紧拒绝

这是我使用了一段时间的个人感受，不代表任何客观情况。

希望国产 AI 越做越好

Kimi tinking

claude code

指令遵循能力

40 条回复 • 2025-11-12 16:22:22 +08:00

ethanwan9

2025 年 11 月 8 日

差强人意: 表示大体上还可让人满意。

yanyuechuixue

2025 年 11 月 8 日

我昨天正好遇到一个 mathematica 画图代码需要从画一条线改成几条线画在一起，kimi 的表现并不如意。

ethanwan9

2025 年 11 月 8 日

另: Kimi Thinking

fingerxie

2025 年 11 月 8 日

@ethanwan9 客气一下而已。不好用

fingerxie

2025 年 11 月 8 日

@ethanwan9 拼写错了尬了～

daweii

2025 年 11 月 8 日 via iPhone

歪个楼，我现在每次看到“差强人意”我都要停下来想想这用对没🤔。

语言是活的，估计这个词很快就跟“空穴来风”一样，本来正确的意思是有根据，但是大家都在说明没有根据的时候用，最后反倒是错误用法占了上风成了主流意思。

netherder

2025 年 11 月 8 日 via Android

Claude.md 不是 claude 的配置吗你应该让他指定读取吧

5ssl

2025 年 11 月 8 日

用着好像还可以

Seck

2025 年 11 月 8 日

v2 不是刚冲进来好几个暗广吗？

一到实战就抓瞎，习惯了

Bantes

2025 年 11 月 8 日

TRAE 才搞笑。

fingerxie

2025 年 11 月 8 日

@lightmanlu 因为用的是 claude code ，只是 kimi 模型

Saniter

2025 年 11 月 8 日

@daweii 感觉现在大部分人还是知道差强人意的意思的，比如 op 就是表达原意。

之前用错的挺多，近几年好像纠正的差不多了

laminux29

2025 年 11 月 8 日

我自己感觉，

Kimi 就是比国内的 deepseek 与豆包差一点。

Google 的 Gemini 又比 GPT 、Grok 、Claude 差一点。

KingFong

PRO

2025 年 11 月 8 日 via iPhone

已经不敢在公开场合使用“差强人意”这个成语了。

tlerbao

2025 年 11 月 8 日

国产都是狗屎，我把话放这，包括 GLM4.6

Wenwener

2025 年 11 月 8 日

kimi 用了七百额度转 cc 之后很多 bug 一轮就能修好 kimi 改半天改不好

ysy950803

2025 年 11 月 8 日

考试高分的学霸，实操不一定最强，道理就是这么简单。我平时遇到编程难题时，都是各个 LLM 都试一遍，每次满意的可能并不是同一个模型。

gunner168

2025 年 11 月 8 日 via iPhone

@daweii 在我认知里，差强人意就是不太满意，通俗点就是不行

xing7673

2025 年 11 月 8 日

他的指令遵循能力很差，比如说我定义好的 claude.md ，对他而言没有作用。
这里指的是它完全忽略了规则，还是说它有看到规则但是没有按照规则去执行？
这种情况我之前在 grok fast 那个模型上也看到过
感觉模型对应用环境不敏感

looplj

2025 年 11 月 8 日

可以看下是不是开了 thinking 模式，thinking 是要单独开的，不开好像不走 thinking 。
和 MimiMax-M2 不一样，M2 是一定会 thinking 的。

xiaoming1992

2025 年 11 月 8 日 via Android

没感觉“差强人意”错多少啊，用在这里表达“勉强还行、过得去、一般般”也说得过去吧

rick13

2025 年 11 月 8 日

上午用了下，跟 gemini 简单对比下，差了点，但没差太多，不过都是免费我肯定用更好的

xiaoming1992

2025 年 11 月 8 日 via Android

gpt 给的例句：
这次考试成绩差强人意，比上次稍微好一些，但还不是很理想。
他的表演差强人意，总体还可以，但还有提升空间。
跟本 post 语意基本相符。

PrinceofInj

2025 年 11 月 8 日

@daweii 空穴来风很容易根据语境来判断正确的意思，但是差强人意就不一样了。本意和误用本来就是达不到预期的意思，只不过本意是基本上还凑活，误用是完全不行。这种没办法根据语境来判断的不可能成为约定俗成的惯用。就像阀值永远不可能成为阈值异体一样。

clarkethan

2025 年 11 月 8 日

刷分高手

usVexMownCzar

2025 年 11 月 8 日 via iPhone

目前别对国产 ai 抱太大希望。有钱还是 Claude openai Gemini 。国产 ai 目前只能替补，做做简单的工作。

lisongeee

2025 年 11 月 8 日

- 差强人意
- 因为 XXX 的原因

我每隔几天就在互联网上能看到这俩

r6Vm94FFk9u3W6XI

2025 年 11 月 8 日

我今天也用了一天，我觉得不错，写代码的质量，跟 claude4.5 sonnet 和 gemini 2.5pro 差不多

RandyLuo

2025 年 11 月 9 日

你确定开了 thinking?目前感觉还挺好用的（之前一直用 gpt-5-high 和 claude-opus 4.1 ）。工具调用能力也很强

cue

2025 年 11 月 9 日 via iPhone

V 站卧龙凤雏真多，很多成语就是在使用过程中改变了意思的啊，央视体育频道就经常说一个球员表现不佳说是差强人意，也就比如卧龙凤雏，语言就是用来沟通的，知道表达什么就 OK 了，天天纠结今非昔比、差强人意这些不觉得蛋疼？

另外，kimi 和 minimax 俩真的烂得大相径庭呢。（狗头）

orangleliu624

2025 年 11 月 9 日 via Android

知道了不太行

FlashEcho

2025 年 11 月 9 日

你是不是看了很多营销号被骗了，kimi k2 刚出来确实有一堆这种宣传，还有 claude 开了 max plan 不直接用 claude code 改用 kimi k2 这种搞笑案例

下次建议看下稍微客观点的评测：

https://livebench.ai/#/

https://lmarena.ai/leaderboard

johnnyyeen

2025 年 11 月 9 日

有没有觉得最近更新的 codex 已经开始要超过 claude code 了。

saymoon

2025 年 11 月 9 日

还有一个点是国内这些厂商的编程套餐看似定价便宜，例如 kimi 49/月档对标 CC $20/月档，实际赠送的可以在 Claude 或它自家 Cli 工具的使用额度（ Kimi For Coding API Key ） 1024 次/周（还是限时优惠），实际使用不了多长时间，如果中等强度使用大概 1-2 天就用完了，还有 qwen 这个价格刺客。实际算下来并不比 CC 便宜，综合使用成本反而更高。