V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
fingerxie
V2EX  ›  程序员

感觉 Kimi tinking 吹的很厉害,使用起来差强人意

  •  1
     
  •   fingerxie · 17 天前 · 5474 次点击

    一直以来都用 claude code ,今天听说 kimi thinking 很强,甚至高于 gpt5,我就去付费试了试。

    试完以后的结论就是:

    1. 他的指令遵循能力很差,比如说我定义好的 claude.md ,对他而言没有作用。
    2. 代码能力还行,修改东西还算可以接受
    3. 工具运用能力不太行,明明要给我展示一段代码,但是用成了修改代码的工具,吓得我赶紧拒绝

    这是我使用了一段时间的个人感受,不代表任何客观情况。

    希望国产 AI 越做越好

    40 条回复    2025-11-12 16:22:22 +08:00
    ethanwan9
        1
    ethanwan9  
       17 天前   ❤️ 8
    差强人意: 表示大体上还可让人满意。
    yanyuechuixue
        2
    yanyuechuixue  
       17 天前
    我昨天正好遇到一个 mathematica 画图代码需要从画一条线改成几条线画在一起,kimi 的表现并不如意。
    ethanwan9
        3
    ethanwan9  
       17 天前
    另: Kimi Thinking
    fingerxie
        4
    fingerxie  
    OP
       16 天前
    @ethanwan9 客气一下而已。不好用
    fingerxie
        5
    fingerxie  
    OP
       16 天前
    @ethanwan9 拼写错了 尬了~
    daweii
        6
    daweii  
       16 天前 via iPhone   ❤️ 4
    歪个楼,我现在每次看到“差强人意”我都要停下来想想这用对没🤔。

    语言是活的,估计这个词很快就跟“空穴来风”一样,本来正确的意思是有根据,但是大家都在说明没有根据的时候用,最后反倒是错误用法占了上风成了主流意思。
    netherder
        7
    netherder  
       16 天前 via Android
    Claude.md 不是 claude 的配置吗 你应该让他指定读取吧
    5ssl
        8
    5ssl  
       16 天前
    用着好像还可以
    Seck
        9
    Seck  
       16 天前
    v2 不是刚冲进来好几个暗广吗?

    一到实战就抓瞎,习惯了
    Bantes
        10
    Bantes  
       16 天前
    TRAE 才搞笑。
    fingerxie
        11
    fingerxie  
    OP
       16 天前
    @lightmanlu 因为用的是 claude code ,只是 kimi 模型
    Saniter
        12
    Saniter  
       16 天前
    @daweii 感觉现在大部分人还是知道差强人意的意思的,比如 op 就是表达原意。

    之前用错的挺多,近几年好像纠正的差不多了
    laminux29
        13
    laminux29  
       16 天前
    我自己感觉,

    Kimi 就是比国内的 deepseek 与 豆包 差一点。

    Google 的 Gemini 又比 GPT 、Grok 、Claude 差一点。
    KingFong
        14
    KingFong  
    PRO
       16 天前 via iPhone
    已经不敢在公开场合使用“差强人意”这个成语了。
    tlerbao
        15
    tlerbao  
       16 天前
    国产都是狗屎,我把话放这 ,包括 GLM4.6
    Wenwener
        16
    Wenwener  
       16 天前
    kimi 用了七百额度 转 cc 之后 很多 bug 一轮就能修好 kimi 改半天改不好
    ysy950803
        17
    ysy950803  
       16 天前   ❤️ 1
    考试高分的学霸,实操不一定最强,道理就是这么简单。我平时遇到编程难题时,都是各个 LLM 都试一遍,每次满意的可能并不是同一个模型。
    gunner168
        18
    gunner168  
       16 天前 via iPhone
    @daweii 在我认知里,差强人意就是不太满意,通俗点就是不行
    xing7673
        19
    xing7673  
       16 天前
    他的指令遵循能力很差,比如说我定义好的 claude.md ,对他而言没有作用。
    这里指的是它完全忽略了规则,还是说它有看到规则但是没有按照规则去执行?
    这种情况我之前在 grok fast 那个模型上也看到过
    感觉模型对应用环境不敏感
    looplj
        20
    looplj  
       16 天前
    可以看下是不是开了 thinking 模式,thinking 是要单独开的,不开好像不走 thinking 。
    和 MimiMax-M2 不一样,M2 是一定会 thinking 的。
    xiaoming1992
        21
    xiaoming1992  
       16 天前 via Android
    没感觉“差强人意”错多少啊,用在这里表达“勉强还行、过得去、一般般”也说得过去吧
    rick13
        22
    rick13  
       16 天前
    上午用了下,跟 gemini 简单对比下,差了点,但没差太多,不过都是免费我肯定用更好的
    xiaoming1992
        23
    xiaoming1992  
       16 天前 via Android
    gpt 给的例句:
    这次考试成绩差强人意,比上次稍微好一些,但还不是很理想。
    他的表演差强人意,总体还可以,但还有提升空间。
    跟本 post 语意基本相符。
    PrinceofInj
        24
    PrinceofInj  
       16 天前
    @daweii 空穴来风很容易根据语境来判断正确的意思,但是差强人意就不一样了。本意和误用本来就是达不到预期的意思,只不过本意是基本上还凑活,误用是完全不行。这种没办法根据语境来判断的不可能成为约定俗成的惯用。就像阀值永远不可能成为阈值异体一样。
    clarkethan
        25
    clarkethan  
       16 天前
    刷分高手
    usVexMownCzar
        26
    usVexMownCzar  
       16 天前 via iPhone
    目前别对国产 ai 抱太大希望。有钱还是 Claude openai Gemini 。国产 ai 目前只能替补,做做简单的工作。
    lisongeee
        27
    lisongeee  
       16 天前
    - 差强人意
    - 因为 XXX 的原因

    我每隔几天就在互联网上能看到这俩
    r6Vm94FFk9u3W6XI
        28
    r6Vm94FFk9u3W6XI  
       16 天前
    我今天也用了一天,我觉得不错,写代码的质量,跟 claude4.5 sonnet 和 gemini 2.5pro 差不多
    RandyLuo
        29
    RandyLuo  
       16 天前
    你确定开了 thinking?目前感觉还挺好用的(之前一直用 gpt-5-high 和 claude-opus 4.1 )。工具调用能力也很强
    cue
        30
    cue  
       16 天前 via iPhone
    V 站卧龙凤雏真多,很多成语就是在使用过程中改变了意思的啊,央视体育频道就经常说一个球员表现不佳说是差强人意,也就比如卧龙凤雏,语言就是用来沟通的,知道表达什么就 OK 了,天天纠结今非昔比、差强人意这些不觉得蛋疼?

    另外,kimi 和 minimax 俩真的烂得大相径庭呢。(狗头)
    orangleliu624
        31
    orangleliu624  
       16 天前 via Android
    知道了 不太行
    FlashEcho
        32
    FlashEcho  
       16 天前
    你是不是看了很多营销号被骗了,kimi k2 刚出来确实有一堆这种宣传,还有 claude 开了 max plan 不直接用 claude code 改用 kimi k2 这种搞笑案例

    下次建议看下稍微客观点的评测:

    https://livebench.ai/#/

    https://lmarena.ai/leaderboard
    johnnyyeen
        33
    johnnyyeen  
       16 天前
    有没有觉得最近更新的 codex 已经开始要超过 claude code 了。
    saymoon
        34
    saymoon  
       16 天前
    还有一个点是国内这些厂商的编程套餐看似定价便宜,例如 kimi 49/月档对标 CC $20/月档,实际赠送的可以在 Claude 或它自家 Cli 工具的使用额度( Kimi For Coding API Key ) 1024 次/周(还是限时优惠),实际使用不了多长时间,如果中等强度使用大概 1-2 天就用完了,还有 qwen 这个价格刺客。实际算下来并不比 CC 便宜,综合使用成本反而更高。
    bingfengfeifei
        35
    bingfengfeifei  
       15 天前
    @xiaoming1992 #21 主要是这个词语误用占大多数,所以当看到这个词的时候,不太清楚作者本意到底想要表达什么。
    bwnjnOEI
        36
    bwnjnOEI  
       15 天前 via iPhone
    月之暗面好像没出过 Kimi tinking 这个模型,最近出的是 kimi k2 thinking
    visper
        37
    visper  
       15 天前
    差强人意我感觉起来也没觉得用错啊。勉强来说,要求不太高的话,大致上还行。但是没有吹的那么厉害。
    sagnitude
        38
    sagnitude  
       15 天前
    让他翻译几个 java bean 到 c++,我已经等了 50 分钟,现在扣了 5 块钱,还没蹦出 10 行有效代码

    再等会,等到一个小时再不出东西就关掉换回 cc 了
    815377546
        39
    815377546  
       14 天前
    @FlashEcho #32 我也怀疑是这些大 up 都收钱了。 不过国外好像还真评价不错? 不知道怎么回事
    haoxiaoru
        40
    haoxiaoru  
       12 天前
    @FlashEcho livebench 上看,跟 DeepSeek V3.2 得分差不多,稍差一丢丢:71.64 vs 71.56 ,国内的 top2
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5256 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 06:46 · PVG 14:46 · LAX 22:46 · JFK 01:46
    ♥ Do have faith in what you're doing.