V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wshhfy
V2EX  ›  Claude Code

Claude5 要来了...真的感到太快了

  •  
  •   wshhfy · 16 小时 39 分钟前 · 5164 次点击
    网上有关于 Claude5 的消息了...更新了很多东西,能力强多少先不论,肯定比现在更好。哪怕参考现有的 4.5 能力已经非常强了。

    按照这个迭代速度,后面真的是不敢想象。真的是越来越焦虑了😢
    46 条回复    2026-02-04 09:18:53 +08:00
    eleganceoo
        1
    eleganceoo  
       16 小时 33 分钟前
    焦虑也没得用,咱们本来就一直在持续学习中
    alittlefun
        2
    alittlefun  
       16 小时 32 分钟前
    md 为啥程序员一直把到挥向自己
    iorilu
        3
    iorilu  
       16 小时 31 分钟前
    4.5 应该便宜了把
    Desiree
        4
    Desiree  
       16 小时 31 分钟前
    不用焦虑,赶紧跟上
    intmax2147483647
        5
    intmax2147483647  
       16 小时 29 分钟前
    古法编程已经被淘汰,但是还有很多公司以安全为由不让用 AI
    wshhfy
        6
    wshhfy  
    OP
       16 小时 25 分钟前
    @eleganceoo 学不过啊😂它学的太快了
    MAVETRICK
        7
    MAVETRICK  
       16 小时 24 分钟前
    还有 gpt5.3 也快了,化身 ai 战士
    kakki
        8
    kakki  
       16 小时 16 分钟前   ❤️ 2
    以前:学不动了
    现在:不用学了
    未来:CNM 失业了
    kera0a
        9
    kera0a  
       16 小时 15 分钟前 via iPhone
    对于 35 老登来讲是好事啊,本来就要没工作了,AI 说不定还能延长几年职业生涯呢
    kneo
        10
    kneo  
       16 小时 8 分钟前 via Android
    这两年我感觉都在原地踏步。每代都吹爆了,回头一看感觉一直在挤牙膏。
    xianzhe
        11
    xianzhe  
       16 小时 5 分钟前
    每次更新的时候我总感觉好像没多大变化。比如用 3.5 的时候感觉好厉害,4 一出来用起来好像也没多大变化,就是感觉 3.5 变蠢了,4.5 出来的时候也是这样,感觉 4 变蠢了,4.5 用起来好像还是那样
    fbu11
        12
    fbu11  
       16 小时 2 分钟前
    各种大模型每次刚发布新版本时挺牛逼的,没几天就不知道是降智还是什么,反正用起来就不尽如人意了,不如刚发布的时候了
    AoEiuV020JP
        13
    AoEiuV020JP  
       15 小时 59 分钟前
    @xianzhe #11 我倒是感觉半年一个阶段,不只是模型,而是整个 AI 行业,都会有明显进步, 作为码农日常 AI 使用方式和占比都有明显变化,
    单独测试几个对话,确实是很难看出来两个模型有多大区别的,
    wshhfy
        14
    wshhfy  
    OP
       15 小时 41 分钟前 via Android
    @xianzhe 我觉得是迭代的太快了,给你的感觉不明显。像是 gpt3 和现在 5.2 。。这个差别不应该不明显吧。cc 出来到现在也才一年多吧。之前手撸的时候都想不到现在这样😂
    cloudnb
        15
    cloudnb  
       15 小时 34 分钟前
    @intmax2147483647 有些领域 数据安全大于一切,网络都是内网不对外
    vipfts
        16
    vipfts  
       15 小时 25 分钟前
    @kneo 跟 4G5G 网一样, 但其实确实是有提升的, 只是没有营销的说的那么大, 每次都是直接把期望打满, 所以感觉糟, 这就是资本主义害人的地方, 跟我恋爱时候一样, 期待约会的时候最开心, 其实见了面也就那样
    xianzhe
        17
    xianzhe  
       15 小时 16 分钟前
    @wshhfy #14 3 和 5.2 的差别确实比较大,不过我很少用。但是 Claude 家的模型我一直有这个怀疑。过去 3.5 能解决的局部代码编写 4.5 完成的没看出来有更好(都已经足够好,再提升就是边际效用递减),正如 @AoEiuV020JP 说的,单独几个对话是看不出来区别的。我感觉进步明显的应该是模型外的工具链,比如 cursor 和 cc 的 plan 模式,之前没这玩意的时候解决复杂问题可太麻烦了。
    livib
        18
    livib  
       15 小时 8 分钟前
    时代早就变了
    kneo
        19
    kneo  
       15 小时 7 分钟前
    @wshhfy >像是 gpt3 和现在 5.2 。。这个差别不应该不明显吧

    你能说出具体的区别吗?

    gpt3 没用过,当时火起来应该是 3.5 。比较有名的是让 chatgpt 模拟一个命令行的虚拟机,你发命令它就能发给你执行结果。你现在看看,说不定都退步了。

    >cc 出来到现在也才一年多吧。之前手撸的时候都想不到现在这样😂

    这是 agent 工具的发展,不是模型能力的进步。

    当然,context 大小是进步明显的。
    FaustinaD
        20
    FaustinaD  
       15 小时 1 分钟前   ❤️ 1
    CatGo
        21
    CatGo  
       14 小时 57 分钟前
    @xianzhe #11 一部份是出新模型有对比导致,一部份感觉是旧模型降智
    wshhfy
        22
    wshhfy  
    OP
       14 小时 21 分钟前 via Android
    @kneo @xianzhe 我说的宽泛了点,不论是 llm 还是 agent 或是各种多模态工具,实际上确实是提升了大部分人的工作效率的,虽然目前不能完全脱离人的 review ,但我自己的工作量是明显减少且速度更快的。

    至于你说的 gpt 早期的模拟命令行功能,现在通过各种 mcp 可以做的更多。

    虽然现在都是通过提升上下文和处理速度来进化,但量变引起的质变很明显
    wshhfy
        23
    wshhfy  
    OP
       14 小时 16 分钟前 via Android
    @FaustinaD 哈哈,游戏确实难搞,不过用 rodin 打印了很多小朋友的 3d 玩具还是可以玩玩的
    andrew2558
        24
    andrew2558  
       14 小时 9 分钟前
    说是 5 sonnet 比现在 4.5 opus 更强,成本降低 50%。真要这样,真是可以的
    yarawen
        25
    yarawen  
       14 小时 7 分钟前
    @FaustinaD 说到游戏,蚂蚁灵波的世界模型,视觉效果也非常震撼。
    或许有生之年真的可以见证一个虚拟世界的诞生。
    当然星网和全息游戏还是很遥远。
    HK560
        26
    HK560  
       13 小时 58 分钟前
    《关于各家 AI 大爹不知不觉把我惯成废物这件事》
    org100
        27
    org100  
       13 小时 53 分钟前
    Claude 免费额度很少 不过很好用
    FaustinaD
        28
    FaustinaD  
       13 小时 8 分钟前
    @yarawen 这个模型在哪可以体验呀
    yarawen
        29
    yarawen  
       12 小时 57 分钟前
    kneo
        30
    kneo  
       12 小时 42 分钟前
    @wshhfy >至于你说的 gpt 早期的模拟命令行功能,现在通过各种 mcp 可以做的更多。

    agent 能力不等于模型能力。如果拉上 mcp 才能实现,说明模型能力在退化。
    kneo
        31
    kneo  
       12 小时 40 分钟前
    @andrew2558 >说是 5 sonnet 比现在 4.5 opus 更强,成本降低 50%。真要这样,真是可以的

    成本降低可能是真的。强多少可很难说。(当然现在 opus 4.5 也不强就是了。)
    Felldeadbird
        32
    Felldeadbird  
       9 小时 46 分钟前
    不用焦虑,只需要知道: 上下文容量、推理质量和 token 消耗 三者存在不可能三角关系。一切就释然了。

    再焦虑也解决不了年纪上去了,社会逐步淘汰老登啊。
    tomorrow092
        33
    tomorrow092  
       9 小时 44 分钟前 via Android
    @iorilu 你把资本想的太善良了,降智 4.5 ,逼你换到 5
    EchoAdventure
        34
    EchoAdventure  
       9 小时 39 分钟前
    坐等他出来。
    NonResistance
        35
    NonResistance  
       9 小时 27 分钟前
    没什么好焦虑的,首先,它进化得没有那么那么快,其次大多数人类的工作没那么重要,别放在心上
    alenryuichi
        36
    alenryuichi  
       8 小时 48 分钟前
    @FaustinaD agent-zero 又来了
    beyondstars
        37
    beyondstars  
       4 小时 43 分钟前
    套路就是,每次精心准备一些 benchmark 数据集,跑出比上一个好一些的分数,精心挑选一些指标放出来,然后让上一代模型降智。

    也就那样。
    holulu
        38
    holulu  
       1 小时 47 分钟前
    AI 生成再快,在严肃场景里还是得人来确认吧,不然上线出问题还是得自己担。如果不是严肃场景就随便吧。
    wzw
        39
    wzw  
       1 小时 43 分钟前 via iPhone
    @xianzhe #17 怎么用好 plan 模式?
    huaweii
        40
    huaweii  
       54 分钟前 via Android
    大量底层码农的自然语言表达能力(需求表达能力),还跟不上模型编码细节能力的提升。
    achangzhou
        41
    achangzhou  
       43 分钟前
    每次出新前,把旧的模型量化狠一点的服务部署多一些,让用户感觉降智,空出来的算力给新模型,让用户体验。
    billzhuang
        42
    billzhuang  
       34 分钟前 via iPhone
    @holulu 啥叫严肃场景?

    还是要 code review 的呀
    wshhfy
        43
    wshhfy  
    OP
       29 分钟前
    @Felldeadbird 老哥说的对,哪怕没有这些 ai 可能也逃不了被优化
    577322753
        44
    577322753  
       24 分钟前
    @billzhuang 你说的 code review ,不就是他说的需要人来确认吗
    connor123
        45
    connor123  
       23 分钟前
    @cloudnb 追求数据安全是假,怕暴露自己有多拉跨是真
    BlackDoge
        46
    BlackDoge  
       13 分钟前
    up 的 codename 是啥…
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   4485 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 01:31 · PVG 09:31 · LAX 17:31 · JFK 20:31
    ♥ Do have faith in what you're doing.