mains's recent timeline updates
mains

mains

V2EX member #200090, joined on 2016-11-06 14:56:41 +08:00
Today's activity rank 206
Per mains's settings, the topics list is hidden
Deals info, including closed deals, is not hidden
mains's recent replies
强迫症如我,做了几十个平台的支持 😂
![]( )

![]( )
twitter:

你说巧不巧

GPT 5.5 刚发布,Anthropic 就说他们找到了 Claude 最近降智的原因了,并且修复了它...🙃

Anthropic 称"Claude 变笨了"归结为三个独立但叠加的变更,全部已在 4 月 20 日 v2.1.116 修复。

20 号修复,今天才公布,而且我感觉并没有修复的迹象...

三个问题分别发生在 3 月 4 日、3 月 26 日、4 月 16 日:

① 3 月 4 日,把默认思考时长从"长"调成"中"。

原因是 high 模式下 Claude 偶尔想太久,UI 像卡死了。内部测下来 medium 智能只掉一点点、速度快很多,就换了默认值。结果用户明显感觉变笨。4 月 7 日改回来,现在 Opus 4.7 默认 xhigh ,其他模型默认 high 。

② 3 月 26 日,一个缓存优化写出了 bug 。

本来只是想在会话闲置超过一小时后,清理一次老的思考记录省点 token 。结果实现成了此后每一轮都在清,Claude 越干越不记得自己为什么干,表现出来就是健忘、重复、工具乱用。顺带还让用户的额度掉得比平时快,因为每次都缓存没命中。4 月 10 日修好。

③ 4 月 16 日,为了让 Opus 4.7 少废话,在 system prompt 里加了一条指令:

"工具调用之间文本 ≤25 词,最终回复 ≤100 词(除非任务需要更多细节)。"

内部评测跑了几周没发现问题,就跟 Opus 4.7 一起上了。后来用更广的评测集一条条删 prompt 测,才发现这句话让 Opus 4.6 和 4.7 都掉了 3%。4 月 20 日回滚。

为什么这么久才发现: 三个变更影响的用户群和时间段都不一样,合起来看就是"Claude 好像变笨了但说不清楚哪里笨"。第二个 bug 还碰巧被两个不相关的内部实验给盖住了,内部员工自己用都没复现出来,定位花了一周多。
5 days ago
Replied to a topic by mains OpenAI Codex 周额度又刷新了,省着用的血亏
又刷新了,亏大了。哎 😑
6 days ago
Replied to a topic by mains OpenAI Codex 周额度又刷新了,省着用的血亏
@Hilong https://limitwatch.app/ 这个. 😂 ,我感觉这个需求太小众,身边同事没一个需要的。
6 days ago
Replied to a topic by mains OpenAI Codex 周额度又刷新了,省着用的血亏
@cqyxy2510 #14 `claude -p 你是什么模型` 这种, 然后 crontab 定期跑。否则 claude/codex 都会血亏,他们按你交互后,才开始记 weekly 额度开始
6 days ago
Replied to a topic by mains OpenAI Codex 周额度又刷新了,省着用的血亏
`claude -p 你是什么模型` 这种
6 days ago
Replied to a topic by mains OpenAI Codex 周额度又刷新了,省着用的血亏
@Mzs #13 https://limitwatch.app/zh/ 自娱自乐的一个玩意,非常小众的一个需求😂。

- Mac 有 island/会话归集/push 网关。
- iOS/Watch 收通知,witget 、灵动岛渲染之类。

![MJlF7hI]( )
6 days ago
Replied to a topic by mains OpenAI Codex 周额度又刷新了,省着用的血亏
@Mzs #5 我写的一个 app ,watch/iOS/Mac 都有
6 days ago
Replied to a topic by mains OpenAI Codex 周额度又刷新了,省着用的血亏
@carverReal #1 反重力哎,20$ pro 用不了几次。Claude 每周一高峰期,完全用不了。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   3191 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 14:27 · PVG 22:27 · LAX 07:27 · JFK 10:27
♥ Do have faith in what you're doing.