Claude Code思考深度降67%,老金找到个深度数据说明案例,还有怎么破

0 阅读7分钟

这两天Claude Code社区炸了。 有人翻了6852次会话记录,发现Claude Code的思考深度从1月到2月底,降了67%。 老金我第一反应是:不会吧,我自己天天用,没感觉啊。 结果看完数据,沉默了。

今天老金我帮你把这件事从头到尾拆一遍。 数据、原因、官方回应、临时修复方案,全给你。

先看数据,数据不会说谎

这件事的源头是GitHub上Claude Code的一个issue,编号#42796。 github.com/anthropics/…

发帖人是AMD的AI总监Stella。

Image

她分析了6852条会话日志,17871个思考块,234760次工具调用。

Image

核心数据如下。

思考深度:从2200字符降到720字符 1月份的基线是每次思考平均2200个字符。 到2月底,降到720个字符。 降幅67%。 你的AI助手从"写论文"变成了"写短信"。

Image

Image

先读后改的比例:从6.6降到2.0 正常编程工作流是先读懂代码再改。 1月份每改1次代码,平均先读6.6次。 到2月底,变成只读2次就改。 降幅70%。 意味着AI开始"不看就改"。

Image

不看就改的比例:从6.2%涨到33.7% 这个数据更吓人。 1月份只有6.2%的修改是没先读代码就动手的。 到2月底,三分之一多的修改都是盲改。 这在复杂项目里就是灾难。

Image

用户打断率:翻了12倍 1月份每1000次工具调用,用户只打断0.9次。 到2月底,打断11.4次。 说明用户越来越不满意AI的输出,频繁手动干预。

Image

成本:从345美元涨到42121美元 2月份总成本345美元。 3月份同样的使用量,成本42121美元。 涨了122倍。 你花更多的钱,得到更差的结果。

Image

还有几个辅助数据。 推理循环从每千次8.2涨到26.6,翻了3倍多。 用户沮丧指标从5.8%涨到9.8%。 情感比率从4.4:1降到3.0:1,正面情绪崩了32%。

如果对你有帮助,记得关注一波~

官方怎么回应的

这个issue发出后,Anthropic的Claude Code团队的人(Boris)出来做了官方回应。

他说造成深度下降的原因有两个。

第一,Opus 4.6自适应思考默认开启(2月9日) Opus 4.6发布时引入了"自适应思考"机制。 AI会自己判断任务复杂度,决定思考多深。 简单任务想少点,复杂任务想多点。 听起来合理,但实际执行中,AI倾向于把所有任务都判断为"简单"。

第二,Medium effort默认值设为85(3月3日) Claude Code的思考强度有一个effort参数。 0是不思考,100是全力思考。 3月3日的更新把默认值设成了85。 看起来不低,但配合自适应思考一起用,效果被放大了。

Boris还澄清了一件事:很多人以为是redact-thinking(思考内容折叠显示)导致的。 他说这只是UI层面的变化,不影响实际思考深度。

临时修复方案

官方给了三个临时方案。

方案一:手动设置高努力模式 在对话中输入 /effort high。 每次会话都要手动输一次。 这个方案最简单,但容易忘。 CCS里可以直接开启它。

Image

方案二:环境变量关闭自适应思考 设置环境变量 CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1。 加到你的shell配置文件里,永久生效。

方案三:开启思考摘要显示 在设置里打开 showThinkingSummaries: true。 让你能看到AI到底想了多少,方便判断是否偷懒。

但Stella(报告作者)说了,即使三个方案全用上,思考深度大概也只能恢复到原来的十分之一。 不是完全恢复。

社区反应

老金我翻了Reddit的讨论,300多条评论。 大部分人都在说同一件事:"难怪最近Claude Code变蠢了"。

有人晒了自己的使用日志,数据趋势和Stella的报告完全吻合。 有人说已经切换到Codex和GPT了。 也有人说自己没感觉到变化,因为他们习惯把任务拆得很细,每个子任务比较简单,影响不大。

中文社区这边反应也很强烈。 华尔街见闻的标题直接写"思考深度骤降67%,无法再信任其处理复杂工程任务"。 新浪财经用了"翻车"这个词。 知乎和linux.do上都在讨论。

老金的实话

说几个值得注意的事。

这件事的本质是效率优化翻车了 Anthropic的出发点是好的。 自适应思考能省Token,能提速度。 但问题是,优化效率不能以牺牲质量为代价。 特别是编程这种容错率极低的场景。 一个"不看就改"就能把你的项目搞崩。

122倍成本增长触目惊心 从345到42121美元。 用户没多干什么活,钱涨了122倍。 这已经不是效率问题了,是商业信任问题。 你省钱省到了用户头上,还让用户买单。

官方回应态度还可以但不够 Boris出来回应了,给了临时方案,说了未来计划。 这些都值得肯定。 但临时方案不能完全恢复,这是事实。 Teams和Enterprise版本未来会默认高努力模式,但个人用户呢? 老金我自己就是个人用户,我等不起。

这件事会改变AI编程工具的竞争格局 Claude Code过去半年是AI编程工具的王牌。 Cursor、Windsurf、Codex都在追。 这次翻车,给了竞对一个窗口期。 已经有人开始试Codex了。

谁需要做什么

如果你是Claude Code重度用户 立刻设置环境变量 CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1。 每次开复杂任务前输 /effort high。 这不是可选的,是必须的。

如果你是企业团队 关注Anthropic后续的Teams版本更新。 默认高努力模式是企业版才有的待遇。 评估一下近期是否需要临时切换工具。

如果你偶尔用Claude Code 影响不大。 简单任务的自适应思考没有明显问题。 只有跨文件、复杂逻辑的任务才会受影响。

如果你在选AI编程工具 暂时别把鸡蛋放一个篮子里。 Claude Code还是最强的,但这次的信任裂痕需要时间修复。 同时关注Cursor和Codex的进展。

老金我自己已经开始在复杂项目里强制用high effort了。 简单任务无所谓,复杂任务绝对不能让它偷懒。 你们现在的使用体验怎么样? 评论区聊聊,老金我很想知道你们有没有感觉到变化。


飞书****开源知识库(实时更新 交流群**):** tffyvtlai4.feishu.cn/wiki/OhQ8wq…

Claude Code & Openclaw 双顶流全中文从零开始的教程:不懂代码照样造网站,老金15万字Claude Code+OpenClaw教程免费开源

我的小破站(含我开源的项目):www.aiking.dev/


每次我都想提醒一下,这不是凡尔赛,是希望有想法的人勇敢冲。 我不会代码,我英语也不好,但是我做出来了很多东西。 我真心希望能影响更多的人来尝试新的技巧,迎接新的时代。

谢谢你读我的文章。 如果觉得不错,随手点个赞、在看、转发三连吧🙂 如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章。