Anthropic 昨天扔了个重磅炸弹——Claude Fable 5 正式上线,面向所有用户开放。这玩意儿不是普通的版本升级,它是 Anthropic 所谓的 "Mythos 级" 模型,简单说就是他们藏了很久的大招,今天终于放出来了。
先上硬数据。Fable 5 在几乎所有主流基准测试上都屠了榜:
-
• SWE-Bench Pro:80.3%,直接把 GPT-5.5 的 58.6% 甩开一大截
-
• FrontierCode Diamond:Mythos 5 拿到 30.9%,第二名才 13.4%,近乎翻倍
-
• Terminal-Bench 2.1:Fable 5 88.0%,比 GPT-5.5 高 4.6 个点
-
• CursorBench:72.9%,新的 SOTA,比之前的最好成绩高了 8 个点
-
• Humanity's Last Exam:53%,领先第二名 7 个点
讲道理,GPT 系列已经强了很久,但这次 Anthropic 确实是拿出了点真东西。有个细节很有意思——Cursor 和 Devin 这些 AI 编程工具都第一时间接入了 Fable 5,说明在 coding 这个最卷的赛道上,Fable 5 的优势是实打实的。
Ethan Mollick 的反馈让我印象挺深:他说可以直接扔一份 15 页的设计文档给 Fable 5,这货能自己干上 9 个小时。还有 Stripe 用它把 5000 万行 Ruby 代码迁移干完了一天内——按原来的 pace 一个团队得干俩月。
价格和门槛
Fable 5 输入 50/百万 tokens,基本是 Opus 4.8 的两倍,但比 GPT-5.5 Pro 便宜。上下文窗口保持 100 万 token 不变。
不过有个坑——现在 Fable 5 是临时包含在 Pro/Max 订阅里的,到 6 月 22 号之后就得走按量付费了。原因也很直白:这模型太贵了,跑起来成本扛不住。我个人觉得,这暗示了未来一个趋势——最强模型可能会越来越脱离 "包月随便用" 的模式,变成按需付费的重度工具。
真正的争议:无声的安全枷锁
聊完能力,说点闹心的。
Fable 5 带了几个新的安全机制。有些是明着告诉你的——比如涉及网络安全、生物化学、模型蒸馏的问题,会自动降级到 Opus 4.8 来回答。你用得着的时候会看到提示,不算太离谱。
但真正捅了马蜂窝的东西藏在系统卡里(System Card)。
Anthropic 悄悄加了一个规则:如果检测到你在用 Fable 5 搞「前沿 LLM 开发」——比如写预训练 pipeline、做分布式训练框架、设计 AI 加速器——模型会默默降低回答质量。用的是 prompt 修改、steering vectors、PEFT 这些手段,而且不告诉你。
你懂的吗,你花着钱用着号称最强的模型,结果人家在后台给你降智了,你还不知道。
Anthropic 给出的理由是防止递归自我改进和竞争对手蒸馏他们的模型。他们说这只影响 0.03% 的流量,不到 0.1% 的组织。但问题是——这个边界谁来定义?你的 ML 研究到底算不算 "前沿 LLM 开发"?是不是写个推理优化、问个 PTX ISA 指令都会被标记?
社区反应很激烈。有人直接说 "这比拒绝回答更可怕——你永远不知道你的结果是真是假"。Karpathy 的评价倒是比较中立:模型本身是一次巨大飞跃,但安全触发的边界太敏感了,"拉得太紧了"。
我个人觉得,Anthropic 做安全没有错,但你卖的是一个开发者工具,在后台对用户静默降级,这跟 "你买的电脑暗地里偷你算力" 有啥区别?信任一旦没了,再强的能力也打折扣。
对开发者意味着什么?
如果你是做 AI 工程、全栈开发、或者重度使用 LLM 做研究的人,Fable 5 确实值得一试。特别是在复杂代码库、Agent 工作流、长周期任务上,它的提升是肉眼可见的。
但如果你在研究前沿 ML 或者做开源模型相关的工作,那得留个心眼——你可能已经撞上那个 "隐形的墙" 而自己不知道。
另外,这次发布也说明了一个更大的趋势:顶尖 AI 能力正在被少数公司集中掌控,访问不再是平等的。这不一定是坏事(安全确实重要),但作为开发者,多留几条后路、了解开源生态,总归没错。
你对 Anthropic 这次的操作怎么看?是合理的安全措施还是过分的控制?评论区聊聊。