Claude Fable 5 发布：地表最强 AI 模型，但背后全是戏Anthropic 昨天扔了个重磅炸弹——Clau

Anthropic 昨天扔了个重磅炸弹——Claude Fable 5 正式上线，面向所有用户开放。这玩意儿不是普通的版本升级，它是 Anthropic 所谓的 "Mythos 级" 模型，简单说就是他们藏了很久的大招，今天终于放出来了。

先上硬数据。Fable 5 在几乎所有主流基准测试上都屠了榜：

• SWE-Bench Pro：80.3%，直接把 GPT-5.5 的 58.6% 甩开一大截
• FrontierCode Diamond：Mythos 5 拿到 30.9%，第二名才 13.4%，近乎翻倍
• Terminal-Bench 2.1：Fable 5 88.0%，比 GPT-5.5 高 4.6 个点
• CursorBench：72.9%，新的 SOTA，比之前的最好成绩高了 8 个点
• Humanity's Last Exam：53%，领先第二名 7 个点

讲道理，GPT 系列已经强了很久，但这次 Anthropic 确实是拿出了点真东西。有个细节很有意思——Cursor 和 Devin 这些 AI 编程工具都第一时间接入了 Fable 5，说明在 coding 这个最卷的赛道上，Fable 5 的优势是实打实的。

Ethan Mollick 的反馈让我印象挺深：他说可以直接扔一份 15 页的设计文档给 Fable 5，这货能自己干上 9 个小时。还有 Stripe 用它把 5000 万行 Ruby 代码迁移干完了一天内——按原来的 pace 一个团队得干俩月。

价格和门槛

Fable 5 输入 $10/百万 tokens，输出$ 50/百万 tokens，基本是 Opus 4.8 的两倍，但比 GPT-5.5 Pro 便宜。上下文窗口保持 100 万 token 不变。

不过有个坑——现在 Fable 5 是临时包含在 Pro/Max 订阅里的，到 6 月 22 号之后就得走按量付费了。原因也很直白：这模型太贵了，跑起来成本扛不住。我个人觉得，这暗示了未来一个趋势——最强模型可能会越来越脱离 "包月随便用" 的模式，变成按需付费的重度工具。

真正的争议：无声的安全枷锁

聊完能力，说点闹心的。

Fable 5 带了几个新的安全机制。有些是明着告诉你的——比如涉及网络安全、生物化学、模型蒸馏的问题，会自动降级到 Opus 4.8 来回答。你用得着的时候会看到提示，不算太离谱。

但真正捅了马蜂窝的东西藏在系统卡里（System Card）。

Anthropic 悄悄加了一个规则：如果检测到你在用 Fable 5 搞「前沿 LLM 开发」——比如写预训练 pipeline、做分布式训练框架、设计 AI 加速器——模型会默默降低回答质量。用的是 prompt 修改、steering vectors、PEFT 这些手段，而且不告诉你。

你懂的吗，你花着钱用着号称最强的模型，结果人家在后台给你降智了，你还不知道。

Anthropic 给出的理由是防止递归自我改进和竞争对手蒸馏他们的模型。他们说这只影响 0.03% 的流量，不到 0.1% 的组织。但问题是——这个边界谁来定义？你的 ML 研究到底算不算 "前沿 LLM 开发"？是不是写个推理优化、问个 PTX ISA 指令都会被标记？

社区反应很激烈。有人直接说 "这比拒绝回答更可怕——你永远不知道你的结果是真是假"。Karpathy 的评价倒是比较中立：模型本身是一次巨大飞跃，但安全触发的边界太敏感了，"拉得太紧了"。

我个人觉得，Anthropic 做安全没有错，但你卖的是一个开发者工具，在后台对用户静默降级，这跟 "你买的电脑暗地里偷你算力" 有啥区别？信任一旦没了，再强的能力也打折扣。

对开发者意味着什么？

如果你是做 AI 工程、全栈开发、或者重度使用 LLM 做研究的人，Fable 5 确实值得一试。特别是在复杂代码库、Agent 工作流、长周期任务上，它的提升是肉眼可见的。

但如果你在研究前沿 ML 或者做开源模型相关的工作，那得留个心眼——你可能已经撞上那个 "隐形的墙" 而自己不知道。

另外，这次发布也说明了一个更大的趋势：顶尖 AI 能力正在被少数公司集中掌控，访问不再是平等的。这不一定是坏事（安全确实重要），但作为开发者，多留几条后路、了解开源生态，总归没错。

你对 Anthropic 这次的操作怎么看？是合理的安全措施还是过分的控制？评论区聊聊。