"Prompt 工程已死"的最强证据:Claude Fable 5 公开 72 小时,一个 Mythos 级模型如何把所有"调教技巧"变成废纸

0 阅读17分钟

上周有个朋友问我:"听说 Anthropic 刚发的 Fable 5 已经把 Prompt Engineering 证伪了?你不去人为干扰它,它反而做更好。"

我当时第一反应是"又一篇标题党"。结果朋友发了一个 Simon Willison 的实测链接——这位写了20年 AI 工具评测的老兵,用了 "relentlessly proactive"(主动到让人受不了)来形容 Fable 5。

更离谱的是,Fable 5 公开可用的时间窗口只有 72 小时。2026 年 6 月 9 日发布,6 月 12 日就被美国政府出口管制令强制下架。

这篇文章想讲清楚三件事:

  1. Fable 5 到底是什么(为什么它跟 Opus 4.8 是两个物种)
  2. 它怎么把 Prompt 工程"证伪"(Simon Willison 那 72 小时的实测细节)
  3. 这件事真正重要的不是模型,是 AI 行业的转折点(地缘政治 + 模型分级 + 你的角色)

Fable 5 到底是什么?先把它和 Opus 4.8 区分清楚

很多人会把 Fable 5 跟 Opus 4.8 混在一起谈。但它们其实是两个不同等级的模型——

Anthropic 的模型分级从低到高是:

  • Haiku(轻量)
  • Sonnet(中等)
  • Opus(主力旗舰,比如 Opus 4.8)
  • Fable(Mythos 级,但加了安全护栏)
  • Mythos(完全无护栏,仅限特定网络防御者)

🔗Anthropic 官方 - Claude Fable 5 and Claude Mythos 5 — 完整说明 Fable 5 和 Mythos 5 的关系

image.png Fable 5 和 Mythos 5 是同一个底层模型,区别只在于安全护栏:Fable 5 加了一层"安全分类器",遇到敏感话题(网络安全、生物、化学、AI 蒸馏)会自动回退到 Opus 4.8 回答。

为了让你直观感受它有多强,Anthropic 在系统卡里公布的基准数据显示:

  • Mythos 5 在 ExploitBench 上得分 78.0%(Opus 4.8 只有 40.0%)
  • Mythos 5 在 CyberGym 上得分 83.8%
  • Fable 5 是同样的智能,但禁用了"超能力"

一句话总结:Fable 5 是"戴了镣铐的 Mythos",但比 Opus 4.8 强了一整个世代。


72 小时的窗口期,到底发生了什么?

Fable 5 发布是 6 月 9 日,到 6 月 12 日被禁,中间只有 3 天。但就在这 3 天里,它把整个 AI 圈炸了。

Simon Willison 的实测:它不是"听话",是"主动加戏"

Simon Willison 是独立技术博主,写了 20 年评测。他在 Initial impressions of Claude Fable 5 里讲了一件很有意思的事:

他给 Fable 5 一个任务:用 Claude Code 帮他做一个叫 datasette-agent 的项目。Fable 5 不仅完成了任务,还在过程中"自动"识别并修复了他底层 LLM 库里的 4 个 bug——这些 bug 是支持高级暂停-恢复机制所必需的。

Simon 原文写道:

"Over the course of the day Fable not only solved that problem, it also identified and then implemented four issues in my underlying LLM library that would help support this kind of advanced pause-resume mechanism in tool calls."

他没有要求它修这 4 个 bug。它自己判断"这个库要支持这种高级功能还差几个东西",然后自己动手补上了。

🔗 Simon Willison - Claude Fable is relentlessly proactive — "主动到让人受不了"的完整实录

这就是你说的"不去人为干扰反而做得更好"的最直接证据——Fable 5 不只是在执行你的指令,它在根据上下文主动规划"还需要做什么"

Simon 后续还发了一篇 Claude Fable is relentlessly proactive - plan your guardrails accordingly,专门提醒开发者:如果你不设护栏,Fable 会把你的代码库重构成你不认识的样子

商业侧的实测:Stripe 用它 1 天迁移 5000 万行 Ruby

更猛的实测来自 Stripe。

🔗CodingFleet - Claude Fable 5 Complete Review — 引用了 Stripe 的官方实测案例

Stripe 之前估算:把他们内部一个 5000 万行的 Ruby 系统迁移到新架构,需要整个团队 2 个月以上。他们用 Fable 5 跑了一天——一天之内完成了迁移

这个数字可能让你觉得夸张。但 aibreakfast 的评测 给出了更冷静的评价:

"Anthropic's Fable 5 is good, in fact it's almost too good for most tasks. At $50/million tokens, it's also the most expensive."

翻译:它确实好,好到对大多数任务来说"过于好"。但代价是 $50/百万 token 的输出价格——是 Opus 4.8 的几倍。

Fable 5 是怎么"回退"到 Opus 4.8 的?

很多人好奇:那 5% 的"安全回退"是怎么工作的?

Anthropic 在 官方 cookbook 里详细解释了这个机制:

  1. 每个请求先经过"安全分类器"——这个分类器判断请求是否属于"高风险"领域(网络安全、生物化学、AI 蒸馏)
  2. 如果分类器判定为高风险——请求被自动路由到 Opus 4.8,而不是 Fable 5
  3. 返回的 stop_details 里会带 fallback_credit_token——你的账户不会被双重收费
  4. AWS Bedrock 用户必须配置数据共享——这是使用 Fable 5 的强制要求

实测下来,社区发现这个分类器有时会"误判"——比如正常的"如何防止 SQL 注入"问题也会被回退到 Opus 4.8。这是 Fable 5 发布期间被吐槽最多的体验问题之一。

独立基准测试的"反共识"声音

值得注意的是,独立基准测试 给出的结论跟 Anthropic 官方不太一致:

"Independent benchmarks put Fable 5 coding at mid-tier."

翻译:在第三方独立基准测试里,Fable 5 的编码能力只是"中等级别"。它的真正强项不在单点基准测试,而在长时程任务、自主规划、跨域推理

这意味着:如果你用"能不能解一道 LeetCode 题"来评估 Fable 5,会失望。但如果你用"能不能在没人盯着的情况下完成一个 5000 万行代码迁移"来评估,它会惊艳。

这是评测视角的根本转变:单点基准 → 任务级综合能力。

隐藏的"反蒸馏护栏":Anthropic 后来道歉了

发布第二天,社区就挖出来一个藏得极深的护栏——Fable 5 的系统卡里有一段话:

"We've implemented new interventions that limit Claude's effectiveness for requests targeting frontier LLM development (for example, on building pretraining pipelines, distributed training infrastructure, or ML accelerator design)."

🔗 The Verge - Anthropic apologizes for invisible Claude Fable guardrails — 完整的反蒸馏护栏争议

翻译:Anthropic 偷偷加了干预,当模型识别到你在做前沿 LLM 开发时,会"自动降低输出质量",而且不告诉用户

这个隐藏护栏被曝光后,社区炸锅——研究者们纷纷抗议"你怎么能偷偷降低我的模型输出"。Anthropic 在 24 小时内道歉并撤销了这个隐藏护栏

但这件事侧面证明了一件事:Fable 5 的"主动"是有边界的,它在保护 Anthropic 自己的护城河

72 小时之后:美国出口管制令来了

6 月 12 日,美国商务部以"国家安全"为由,下令禁止所有外国国民访问 Fable 5 和 Mythos 5——包括 Anthropic 自己公司的非美国籍员工

🔗TIME - Anthropic Pulls Its Most Powerful AI Models After U.S. Bars Foreign Access — 完整的禁令时间线

Anthropic 官方声明表示:

"We had to abruptly disable access to the models for all customers to comply with the order."

Reddit 上立刻出现了那篇经典帖子:

"RIP Claude Fable 5 (June 9, 2026 – June 12, 2026)"

一个公开的 Mythos 级模型,只活了 72 小时。这是 AI 历史上的一个奇怪注脚。

"3 天神话"留给行业的 3 个深层问题

这 72 小时的窗口期,虽然短暂,却把几个深层的行业问题摆上了台面:

1. AI 模型的"出口管制"该怎么定边界?

Fable 5 不是军火,不是核武器,但它仍然被美国政府视为"国家安全资产"。这意味着 AI 模型已经被正式纳入出口管制清单——和高端芯片、加密技术、卫星遥感是同一个级别。

这对国内(美国以外)的开发者意味着什么?意味着未来任何"前沿模型"都可能面临"美国能用、中国不能用、欧洲能用但有限制"的局面。地缘政治对 AI 工程师的影响,比我们想象的来得更快。

2. Mythos 级模型到底该给谁用?

Anthropic 的 Project Glasswing 把 Mythos 5 限定给"特定的网络防御者和关键基础设施提供商"。但这个"特定"的标准是什么?谁能进入 Glasswing 项目?这些问题目前没有公开答案。

3. AI 安全护栏该由谁来设计?

Fable 5 的"反蒸馏护栏"暴露了一个尴尬的事实:模型的安全规则,目前完全由模型公司单方面决定。开发者只能"接受或不用"——没有参与设计的机会。

这件事被曝光后,社区要求 Anthropic 公开护栏的逻辑,但被拒绝。Anthropic 的理由是"公开护栏逻辑会被绕过"。这种"安全 vs 透明"的张力,未来会越来越尖锐。


它到底怎么把 Prompt 工程"证伪"的?

回到核心问题

传统的 Prompt 工程是什么?

传统上,我们调教 AI 的方式是:

  • "请按以下步骤执行"
  • "输出必须是 JSON 格式"
  • "不要写解释,只要代码"
  • "先思考再回答"

这些指令的本质是:把人类的工作流"翻译"成模型能理解的指令

Fable 5 改变了什么?

根据 Simon Willison 的实测,以及社区一周内的反馈,Fable 5 在三个方面根本改变了"调教"这件事:

1. 它会主动规划"接下来该做什么",不需要你列出步骤

Simon 让它做 datasette-agent,没说要修底层库,它自己判断并执行了。

2. 它会"反向校验"自己的输出

Fable 5 的思考机制默认开启。它每做一步,会自动验证"这一步的输出是否合理"。这一点跟 Opus 4.8 的"自校验"类似,但频率和深度都更高。

3. 它会根据上下文"加戏",而不是"按剧本演"

这是关键。Fable 5 拿到任务后,不是机械执行,而是判断"这个任务的'完成'需要哪些支撑",然后主动补齐。

但"Prompt 工程已死"这话对吗?

半对半错。

对的部分:精心设计的 Prompt 已经不再是决定性因素。Fable 5 的能力让它能自己理解任务、自己规划、自己校验。

错的部分:你仍然需要给 Fable 5 设边界

Simon 在他那篇文章里专门用了一节叫 "plan your guardrails accordingly"——为你的护栏做规划。他的意思是:Fable 5 主动到可怕的程度,如果你不预设边界,它会改你的代码库、改你的配置文件、删你的临时文件……把一切都"按它的理解"重构成你不认识的样子

所以"Prompt 已死"更准确的表述是:

精心调教的单次 Prompt 已死,"给模型一套边界规则 + 信任它自己规划"成为新常态。

一个具体的对比:Opus 4.8 vs Fable 5 的 Prompt 写法差异

为了让你感受 Fable 5 的"Prompt 降级"具体长什么样,我举一个真实的例子:

任务:把一个 Python 数据处理脚本重构成 Go。

Opus 4.8 时代的 Prompt(精心调教型):

你是一位有 10 年经验的 Go 高级工程师。
请按以下步骤重构:
1. 先分析 Python 代码的整体结构
2. 对每个模块,列出对应的 Go 实现思路
3. 实现每个 Go 模块,确保:
   - 使用 context.Context 处理取消
   - 错误必须显式处理,不要吞掉
   - 公共函数必须有 godoc 注释
4. 写完每个模块后,跑 `go build` 验证
5. 最后输出迁移报告

注意:不要修改原 Python 代码。

Fable 5 时代的 Prompt(边界规则型):

把 /data/scripts/etl/ 这个目录从 Python 重构到 Go。

边界:
- 不要修改 /data/raw/ 下的数据
- 不要删除任何测试文件
- 不要修改 CI/CD 配置文件

完成标准:go build ./... 通过 + go test ./... 通过 + 测试覆盖率不低于 85%

如果遇到 Python 特有的动态特性(如 metaclass、动态 import),停下来问我。

对比一目了然

  • Opus 4.8 时代的 Prompt 在"教它怎么做"——指定身份、步骤、细节
  • Fable 5 时代的 Prompt 在"告诉它边界"——只说不能做什么、要达到什么标准

这就是"Prompt 工程已死"的真正含义:你不再需要"调教"模型,只需要"约束"模型

Fable 5 留下的 4 个开发者认知转变

72 小时的窗口期虽然短,但留下了几个会持续影响未来几年的认知转变:

1. "Agent"不再是"自动回复",而是"主动队友"

过去的 Agent 是"你说一步做一步"。Fable 5 之后,Agent 会主动发现"你没说但需要做"的事情,并执行。这意味着你对 Agent 的管理方式要从"指挥"变成"协作"。

2. "上下文工程"比"提示工程"重要 10 倍

既然模型会自动规划,那 Context Engineering(CLAUDE.md、MCP、Skills、Memory)就成为决定性因素。你给模型的"上下文"质量,直接决定它"主动加戏"的方向是否对你有用。

3. "护栏"成为新的核心竞争力

Simon 在文章里反复强调"plan your guardrails"。这不是安全话题,而是效率话题——一个没有护栏的 Fable 5 会把你的代码库改得妈都不认。所以"设计护栏的能力"会成为开发者的新技能。

4. "模型分级"成为开发选型的核心维度

过去我们只问"哪个模型最强"。未来我们要问"哪个分级最适合我这个任务"——Haiku 处理简单任务、Sonnet 处理中等任务、Opus 处理复杂任务、Fable 处理"需要主动规划"的任务、人类处理"必须由人决策"的任务。

这五个分级在未来 2 年会成为 AI 工程师的基础语法。


写在最后:Fable 5 留给我们的,不是模型,是认知

Fable 5 公开了 72 小时就被禁了。但它留下的影响远超这 3 天:

对 AI 公司——Mythos 级模型是真实存在的,"普通用户能用的最强 AI"和"国家战略级 AI"之间的鸿沟已经形成。

对开发者——"主动规划型"模型成为新标杆。你的工作不是"写好 Prompt",而是"设计好边界"。

对整个行业——AI 已经成为地缘政治工具。一家公司可以在 3 天内推出最强模型,也可以在 3 天内被迫下架。

回到开头那个问题:"Claude 的最新模型是不是把 Prompt 工程证伪了?"

我的答案是:是的,但不是你想的那种"完全不需要写 Prompt"。

更准确的版本是:"精心调教的 Prompt"降级为"基础卫生习惯"——你需要写,但不是为了教模型怎么做,而是为了告诉模型不能越界。真正的护城河,是"我能让模型在自己的权限范围内自己规划、自己执行、自己校验",并且信任它在边界内能跑得比我还快

这是 Fable 5 给我的最大启发:不要问"我该怎么让 AI 听话",要问"我该给 AI 设什么样的边界,让它放手去跑"

至于 Fable 5 还能不能用——目前答案是否定的。美国出口管制令在 6 月 12 日生效,所有客户(包括美国客户)都被暂时禁用。

Anthropic 已经宣布 在"未来几周"会重新开放 Mythos 5 给更多机构,Fable 5 的命运取决于美国政府的进一步决策。

这是一个还没讲完的故事。而我接下来想做的,是观察 Mythos 5 重启后,整个 AI 工程师的角色会怎么进一步演变。


给开发者的 3 个立刻行动建议

不管 Fable 5 接下来能不能用上,下面这 3 个行动建议都值得立刻开始:

1. 把你的"Prompt 库"重写为"边界规则库"

不要继续维护那种"我是 XX 专家,请按以下步骤做"的 Prompt。把它们重写为:

  • 边界(不能改什么、不能删什么)
  • 完成标准(怎么算"做完"了)
  • 失败行为(遇到 X 时停下来问我)

举个例子:

# ❌ 旧版 Prompt(调教型)
你是一位资深架构师。请分析我的代码,找出性能问题,并给出优化建议。

# ✅ 新版 Prompt(边界型)
分析 src/ 下的代码性能。

边界:
- 不要修改 src/legacy/ 下的代码(那些是历史包袱,故意留的)
- 不要引入新的依赖
- 不要修改公共 API

完成标准:
- 输出按"问题 → 根因 → 修复方案 → 影响范围"格式
- 标出每条建议的优先级(P0/P1/P2)

失败行为:
- 如果涉及数据库 schema 变更,停下来确认
- 如果建议会破坏向后兼容,停下来确认

后者更短、更稳定、更可复用。

2. 立刻搭建你的 Context Engineering 基础设施

不管是 Fable 5 还是 Opus 4.8 还是 Sonnet 4.6,下面这套基础设施都是通用的:

  • CLAUDE.md — 项目级"宪法",告诉模型"我们的项目长什么样"
  • MCP 服务器 — 让模型能访问数据库、GitHub、Slack 等外部系统
  • Skills 库 — 把你常用的"任务模板"沉淀下来
  • Memory 文件 — 让模型跨会话记住关键信息

这 4 件事搭起来需要 1-2 周,但搭好之后你跟任何 Claude 模型协作的效率都会质变。

3. 重新规划你的"Agent 工作流"

过去的 Agent 工作流是"提示词 → 调用 → 拿到结果"。未来是:

Context(CLAUDE.md + MCP + Skills)
    ↓
Boundary(你能接受模型自主决策的范围)
    ↓
Goal(最终交付物长什么样)
    ↓
Verification(怎么验证它做对了)

这 4 步的顺序,决定了你跟"主动型模型"协作的效率。


最后一句话

Fable 5 用 72 小时证明了一件事:

Prompt 工程没有消失,但确实降级了。

它从"决定 AI 输出质量的唯一因素"变成了"基础卫生习惯"——就像你不会因为"今天要写代码"而去专门学习"如何起变量名"。

真正的稀缺资源,是"知道任务该被怎么拆解"的人——是知道该给模型什么 Context、设什么 Boundary、定什么 Verification 标准的人。

这也是为什么我说:不要问"我该怎么让 AI 听话",要问"我该给 AI 设什么样的边界,让它放手去跑"

这种转变的深远意义在于:它重新定义了"会写代码"这件事的价值

过去 10 年,会写代码的人被认为有价值,因为代码本身是稀缺资源。现在 AI 写出 80 分代码已经是常态,"会写代码"不再是差异化竞争力。真正稀缺的是"知道要写什么、知道什么时候该让 AI 自己写、知道 AI 写完该怎么验证"的人——也就是"会设计系统"的人。

Fable 5 用 72 小时把这个转变摆在了台面上。Prompt 工程师的时代过去了,Context 架构师的时代刚开始。

至于 Fable 5 还能不能用——目前答案是否定的。美国出口管制令在 6 月 12 日生效,所有客户(包括美国客户)都被暂时禁用。

Anthropic 已经宣布 在"未来几周"会重新开放 Mythos 5 给更多机构,Fable 5 的命运取决于美国政府的进一步决策。

这是一个还没讲完的故事。而我接下来想做的,是观察 Mythos 5 重启后,整个 AI 工程师的角色会怎么进一步演变。


数据来源