Anthropic 内部文档泄露背后:Claude Mythos 到底意味着什么
上周 AI 圈最大的瓜,不是哪家发了新模型,而是 Anthropic 被自己人坑了——CMS 后台权限没关,近 3000 份内部文件直接裸奔在公网,被《Fortune》记者扒了个干净。
事情的起因非常低级。Anthropic 使用的外部 CMS 工具,上传资产默认公开可访问,除非手动切换为私密。剑桥大学网络安全研究员 Alexandre Pauwels 后续验证了这批材料的真实性。Anthropic 发言人也没法否认,直接确认了核心内容。
但真正让行业震动的不是泄露本身,而是泄露出来的东西:一个从未对外公布的模型——Claude Mythos。
一个凌驾于 Opus 之上的新层级
搞清楚 Mythos 的定位,得先看 Anthropic 现有的产品线。Claude 家族一直是三层架构:Haiku 走轻量路线,Sonnet 打性价比,Opus 负责重型推理。从 Claude 3 到现在,Opus 一直是最顶上那个。
Mythos 不是 Opus 的升级版,而是在 Opus 之上硬生生加了第四层。
泄露的内部草稿博文是这样说的:「Mythos 是一个全新层级模型的名字,比我们的 Opus 模型更大、更智能。」
具体强多少?草稿提到在三个方向上对 Opus 4.6 有"显著"优势:
编程能力——Opus 4.6 已经是业界公认的编程标杆之一,Mythos 还能再拉开一截,这个提升不是小数点级别的。
学术推理——数学、逻辑、科学问题,草稿专门拎出来讲,说明 Anthropic 在这方面的测试数据很硬。
网络安全——这块最炸裂,后面单独聊。
Anthropic 发言人给了两个定性:「质的飞跃」和「迄今为止最强大的模型」。过去两年大模型竞争基本是贴身肉搏,GPT、Gemini、Claude 之间的差距用个位数百分比衡量。Mythos 如果真如内部评估所言,那就不是追赶了,是换了条赛道。
网络安全能力:连自家都觉得需要"先发解药"
泄露文档里最让人坐不住的一段话:
尽管 Mythos 目前在网络安全能力上远超任何其他 AI 模型,但它预示着即将到来的一波浪潮,届时模型将能以远超防御者努力的速度来利用漏洞。
注意,这是内部技术评估,不是面向媒体的公关话术。用词是"远超",不是"领先"、不是"优于"。
然后 Anthropic 做了一个在 AI 发布史上几乎没有过的操作:Mythos 的第一批用户不是开发者也不是企业客户,而是网络安全防御机构。
这个决策链条很清晰——如果你造了一把能破所有锁的万能钥匙,在卖给消费者之前,至少得先让锁匠拿到同一把钥匙来升级锁。
OpenAI 发 GPT-4 做过红队测试,Google 发 Gemini 做过安全审查,但把"安全防御者优先使用"直接写进发布路线图的,Anthropic 是头一个。
说实话,我对这件事的解读比较分裂。一方面,一家以安全标榜自己的公司在内部文档里承认造出了可能让攻防天平失衡的东西,这种坦率在行业里几乎没有。另一方面,"太强了所以要谨慎"本身就是一种极其高明的能力背书——你见过哪家公司说自己产品太弱需要小心释放的?
运行成本:实验室里的珍稀品种
草稿里还坦承了一个现实问题——Mythos 的服务成本"非常昂贵",需要大幅优化效率后才会考虑面向大众开放。
这其实不意外。大模型的参数量和推理成本基本成正比,一个"显著"强于 Opus 的模型,推理开销大到需要专门提出来,说明体量差距不小。对普通开发者来说,短期内大概率用不上——即使发布,定价也不会好看。
但信号本身比产品更重要。当竞争对手还在想办法追平 Opus 级别的表现时,Anthropic 已经在讨论 Opus 之上的东西怎么安全地释放了。
代号卡皮巴拉:撞车阿里通义千问
每个大模型都有内部代号,GPT-4 叫过 Arrakis,Google 用宝石命名。Anthropic 给自家最强模型选了卡皮巴拉(Capybara)——互联网 meme 界的和平大使。
怎么实锤的?泄露的博客有两个版本,V1 全文用"Mythos",V2 把每处"Mythos"全部替换成了"Capybara"。说明这个代号在 Anthropic 内部用了相当长时间,"Mythos"反而是后来包装的发布名。
问题在于,卡皮巴拉这个 IP 在 AI 圈早就有主了。阿里通义千问 Qwen 的吉祥物就是卡皮巴拉,社区周边铺天盖地。所以消息一出,千问前技术负责人林俊旸直接在评论区留了一句:
「capybara? seriously?」
两家争夺 AI 高地的公司不约而同选了同一只呆萌啮齿动物,2026 年 AI 圈目前为止最有喜感的碰撞。
最讽刺的部分
一家正在打造"有史以来最强网络安全 AI"的公司,被最基础的 CMS 权限配置失误扒了底裤。
跟 AWS S3 存储桶忘关公开访问一个性质,有完善的文档记录,百分之百可以避免。
同一批泄露文件里还包含一场计划在英国 18 世纪庄园酒店举办的闭门 CEO 峰会细节——Dario Amodei 出席,对象是欧洲大企业高管。一场精心策划的高端局,就这么跟着产品草稿一起晒在了阳光下。
Anthropic 的回应是:「这些只是考虑发布的早期草稿,不涉及核心基础设施、AI 系统、客户数据或安全架构。」
技术上说没毛病。但"早期草稿"里白纸黑字写着可能引发"AI 驱动的漏洞利用浪潮",这就不是一次普通的文件泄露能概括的了。
对开发者来说意味着什么
抛开戏剧性不谈,Mythos 的泄露给技术社区留下了几个实际问题:
编程工具的又一次洗牌可能要来了。 如果 Mythos 的编程能力确实如评估所言显著超过 Opus 4.6,那现在基于 Claude 构建的 Coding Agent、代码补全工具、自动化 pipeline,都会迎来一波能力跃迁。早期接入的团队会拿到明显的效率红利。
安全攻防的不对称性正在被放大。 AI 辅助渗透测试已经不是新鲜事,但一个"远超任何其他 AI 模型"的网安能力意味着什么?意味着漏洞发现和利用的自动化程度会再上一个台阶。做安全的同学需要认真思考防御策略的迭代节奏了。
成本仍然是硬约束。 短期内 Mythos 大概率是高端定价甚至限量邀请制。对大多数团队来说,Opus 4.6 和 Sonnet 仍然是主力。但关注 Anthropic 的定价策略和效率优化进展是值得的——一旦成本降下来,能力差距就是碾压。
说到底,模型能力的军备竞赛还在加速。当一家公司开始在内部文档里用"预示着一波浪潮"来形容自己的产品,不管你信不信他们的营销叙事,至少该认真对待他们的技术判断了。