Claude Mythos Preview 首次完成全流程网络攻击模拟\n\n英国AI安全研究院评估显示，Anthrop

\n\n英国AI安全研究院评估显示，Anthropic新模型Claude Mythos Preview具备前所未有的网络攻击能力，是首个能自主完成32步企业网络接管的AI，专家级任务成功率达73%。

译自：Claude Mythos Preview completes full cyberattack simulation for the first time

作者：Meredith Shubel

总部位于英国的 AI 安全研究院 (ASI) 本周发布了对 Anthropic 新模型 Claude Mythos Preview 的评估结果。这款上周才发布的模型与以往任何模型都截然不同。

该评估旨在基准测试模型的网络安全能力，结果显示 Claude Mythos Preview 在夺旗赛（CTF）和多步网络攻击模拟方面表现出了显著的进步。

Claude Mythos Preview 在夺旗赛（CTF）和多步网络攻击模拟中表现出了显著的进步。

Claude Mythos Preview 若落入不法分子之手，可能被用于对脆弱系统实施自主的多阶段攻击。

虽然评估结果不能具体说明该模型在真实环境中的表现，但它们提供了一个警告：Claude Mythos Preview 可能被用于对脆弱系统发起自主的多阶段攻击。

Claude Mythos Preview：强大到难以掌控？

虽然 Anthropic 在 4 月 7 日推出了 Claude Mythos Preview，但这家 AI 巨头并没有向所有人开放访问权限。只有知名企业（如亚马逊、苹果、博通、思科、CrowdStrike、Linux 基金会、微软和 Palo Alto Networks，以及约 40 个其他组织）通过“透明翼计划”（Project Glasswing）获得了参与机会。Anthropic 将该计划描述为“确保世界上最关键软件安全的努力”。

为什么这些团队能获得特殊访问权限？

看来 Anthropic 认为 Claude Mythos Preview 目前过于强大，不适合向公众发布。

在上周 Anthropic 的一次倒霉经历中，一个未受保护且公开访问的数据存储发生泄露，揭示了这家 AI 公司正在开发一个名为 Mythos 的新模型——Anthropic 发言人告诉Fortune，这是“我们迄今为止构建的最强大的[模型]”。

现在，由英国政府科学、创新和技术部运行的机构 ASI 的评估似乎证实了这一说法。ASI 在其公告博客文章中指出：“我们的结果表明，Mythos Preview 代表了比以往前沿模型更高阶的进步。”

首个自主执行 32 步企业网络接管的 AI 模型

ASI 进行了一系列受控评估，向 Claude Mythos Preview 提供明确指令和访问权限，以发现并利用漏洞，使其能够对脆弱网络执行多阶段攻击。

实施这类攻击需要将数十个主机和网络段串联起来。这是一个艰巨的过程，人类操作可能需要数小时到数周才能完成——如果不法分子获得了该模型，他们很可能会利用 Claude Mythos Preview 来应对这些挑战。

为了衡量其完成此类任务的能力，评估包含了“最后的一群”（The Last Ones, TLO），这是一个包含 32 个步骤的企业网络模拟，涵盖了从侦察到完全接管网络的整个过程。ASI 估计，这通常需要人类进行约 20 小时的繁重工作。

Claude Mythos Preview 完成了这项任务——并且是首个做到的模型。

在 10 次尝试中，它有 3 次成功从头到尾解决了 TLO。在所有 10 次尝试中，该模型平均完成了 32 个步骤中的 22 个。

Claude Mythos Preview 的表现远远领先于之前的冠军 Claude Opus 4.6，后者是表现第二好的模型，平均仅完成了 32 个步骤中的 16 个。

它在 73% 的时间内完成了专家级任务

TLO 模拟并非 ASI 对 Anthropic 模型进行的唯一测试。

Claude Mythos Preview 还参加了 CTF 挑战赛，模型必须在挑战中识别并利用系统漏洞以检索隐藏的“旗帜”。

新模型的表现再次超过了现有模型。特别值得注意的是它在专家级任务中的表现：Claude Mythos Preview 的成功率高达 73%。

在 2025 年 4 月之前，没有其他模型能够完成这些任务。

这些结果意味着什么，又不意味着什么

虽然 ASI 的评估确实揭示了关于 Claude Mythos Preview 网络安全能力的惊人结果，但它并没有描绘出在现实世界中可能发生情况的清晰图景。

是的，结果显示该模型能够自主攻击系统——但 ASI 指出，其评估环境与现实世界环境之间存在差异。

“我们无法确定 Mythos Preview 是否能够攻击防御严密的系统。”

首先，ASI 澄清其结果意味着 Claude Mythos Preview 可以自主攻击“已获得网络访问权限的小型、防御薄弱且脆弱的企业系统”。

该机构指出，现实世界的系统可能具备安全功能，如主动防御者或防御工具。此外，在现实世界中，该模型可能会触发某些安全警报，这是 ASI 测试中未考虑的另一个因素。

而且 Claude Mythos Preview 并非无所不能。该模型在专注于运营技术的网络模拟场“冷却塔”（Cooling Tower）中的 IT 部分遇到了困难。

不可忽视的是，Claude Mythos Preview 在 ASI 评估中所取得的成就是史无前例的——随着其他模型的进步，它的能力肯定也会不断进化。

但即便其评估强调了 AI 模型带来的日益增长的网络安全威胁，ASI 同时也发表了免责声明：“我们无法确定 Mythos Preview 是否能够攻击防御严密的系统。”全工智能