当 AI 开始像黑客一样思考:Anthropic 发布的这个工具,让网安行业股价闪崩

19 阅读9分钟

当 AI 开始像黑客一样思考:Anthropic 发布的这个工具,让网安行业股价闪崩

你的代码里可能藏着存在了十几年的高危漏洞,所有安全工具都没扫出来,所有安全专家的 code review 都漏掉了。这不是假设 — Anthropic 刚用 Claude 在大量生产级开源项目中找到了超过 500 个这样的漏洞

这件事的意义不在于"AI 又能做一件新事了"。而在于:传统网络安全工具赖以生存的底层逻辑 — 基于规则的模式匹配 — 可能正在被判死刑。 CrowdStrike 股价当天暴跌 9.9%,不是没有原因的。


发生了什么

2026 年 2 月 20 日,Anthropic 发布 Claude Code Security — 一个集成在 Claude Code 网页端的安全扫描工具,目前处于有限研究预览阶段。

一句话概括:它不是传统的静态分析工具。它像人类安全研究员一样"阅读"和"推理"你的代码 — 理解组件之间如何交互,追踪数据在应用中的流转路径,然后找出那些规则引擎永远发现不了的漏洞。

Enterprise 和 Team 客户可以抢先体验。开源项目维护者可以免费获得加速访问权限 — 这一点后面会详细聊,因为它的战略意义比表面看起来大得多。


这不是又一个 SAST 工具

先说清楚 Claude Code Security 不是什么

传统的 SAST(Static Application Security Testing,静态应用安全测试)工具 — 比如 SonarQube、Checkmarx、Fortify — 本质上都是模式匹配器。它们维护一个庞大的规则库:这种代码模式是 SQL 注入,那种代码模式是 XSS,这个函数调用有缓冲区溢出风险。遇到匹配的模式就报警。

这套方法论统治了网络安全行业几十年,也养活了一个价值超过 2000 亿美元的产业。

但它有一个根本性的缺陷:规则只能发现已知类型的问题。 如果一个漏洞的触发路径跨越了三个模块、涉及两种数据格式转换、且只在特定的并发条件下才能被利用 — 没有任何规则库覆盖得到。

Claude Code Security 的做法完全不同。用 Anthropic 自己的话说:

"Rather than scanning for known patterns, Claude Code Security reads and reasons about your code the way a human security researcher would: understanding how components interact, tracing how data moves through your application."

这不是在规则库里加了更多规则。这是把规则库扔掉,换成了一个能理解代码语义的推理引擎。

打个比方:传统 SAST 像机场安检的 X 光机 — 训练它识别枪支的形状、刀具的轮廓。它很擅长找到这些东西,但如果有人用乐高积木拼了一把枪带进来,X 光机可能就懵了。而 Claude Code Security 更像一个有十年经验的安检员 — 他不光看形状,他会看你的行为、你的路线、你的逻辑是否合理。


500 个零日漏洞:这个数字意味着什么

用 Claude Opus 4.6 模型,Anthropic 团队在生产级开源代码库中发现了超过 500 个漏洞 — 其中很多是高危漏洞,有些已经在代码中存在了几十年,经过了无数次专家审查都没被发现。

几十年。

让这个数字沉一沉。这些不是小型个人项目。这些是被全球数百万开发者依赖的生产级开源项目。它们经历了社区 code review、安全审计、渗透测试、各种自动化扫描工具的轮番检查 — 然后 AI 走进来,一次性翻出了 500 多个。

这说明什么?不是说人类安全专家不行。而是说人类安全专家面对的代码复杂性,已经超出了人脑单靠逻辑推演能覆盖的范围。 当一个项目有几百万行代码、几千个模块、无数种可能的执行路径时,任何人类都不可能在脑子里完整建模。

AI 能。至少在这个特定维度上,AI 能。

而且 Anthropic 在这里做了一件很聪明的事:多阶段验证。Claude 不是发现一个可疑模式就直接报警。它会:

  1. 初步扫描:识别可能的漏洞
  2. 重新检查:Claude 自己重新审视发现结果,过滤误报
  3. 评级:给每个漏洞标注严重程度(severity)和置信度(confidence)
  4. Dashboard 呈现:团队在面板上审查所有发现,然后决定是否接受修复建议

最后一步是关键:所有修复都需要人类批准后才会执行。 Claude 只负责发现问题和提出修复方案,开发者做最终决策。

这个设计很重要。它直接回应了安全行业对 AI 工具的最大担忧:如果 AI 自动改了代码怎么办?答案是 — 不会。Human-in-the-loop 不是口号,是产品架构。


一年磨一剑:CTF 冠军和核设施防御

Claude Code Security 不是一个突发奇想的产品。Anthropic 的 Frontier Red Team 花了超过一年系统性地测试和训练 Claude 的网络安全能力。

怎么测试的?最硬核的方式 — 让 Claude 去打 CTF

CTF(Capture the Flag)是网络安全领域的竞技比赛,参赛者需要在限定时间内攻破系统、找到漏洞、夺取"旗帜"。这是安全从业者证明实力的硬通货。Claude 的战绩:

赛事成绩
PicoCTF全球前 3%
HackTheBox AI vs Human CTF20 题解出 19 题
实时网络攻防对抗9 支队伍中排名第 6(防守方,对抗人类红队)

全球前 3% 是什么概念?PicoCTF 参赛者包括大量专业安全工程师和计算机科学学生。一个 AI 模型跑到前 3%,不是因为它会"暴力搜索",而是因为它真的能推理出漏洞在哪。

但更值得关注的是 Anthropic 和太平洋西北国家实验室(PNNL) 的合作。PNNL 是美国能源部下属的国家实验室,负责核安全和关键基础设施防护。他们让 Claude 对一个模拟的水处理厂进行对抗性测试。

结果:Claude 在 3 小时内完成了传统方法需要数周才能完成的对手仿真(adversary emulation)。

3 小时 vs 数周。这个效率差距不是渐进式的改进 — 这是量级的跳跃。对于关键基础设施防御来说,时间就是一切。攻击者不会等你花三周做完安全评估才发动攻击。


网安行业的"柯达时刻"

现在说说 CrowdStrike 股价暴跌 9.9% 的事。

Anthropic 发布 Claude Code Security 之后,网络安全板块经历了一次小型闪崩。CrowdStrike 跌了近 10%,微软也跌了 3.2%。Forrester 的分析师直接用了 "SaaS-pocalypse"(SaaS 末日)来形容这次冲击。

为什么华尔街反应这么激烈?

因为投资者瞬间看清了一个逻辑链:如果 AI 能用语义推理的方式做漏洞检测,那靠卖规则库和扫描引擎的公司的护城河就没了。这些公司花了十几年积累的规则库,可能在 AI 面前毫无壁垒 — 因为 AI 根本不需要规则库。

VentureBeat 采访了超过 40 位 CISO(Chief Information Security Officer,首席信息安全官),发现大多数人没预料到这个能力会在 2026 年就到来。他们原以为还有几年缓冲期来调整战略。

但这不意味着传统安全工具明天就死了。Forrester 和 Snyk 的分析都指出:AI 擅长的是复杂逻辑分析和零日漏洞发现,传统工具擅长的是合规检查和已知漏洞模式扫描。 短期内两者会共存。

真正的趋势是:安全功能正在从独立产品变成开发平台的内置能力。 以前你需要买一套专门的安全扫描工具;以后安全扫描可能就是你 IDE 的一个功能。Anthropic 把它直接集成在 Claude Code 里,就是这个方向的信号。

对中国的网络安全公司来说,这个信号值得认真对待。如果 AI 语义推理真的能替代大部分规则匹配的工作,那么国内以"安全产品"为卖点的独立厂商会面临类似的压力。当大模型厂商开始把安全能力内置到开发工具链时,"安全"从一个独立赛道变成了一个特性(feature),而不是一个产品(product)


最讽刺的时间线

最后不得不提一个时间线上的巧合 — 或者说讽刺。

就在 Claude Code Security 发布的同一周,Anthropic 正在和五角大楼打架。因为拒绝在武器系统中使用 Claude,Anthropic 被 Trump 点名攻击,被 Hegseth 列为"供应链风险"。

一边是政府说"你不配为国防服务",一边是 Anthropic 发布了可能是近年来最重要的防御性网络安全工具。

这个时间线很有意思。Anthropic 的态度很清楚:防御可以,进攻不行。 帮你找漏洞、堵漏洞,没问题。帮你做武器,不行。

而且 Anthropic 同时宣布了 6 个新的网络安全探针(probes) — 专门用来监测 Claude 在网络安全领域的能力是否被滥用。这就是 Anthropic 一贯的风格:给你能力的同时,建一套监测系统确保这个能力不被用在不该用的地方。

开源维护者免费使用这一条也值得品味。全球最重要的软件基础设施 — Linux 内核、OpenSSL、各种关键库 — 很多都是几个维护者在用爱发电。给他们免费的 AI 安全审计能力,既是公益,也是 Anthropic 获取真实世界安全数据的最佳途径。双赢。


一句话带走

传统网安卖的是"我比你知道更多漏洞模式",Anthropic 卖的是"我能像人一样思考你的代码" — 后者没有上限。

你的公司现在用什么做代码安全扫描?如果 AI 推理引擎成为标配,哪些安全产品会最先被替代?评论区聊聊。


关注本号,第一时间解读 Anthropic 最新动态。