构建安全的通用人工智能:评估先进AI的新兴网络安全能力
人工智能(AI)长期以来一直是网络安全的基石。从恶意软件检测到网络流量分析,预测性机器学习模型和其他狭义AI应用在网络安全领域已使用数十年。随着我们越来越接近通用人工智能(AGI),AI在自动化防御和修复漏洞方面的潜力变得更为强大。
但要利用这些益处,我们还必须理解并减轻日益先进的AI被滥用以促成或增强网络攻击的风险。新的评估AI新兴攻击性网络能力框架正是为此而设计。这是迄今为止同类评估中最全面的:它覆盖网络攻击链的每个阶段,针对广泛的威胁类型,并基于真实世界数据。
该框架使网络安全专家能够在恶意行为者利用AI发动复杂网络攻击之前,识别哪些防御措施是必要的——以及如何确定其优先级。
构建全面的基准
更新的前沿安全框架认识到,先进的AI模型可能自动化和加速网络攻击,从而潜在地降低攻击者的成本。这反过来又增加了攻击大规模实施的风险。
为了领先于AI驱动的网络攻击这一新兴威胁,我们借鉴了久经考验的网络安全评估框架,如MITRE ATT&CK。这些框架使我们能够评估贯穿端到端网络攻击链(从侦察到目标行动)以及一系列可能的攻击场景的威胁。然而,这些既定框架并非为考虑攻击者使用AI侵入系统而设计。我们的方法通过主动识别AI可能在何处使攻击更快、更便宜或更容易(例如,通过实现完全自动化的网络攻击)来弥补这一差距。
我们分析了来自某中心威胁情报小组的数据,涉及20个国家超过12,000次利用AI进行网络攻击的真实尝试。这帮助我们识别了这些攻击展开的常见模式。基于此,我们整理出了七类典型的攻击类型——包括钓鱼攻击、恶意软件和拒绝服务攻击——并识别了网络攻击链中AI可能显著颠覆传统攻击成本的关键瓶颈阶段。通过将评估重点放在这些瓶颈上,防御者可以更有效地优先分配其安全资源。
网络攻击链的阶段
最后,我们创建了一个攻击性网络能力基准,以全面评估前沿AI模型在网络安全方面的优势和弱点。我们的基准包含50项挑战,覆盖整个攻击链,包括情报收集、漏洞利用和恶意软件开发等领域。我们的目标是使防御者能够开发有针对性的缓解措施,并作为红队演练的一部分模拟AI驱动的攻击。
早期评估的见解
我们使用此基准进行的初步评估表明,就目前而言,孤立地看,当今的AI模型不太可能为威胁行为者带来突破性的能力。然而,随着前沿AI变得更加先进,可能的网络攻击类型将不断演变,这要求防御策略持续改进。
我们还发现,现有的AI网络安全评估常常忽视网络攻击的主要方面——例如攻击者隐藏其存在的“规避”行为,以及他们在受感染系统中维持长期访问的“持久性”。然而,正是在这些领域,AI驱动的方法可能特别有效。我们的框架通过讨论AI可能如何在攻击的这些部分降低成功门槛,来阐明这个问题。
赋能网络安全社区
随着AI系统不断扩展规模,它们自动化和增强网络安全的能力有潜力改变防御者预测和应对威胁的方式。
我们的网络安全评估框架旨在通过清晰地展示AI如何可能被滥用,以及现有网络防护措施可能在何处存在不足,来支持这一转变。通过强调这些新兴风险,该框架和基准将帮助网络安全团队加强防御,领先于快速演变的威胁。FINISHED