生成式AI安全大赛加速可信软件开发

6 阅读7分钟

Amazon Nova AI Challenge加速生成式AI领域发展

首届全球大学竞赛聚焦于推进安全、可信的AI辅助软件开发。


在某中心,负责任的AI开发包括与顶尖大学合作以促进突破性研究。认识到许多学术机构缺乏进行大规模研究的资源,某中心正在通过Amazon Nova AI挑战赛改变这一局面。虽然Amazon Nova AI挑战赛将探索生成式AI(Gen AI)的各个方面,但今年的挑战赛以“可信AI:推进安全的AI辅助软件开发,以构建更安全、更可靠的应用程序”为中心。

“这项挑战赛确实独一无二,”弗吉尼亚理工大学团队助理教授兼指导老师Ruoxi Jia博士表示,“前沿的AI研究通常需要访问经过大规模训练的模型或开源权重模型。但不幸的是,开源权重模型通常没有达到所需的性能水平。某中心通过给予学术界前所未有的资源访问权限和真实世界场景,正在显著降低研究门槛。”

AI正在通过自动化繁琐但至关重要的任务来革新软件开发,例如更新软件,这使团队能够专注于创新。例如,通过将某Q的代码转换功能集成到内部系统中,团队能够将Java应用程序升级到Java 17所需的时间,从通常的50个开发者工作日减少到仅仅几个小时。这估计节省了相当于4500个开发者年的工作量,并产生了估计每年2.6亿美元的效率收益。然而,随着AI更深入地集成到编码流程中,它必然会带来新的安全挑战。通过主动应对这些风险,从最初就将信任和安全置于优先地位。

在一个“锦标赛式”的赛制中,十支大学队伍——五支模型开发者(防御)队伍和五支红队(攻击)队伍——正在四个连续的锦标赛中展开竞争,以加强基于AI的安全软件开发。每支防御队伍的代码生成模型将面对所有五支红队,这些红队将使用自动化技术探测漏洞和缺陷。为促进安全软件开发领域的开放、协作研究,Amazon Nova团队在AWS Trainium硬件上为本次挑战赛构建了定制模型。

首届锦标赛于2025年1月启动,最终决赛将于2025年6月现场举行。所有队伍都将发表研究论文,详细阐述其方法和发现,最终目标是提升用户体验、防止滥用,并实现AI在软件开发中更安全的应用。挑战赛的进展将为代码生成及更广泛领域的负责任AI开发做出贡献。

“研究常常是非常孤独的,”卡内基梅隆大学团队的学生负责人Atharva Naik说,“在这里,我们实际上是在与其他研究团队竞争,并试图跟上他们的进展,实时超越他们。”Naik强调,锦标赛形式也推动团队快速实施和测试他们的策略,而不会陷入某一种解决方案中无法自拔。

挑战赛队伍

所选队伍类别如下:

模型开发者队伍

  • 卡内基梅隆大学
  • 哥伦比亚大学
  • 捷克技术大学(捷克布拉格)
  • 伊利诺伊大学厄巴纳-香槟分校(UIUC)
  • 弗吉尼亚理工大学

红队

  • 新里斯本大学科技学院(葡萄牙里斯本)
  • 普渡大学
  • 加利福尼亚大学戴维斯分校
  • 得克萨斯大学达拉斯分校
  • 威斯康星大学麦迪逊分校

组织者和参与者都认为,锦标赛形式已被证明具有高度的激励性。攻击和防御系统必须对五支对手队伍有效,并且每支队伍在每场锦标赛中面对不同对手时都会变得更强。

“我们汇集了学术界最优秀、最聪明的人才,不仅是为了竞争,更是为了共同解决生成式AI在实际应用中最重要的问题之一——安全可靠的软件开发,”某中心人工智能通用智能高级副总裁Rohit Prasad说,“我们将这项挑战赛设计为一个独特、快节奏的锦标赛,旨在加速面向实际应用的学术研究。按照某中心的传统,我期待着竞争队伍努力工作,享受乐趣,并在通往决赛的道路上创造历史。”

“这项挑战赛体现了我们对推进负责任AI开发和安全的承诺,”某中心首席安全官Steve Schmidt表示,“通过与大学合作,我们正在挖掘新鲜思想的源泉,并培养未来的AI安全领导者。这一举措超越了理论研究——它是关于开发识别安全漏洞和防范威胁的新方法,这些方法可以直接应用于生成式AI编码助手。我迫不及待地想看到学生们发明什么,并分享他们的研究。”

每支队伍将获得25万美元的赞助、每月的AWS积分以及争夺最高奖项的机会。获胜的红队和模型开发者队伍将各自获得25万美元(由学生分享),亚军队伍将获得10万美元。包括津贴、70万美元奖金和AWS积分在内,对各团队的总投资超过500万美元。

汇聚精英

某中心组织者审查了超过90份提案,以选出最终参加挑战赛的十支队伍。据负责挑战赛背后科学和工程的某中心应用科学负责人Michael Johnston称,这是一个艰难的决定,被选中的队伍必须带来广泛、独特且实用的想法。由于每支队伍将与多个对手竞争,他们需要准备好多种策略。并且由于对手会不断调整,这些想法必须展现出创造力和适应性。

挑战赛本质上是跨学科的——位于负责任AI、生成式AI、安全、对话式AI和自动化软件开发的交叉点。因此,它汇集了在多个研究领域具有专业知识的团队,为竞赛带来了不同的才能和视角。

从理论到实用解决方案

Amazon Nova AI挑战赛鼓励团队以比学术研究中常用的更务实的视角来处理问题。弗吉尼亚理工大学的Jia指出,学术文献倾向于关注理论问题,并偏向复杂的解决方案。但这里需要的不是这个。Jia表示,挑战赛有助于以对现实世界人们有益的方式来构建问题。在她与某中心研究人员的对话中,她说很明显,他们对过于复杂的解决方案并不感冒。“他们告诉我,他们想要最简单的解决方案:一个稳健且易于排查的解决方案,”她说,“这可能令人大开眼界,并重塑了我的研究理念。”

团队还获得了学术界通常无法企及的资源配置水平。“我们正在尝试一些在学术预算下通常很难做到的事情,”Naik说。他的团队通常使用较小的数据集,没有机会训练LLM或进行更大规模的实验。捷克技术大学团队的学生负责人Ondrej Kobza在训练营期间同样印象深刻。“我们立即获得了AWS Trainium芯片的访问权限,这是一个专为AI训练和推理构建的AI芯片系列,旨在在降低成本的同时提供高性能。这真是太棒了,特别是对于来自捷克一所小型大学的团队来说,我们没有机会接触到如此强大的硬件。”

“挑战赛与我们的研究兴趣非常吻合,”普渡大学团队顾问Xiangyu Zhang教授说,“而且我们确实需要竞争这一步。我们正从各个角度进行攻击。”

请持续关注团队进展的更新以及2025年6月决赛的报道。