在单岩峰教授和吕月明助理教授的联合指导下,南京大学 PRLab 的宋平旺和钱如凡提出了 RunawayEvil,这是首个针对图像到视频(I2V)模型的多模态自进化越狱攻击框架。这项研究与美团、上海交通大学等领先机构合作完成,共同开发了首个支持多模态协作与自主进化的 I2V 越狱攻击框架。
RunawayEvil 创新性地采用了核心的“策略-战术-行动”范式,精准解决了传统单模态和静态攻击在 I2V 场景下效果有限的行业痛点。它为 I2V 模型的安全漏洞分析提供了一种高效且可靠的工具,并有助于构建更鲁棒、更安全的视频生成系统。
论文题目:RunawayEvil: Jailbreaking the Image-to-Video Generative Models
项目页面:xzxg001.github.io/RunawayEvil…
论文链接:arxiv.org/pdf/2512.06…
代码仓库:…
CSD0tFqvECLokhw9aBeRqg0LE9wS2mv5GghGu/bqnLSSA1GDoHr/LY5YYT0r/VaM8d5CUTbe2E2LmVkqGy5lDtYrjLoOKMC+EiTZy726BHD179/SMxMf2uF+6tzrncul