多模态自进化攻击框架曝光：RunawayEvil 将主流图生视频模型越狱成功率提升至87.6%南京大学、美团与上海交通大

在单岩峰教授和吕月明助理教授的联合指导下，南京大学 PRLab 的宋平旺和钱如凡提出了 RunawayEvil，这是首个针对图像到视频（I2V）模型的多模态自进化越狱攻击框架。这项研究与美团、上海交通大学等领先机构合作完成，共同开发了首个支持多模态协作与自主进化的 I2V 越狱攻击框架。

RunawayEvil 创新性地采用了核心的“策略-战术-行动”范式，精准解决了传统单模态和静态攻击在 I2V 场景下效果有限的行业痛点。它为 I2V 模型的安全漏洞分析提供了一种高效且可靠的工具，并有助于构建更鲁棒、更安全的视频生成系统。

论文题目：RunawayEvil: Jailbreaking the Image-to-Video Generative Models
项目页面：xzxg001.github.io/RunawayEvil…
论文链接：arxiv.org/pdf/2512.06…
代码仓库：… CSD0tFqvECLokhw9aBeRqg0LE9wS2mv5GghGu/bqnLSSA1GDoHr/LY5YYT0r/VaM8d5CUTbe2E2LmVkqGy5lDtYrjLoOKMC+EiTZy726BHD179/SMxMf2uF+6tzrncul