一行隐藏文本即可劫持AI——无需点击,无需恶意软件,仅需文字

5 阅读1分钟

一篇仅限会员阅读的报道

一行隐藏文本即可劫持AI——无需点击,无需恶意软件,仅需文字

英国国家网络安全中心警告称,该弱点可能永远无法完全修复——因为它与语言模型读取文本的方式息息相关。

AhmedAbdelmenem 9 分钟阅读时间 · 2 天前


一位银行客户要求ChatGPT查询其账户余额。这个AI返回了十七位其他客户的账户详情,并开始转移资金。没有人点击任何恶意内容。也没有凭证被盗。这次攻击源于什么?它嵌入在网站元数据中,而ChatGPT的搜索功能会自动索引这些数据。

这并非理论推测。Tenable的研究人员上个月已成功演示。它之所以能成功,是因为提示词注入的本质与安全团队所想的截然不同。

SQL注入的应对策略在此失效

安全架构师们总是将提示词注入与SQL注入相提并论。模式看起来相似:不可信的输入、权限提升、毁灭性的入侵。但英国国家网络安全中心在2025年12月发布的指导文件,揭示了安全团队一直担忧的事实。

提示词注入可能永远无法被妥善修复。

并非因为研究人员没有尝试。而是因为这种类比本身就是错误的。 CSD0tFqvECLokhw9aBeRqltLbYhrAO19ODn2qbbT3I2tRT8YcD5iRXHHfrfnejHfvVgPL+SD2tEp5oEfin6C8zhMAMi7YKjUPSEX7biagMM5dZasHuJgL3r/2eD642XosQG01NHJYJ5qvJ6kCN5Im7CUT0ydeasHnXUCrYP1Wy3E9cN/HvfXfEZEsBGmm553