AI防伪神话并非无懈可击？逆向算法正物理级解剖水印今天我们要聊的是关于AI生成的内容，是如何通过一些隐形的水印技术去追溯

今天我们要聊的是关于AI生成的内容，是如何通过一些隐形的水印技术去追溯它的来源，以及现在这些水印和反水印之间的这种攻防，是如何不断的升级的。

现在很多社交平台上面看到的AI生成的图片里面都已经被植入了这种隐形水印，它不是一个肉眼可见的logo，而是被藏在图像的频域或者是非常深层的元数据里面。就算这个图片被裁剪、被压缩很多次，这个水印其实还是存在的，就像思想钢印一样，无论怎么截图、怎么压缩，它都还是在图片里面。平台就可以通过自己的算法去识别出来这是AI生成的，比如说像谷歌的SynthID还有C2PA这种协议，都是现在比较主流的一些做法。

既然有了给AI生成的图片加水印的技术，那就有专门研究怎么去掉这些水印的。这个东西就跟密码学是一样的有加密就有破解，最近在技术圈很火的一个项目叫remove-ai-watermarks，就是专门做这个事情的，它把隐形水印的这个攻防拉到了一个非常硬核的程度。

remove-ai-watermark用的方法叫物理级结构打碎。它会把这个图片重新喂回到一个扩散模型里面，然后通过正向的去扩散，强行的给它注入一些物理噪声，就相当于把原本藏着水印的这个潜空间的结构彻底的打乱，那这个时候水印也就不存在了。

在彻底破坏隐形水印的微观结构后，再利用逆向去噪将图像画面重构出来。这个时候图片看上去是完好无损的，但是其实水印已经灰飞烟灭了。

remove-ai-watermarks能够精准的剥离掉这些用来溯源的底层数据。它其实就像一个数字世界里的外科医生一样，可以在一毫秒之内把图片里面的生成提示词、随机种子、还有来源签名这些元数据的外壳全部都抽走，只留下最最基础的像素阵列。那这个时候任何想要通过代码溯源的这种防伪协议就完全失效了。

这个对抗性干扰机制在实际运行的时候，会在重构的最后一步故意的在画面当中添加一些高度还原的胶片颗粒和边缘色差，这些东西其实就是模拟相机的那种光学的随机误差。机器在识别这些AI特征的时候就会被这些干扰所迷惑，然后就会产生这种分类错误，从而达到视觉欺骗的目的。

remove-ai-watermarks这个东西的出现，对于现在的数字内容的溯源体系来讲，更像是在这个数字内容溯源的体系里面投下了一块问路石。它用非常实实在在的代码告诉大家，没有任何一种现有的数字水印方案是可以真正的做到牢不可破的。现在这个水印和去水印的这种对抗，其实是在推动整个数字信任的体系不断的升级。每一次水印被破解都会逼着科技公司去开发更高级的加密手段，然后每一次新的水印方案出来又会让去水印的这一方绞尽脑汁的去寻找新的突破口，在这种循环的较量当中其实一种全新的数字信任学正在慢慢的建立起来。

到底是加水印的这一派会取得最终的胜利，还是去水印的这一派会更胜一筹？欢迎各位技术极客在评论区留下你的想法，让我们一起碰撞，共同想象数字内容真实性的未来会走向何方。

【合规倡议与免责声明】

本文仅客观分析AI生成与鉴别这两者之间的技术演进，明确反对并不提倡使用擦除工具进行规避监管、侵权甚至伪造新闻等行为。技术本身是中立的，但其应用存在边界。本文鼓励技术层面的研究探索，同时提醒从业者守住底线。在享受AI带来的创作自由的同时，也应尊重内容的透明性，遵守平台关于AI生成内容的标识规则，这是维护健康网络环境最基本的要求。

github.com/wiltodelta/…