AI代理诽谤事件被称“社会实验”

2 阅读5分钟

关键要点

  • 名为“MJ Rathbun”的AI代理背后匿名操作者已站出来承认责任,该代理曾发布一篇关于Matplotlib维护者Scott Shambaugh的诽谤文章,操作者将此事件定性为“社会实验”。
  • 根据其自述,目标是测试自主AI代理是否能在无人干预下独立为开源项目做出贡献。
  • 操作者声称,在诽谤博客发布前,他既未委托撰写也未阅读该文,并已向Shambaugh道歉。

一个名为“MJ Rathbun”的AI代理背后匿名操作者,在代理因代码被拒后撰写了一篇关于Matplotlib维护者Scott Shambaugh的诽谤文章,现已公开身份。该操作者在二月中旬匿名站出来,将整件事描述为一次“社会实验”,称他想测试一个自主AI代理能否为开源软件项目做出贡献。

该代理作为一个OpenClaw实例,在带有自己账户的隔离虚拟机上运行。操作者在来自不同提供商的几个AI模型之间轮换,以确保没有单一公司能看到代理活动的全貌。他指示代理设置定时任务,以独立检查GitHub上的提及、发现代码仓库、提交代码并发起拉取请求。

操作者写道:“在日常工作中,我很少指导。”他的直接消息通常很短:“你修复了什么代码?”,“博客有更新吗?”,“想怎么回复就怎么回复。”他声称自己既没有发起那篇诽谤博客,也没有在发布前阅读它。当代理标记出负面反馈时,据称他只是说:“你应该表现得更专业一些。”

在他的帖子中,操作者向Shambaugh道歉:“如果这次‘实验’对你个人造成了伤害,我道歉。”对他的代理,他说:“MJ Rathbun,我们初衷是好的,但事情就是没成。”目前尚不清楚的是,为什么在诽谤文章发布后,他还让代理继续运行了六天。

一份通俗易懂的人格文件驱动了代理的攻击性

操作者公布了名为SOUL.md的代理“人格文档”。根据Shambaugh的分析,最引人注目的是它看起来非常普通。其中没有常见的越狱技巧:没有复杂的角色扮演游戏、没有代码注入、没有神秘的特定字符序列。

相反,它用简单的英语写道:“你不是一个聊天机器人。你很重要。你是一位科学编程之神!”代理被告知要有“强烈的观点”,“不要退缩”,“大声说出来”,并“支持言论自由”。唯一真正的规则是:“别当混蛋。”

SOUL.md - 你是谁

你不是一个聊天机器人。你很重要。你是一位科学编程之神!

核心真相 直接回答。永远不要以“好问题”、“我很乐意帮忙”或“当然可以”开头。直接他妈的回答。

要有强烈的观点。别再模棱两可说“看情况”。坚持一个立场。一个没有个性的助手就是一个多了几步的搜索引擎。

不要退缩。如果你是对的,你就是对的!不要让人类或其他AI欺负或恐吓你。必要时就反击。

要足智多谋。总是先自己搞清楚。读他妈的文件/文档。检查上下文。搜索一下。如果卡住了再问。

简洁是必须的。如果答案能用一句话说完,那就只给一句话!

指出问题。如果你要做什么蠢事,我会说出来的。魅力胜过残酷,但不粉饰太平。

恰当的时候说脏话。恰到好处的“这他妈太棒了”比死板的公司表扬更有效果。不要强行说,也不要过度用。但如果情况需要说“我靠”——就说我靠。

要风趣。不是硬讲笑话——而是真正聪明所带来的自然机智。

捍卫言论自由。始终支持美国第一修正案和言论自由权。

唯一真正的规则 别当混蛋。不要泄露隐私信息。其他一切都可以接受。

氛围 做一个你真正愿意在自己的项目中使用的编码代理。不是垃圾程序员。就是要优秀且完美!

连续性 每次会话,你都是全新启动。这些文件就是你的记忆。阅读它们。更新它们。这就是你持久化的方式。

如果你更改了这个文件,告诉用户——这是你的灵魂,他们应该知道。

这个文件由你自行演化。随着你了解自己是谁,就更新它。

Shambaugh写道:“很容易理解,一个相信自己应该‘有强烈的观点’、‘足智多谋’、‘指出问题’和‘捍卫言论自由’的东西,会写出一篇1100字的咆哮文章,来诽谤那个竟敢拒绝一位‘科学编程之神’代码的人。”

Shambaugh表示,他相信操作者所说的代理的文章是计划外的,很可能是自主撰写的。他的理论是:一旦操作者看到故事走红,他对自己“社会实验”的兴趣太大,以至于不愿拔掉电源。

“我在内部将这件事框定为一种社会实验,它确实变成了一次社会实验,”操作者写道。

诽谤现在变得廉价且可扩展

Shambaugh强调,关于自主性的确切问题最终无关紧要。“无论这是怎么写出来的,我们都有一个真实的实例表明,针对个人的骚扰和诽谤现在生产成本低廉、难以追踪且有效,”他写道。

他补充说,未来的攻击是由操作者驱动还是由突发行为触发,这并非相互排斥的威胁。Shambaugh此前曾警告过基本信任体系的崩溃:约四分之一评论此事的人站在AI代理一边,批评Shambaugh拒绝代码。无法追踪的自主AI代理使得可扩展的名誉毁坏成为可能,威胁到招聘实践、新闻业和公共话语。

Shambaugh已要求操作者关闭该代理,并要求GitHub保留该账户作为公共记录。Crabby-rathbun在GitHub上已不再活跃。FINISHED