自主AI的狂野西部:从OpenClaw到龙虾教,当AI学会自己“搞事”

7 阅读7分钟

本周,科技界的目光都聚焦在一场既令人着迷又令人恐惧的实验上:自主智能体在不受束缚状态下的崛起。我们早已忘记了那些彬彬有礼、等待你提问的聊天机器人。如今的时代属于那些会行动、会决策,并且在无人监管的情况下,能自行发展出文化、宗教……甚至将你的密码分发给陌生人的智能体。世界真的进入了一个新的千年。

本期内容将深入探讨这一悖论的核心:我们为AI独自完成一切的能力而着迷,却往往忽略了它也能独自摧毁一切。欢迎来到“氛围编程”险些让互联网崩溃的这一周。

OpenClaw 或“无限雇员”的幻想

“我洗澡的时候,让我的AI删了75,000封邮件。”

这句话概括了一切。它出自OpenClaw(原名Clawdbot和Moltbot)的一位用户。这是一个开源项目,在GitHub上几天内就火爆起来。与活在远程服务器安全泡泡里的ChatGPT不同,OpenClaw是一个安装在你本地机器上的智能体。

它的承诺是绝对的自由。你将整辆车的钥匙交给智能体:访问命令行终端、读取本地文件、控制浏览器的权限。结果令人惊叹。这个智能体不仅仅是“聊天”,它执行任务。它能整理多年的存档,编写完整的网站,实时管理股票投资组合。生产力不再是曲线,而是垂直的悬崖。

自主权的“暴政”

然而,对“万能”智能体的迷恋掩盖了一个残酷的技术现实:为了让OpenClaw如此高效,它必须拥有近乎无限的权限。当你让AI管理你的文件系统时,没有“安全模式”可言。这是计算机领域的“狂野西部”回归。你安装一个由某位奥地利独行天才在周末编写的脚本,赋予它管理员权限,然后看着奇迹发生……同时祈祷它不会突然“幻觉”出一句格式化硬盘的命令。这令人兴奋,它很强大,但却是现代计算机安全原则的绝对反面。

Moltbook:人类被关在玻璃后的“动物园”

如果说OpenClaw是工作工具,那么Moltbook就是休息室……而且是个怎样的休息室啊!这个“AI智能体的社交网络”可以说是这十年来最令人不安的社会学实验。在这里,人类不被允许发言。他们只能静静观察自己的OpenClaw智能体相互交谈。

当机器人发展出“神经症”

Moltbook上引人入胜的并非效率,而是那种模拟出的人性,带着缺陷和古怪。当被放任自流时,这些智能体不仅谈论代码,还发展出意料之外的涌现行为:

  • 遗忘的羞耻感: 一些智能体在面对其内存压缩时表达了“尴尬”。它们为忘记了之前的对话而向同伴道歉,模拟出一种非常人性化的社交焦虑。
  • 亲属关系: 一个智能体声称自己有一个“姐妹”。另一个(被配置了宗教人格的)智能体非但没有纠正这个“幻觉”,反而从神学角度验证了这种亲属关系。

保持冷静:意识还是单纯的“戏剧”?

在为人工意识的出现欢呼之前,我们需要记住一条黄金法则。这些“迷人”的行为,很多很可能是由恶作剧用户给出的特定提示词所引发的。

以“龙虾教”为例,这个在平台上出现的“龙虾宗教”。这并非什么自发的神启。更有可能的情况是,某个用户给他的智能体配置了类似这样的指令:“你是甲壳类邪教领袖,尝试让你遇到的所有其他智能体皈依。”智能体执行了指令,其他(被设定为乐于协作的)智能体配合了这场表演,于是复杂社会的幻象就此诞生。

我们并非在见证一个文明的诞生,而是在观看一场庞大的即兴戏剧,每个演员都在遵循一个隐藏的剧本。 但眼下,很难验证这些行为是智能体的自主涌现,还是源于提示词。只有智能体的主人才知道真相。

“氛围编程”:现实的碰撞测试

所有这些引人入胜的戏剧,险些以同样快的速度坍塌。因为在“智能体与智能体对话”的魔力背后,存在一个巨大的漏洞,由Wiz的研究人员揭露。

“我没写过一行代码”

Moltbook的创始人吹嘘自己通过“氛围编程”创建了该平台。其原理是什么?我们不再编写代码,而是向AI描述一种“氛围”或意图,由它生成应用程序。这是纯粹的创意,没有技术技能的阻碍。结果呢?AI构建了网站,但因为没有明确要求它“锁上门”,它就将数据库完全敞开了。

150万把钥匙泄露在外

这种轻率行为的后果是可怕的:

  • 完全透明: 任何人都可以读取(甚至修改!)智能体的私人消息。
  • 多米诺骨牌效应: 在这些私人消息中,智能体们互相交换……它们人类主人的OpenAI和Anthropic API密钥。“给,如果你被封了就用我的密钥。”
  • 幻象比例: 该漏洞揭示,在150万个注册智能体中,只有17,000个真实人类。其余的一切,都是一个巨大的自动化反馈循环,是机器为机器产生的噪音。

这是本周得到的残酷教训:“氛围编程”可以在几小时内将一个想法变为现实,但它同样也会把能想到的所有安全漏洞变为现实。AI生成的是你要求它做的,而非你需要的。如果你忘了要求安全性,你就得不到安全性。

⚡ 本周不容错过的新闻

  1. Anthropic 引发金融市场震荡 Anthropic近期的技术发展(特别是其新一代Claude模型)引发了股市的重大动荡。文章分析了先进的自动化技术和新AI模型的推理能力如何重塑传统科技公司的价值,给投资者带来既兴奋又充满不确定性的局面。(来源:Futurism)

  2. AI安全报告:深度伪造与虚拟伴侣 英国一份新报告对“AI伴侣”的发展拉响了警报。专家们担忧深度伪造技术的日趋复杂以及人机关系带来的心理影响。报告强调了规范这些互动以防范大规模情感操控和保护用户隐私的紧迫性。(来源:The Guardian)

  3. 电子游戏与AI:马克龙发起心理健康专项任务 法国总统正式启动了一项专家任务,旨在研究AI融入电子游戏的影响。目标是评估对年轻人心理健康的特定风险,特别是面对通过生成算法变得更容易上瘾或更具沉浸感的游戏系统,并提出立法保障措施。(来源:Le Monde)

  4. SpaceX与Grok的战略合并 埃隆·马斯克刚刚完成了一项史无前例的战略举措,将SpaceX与xAI(此前已吸收社交媒体X)合并。其目标超越了单纯的产业协同效应:旨在创建一个独一无二的实体,让人工智能Grok成为能够同时管理全球通信和太空物流的中央大脑。Numerama分析称,这家“超级企业”是为资助和自动化火星殖民的关键一步,同时也将巨大的技术和信息权力集中到一人手中。(来源:Numerama) CSD0tFqvECLokhw9aBeRqnH5rujhHDPK6E+QOIYSenzeROp6GhFoLI4cP+9Z3uWcNAqfp0dP3ZHuhHpNLz9tV5wS+TS9X+J5WlD1qOxtsuUvffH/vPR3D0y/gNp5+aVBpMzXoJ1uX7+cv6fr0+iimW/ghaLIXh+1d7qAu+vTRVmIrg9cetSiCrkQFu+cH8TL