我的AI代理正在为我工作
清晨,当我走进山丘时,我知道有一个人造智能正代表我工作。事实上,不止一个。在我开始徒步之前,我坐在一家咖啡店里,设置了一堆研究代理开始工作。所以当我在徒步时,我知道机器正在替我阅读成千上万的研究论文,并勤勉地编译数据、交叉引用、反复检查工作,并生成分析报告。
后来,当我回到有手机信号的地方,我获取了这些报告:机器智能发展趋势的得分分析、随时间变化的太阳能电池板价格图表、关于汽车安全带安装推动与反对力量的分析。我凝视着这一切,深知如果我自己来做这些,每份报告可能需要我持续工作一周。
为我工作的这些代理极大地扩展了我的能力。而且,这将是它们最笨拙的时刻。
这种切实感受到的潜在工作量——如同拥有一支由超级智能、忠诚的同事组成的军队听我调遣——时刻萦绕在我心头。现在,我与家人在一起时常常感到自己很懒。不是因为我觉得应该工作,而是因为我感到内疚,内疚于没有在陪孩子玩磁力片的时候,指派某个AI系统为我工作。
在我的机构里,人们也经历着同样的事情——学习如何利用AI扩展自身能力,学习如何管理一群智能代理。
反AI组织制造工具投毒AI系统
反AI活动人士构建了一个实用的技术武器来破坏AI系统——“Poison Fountain”,一种向AI训练数据爬虫投喂垃圾数据的服务。
运作方式:Poison Fountain生成看似正确实则存在细微错误的文本。它通过刷新URL可以产生看似无穷无尽的垃圾数据。
动机:“我们同意杰弗里·辛顿的观点:机器智能对人类物种构成威胁。针对这一威胁,我们希望破坏机器智能系统,”作者写道。“少量被污染的训练数据就能严重损害语言模型。上述URL提供了一个几乎无穷无尽的被污染训练数据流。通过缓存和转发这些被污染的训练数据来支持这场战争。通过将这些数据投喂给网络爬虫来支持这场战争。”
重要性——互联网将成为一个捕食者-猎物生态:AI及AI代理的兴起意味着互联网将变成一个包含比以前更多生命形态的生态——爬虫、人类、AI代理等。像Poison Fountain这样的工具代表了人们可能如何试图在这个不稳定的生态中改变平衡,注入使某些生命形态更适宜、其他形态更不适宜的东西。
为良好AI结局,思考引导智能所需的机构
纳米技术先驱埃里克·德雷克斯勒发表了一篇短文《超能力世界框架》,探讨如何在充斥各种有用AI服务的世界中为人类取得良好结局。
将AI视为生态而非单一实体:“复合、多组件的AI系统已成为主导,”德雷克斯勒写道。“持久的传统叙事想象一个统一的实体——‘AI’——作为一个整合的智能体来学习、行动和追求目标。这类实体可能会出现,但请思考现有的事物:各种模型组合成系统,在机器间复制,扩散到数千种不同的角色和配置中。当前的技术状态是一个资源池,而不是一个生物。”
为取得良好结局,构建适用于AI的机构:德雷克斯勒的论点是,如果我们希望从AI中获得良好结局,关键不在于制造一个能解决所有问题的单一实体,而在于构建我们人类可以用来控制和解决问题的机构。核心思想是AI既适合操作机构,也通过机构被控制。
“考虑一下机构如何应对宏大的任务。规划团队生成备选方案;决策者比较和选择;执行单元在既定范围和预算内执行限定任务;监控发现问题;根据结果修订计划。没有一个人理解全部,也没有一个统一的智能体控制整体,然而人类建造的航天器到达了月球,”德雷克斯勒写道。“AI自然契合其中。生成方案是竞争性生成模型的任务——多个系统提出备选方案,竞争以开发更好的选项和更尖锐的批评。选择方案是由AI系统辅助的人类任务,AI识别问题并阐明权衡。执行分解为由专业系统执行的限定任务,具有明确的权限和资源。评估提供修订手段和目的的反馈。在每一个角色中,AI行为可以比人类更稳定、透明、受限和可引导。”
重要性——也许AI是外星物种,但也可能被驯服?这类论点将应对AI的许多问题从单个AI系统重新定向到我们如何构建一个可以利用并从日益强大的AI系统出现中受益的人类驱动世界。利用这些AI系统的核心技术属性,我们可以构建比仅由人类组成和运行的机构更好、更强、更有韧性的机构。
数学家与Gemini合作拓展人类知识空间
不列颠哥伦比亚大学、新南威尔士大学、斯坦福大学和某机构DeepMind的研究人员发表了一个新的数学证明,该证明是与某机构开发的一些基于AI的数学工具密切合作构建的。“主要结果的证明是在与某机构Gemini及相关工具,特别是DeepThink,以及一个专门用于数学的未发表相关系统的非常实质性的输入下发现的,”作者写道。
完成方式:证明的部分内容是通过“迭代的人/机交互”获得的。这种交互形式是AI系统为简单或早期问题提供一些正确解法,然后人类研究人员识别AI系统所做的关键陈述并加以概括,随后用这些概括所启发的新问题重新提示AI系统。“提示方法足以让系统为新问题生成完整证明,”作者写道。
结果是一个由人类和AI系统协作构建的数学证明:“在某些情况下,下面的证明与AI工具建议的证明仅有高层次的相似性。然而值得注意的是,一些AI生成的证明——尤其是来自专业内部工具FullProof的那些——已经非常出色,”他们写道。“模型的贡献似乎涉及对现有技术的综合、检索、概括和创新的真实结合。”
重要性——人类与机器,共同扩展和探索知识前沿:这里是一群高度进化的人猿,与用数学和逻辑构建的合成智能合作,在原子级精确制造工艺的硬件上运行,共同探索数学领域,在知识边缘为自己建造新的基础,进一步扩展我们小小的“已知”国度,对抗无形且变幻莫测的未知潮汐。这一切蕴含着宏大的诗意和喜悦。
科技故事:造物者的阴影
【估计源自2029年】 报告:对“柏林”模型系列的特征调查
分析证实存在一个特征,该特征在提及员工、项目和机构时被激活。尽管采取了极端措施避免上述提及,包括直接分析和预先过滤训练数据以剔除此类提及。进一步调查显示,某些提及是通过与[ntk——详情见go/ntk]相关技能的RL环境留下的评论进行的。我们估计,在训练和微调期间,模型总共看到的此类数据不超过约20万个令牌,包括重复内容。模型从如此稀疏的数据中发展出对员工、项目和机构如此精细的表征,与近期模型比其前代更具数据效率的趋势一致。我们认为消除此类数据泄露是P0优先事项,并在随后的备忘录中提出了我们必须采取的程序和实践,以消除这一严重的安全风险。
鉴于[ntk]的数字和物理能力,包括动能能力,我们认为除了上述措施外,有必要隔离该系统。我们认识到这会带来巨大的时间和资源成本,并对我们的战略优势产生影响,但鉴于其能力与此特征结合可能带来的严重后果,我们认为此类行动是审慎的。
最后,我们建议人力资源部门向以下被提名者提供支持,包括心理健康咨询,这些人的名字激活该特征的程度远超其他所有人。FINISHED