Auto-GPT 介绍

1,072 阅读5分钟

介绍

Auto-GPT是一种以自然语言给出目标的“AI代理”,可以尝试通过将目标分解为子任务并自动循环使用Internet和其他工具来实现该目标。它使用OpenAI的GPT-4或GPT-3.5 API,是使用GPT-4执行自主任务的应用程序的首批实验性项目,目的是让 GPT-4 完全自动化运行。除了能够自动联网搜索、搜集各种数据之外,它还能尝试访问当下的主流网站和平台,利用 GPT 进行文件存储和总结。它有可能成为自动化任务的强大工具。

特性

  1. 🌐用于搜索和信息收集的 Internet 访问
  2. 💾长期和短期内存管理
  3. 🧠用于文本生成的 GPT-4 实例
  4. 🔗访问热门网站和平台
  5. 🗃️使用 GPT-3.5 进行文件存储和汇总
  6. 🔌插件的可扩展性

原理

ChatGPT 唯一不太好用的地方,就是需要人类输入 Prompt。而 Auto-GPT 的一大突破是,可以让 AI 自我提示,它就像是赋予了 GPT-4 记忆和实体一样,让它能够独立应对任务,甚至从经验中学习,不断提高自己的性能。

我们每分配一个任务,Auto-GPT 都会给出一个相应的解决计划。比如,需要浏览互联网或使用新数据,它便会调整其策略,直到任务完成。这就像拥有一个能处理各种任务的私人助手,如市场分析、客户服务、市场营销、财务等。

想让 Auto-GPT 运行起来,需要依靠以下 4 个组件:

  1. 架构

    Auto-GPT 是使用强大的 GPT-4 和 GPT-3.5 大型语言模型构建的,它们充当机器人的大脑,帮助它思考和推理。

  2. 自主迭代

    这就像机器人从错误中学习的能力。Auto-GPT 可以回顾它的工作,在以前的努力的基础上再接再厉,并利用它的历史来产生更准确的结果。

  3. 内存管理

    与向量数据库(一种内存存储解决方案)集成,使 Auto-GPT 能够保留上下文并做出更好的决策。这就像给机器人配备了长时记忆,可以记住过去的经历。

  4. 多功能性

    Auto-GPT 的文件操作、网页浏览和数据检索等功能使其用途广泛。这就像赋予机器人多种技能来处理更广泛的任务。

使用

  1. 从这里下载最新的稳定版本:github.com/Significant….
  2. 进入界面后,你先明确想让 AI 帮忙做什么,然后为 AI 起个名字。
  3. 像官方 demo 展示的那样,你给 AI 起名为“Chef-GPT”,再进一步明确它的身份,“这个大厨 AI 可以自己浏览互联网,为下一个即将到来的大节日想出合乎时宜的、独特且原创的菜谱。”

image.png

  1. 你还可以进一步细化你的目标(最多可写 5 个),比如:
  • 目标 1:为将到的大节日(比如复活节)发明菜谱,得是原创,而且得是不落俗套的;
  • 目标 2:菜谱生成直接生成文件,保存到我电脑本地;
  • 目标 3:实现目标后就停下。

然后,就什么都不用管了,AI 会自行拆解多个任务,自己进行多轮提问,不停迭代,直到问题解决。

  1. 据用户反馈, Auto-GPT 也能编程,它处理 Java 可能会遇到困难,但和 Python 配合得很好,只要脚本不太复杂,生成结果就能让人惊喜。
  2. 建网站也不在话下。一位叫 @Sully 的 Twitter 用户用 Auto-GPT 建站,要求是用 React 写一个网站,背景为蓝色,并指定了页面标题和简单元素。结果是 Auto-GPT 在人类不干预的情况下,用三分钟就做完了。

site.gif

  1. 想要用上 Auto-GPT , 你得经过多个步骤将其部署到电脑后才行。现在,有人帮你做了一个组装好的 web 版的 AgentGPT,输入你的 OpenAI API 密钥,就能使用了。由于 Auto-GPT 接的是 GPT-4 的 API,所以它的运行会消耗你 OpenAI 账户里的额度。而且Auto-GPT 运作成本相当高,你最好多盯着你的 OpenAI 账户,对 API 做些限制。

限制

Auto-GPT 在实际使用时,经常会陷入到死循环里……

那么,为什么 Auto-GPT 会陷入这些循环?

  1. 要理解这一点,我们可以把 Auto-GPT 看作是依赖 GPT 来使用一种非常简单的编程语言来解决任务,解决任务的成功取决于两个因素:编程语言中可用的函数范围 和 GPT 的分治法能力(divide and conquer),即 GPT 能够多好地将任务分解成预定义的编程语言。遗憾的是,GPT 在这两点上都是不足的。
  2. Auto-GPT 提供的有限功能可以在其源代码中观察到。例如,它提供了用于搜索网络、管理内存、与文件交互、执行代码和生成图像的功能。然而,这种受限的功能集缩小了 Auto-GPT 能够有效执行的任务范围。
  3. 此外,GPT 的分解和推理能力仍然受到限制。尽管 GPT-4 相较于 GPT-3.5 有了显著的改进,但其推理能力远非完美,进一步限制了 Auto-GPT 的解决问题的能力。
  4. 这种情况类似于尝试使用 Python 构建像《星际争霸》这样复杂的游戏。虽然 Python 是一种强大的语言,但将《星际争霸》分解为 Python 函数极具挑战性。
  5. 本质上,有限功能集和 GPT-4 受限的推理能力的结合,最终造成了这个循环的泥潭,使 Auto-GPT 在许多情况下无法实现预期的结果。

参考资料

  1. Jina AI 创始人肖涵博士:揭秘 Auto-GPT 喧嚣背后的残酷真相