漫画:什么是智能体(Agent)?

420 阅读10分钟

智能体,对应英文Agent,由美国计算机科学家,号称人工智能之父的马文·明斯基所提出。

1986年,他在自己出版的《思维的社会》一书中,把思维描述为由大量相互作用的智能体构成的复杂系统,每个智能体都执行特定的任务,并通过协作完成复杂的认知活动。这一思想为智能体的研究奠定了理论基础。

在后续的近40年时间里,有许多计算机领域的人才都在致力于智能体的研究,其中相继诞生了许多出色的成果,比如IBM的深蓝、谷歌的AlphaGo等等。

但一直到最近几年,随着GPT为首的一批大语言模型的诞生,智能体才真正得以发扬光大。

智能体可以做到哪些事情呢?我们来举几个例子:

1.AI旅游专家

利用AI技术,可以实现旅游专家这样的智能体,它们就像真正的导游一样,为你规划行程、为你推荐酒店、回答你各种各样的旅游问题。

2.AI外教

智能体可以扮演成精通多国语言的外教,与你进行各种场景的外语对话,让你在自然的聊天环境中学习外语,而且有着无限的耐心和精力。

3.AI象棋高手

利用AI在棋类竞赛上打败人类冠军,虽然早已经不是什么新闻。但使用智能体可以更加灵活方便地扮演象棋高手,陪你下棋娱乐。

4.AI编程助手

AI编程助手是程序员们的好朋友,它可以与真人程序员一起结对编程,智能生成许多关键代码,大大提升了程序员的工作效率。

5.AI保险顾问

普通人买保险,会有很多搞不清楚的地方,如果拥有一个AI保险顾问,将会为你做出有效的分析和规划,甚至比真人保险顾问更加专业且客观。

6.AI营养师

营养和健康,对于每一个人都十分重要。AI营养师可以根据你的身体状况,为你定制一份个性化的食谱和生活建议,不但免费,而且随时保持着耐心。

7.AI漫画家

许多人很喜欢动漫,但是真正创作出一部漫画是非常困难的事情。AI漫画家可以帮助你实现自己的幻想,只要你的想法足够好,就能利用它生成一部精彩的漫画。

8.AI面试官

对于互联网行业的打工人,尤其是程序员,面试能力是非常重要的。毫不夸张地说,如果有幸面试进一家有前途的大厂,很可能整个职业生涯都会被改写。如果此时我们拥有一个AI面试官,帮助我们进行一次又一次的模拟面试,那么一定能让我们在真正面试的时候得到最好的发挥。

直接使用大模型,都有哪些局限呢?

1.缺乏实时性

尽管大模型已经非常聪明了,但即使再新的模型版本,用于训练的数据也有一个截止的时间点,在那个时间点之后发生的任何事情,大模型都是不知道的。

因此,当我们询问大模型一些最新事件的时候,大模型的回答质量往往不够好。

2.缺乏长期记忆

在经过一个版本的训练之后,大模型的能力基本就已经固定下来了。虽然我们可以通过对话来给大模型的回答进行微调,但大模型只拥有短期的会话记忆,并不能真正长期记住用户的输入内容,更不可能在多个用户之间共享知识。

3.不适合处理复杂逻辑

许多时候,我们希望获得的结果并不是简单通过一个问题就能得到,而是需要经过复杂的逻辑和流程才能完成。如此一来,我们就不得不把提示词写得无比复杂,甚至需要多轮对话才可以实现。

这样不但一次性使用起来比较麻烦,还不方便后续的重复使用。

1.什么是插件

构成智能体的插件,可以理解为拥有特定功能的辅助工具。插件为智能体提供了各个领域的最新讯息和扩展功能。

比如,我们想要开发一个旅游专家的智能体,需要寻找一个旅游城市当中的高端酒店,那我们就有可能用到携程提供的插件;如果我们想要开发一个新闻评论员的智能体,需要查询当天甚至最近一两个小时的热点新闻,我们有可能使用新闻资讯类的插件。

2.什么是知识库

知识库,就好比是智能体的存储器,为智能体提供了信息来源。知识库的存储形式多种多样,即可以是数据库,也可以是不规则的文本。

与此同时,智能体还可以长期存储和提炼用户的输入信息,从而更好地为用户提供个性化回答。

在智能体查询知识库并生成输出结果的过程中,会用到一种被称为检索增强生成(RAG)的技术,这个我们今后会专门来讲。

3.什么是工作流

工作流,就是为了完成某一个大目标所需要的一系列工作流程,第一步是做什么、第二步是做什么。

工作流的基本单元是节点,每个节点有着各自独立的功能。同时工作流也像程序一样,也会涉及到各种各样的逻辑,比如条件、循环等等。

可以认为,工作流就是智能体的指挥官。下面这张图就是一个标准的工作流:

市面上都有哪些智能体平台呢?我们这里列举两个比较有代表性的:

1.GPTs

ChatGPT可以说是大模型领域的领军者,在2023年11月,OpenAI公司推出了配套的智能体平台GPTs,允许用户构建自定义的GPT应用,完成特定的个人和专业任务。

2.扣子(Coze)

Coze平台是由字节跳动推出的一款AI聊天机器人和应用程序编辑开发平台,允许用户快速搭建基于 AI 模型的各类智能体,并将它们部署在其他社交平台和消息应用上。

Coze不但支持多种基础大模型,而且提供了多种插件、知识、工作流、长期记忆和定时任务等功能,非常方便国人使用。

除了上面这两大平台之外,腾讯元气、讯飞星火、智谱清言、文心智能体等等,也都提供了非常好用的智能体平台。