大家好,我是小民,见字欢喜。
智能体的五大组件到底是啥?光看理论可能有点懵,所以我决定——自己搭一个试试,边搭边验证这五个组件到底是怎么工作的。
前面我们聊了智能体是什么、它和聊天机器人的区别,还有它的「思考方式」➔ReAct模式。
今天咱们继续往下学,把智能体拆开看看:一个完整的智能体,到底是由哪些部件组成的?
这是我第一次搭,全程记录,翻车的地方也一起分享给你👇
先说说我要搭一个什么智能体
为了便于演示,我们来个简单的,搭一个“邮箱助手”——跟它说“帮我给XXX发邮件”,让它自动写好、自动发送,还能记住常用的收件人。
平台我选的是Coze(字节跳动旗下的智能体平台,免费,上手简单),地址在这里👇
⚠️友情提示: 复制链接注册后,你会获得一些初始积分,够用很久~
下面,我们就按照“感知→规划→记忆→工具→行动”这五个组件,一边搭一边验证,系好安全带,我们发车👇
01 感知:智能体的“眼睛和耳朵”
它的作用是:接收用户的输入和外界环境的状态。说白了就是智能体靠它“听到”你在说什么,“看到”周围发生了什么。
实操
在Coze里新建智能体,第一步就是设置“人设与回复逻辑”。
这里其实就是在配置感知——告诉智能体:你的输入是什么格式,你要听什么。
我给邮箱助手写的人设是:
你是一个邮箱助手。
用户会告诉你他想给谁发邮件、写什么内容,你需要帮他写好并发送。
如果用户没说收件人或者内容,你要主动问清楚。
① 创建智能体
② 填写好智能体名称、功能介绍和图标
点击「确认」,填写「人设与回复逻辑」
我输入:“帮我给三哥发邮件”。它没直接发,而是问我👇
请问你这封邮件想跟三哥说什么具体内容呢?
比如是日常问候、事情告知,还是有其他需求呀?
你告诉我详细内容后,我会帮你写好邮件的~
感知组件配置完成➔它知道先把信息收集全了再动手。
02 规划:智能体的“大脑”
它的作用是:拆解复杂任务,决定下一步该做什么。说白了就是把一件麻烦事拆成几步,自己安排先干啥后干啥。
实操
在Coze里,规划能力主要靠「提示词」来实现。我在人设里加了一段规划指引:
收到用户发邮件需求后,请按以下步骤操作:
1. 先确认收件人是谁(如果用户只说了称呼,从记忆里查)
2. 再确认邮件内容(如果用户没说,主动问)
3. 生成邮件正文
4. 让用户确认后发送
如上图所示,效果不够明显,它有时还是会跳过步骤。
所以这里我们再优化一下提示词,把规则写得更“硬”一点
你是一个邮箱助手。
重要:必须严格按照以下步骤执行,不要跳过任何一步:
第1步:确认收件人
如果用户给了具体邮箱(如xxx@xx.com),直接使用
如果用户只给了称呼(如“老板”“小张”),先从记忆里查找
如果记忆里没有,问用户:“请提供收件人的邮箱地址”
第2步:确认邮件内容
如果用户给了具体内容,直接使用
如果用户没给,问用户:“邮件内容是什么?”
第3步:生成邮件正文
根据收件人和内容,生成一封正式的邮件
展示给用户确认
第4步:发送
用户确认后,调用邮件插件发送
发送成功后回复“邮件已发送”
效果完全不一样了,它已经严格按照我的步骤要求来了👇
它自己拆成了4步:
- 确认收件人
- 确认邮件内容
- 生成邮件正文
- 发送
我不用告诉它“先干嘛再干嘛”,它自己就能拆明白了。所以规划阶段,顺利完成✌️
03 记忆:智能体的“记忆库”(短期+长期)
它的作用是:让智能体记住历史信息,避免重复提问,利用过往经验。说白了就是让它别转头就忘。
实操
Coze里记忆分两种👇
1. 短期记忆: 默认就有,当前对话里它能记住上下文
2. 长期记忆:需要手动开启「记忆」功能,可以存储用户偏好和历史
我们来看下效果👇
当前对话,它能记住上下文
删除对话记录后,就记不住了
接下来我们来解决这个问题,给小助手配置一下长期记忆👇
配置完成后,我告诉它“三哥的邮箱是:646303771@qq.com”,虽然我写成了“邮件”,但它懂了🤣
然后我再次「删除对话记录」,再问它,发现小助手已经具备长期记忆功能了👇
记忆组件搞定💪,继续往下看👇
04 工具:智能体的“双手”
它的作用是:赋予智能体调用外部世界的能力。说白了就是让它不光会“说”,还会“动手”。
常见的工具类型有👇
1. 信息类: 查天气、查新闻、搜资料
2. 操作类: 发邮件、设提醒、下订单
3. 计算类: 写代码、跑数据
4. 通信类: 发消息、打电话
实操
在Coze里,工具叫“插件”。
咱们来给邮箱助手加个插件:邮件发送插件(Coze里自带的“邮件助手”插件)。
点一下「➕」号
配置完成
到这里,工具组件我们也配置好了~🎉
05 行动:智能体的“执行动作”
它的作用是:执行动作并返回结果,完成与外界的交互。说白了就是把“想好的事”真正做出来。
规划和行动的区别:
-
规划: 决定“要发一封邮件”
-
行动: 真正去调用发邮件的功能,把邮件发出去
实操
在Coze里,行动其实和工具是绑定的——选了工具,它就会执行。但需要你在人设里明确告诉它“什么时候该行动”。
实际上这个规则我们在上面已经加过了:
🚀 终极大测试:验证完整流程
现在到了最激动人心的时刻了,我们来测试一下搭建的邮件小助手好不好用👇
第1轮对话
帮我给三哥发邮件
第2轮对话
祝三哥发量越来越多,身体倍棒,吃啥都香~
小助手帮我把邮件内容生成了,在等待我确认👇
以下是为您生成的邮件内容,请您确认:
主题:暖心祝福
三哥:
展信佳!
特意为您送上真挚的祝福,愿您发量日益浓密,身体强健硬朗,吃什么都香甜可口!祝您生活顺遂,日日开怀!
顺颂时祺
[您的名字]
[发送日期]
请问是否确认发送这封邮件?
第3轮对话
确认发送
等等,翻车了! 它说:
请提供发送方邮箱地址以及该邮箱的授权码,以便我为您发送邮件。
原来小助手还不知道发送方是谁,没关系,我们这就去配一下。
🔧 小插曲:配置发件人信息
我随便搞了个新浪邮箱,步骤如下:
-
登录新浪邮箱网页版,进入「设置」→「客户端pop/imap/smtp」
-
开启「客户端授权码」功能👇
-
复制生成的16位授权码👇
📌小提示: 授权码和邮箱登录密码不同,是专门给第三方客户端使用的。记得保存好,它只会完整显示一次。
拿到发件人邮箱和授权码后,告诉小助手👇
🎉🎉邮件发送成功了🎉🎉
咱们来看看结果👇
如上图,成功收到了小助手发送的邮件,虽然有一点小瑕疵(没有自动填充我的名字和发送日期),但核心流程完全跑通了。
重点是👇
我们完整地搭了一个智能体,并且亲眼见证了五大组件是如何协同工作的,小伙伴们也可以按照这个思路尝试一下,亲手感受一下智能体的“魔力”~
最后来个小结
本文理论+实操,我们亲手验证了智能体五大组件协同工作的全过程,让它不仅能“懂你”,更能“帮你做”👇
1. 感知接收指令
2. 记忆调取经验
3. 规划拆解任务
4. 工具选择手段
5. 行动执行落地
这里面少了任何一个,智能体都不完整:
没感知→聋子瞎子
没规划→无头苍蝇
没记忆→金鱼脑子
没工具→嘴把式
没行动→纸上谈兵
一个完整的智能体,就是让这五个组件像一支训练有素的团队,各司其职,协同作战!
好了,今天的分享就到这里了,欢迎在评论区分享你的成果,或者遇到的坑。
让我们一起在实战中学习,在“翻车”中成长,下期见~