看懂这张图,也就读懂了智能体的核心逻辑。
一、总结
🧠 Memory(记忆模块)
记忆系统帮助 Agent 在任务中保持上下文和经验的连续性,分为两种:
- Short-term memory(短期记忆) :存储当前对话或任务中的临时信息,类似于人类的“工作记忆”。
- Long-term memory(长期记忆) :保存过去的知识、经验或用户偏好,支持跨会话的个性化与学习。
🛠️ Tools(工具模块)
Agent 可以调用多种外部工具来执行具体任务,图中列举了以下几种:
- Calendar(日历) :管理时间、安排日程。
- Calculator(计算器) :执行数学运算。
- CodeInterpreter(代码解释器) :运行代码,支持动态计算或数据处理。
- Search(搜索) :从互联网或知识库中检索信息。
- ...more:表示还可以扩展更多工具。
这些工具让 Agent 具备了“行动能力”,可以执行超出语言模型本身功能的任务。
👀 感知
- 智能体工作的第一步。它接收用户的问题或指令,同时从短期记忆和长期记忆中读取相关信息,理解当前所处的状态和可用资源。
🧭 Planning(规划模块)
在理解任务后,智能体开始制定执行步骤。规划是 Agent 实现目标的关键步骤,图中包含以下几种策略:
- Subgoal decomposition(子目标分解) :将复杂任务拆解为多个小步骤,逐步完成。
- Chain of thoughts(思维链) :通过一系列逻辑推理步骤来解决问题,类似于“逐步思考”。
🏃 行动
- 根据规划开始执行具体操作。此时智能体会调用行动工具(即调用右侧的工具集),比如打开计算器算数,或者使用搜索查询信息。
🔍 反思/观察
- 这是智能体具备“智能”的关键环节。 在行动之后,智能体会观察行动产生的结果。
- 自我批评:如果结果出错,或者不是最优解,智能体会进行自我批评(例如:“刚才的搜索关键词太宽泛,导致结果不精确”)。
💾 记忆存储经验
- 反思的结果(无论是成功的经验还是失败的教训)最终会被写入记忆系统。
- 这样就形成了闭环: 下次遇到类似任务时,智能体可以从长期记忆中读取这次的经验,避免再犯同样的错误,或者直接套用成功的策略。
🔁 核心思想总结
这张图描绘的是一个具备学习能力的智能体:
- 它有工具(能做事)
- 它有记忆(能记住事)
- 它会思考(能规划步骤)
- 它会复盘(能反思错误)
- 它会成长(能把反思结果存下来,下次做得更好)
二、举个例子
场景:假设我们有一个智能家居系统,它的任务是根据家庭成员的需求调节室内环境,比如温度和灯光。
1.感知 (Perception):
家庭成员通过语音助手说:"我感觉有点冷,能不能把温度调高一些?"智能家居系统通过语音识别和情感分析技术"感知"到用户觉得房间温度太低,需要提高温度。
2.规划(Planning):
系统根据用户的需求,规划出下一步的行动,决定如何调节房间温度。系统可能会制定以下计划:
-
检查当前的室内温度。
-
根据用户的偏好和当前温度决定升高几度合适。
-
调整温度设置,并告知用户。
3.行动(Action):
系统执行计划的行动,首先检查当前温度,例如发现室温是20C。根据用户的偏好,将温度调高到23C,并通过语音助手反馈给用户:"我已经将温度调高到23C,请您稍等,温度将逐渐上升。"
4.观察 (0bservation): 系统观察房间温度的变化,以及用户的反馈。如果用户在几分钟后再次说"现在温度刚刚好",系统会感知到环境调节成功。
如果用户还觉得冷,系统可能会调整计划,进一步调高温度。
循环:
在每个阶段,智能家居系统都可能根据环境变化和用户反馈调整操作。例如,如果调高温度后用户依然觉得冷,系统会重新规划,进一步调整温度设置。通过这一系列的感知、规划、行动和观察,智能家居系统能够动态响应家庭成员的需求,不断调整室内环境,直到用户感觉舒适为止。