智能体 (Agent) 架构设计
Agent 四大能力架构概述
Agent 系统宏观架构的理解,核心不仅是大模型,还需整合规划、记忆、工具等模块,形成完整能力体系。
Agent 核心大脑 (Agent Core)
大模型是核心指挥部,负责逻辑推理与角色身份确立。需明确 Agent 的人设,例如设定为专业电商客服或资深 Python 程序员,而非通用模型。
规划模块 (Planning)
解决任务执行顺序问题,核心包括任务拆解与自我反思。以策划云南 5 天旅行并订票为例,需拆解为查天气、做攻略、比价、下单等步骤;自我反思指任务异常时(如查不到机票)能自主排查问题(日期错误、换航班查询),如同导航仪引导行动路径。
记忆模块 (Memory)
区分短期记忆与长期记忆。短期记忆即聊天上下文,用于记住近期对话内容(如刚说要买杯子);长期记忆通过向量数据库实现,解决 token 溢出问题,可长期存储用户信息(如下个月仍能回忆起用户是喜欢喝咖啡的 VIP),确保 Agent“记住自己是谁、说过什么”。
工具与行动模块 (Tools & Action)
大模型落地关键,为 Agent 配备工具箱,弥补模型能力局限。工具包括联网搜索(获取实时信息如天气)、计算器(复杂数学计算)、API 调用(查询数据库、执行代码)等。模型作为调度员,判断需求后调用对应工具(如查天气时调用天气查询器),是 Agent 开发中易出彩也易出 bug 的部分。
四大模块关系总结
规划是导航员(决定任务路径与拆解),记忆是图书管理员(避免对话断片、记住用户喜好),工具是执行官(弥补模型不足,执行具体操作),核心大脑是运筹帷幄的司令部,四者协同构成完整 Agent 架构。