说明 :
为了更好地对 AI Agent 模式进行应用,更是为了设计可工程化、可维护、可演进的生产级 AI Agent 系统,有必要将高层智能决策逻辑(LLM 视角)与底层工程实现机制(Agent 工程视角)进行系统性解耦与结构化映射,从而在复杂业务场景中实现架构可控、行为可预测、迭代可持续的智能体系统构建。同时,通过标准化的模式卡片明确每种能力的设计意图、适用边界、组合方式及潜在风险。
在形成上述工作内容之前,需要对业界优秀的 AI Agent 实践案例、开源框架(如 LangChain、AutoGen、CrewAI、LangGraph)、学术研究成果(如 ReAct、Plan-and-Execute、ToT)以及企业级落地项目进行系统性梳理、抽象与归纳,识别共性能力单元与典型交互范式,进而提炼并分类形成一份结构清晰、覆盖全面、来源可溯的《AI Agent 设计模式清单》,作为后续模式卡开发与架构设计的统一基础。
- A#X:来自LLM视角的第 X 项模式
- B#Y:来自Agent工程视角的第 Y 项模式
I. 目标理解与任务入口层
解决"做什么"和"从哪里开始"的问题
| 模式 | 来源 | 说明 |
|---|---|---|
| 被动目标创建者 | A#1 | 用户通过明确指令表达任务目标,系统解析意图并初始化执行上下文 |
| 主动目标创建者 | A#2 | 系统基于上下文线索(屏幕状态、历史行为、用户习惯)推断未明确表达的用户需求 |
| 路由(Routing) | B#2 | 根据任务特征选择最优处理路径,如简单查询直连大模型,复杂任务分发至专用模块 |
| 目标设定和监控 | B#11 | 建立任务目标指标和进度跟踪机制,实时评估执行状态并在偏差时触发调整 |
小计:A(2) + B(2) = 4项
II. 输入/输出结构化与接口标准化层
解决"如何与大模型可靠交互"的问题
| 模式 | 来源 | 说明 |
|---|---|---|
| 提示/响应优化器 | A#3 | 通过预定义模板规范输入结构,添加格式约束和后处理逻辑,确保输出可被程序解析 |
| 提示词链(Prompt Chaining) | B#1 | 将复杂任务分解为顺序执行的子任务链,每个子任务的输出作为下一任务的结构化输入 |
小计:A(1) + B(1) = 2项
III. 动态知识获取与工具集成层
解决"知识过时、能力封闭"的问题
| 模式 | 来源 | 说明 |
|---|---|---|
| 检索增强生成 (RAG) | A#4 | 从外部知识源检索相关信息,将检索结果与查询结合后输入模型,增强回答准确性 |
| 知识检索(RAG) | B#14 | 实现检索系统的工程组件,包括索引构建、查询重写、结果排名和上下文融合机制 |
| 工具使用(函数调用) | B#5 | 为Agent提供调用外部API、数据库、命令行工具等的能力接口,扩展基础功能 |
| 工具/Agent注册中心 | A#15 | 维护系统中可用工具和子Agent的元数据目录,支持动态发现和能力查询 |
| Agent适配器 | A#16 | 设计统一的工具调用接口,抽象不同工具的具体实现差异,提供标准化调用协议 |
小计:A(3) + B(2) = 5项(含1项重合)
IV. 多步规划、推理与探索层
解决"单步生成不可靠、复杂任务难处理"的问题
| 模式 | 来源 | 说明 |
|---|---|---|
| 单次模型查询 | A#5 | 通过单一提示要求模型生成完整解决方案,适用于确定性强、复杂度低的任务 |
| 增量模型查询 | A#6 | 将任务拆分为多个推理步骤,每步基于历史上下文调用模型,逐步推进至完成 |
| 单路径规划生成器 | A#7 | 生成线性执行路径,采用因果推理链(如Chain-of-Thought)逐步解决结构化问题 |
| 多路径规划生成器 | A#8 | 生成并评估多条可能的执行路径,通过树状搜索和回溯机制选择最优解决方案 |
| 规划(Planning) | B#6 | 动态制定可执行的多步骤计划,包含条件分支和回退策略,根据执行反馈进行调整 |
| 推理技术(Reasoning Techniques) | B#17 | 集成程序辅助语言模型(PAL)、自洽性推理等技术,将复杂推理转化为可执行代码 |
| 探索和发现(Exploration and Discovery) | B#21 | 当标准解决方案失败时,主动尝试替代策略,通过系统性试错扩展解决空间 |
小计:A(4) + B(3) = 7项
V. 反思、记忆与持续学习层
解决"无法自我修正、经验无法沉淀"的问题
| 模式 | 来源 | 说明 |
|---|---|---|
| 自我反思 | A#9 | Agent对自身输出进行错误检测和修正,识别逻辑不一致、事实错误或不完整之处 |
| 交叉反思 | A#10 | 多个专业化Agent相互评审输出,通过多角度验证提高结果可靠性和完整性 |
| 人类反思 | A#11 | 在关键决策点引入人类专家反馈,将修正建议整合到后续决策和长期记忆中 |
| 反思(Reflection) | B#4 | 任务完成后执行系统性复盘,生成可操作的改进建议并更新执行策略 |
| 记忆管理(Memory Management) | B#8 | 实现多级存储架构,区分短期会话记忆、长期知识记忆和经验回放缓冲区 |
| 学习和适应(Learning and Adaptation) | B#9 | 从历史成功/失败案例中提取模式,自动调整决策阈值和行为策略 |
小计:A(3) + B(3) = 6项
VI. 多智能体协作与通信层
解决"单一Agent能力有限、可靠性不足"的问题
| 模式 | 来源 | 说明 |
|---|---|---|
| 基于投票的合作 | A#12 | 多个Agent独立生成解决方案,通过加权投票或多数决确定最终输出 |
| 基于角色的合作 | A#13 | 为不同Agent分配特定角色(如调度器、执行者、验证者),形成职责明确的协作流水线 |
| 基于辩论的合作 | A#14 | Agent通过结构化辩论提出论点、反驳和证据,通过共识或最优论点确定最终方案 |
| 多Agent协作 | B#7 | 将复杂任务分解为专业子任务,分配给领域专家Agent,协调结果整合 |
| Agent间通信(A2A) | B#15 | 定义Agent通信的消息格式、传输机制和状态同步协议,确保协作一致性 |
| 模型上下文协议(MCP) | B#10 | 标准化上下文交换格式,明确定义对话历史、目标状态和工具使用上下文的序列化方式 |
小计:A(3) + B(3) = 6项
VII. 安全、评估与运行时治理层
解决"输出不可控、系统不可信、性能不可管"的问题
| 模式 | 来源 | 说明 |
|---|---|---|
| 多模态护栏 | A#17 | 在输入/输出层实施内容过滤机制,防止生成有害、违法或越权内容,支持文本、图像等多种模态 |
| Agent评估器 | A#18 | 设计自动化测试框架,评估Agent在准确性、鲁棒性、安全性等维度的表现指标 |
| Guardrails / 安全模式 | B#18 | 在关键操作(如文件修改、网络请求)前进行权限验证和风险评估,实施分级授权机制 |
| 人机协同(Human-in-the-Loop) | B#13 | 识别高风险操作点,自动暂停执行并请求人类确认,确保关键决策的人类监督 |
| 异常处理和恢复 | B#12 | 实现异常检测机制,支持事务回滚、状态快照恢复和备用执行路径 |
| 评估和监控 | B#19 | 建立实时监控仪表盘,跟踪Agent性能指标、资源消耗和错误率,支持动态扩缩容 |
小计:A(2) + B(4) = 6项
VIII. 执行调度与资源优化层
解决"执行效率低、资源浪费、缺乏优先级"的工程问题
| 模式 | 来源 | 说明 |
|---|---|---|
| 并行化(Parallelization) | B#3 | 识别任务中可并行执行的子任务,利用多线程、异步IO优化执行效率 |
| 优先级排序 | B#20 | 基于任务紧急度、业务价值和资源需求,动态调整任务队列优先级 |
| 资源感知优化 | B#16 | 在运行时监控token消耗、API调用成本、计算资源使用,动态调整策略以优化整体成本 |
小计:A(0) + B(3) = 3项
全量统计
| 类别 | A贡献 | B贡献 | 小计 |
|---|---|---|---|
| I. 目标理解 | 2 | 2 | 4 |
| II. I/O结构化 | 1 | 1 | 2 |
| III. 知识与工具 | 3 | 2 | 5 |
| IV. 规划与推理 | 4 | 3 | 7 |
| V. 反思与学习 | 3 | 3 | 6 |
| VI. 协作通信 | 3 | 3 | 6 |
| VII. 安全与治理 | 2 | 4 | 6 |
| VIII. 调度与优化 | 0 | 3 | 3 |
| 总计 | 18 | 21 | 39 |
架构整合视角
在构建生产级Agent系统时,架构师/SE应先从A类模式确定系统能力边界和核心决策点,再结合B类模式设计具体组件实现。
- LLM视角(A类)提供了18种高层架构模式,主要关注"在哪些关键决策点需要设计选择",例如在规划层选择单路径还是多路径策略,在协作层选择投票还是角色分配机制。
- Agent工程实践(B类)贡献了21种可落地的组件模式,重点解决"每个能力模块的具体实现",例如工具注册中心的数据结构设计、记忆管理器的存储优化策略、多Agent通信的序列化协议。
举例:在构建CLI AI Agent时,可采用增量模型查询(A#6)作为基础推理框架,配合工具使用(B#5)和工具/Agent注册中心(A#15)实现命令行工具集成,通过资源感知优化(B#16)控制token消耗,最后用异常处理和恢复(B#12)确保系统稳定性。这种自顶向下与自底向上结合的方法,能有效平衡架构完整性与实现可行性。