第 15 章：Supervisor 模式——给你的 Agent 军团配个“主管”第15章：Supervisor 模式：给

第15章：Supervisor 模式：给你的 Agent 军团配个“主管”

如果说 DAG 是按图索骥的流水线，那么 Supervisor 就是随机应变的部门经理。它不干具体活，但它掌握着最重要的权力：招人、分钱、以及——把搞不定的锅甩给人类。

0001页.png

上一章我们讲了 DAG（有向无环图），它非常适合 流程固定 的任务。比如“写财报分析”：搜数据 -> 算指标 -> 写报告。这一套流程雷打不动，DAG 执行得行云流水。

但在现实世界里，计划赶不上变化。 场景重现： 用户让 Agent “分析一下 AI 行业的竞争格局”。 Agent 刚开始调研了 OpenAI 和 Google。突然，它发现了一个新秀 Anthropic 好像也很猛。

DAG 的反应：瞎了吗？流程图里只有两家公司，没画第三家，我不看。
Supervisor 的反应：等等，这有个新情况。临时招募 一个新 Agent，专门去查 Anthropic！

这就是 Supervisor（主管）模式 的核心价值——动态应变。

01. 什么时候你需要一个“包工头”？

DAG 虽好，但它有一个致命弱点：它是静态的。图画好了就不能改。当你的任务出现以下特征时，你就必须升级到 Supervisor 模式：

任务结构不确定：做着做着发现需要加任务（Dynamic Recruitment）。
需要内部开会：Agent A 查到的东西，需要“私聊”告诉 Agent B（Inter-Agent Communication）。
规模太大：子任务超过 5 个，画 DAG 图会乱成一团麻，需要层级化管理。

简单说：5 人以下的小作坊用 DAG，5 人以上的正规军用 Supervisor。

02. 核心权力一：动态招募（HR 系统）

Supervisor 最酷的能力，就是可以在运行时 “摇人” 。

在 Shannon 框架中，我们设计了一套 Signal（信号）机制。当某个负责“初筛”的 Agent 发现新线索时，它不会自己去干（因为它不专业），而是向 Supervisor 发送一个 recruit_signal（招募信号）。

剧本演示

Agent A（初筛员） ：“老板，我发现财报里提到了一个叫‘Project X’的秘密项目，但我看不懂技术细节。”
Supervisor（包工头） ：“收到。系统，给我 实例化 一个‘技术专家 Agent’，现在的任务是：深挖 Project X。”
Agent B（新来的技术专家） ：“收到，开工。”

这就像在玩 RTS 游戏（如星际争霸），你不仅是指挥现有的兵，你还在不断造兵。

03. 核心权力二：邮箱系统（Slack）

在 DAG 模式下，信息传递是“传声筒”式的：A 传给 B，B 传给 C。A 和 C 没法直接说话。 Supervisor 模式引入了 邮箱（Mailbox） 概念。

任何 Agent 都可以给其他 Agent（或者群发）写信。

Agent A：“@Agent B，我刚查到的数据有点怪，你要不要复核一下？”
Agent B：“收到，我去看看。”

架构设计的关键点：为了防止死锁（A 等 B 回信，B 等 A 回信），邮箱系统的发送必须是 非阻塞（Non-blocking） 的。就像发微信一样，发完我就去干别的事了，你回不回我不管。

04. 核心权力三：智能容错（50%+1 原则）

带过团队的都知道，你不能指望每个人都靠谱。如果有 10 个 Agent 在干活，其中 2 个挂了（比如联网超时、报错），整个任务要停下来吗？

DAG 的逻辑是：一荣俱荣，一损俱损。只要一个节点红了，整个图就红了。 Supervisor 的逻辑是：民主集中制。

容错算法：

我们通常设定一个 50%+1 阈值。

如果有 10 个子任务，挂了 4 个。Supervisor 会判断：剩下 6 个的结果也够用了，忽略错误，继续推进。
如果挂了 6 个。Supervisor 判定：信息缺失太多，任务失败。

这大大提高了长链路任务的 鲁棒性（Robustness） 。

0005页.png

05. 终极权力：向上管理（Human-in-the-Loop）

Agent 再聪明，也有犯浑的时候。特别是涉及 “删库”、“转账”、“发邮件给全员” 这种高危操作时，Supervisor 必须要把决策权上交。

这就叫 HITL（Human-in-the-Loop，人类介入） 。

什么时候该烦人类？

不能大事小事都弹窗，那样用户会把系统关了。我们需要定义 升级触发器（Escalation Triggers） ：

敏感操作：检测到 delete、pay、publish 等关键词。
置信度低：Agent 自己也拿不准（置信度 < 0.6）。
成本超限：这个任务已经烧了 5 美元了，还要继续吗？

0009页.png

信任升级机制（Trust Level）

这是一个非常人性化的设计。我们把 Agent 分为三个信任等级：

等级	待遇	升级条件
实习生 (Novice)	步步惊心：每一步操作都要人类点“批准”。	完成 50 个任务且无事故。
熟练工 (Proficient)	抓大放小：只有敏感操作才弹窗。	完成 200 个任务，成功率 98%。
专家 (Expert)	先斩后奏：只在异常时报警，平时全自动。	一旦出事，立马降级回实习生。

这完全模拟了真实职场的信任建立过程。

总结

Supervisor 模式是多 Agent 系统的 管理层。

它通过 动态招募 解决了任务的不确定性。
它通过 邮箱系统 打通了信息孤岛。
它通过 容错阈值 保证了系统的韧性。
它通过 HITL 机制 守住了安全的底线。

至此，你的 Agent 军团已经具备了独立作战、自我管理、且懂得分寸的能力。

Part 5（多 Agent 编排）完结。

我们从基础的编排概念，讲到了静态的 DAG，最后讲到了动态的 Supervisor。你现在手里已经握有一支训练有素的 AI 军队了。

但是，这支军队还面临最后一个问题：交接棒。当 Agent A 做完工作，把结果交给 Agent B 时，如何保证数据不丢、格式不对、理解无误？仅仅靠把文本塞进 Prompt 够吗？

Part 6：工程化落地 即将开启。下一章，我们将深入 Handoff（交接）机制：探讨在复杂的分布式环境中，如何实现 Agent 之间丝般顺滑的“脑机接口”。

0015页.png