第15章:Supervisor 模式:给你的 Agent 军团配个“主管”
如果说 DAG 是按图索骥的流水线,那么 Supervisor 就是随机应变的部门经理。它不干具体活,但它掌握着最重要的权力:招人、分钱、以及——把搞不定的锅甩给人类。
上一章我们讲了 DAG(有向无环图),它非常适合 流程固定 的任务。 比如“写财报分析”:搜数据 -> 算指标 -> 写报告。这一套流程雷打不动,DAG 执行得行云流水。
但在现实世界里,计划赶不上变化。 场景重现: 用户让 Agent “分析一下 AI 行业的竞争格局”。 Agent 刚开始调研了 OpenAI 和 Google。突然,它发现了一个新秀 Anthropic 好像也很猛。
- DAG 的反应:瞎了吗?流程图里只有两家公司,没画第三家,我不看。
- Supervisor 的反应:等等,这有个新情况。临时招募 一个新 Agent,专门去查 Anthropic!
这就是 Supervisor(主管)模式 的核心价值——动态应变。
01. 什么时候你需要一个“包工头”?
DAG 虽好,但它有一个致命弱点:它是静态的。图画好了就不能改。 当你的任务出现以下特征时,你就必须升级到 Supervisor 模式:
- 任务结构不确定:做着做着发现需要加任务(Dynamic Recruitment)。
- 需要内部开会:Agent A 查到的东西,需要“私聊”告诉 Agent B(Inter-Agent Communication)。
- 规模太大:子任务超过 5 个,画 DAG 图会乱成一团麻,需要层级化管理。
简单说:5 人以下的小作坊用 DAG,5 人以上的正规军用 Supervisor。
02. 核心权力一:动态招募(HR 系统)
Supervisor 最酷的能力,就是可以在运行时 “摇人” 。
在 Shannon 框架中,我们设计了一套 Signal(信号)机制。 当某个负责“初筛”的 Agent 发现新线索时,它不会自己去干(因为它不专业),而是向 Supervisor 发送一个 recruit_signal(招募信号)。
剧本演示
- Agent A(初筛员) :“老板,我发现财报里提到了一个叫‘Project X’的秘密项目,但我看不懂技术细节。”
- Supervisor(包工头) :“收到。系统,给我 实例化 一个‘技术专家 Agent’,现在的任务是:深挖 Project X。”
- Agent B(新来的技术专家) :“收到,开工。”
这就像在玩 RTS 游戏(如星际争霸),你不仅是指挥现有的兵,你还在不断造兵。
03. 核心权力二:邮箱系统(Slack)
在 DAG 模式下,信息传递是“传声筒”式的:A 传给 B,B 传给 C。A 和 C 没法直接说话。 Supervisor 模式引入了 邮箱(Mailbox) 概念。
任何 Agent 都可以给其他 Agent(或者群发)写信。
- Agent A:“@Agent B,我刚查到的数据有点怪,你要不要复核一下?”
- Agent B:“收到,我去看看。”
架构设计的关键点: 为了防止死锁(A 等 B 回信,B 等 A 回信),邮箱系统的发送必须是 非阻塞(Non-blocking) 的。就像发微信一样,发完我就去干别的事了,你回不回我不管。
04. 核心权力三:智能容错(50%+1 原则)
带过团队的都知道,你不能指望每个人都靠谱。 如果有 10 个 Agent 在干活,其中 2 个挂了(比如联网超时、报错),整个任务要停下来吗?
DAG 的逻辑是:一荣俱荣,一损俱损。只要一个节点红了,整个图就红了。 Supervisor 的逻辑是:民主集中制。
容错算法:
我们通常设定一个 50%+1 阈值。
- 如果有 10 个子任务,挂了 4 个。Supervisor 会判断:剩下 6 个的结果也够用了,忽略错误,继续推进。
- 如果挂了 6 个。Supervisor 判定:信息缺失太多,任务失败。
这大大提高了长链路任务的 鲁棒性(Robustness) 。
05. 终极权力:向上管理(Human-in-the-Loop)
Agent 再聪明,也有犯浑的时候。 特别是涉及 “删库”、“转账”、“发邮件给全员” 这种高危操作时,Supervisor 必须要把决策权上交。
这就叫 HITL(Human-in-the-Loop,人类介入) 。
什么时候该烦人类?
不能大事小事都弹窗,那样用户会把系统关了。我们需要定义 升级触发器(Escalation Triggers) :
- 敏感操作:检测到
delete、pay、publish等关键词。 - 置信度低:Agent 自己也拿不准(置信度 < 0.6)。
- 成本超限:这个任务已经烧了 5 美元了,还要继续吗?
信任升级机制(Trust Level)
这是一个非常人性化的设计。我们把 Agent 分为三个信任等级:
| 等级 | 待遇 | 升级条件 |
|---|---|---|
| 实习生 (Novice) | 步步惊心:每一步操作都要人类点“批准”。 | 完成 50 个任务且无事故。 |
| 熟练工 (Proficient) | 抓大放小:只有敏感操作才弹窗。 | 完成 200 个任务,成功率 98%。 |
| 专家 (Expert) | 先斩后奏:只在异常时报警,平时全自动。 | 一旦出事,立马降级回实习生。 |
这完全模拟了真实职场的信任建立过程。
总结
Supervisor 模式是多 Agent 系统的 管理层。
- 它通过 动态招募 解决了任务的不确定性。
- 它通过 邮箱系统 打通了信息孤岛。
- 它通过 容错阈值 保证了系统的韧性。
- 它通过 HITL 机制 守住了安全的底线。
至此,你的 Agent 军团已经具备了独立作战、自我管理、且懂得分寸的能力。
Part 5(多 Agent 编排)完结。
我们从基础的编排概念,讲到了静态的 DAG,最后讲到了动态的 Supervisor。 你现在手里已经握有一支训练有素的 AI 军队了。
但是,这支军队还面临最后一个问题:交接棒。 当 Agent A 做完工作,把结果交给 Agent B 时,如何保证数据不丢、格式不对、理解无误?仅仅靠把文本塞进 Prompt 够吗?
Part 6:工程化落地 即将开启。 下一章,我们将深入 Handoff(交接)机制:探讨在复杂的分布式环境中,如何实现 Agent 之间丝般顺滑的“脑机接口”。