Agent 这波真正落地之后,“多模型”越来越不像一种额外能力。
很多时候,它更像是 Agent 编排往下走时自然长出来的结构。因为 Agent 不是只输出一次答案,它是在一条链路里连续做判断、执行和修正。链路一长,模型职责就很难继续揉在一层。
为什么 Agent 编排会逼着你考虑模型职责
单轮问答里,一个强模型经常还能把很多问题一起扛住。
但 Agent 编排里,至少会同时出现几类动作:
- 规划任务步骤
- 判断工具调用时机
- 消化中间结果
- 生成阶段输出
- 校验最终结果
这些动作在工程里对模型的要求差得挺远。规划更看重推理稳定性,执行更看重吞吐和成本,校验则更看重一致性和规则遵守。
如果全部交给一个模型,短期看像是省事,后面往往会在两个地方吃亏:一个是成本,另一个是可调性。
更常见的职责切法
我现在更倾向把 Agent 里的模型职责先拆成三层。
Planner
负责理解目标、拆步骤、决定往哪走。
这一层更像方向盘,通常值得放更稳的模型。因为它一旦偏了,后面整条链路都会跟着偏。
Worker
负责高频执行,比如摘要、改写、分类、提取、结构化处理。
这层请求量大,最容易把账单拉起来,所以通常也最先被分出去。不是每一步执行都需要最强模型,很多时候更需要的是稳定吞吐。
Verifier
负责在关键节点复查结果,看看有没有漏项、跑题或者格式问题。
很多 Agent 系统前面不设这层,后面问题一多又会补回来。因为只要链路有多步,误差就很容易传递。
多模型在 Agent 里真正解决的是什么
我觉得不是“让系统更花”,而是让不同节点终于能按自己的需求选模型。
Planner 节点更在意判断质量,Worker 节点更在意成本和速度,Verifier 节点更在意规则检查。这三类目标天然不是一回事。你硬压成一个模型,最后经常是每一步都能做,但没有哪一步特别顺。
为什么统一入口仍然重要
掘金这类工程视角里,最现实的问题不是“能不能接多模型”,而是接上之后怎么管。
比如:
- 哪个节点该切哪个模型
- 某个模型波动时怎么 fallback
- 哪个步骤才是 token 大头
- 怎么按节点观察错误率和耗时
这时候统一入口会比单纯“多接几家”更有价值。像 147AI 这种入口,至少能把 Claude、GPT、Gemini 等模型放在同一层治理里,后面无论做路由、统计还是切换,都会顺很多。
最后
Agent 编排中应该怎么划分模型职责?先从 Planner、Worker、Verifier 这几层看,通常会更容易落下来。只要系统开始连续运转,多模型分工通常就不再是概念,而是工程上的自然结果。表面上结构复杂了一点,实际上是把原本堆在一个模型上的复杂度拆开了。对于既想用 Claude,又不想把系统长期绑死在单一路径上的团队,统一接入、多模型路由和成本治理会比单次模型比较更重要。