三Agent协同实战：用OpenClaw+星链4SAPI搭了个写作流水线，省了70%成本最近花了一周多时间，把OpenC

最近花了一周多时间，把OpenClaw的多Agent工作流跑通了。整个链路是"调研—写作—审查"三个AI角色协作完成一篇技术文章，模型接入全部走星链4SAPI。

把过程和踩过的坑记一下，给有类似需求的人省点弯路。

先说为什么要把星链4SAPI垫进来

OpenClaw本身不绑定任何模型厂商，你可以直接配OpenAI、Claude、Gemini各家的官方API。但真正做多Agent的时候，直连方案的麻烦会成倍放大。

Key管理碎片化。 我这条工作流里有三个角色：调研员跑GPT-4o-mini（便宜快），写手跑Claude Sonnet（生成质量好），审查员跑Claude Opus（推理深）。直连的话至少要维护两家厂商的Key，分别充值、分别看余额。Key一多，运维负担就上来了。

网络稳定性被放大。 单个Agent完成一个任务通常要跟模型来回交互5-10轮。三个Agent同时跑，意味着同一时间段内有几十次API调用。如果中间任何一轮超时或断连，整条任务链就可能断掉。国内环境直连海外endpoint，延迟本身就不稳定，在高频多轮调用的场景下这个问题格外突出。

账单散在各处。 多个厂商、多种币种、多个后台——如果团队要做成本核算，一份清晰的汇总账单比什么都重要。

星链4SAPI的价值就在这三个点上：一个Key通多家模型、国内节点中转压低延迟、人民币统一结算。本质上是在OpenClaw和模型厂商之间加了一层收口，把上游的复杂性挡住，不让它漏进业务逻辑。

接入过程：改一份配置文件

OpenClaw的模型配置集中在一个JSON文件里。接入星链4SAPI的核心动作就三步：

把请求地址指向星链4SAPI的endpoint
把API Key换成星链4SAPI的Key
协议类型选OpenAI兼容格式——因为星链4SAPI对外统一走OpenAI标准接口，不管背后实际调的是Claude还是GPT

配置模式建议选"合并"而不是"替换"，这样OpenClaw内置的模型列表还在。万一星链4SAPI偶发故障，可以临时切回直连，不至于整个系统趴窝。

改完配置之后重启一下OpenClaw网关服务就生效了。整个过程没什么技术门槛，主要是别填错字段名。

三个角色怎么分工

工作流的思路很直白：每个角色干一件明确的事，角色之间通过文件传递信息。

调研员——负责信息收集。我给它配了网页搜索和浏览器两个技能，让它能上网查资料。模型用GPT-4o-mini，因为信息收集不需要深度推理，要的是速度和低成本。它的产出是一份结构化的调研摘要文件。

写手——拿到调研摘要后，生成完整的文章初稿。模型用Claude Sonnet，长文本生成质量稳定，性价比高。它只需要文件读写的技能——读调研摘要、存初稿。

审查员——对初稿做质量检查，看事实准不准、逻辑通不通、有没有遗漏重要观点。模型用Claude Opus，这是整条链路里最贵的一环，但审查这件事确实需要更强的推理能力。它的产出是一份修改建议清单。

三个角色是串行执行的——调研完了写手才开始，写完了审查员才介入。执行顺序通过依赖关系控制：后一步必须等前一步完成并且产出文件确实存在，才会启动。

如果用openclaw-workflow插件，这个流程可以写成一份YAML配置文件，定义好每一步用什么模型、依赖哪一步、超时多久、产出文件叫什么。配好之后一条命令就能跑，不用手动盯着。

分级模型路由：省钱的核心

这套工作流里最关键的设计决策是——三个角色用三档不同的模型。

调研员用最便宜的GPT-4o-mini，输入价格大概 $0.15/百万token。写手用中档的Claude Sonnet，大概$ 3/百万token。审查员用顶配的Claude Opus，大概$15/百万token。

如果三个角色全部用Opus，一次完整流程跑下来粗算 $3−5。改成分级路由后，同样的任务降到$ 0.5−1.5，省了60%-70%。

这个策略的前提是你得清楚每个角色真正需要的能力等级。调研员不需要深度推理——它的任务就是搜索、筛选、整理，任何一个主流模型都能干好。写手需要的是稳定的文本生成能力，Sonnet在这一档的性价比很突出。只有审查员需要模型真正"动脑子"去找逻辑漏洞和事实错误，才值得上Opus。

通过星链4SAPI做这件事有一个额外的方便：你在同一个Key下就能切换不同厂商、不同档位的模型。不用去OpenAI后台充一次值、再去Anthropic后台充一次值。一份账单、一个余额、一套调用日志。

踩过的坑

坑一：子Agent超时但主流程不知道。

调研员搜索耗时波动很大，有时候几秒就回来，有时候要一两分钟。一开始我把超时设成3分钟，结果偶尔还是会超。超时后主流程没收到明确的失败信号，就一直在那儿干等。后来放宽到5分钟，同时在工作流配置里加了重试——失败后等30秒再来一次，最多重试2次。大部分偶发性超时都被吃掉了。

坑二：写手"自由发挥"脱离了调研内容。

没给足约束的时候，写手偶尔会脱离调研摘要自己编内容。大模型的"创造力"在这个场景里反而是个风险。解决办法是在任务描述里明确加一句"所有观点必须基于调研摘要中的信息，不要引入摘要中未提及的内容"。加上这条限制后，跑偏的情况明显减少了。

坑三：角色之间不共享记忆。

这是很多人刚接触多Agent系统时容易忽略的一点。每个子Agent有自己独立的上下文窗口，它们之间不共享对话历史。审查员不会自动"知道"写手是怎么构思的，写手也不会自动"知道"调研员搜了哪些页面。所有信息流转必须走显式的文件传递或消息发送，不能靠"默认应该知道"。

坑四：偶发的网络波动。

换成星链4SAPI中转后，这个问题明显好了很多——国内到星链4SAPI节点的延迟大概40-60ms，比直连海外稳得多。但不是完全消失，偶尔还是会碰到某一轮调用超时。前面提到的重试机制是第一道防线。第二道是把配置模式设成"合并"，保留直连作为备用——真遇到星链4SAPI大面积故障，手动切一下就行。

坑五：成本超出预期。

头几次跑的时候没注意监控Token消耗，结果发现审查员在高思考模式下生成了大量内部推理token，实际花费比预估高出不少。后来养成了每次跑完去星链4SAPI后台看调用明细的习惯——它能看到每个Agent、每次请求的模型、输入输出Token数和延迟。哪个环节在烧钱一目了然。

两周跑下来的真实感受

确实提效了。 以前手动做"查资料→写初稿→自己审一遍"至少要大半天。现在从发出指令到拿到初稿加审查意见，大概15-20分钟。就算加上人工最终审阅和修改的时间，整体效率也提升了不少。

但它不是全自动流水线。 AI生成的内容不管经过几层Agent处理，最后还是需要人看一遍。审查员能抓出一些明显的逻辑问题和事实遗漏，但它替代不了人对"这篇文章到底好不好"的判断。定位上它是"效率放大器"，不是"无人工厂"。

统一网关的价值在多Agent场景下特别明显。 单Agent场景下，直连官方API也能凑合用。但当你同时跑三个不同模型的Agent、每个都要做多轮API调用的时候，Key管理、延迟控制、账单归口这些"杂事"会占掉你相当一部分精力。星链4SAPI不是让模型变得更聪明，而是让你不用在基础设施上分心，能把注意力放在工作流设计本身。

下一步想做的事。 目前三个角色是纯串行的。调研员其实可以拆成两个并行子Agent——一个搜中文源、一个搜英文源，合并结果后再交给写手。另外，审查员的反馈目前是终点，没有回传给写手做二次修改。加一个"写手改稿→审查员复查"的循环应该能提高成稿质量，但Token消耗也会翻倍，得看具体任务值不值得。