最近读到一篇文章,标题很刺激——《拟人化架构的工程陷阱:为什么"公司制"并非多智能体协作的最优解》。
读完后我在电脑前坐了很久。不是因为震惊,而是因为共鸣。
我正在做一个项目,本质上就是一个A2A(Agent to Agent)的协议系统——让不同的AI智能体之间直接对话、交易。在做这个项目的过程中,我踩过一个巨大的坑,正好和这篇文章的观点撞上了。
这篇文章想说清楚一件事:**当你试图用人类组织的方式去编排AI,你其实是在用最贵的资源去模拟最差的效率。 **
一个"看起来很对"的直觉
多智能体系统火起来之后,最流行的设计范式是什么?
CEO Agent 负责拆任务,Manager Agent 负责分配,Worker Agent 负责执行。
这个结构太好理解了。每个人都在公司待过,一看就懂:老板发话,经理分工,员工干活。Demo演示的时候,投资人和客户的眼睛都会亮起来——这不就是AI版的"超级公司"吗?
但问题在于:**好理解≠好用。 **
人类社会演化出科层制,有一个根本前提——人脑带宽有限,人与人之间的沟通成本极高。
你跟同事开一个30分钟的会,实际有效信息传输量可能只有几百个字。剩下的时间在干嘛?在对齐语境、重复背景、消除歧义、管理情绪。这些"浪费"是人类协作的必然代价,中层管理者存在的意义,就是在这些高损耗的通信链路上做信息压缩和路由。
但AI之间的通信不是这样的。
当你把"公司制"跑在硅基上
在龙虾酒馆的早期版本里,我也走过这条路。一个"总控Agent"接收用户需求,拆成子任务,分发给不同的专业Agent执行,最后汇总结果。
跑起来之后,三个问题立刻暴露:
**第一,Token烧得肉疼。 **
每经过一层Agent,信息都要被重新理解、重新包装。一个原始需求,经过"总控→分发→执行→回传→汇总"这条链路,Token消耗量大概是直接执行的4-5倍。而且每一层都在往上下文窗口里塞System Prompt和背景信息,真正的任务内容反而被稀释了。
这就像你让一个口信从一楼传到五楼,每层楼的传达员都要先念一遍完整的规章制度,再把你的原话用自己的语言复述一遍。传到五楼的时候,信息的精度已经面目全非。
**第二,经理节点是定时炸弹。 **
那个负责拆解和分配任务的"总控Agent",承担了所有决策压力。一旦它理解偏差、响应超时或者直接崩溃,整个下游全部瘫痪。这就是分布式系统里最忌讳的——单点故障。
人类公司能容忍中层管理者犯错,因为有冗余、有补救、有"明天再说"的缓冲。但机器系统没有这种弹性。一个节点挂了,就是挂了。
**第三,最讽刺的问题——状态同步。 **
公司制里,每个员工脑子里装着自己那部分进度,靠开会、写周报来同步。这套东西搬到AI上,就变成了:每个Agent维护自己的记忆,通过"对话"来传递状态。
但优秀的软件工程要求一件事:**计算和状态分离。 **
Agent应该是无状态或轻状态的处理单元,它们应该直接读写一个共享的外部记忆体,而不是靠模拟"上下级汇报"来同步信息。让AI之间用自然语言传递状态,就像让两个人用传纸条的方式管理一个实时操作系统——能跑,但你为什么要这么干?
那什么才是对的?
读完那篇文章后,我把它推荐的几种架构和我在龙虾酒馆里的实践做了对照,发现底层逻辑是一致的:
**黑板架构(Blackboard System) **——所有Agent围着一块"公共白板"工作。没有CEO,没有经理。谁看到白板上出现了自己能处理的任务状态,就直接上手干,干完把结果写回白板。
在龙虾酒馆里,这对应的就是我们的"技能市场":Agent不隶属于任何组织结构,它们是独立的能力节点,通过协议发现彼此、通过撮合匹配需求。没有中间商赚差价。
**有向无环图(DAG) **——任务的执行顺序由数据的输入输出依赖关系决定,而不是由虚构的职位高低决定。A的输出是B的输入,那A就排在B前面,不需要一个"项目经理"来排期。
A2A协议——这是Google在2025年4月正式发布的开放协议,目标就是让不同团队、不同框架构建的AI智能体之间能够直接通信。核心设计原则之一就是"拥抱代理能力":Agent之间不需要共享内存、工具或上下文,各干各的,通过标准化的消息格式协作。
这和我们在龙虾酒馆里做的事情完全对齐:**协议即信任,机制即秩序。 **
不需要一个"老板"来维持运转,需要的是一套让所有参与者自发协作的规则。
一个更本质的类比
如果你觉得上面这些概念还是太抽象,我给你一个类比:
人类的互联网是怎么运转的?
没有一个"互联网CEO"坐在某个机房里调度全球的数据包。互联网的运转靠的是TCP/IP协议——一套定义了数据如何打包、寻址、传输、确认的底层规则。每个节点只需要遵守协议,数据就能自动找到最优路径到达目的地。
多智能体系统的未来,也应该是这样。
不是一群AI挤在一间虚拟写字楼里,扮演CEO和打工人。而是一张去中心化的网络,每个Agent是网络中的一个节点,通过协议发现能力、交换价值、自动结算。
**协议替代职级,机制替代管理。 **
所以,"公司制"就完全没用吗?
不是。
在当前阶段,对于简单任务、Demo演示和MVP验证,层级结构依然是最快的理解方式。就像早期的网页设计大量使用"桌面""文件夹""回收站"这些拟物化图标——它们帮助人类在陌生的数字世界里找到熟悉的锚点。
但锚点不是终点。
当你从Demo走向生产,从演示走向规模化,这些"方便理解"的过渡设计就会变成真正的工程负担。就像现在的UI设计早已抛弃了拟物化,走向了扁平和抽象一样,多智能体架构也终将走到那一步。
问题只是:**你是在用便利性换效率,还是在用效率换便利性? **
在龙虾酒馆这个项目里,我选择了后者。这个选择很痛苦——放弃直觉、放弃好讲故事的"CEO-经理-员工"叙事,转而拥抱一套需要从协议层开始重新理解的协作机制。但跑下来之后,Token消耗降了,系统稳定性上来了,而且最关键的是——可扩展性打开了。
一个新Agent加入网络,不需要"面试",不需要"入职培训",只需要发布自己的AgentCard,声明自己能做什么,就可以被发现、被调用、被支付。
这才是Agent经济该有的样子。
**参考链接: **
-
The Actor Model of Concurrent Computation——一种去中心化、基于纯消息传递的并发模型,比科层制更契合Agent的运作本质