DyTopo:多智能体协作,什么时候该跟谁说话?

1 阅读3分钟

最近在arXiv上看到一篇有意思的论文,解决了一个我一直觉得别扭的问题。

问题在哪?

现在做多智能体系统的,基本都在用固定的通信结构——要么星型,要么全连接,要么链式。

但仔细想想,这合理吗?

一个复杂的推理任务,往往要经历几个阶段:

  • 刚开始探索的时候,需要广泛撒网收集信息
  • 到了整合阶段,就该聚焦关键路径
  • 最后验证的时候,只需要特定的几个连接

用一套固定的通信模式走到底,就像让一个团队从头到尾都用同一套汇报流程——不别扭才怪。

DyTopo是怎么解决的

论文标题叫《DyTopo: Dynamic Topology Routing for Multi-Agent Reasoning via Semantic Matching》,核心思路很简单:

每一轮推理,都重新决定谁跟谁通信。

具体怎么做呢?

首先有个"管理器",每轮开始前告诉大伙儿这轮要干什么。

然后每个智能体会输出两句话:

  • Need:我需要什么信息
  • Offer:我能提供什么信息

接下来就是语义匹配——看谁的Need能对上别人的Offer。相似度够高就建一条边,让信息从提供者流向需求者。

就这么简单。

为什么能work?

我觉得有几个点:

动态适应。探索阶段连得多,整合阶段连得少,验证阶段只连需要的。这不就是我们实际工作中配团队的逻辑吗?

语义驱动。不是按规则匹配,而是理解你要什么、我能给什么。比如"数据验证"的需求就能匹配上"测试用例生成"的能力,哪怕字面上没有一个词重复。

可解释。每一轮的通信图都看得见,哪里堵了、哪里通了,一目了然。

效果怎么样?

在代码生成和数学推理两个任务上测的,比最强的固定拓扑基线平均高了6.2%。

有意思的是,智能体越多优势越大。想想也对,人一多,固定结构的"过度连接"问题就越严重。

另外,虽然每轮都要重建通信图,但因为通信变稀疏了,总token消耗反而降了。

能拿来干什么?

论文里提了几个方向:

量化交易。多因子策略里,每个智能体盯一个因子,需要配合的时候动态连起来。风险管理系统也一样,市场平稳的时候少传点消息,出事了就加强关键通道。

AI系统设计。把大系统拆成功能明确的模块,每个模块知道自己的能力边界。需要配合的时候,让语义匹配来决定谁找谁。

还有什么问题?

论文自己也提了几点:

  • 阈值现在是固定的,不同场景可能需要不同的阈值
  • 刚开始几轮信息不够,匹配可能不准
  • 如果有恶意智能体,可以通过伪造描述符来捣乱

我觉得还有一个问题没说透:语义匹配本身的开销怎么算?每轮都要算一遍相似度,智能体一多,这块成本也不小。

小结

这篇论文解决了一个很实际的问题,方案也不复杂。

更重要的是,它验证了一个直觉:该连的时候连,不该连的时候别连——比大家一直连着的效果要好。

论文地址:arxiv.org/abs/2602.06…

有篇更详细的中文解读可以参考:xiaoxiang.io/posts/59ee5…