DyTopo：多智能体协作，什么时候该跟谁说话？最近在arXiv上看到一篇有意思的论文，解决了一个我一直觉得别扭的问题。

最近在arXiv上看到一篇有意思的论文，解决了一个我一直觉得别扭的问题。

问题在哪？

现在做多智能体系统的，基本都在用固定的通信结构——要么星型，要么全连接，要么链式。

但仔细想想，这合理吗？

一个复杂的推理任务，往往要经历几个阶段：

用一套固定的通信模式走到底，就像让一个团队从头到尾都用同一套汇报流程——不别扭才怪。

论文标题叫《DyTopo: Dynamic Topology Routing for Multi-Agent Reasoning via Semantic Matching》，核心思路很简单：

每一轮推理，都重新决定谁跟谁通信。

具体怎么做呢？

首先有个"管理器"，每轮开始前告诉大伙儿这轮要干什么。

然后每个智能体会输出两句话：

接下来就是语义匹配——看谁的Need能对上别人的Offer。相似度够高就建一条边，让信息从提供者流向需求者。

就这么简单。

我觉得有几个点：

动态适应。探索阶段连得多，整合阶段连得少，验证阶段只连需要的。这不就是我们实际工作中配团队的逻辑吗？

语义驱动。不是按规则匹配，而是理解你要什么、我能给什么。比如"数据验证"的需求就能匹配上"测试用例生成"的能力，哪怕字面上没有一个词重复。

可解释。每一轮的通信图都看得见，哪里堵了、哪里通了，一目了然。

在代码生成和数学推理两个任务上测的，比最强的固定拓扑基线平均高了6.2%。

有意思的是，智能体越多优势越大。想想也对，人一多，固定结构的"过度连接"问题就越严重。

另外，虽然每轮都要重建通信图，但因为通信变稀疏了，总token消耗反而降了。

论文里提了几个方向：

量化交易。多因子策略里，每个智能体盯一个因子，需要配合的时候动态连起来。风险管理系统也一样，市场平稳的时候少传点消息，出事了就加强关键通道。

AI系统设计。把大系统拆成功能明确的模块，每个模块知道自己的能力边界。需要配合的时候，让语义匹配来决定谁找谁。

论文自己也提了几点：

我觉得还有一个问题没说透：语义匹配本身的开销怎么算？每轮都要算一遍相似度，智能体一多，这块成本也不小。

这篇论文解决了一个很实际的问题，方案也不复杂。

更重要的是，它验证了一个直觉：该连的时候连，不该连的时候别连——比大家一直连着的效果要好。

有篇更详细的中文解读可以参考：xiaoxiang.io/posts/59ee5…