Devin联合创始人:警惕多智能体系统的误区!微软和OpenAI的代理构建理念其实错了!上下文工程才是未来的关键
最近,Devin联合创始人Walden Yan发布了一篇令人深思的帖子,批评了OpenAI和微软在智能体构建方面的一些错误理念,引发了业界的广泛讨论。他认为,当前流行的多智能体框架,虽然在理论上看起来很有前景,但在实际应用中却远未达到预期的效果。
不要盲目追求多智能体架构
Yan指出,许多开发者在构建智能体时犯了同样的错误。他特别提到OpenAI的Swarm和微软的AutoGen这两个开源产品库,认为它们推广的多代理架构并不适合当前的技术环境。实际上,随着时间的推移,虽然很多智能体框架看似高效,但却因为上下文共享和决策冲突的问题,往往导致系统的崩溃。
在Yan看来,现在的智能体构建技术还处于“原始HTML + CSS”的阶段,开发者们仍在探索如何将各种组件组合在一起。真正的生产级应用需要更加可靠的设计,而这正是他所提到的“上下文工程”和“行为暗含决策”这两个核心原则的关键所在。
上下文工程:让智能体长时间稳定运行
Yan强调,对于那些需要长时间运行并保持连续对话和行为的智能体,必须采取有效的上下文管理机制。否则,系统很容易因为错误的逐步积累而崩溃。在他看来,“上下文工程”是智能体构建中最重要的部分,它关注如何在动态环境中自动构建和管理上下文。
目前,大模型已经很智能,但即使是最聪明的系统,如果缺乏良好的上下文管理,也很难高效完成任务。Yan建议,智能体之间必须共享完整的上下文轨迹,而不仅仅是简单的消息交换。这样才能保证子智能体在执行任务时,能够理解前一个智能体的工作成果,避免产生矛盾的决策。
为什么多智能体架构存在问题?
Yan举了一个例子来说明问题:如果你把一个复杂任务拆解成两个子任务,像是“做背景和管道”和“制作鸟”,但其中一个子任务做错了,另一个子任务也做错了,最终合并出来的结果几乎是灾难性的。任务的细节和语境需要共享,单独传递上下文并不能解决所有问题。
他提出的第一个原则是:共享上下文,而不是简单地共享任务消息,而是共享完整的智能体行为轨迹。
第二个原则是:行为暗含决策。子智能体不能独立决策,必须依赖主智能体的上下文和决策。如果忽视这些原则,系统的可靠性和有效性将大打折扣。
发展中的挑战与创新的机会
尽管当前的多智能体系统依然存在问题,但Yan认为,智能体技术的进步是不可阻挡的。我们仍然处在技术的早期阶段,未来会有更多的创新和优化。例如,Devin团队正在通过压缩历史上下文来保持长时间的上下文一致性,虽然这还很复杂,但已经是解决问题的一大进步。
此外,像Anthropic的MCP和谷歌的A2A协议等新技术正在解决智能体与工具之间的调用问题,这些创新也为未来的智能体构建提供了新的希望。
员工与网友的反应
这篇文章不仅在业界引起了强烈反响,也激发了不少同行的共鸣。一些人表示,他们在实践中也遇到了类似的问题,纷纷表示认可Yan的观点。而在Devin的团队内,甚至有员工忍不住开玩笑地提醒Walden:“老板,别泄密了!”
不过,也有网友提出了不同的看法,认为多智能体架构在某些特定领域(如代码编辑等)还是有效的。他们认为,通过合适的上下文传递和设计,多个子智能体能够很好地协作,完成复杂任务。
结语
总的来说,Devin的Walden Yan对于智能体构建提出的“上下文工程”理念为我们提供了新的视角,也为正在探索AI智能体技术的开发者们指明了方向。虽然目前仍面临许多技术难题,但未来随着技术的成熟,我们有理由相信,智能体系统的设计将逐步实现更高效、更可靠的运行。
希望这些思考能够帮助更多从事智能体开发的同行们,少走弯路,找到适合自己的解决方案。