应用智能体最大挑战是什么?
可以想象一下这些场景:
公司采购了A厂的智能客服,却无法与B厂的销售智能体对接。
不同部门使用的智能体像讲不同方言,完全无法协作。
是不是有种熟悉的感觉?就像:
你买了苹果手机,同事用的是华为,朋友用的是小米,结果发现互相传文件特别麻烦。
公司里财务用金蝶系统,销售用用友系统,两个系统数据完全不通。
家里智能家电,小米的空调、海尔的冰箱、格力的净化器,各自为政无法联动。
这正是当前多智能体协同面临的核心难题:如何让不同框架和供应商构建的智能体能够互相配合工作?
而Google最新推出的A2A协议,就是要做智能体世界的"通用翻译器",让不同出身的智能体都能顺畅对话。
这是突破性技术,将彻底改变多智能体的协作方式。
什么是A2A协议
Agent2Agent Protocol(简称A2A协议),是一种全新的开放协议,为Agent提供一种相互通信,让它们能够在各种企业平台或应用程序上协作工作。
目前,已经获得包括 Atlassian、Langchain、Salesforce、MongoDB、PayPal 等50多家科技公司,以及埃森哲、波士顿咨询公司(BCG)、麦肯锡在内领先服务供应商的支持。
遵循五大设计原则
1."不挑食"协作模式
专注于让Agent能够以自然、非结构化的方式进行协作,即使他们不共享内存、工具和上下文。实现真正的多Agent场景,而不是将Agent简单地看成“工具”。
2."接地气"技术方案
基于现有标准,包括HTTP、SSE、JSON-RPC等企业熟悉的"普通话"标准,方便与现有 IT 技术栈集成。
3."保险箱"级安全
默认安全,支持企业级安全认证机制,提供与OpenAPI同等级别的身份验证和授权保护。
4."马拉松"式任务
支持支持长时间运行的任务,擅长完成从快速任务到深入研究的工作,可以数小时甚至数天,场景灵活,并且能够提供实时反馈、通知和状态更新。
5."全感官"交互体验
不限于文本,还支持音频和视频流等多模态。
有几个核心概念要了解
Agent Card(代理卡):每个Agent的"身份证",详细记录Agent的功能、接口和认证方式,方便客户端发现和调用。
A2A Server(服务器):作为协议的执行中枢,接收请求并管理任务执行。
A2A Client(客户端):使用 A2A 服务的应用程序或其他Agent。
Task(任务):核心工作单元。客户端通过发送消息来启动任务。具有唯一ID和明确状态,构成Agent协作的基础。
Message(消息):表示客户端和Agent之间的通信轮次。
Part(部分):消息或工件中的基本内容单元。
Artifact(工件):Agent在任务期间生成的输出(如生成文件、最终的结构化数据)。
Push Notifications(推送通知):服务器可以主动将任务更新发送到客户端。
A2A 怎样工作的
A2A协议就像Agent世界的“电话总机”,让不同位置的Agent能够顺畅沟通。
简单来说
你身边的Agent(客户端Agent)负责“发号施令”。
专业Agent(远程Agent)负责“干活办事”。
比如:你的语音助手自动调用翻译Agent处理外文邮件
主要涉及以下几个关键功能:
能力匹配
每个Agent都有“技能名片”(代理卡),系统自动匹配最合适的Agent来干活,并利用 A2A 与远程Agent进行通信,这就像公司HR为项目组建最佳团队。
任务管理
客户端与远程Agent之间的通信以任务完成为导向,Agent负责执行最终用户的请求。这个“Task”(任务)对象由协议定义,并且具有生命周期。它可以立即完成,或者对于长时间运行的任务,每个Agent可以进行通信,以彼此保持同步,了解任务的最新完成状态。任务的输出称为“Artifact”(工件)。
协作
Agent之间可以像同事一样发消息讨论(传达上下文、回复、工件或用户指令)
用户体验协商
每条消息包含“Parts”(部分),这是一个完全形成的内容,就像生成的图像一样。每个部分都有指定的内容类型,允许客户端和远程Agent协商所需的正确格式,并明确包括用户 UI 功能的协商,例如 iframe、视频、Web 表单等。
A2A 真实跑通的案例
智能招聘:A2A组建智能猎头团队,让招聘工程师变得简单。
招聘经理在Agentspace平台发布需求后,专属Agent立即联动人才库Agent筛选匹配,薪酬Agent分析市场行情。
然后,Agent会与其他专业Agent互动,以寻找潜在候选人。招聘经理收到这些建议后,可以指示其Agent安排进一步的面试,从而简化候选人寻找流程。
面试流程完成后,可以联系另一位Agent协助进行背景调查。
整个招聘流程如同精密的协作网络,每个环节都有最专业的Agent各司其职。
最后,理清一下 A2A 与 MCP 的区别
A2A 与 MCP 是两个不同的开放协议。
MCP(Model Context Protocol,模型上下文协议)是连接 LLM 与数据、资源和工具的新兴标准。就像 AI 应用程序的 USB-C 端口一样。
A2A 是一种应用层协议,专注于Agent之间的通信,使不同框架和供应商的Agent能够无缝协作。它允许以Agent(或用户)的身份进行通信,而不是以工具的身份。
简而言之:Agent应用需要 A2A 和 MCP。A2A 是对 MCP 的补充,MCP 为Agent提供了实用的工具和上下文,A2A 使不同框架和供应商的Agent能够协同工作。
A2A协议类似于早期的互联网HTTP协议,标志着智能体交互领域的一大突破。
如果你对AI感兴趣,可以加我V:YJ-zhixing ,备注掘金,拉你进 Agent & A2A 交流群,一起学习交流!
如果您觉得这篇文章对您有帮助,别忘了点赞、转发、关注,感谢您的阅读!