AI Agent 协议全景:A2A、AP2、x402 如何拼出智能体经济的完整拼图

0 阅读10分钟

AI Agent 协议全景:A2A、AP2、x402 如何拼出智能体经济的完整拼图

导语

2025 年,AI Agent 领域发生了三件标志性事件:

4 月,Google 在 Cloud Next 大会上开源了 A2A(Agent-to-Agent)协议,50+ 家企业联合签署支持;5 月,Coinbase 推出 x402 支付协议,将沉睡了 30 年的 HTTP 402 状态码变成了真正的链上支付层;9 月,Google 再次出手,联合 Mastercard、PayPal 等 60+ 家机构发布 AP2(Agent Payments Protocol),为 AI Agent 的支付行为建立"法律框架"。

三个协议,三个月内密集落地。它们分别解决 Agent 经济中的不同问题,又彼此衔接、互为补充——共同构成了 AI Agent 从"能聊天"到"能办事、能花钱、能赚钱"的协议基础设施。

这是本系列四篇文章的第一篇。本文将从全局视角出发,厘清这三个协议的定位、关系和协同逻辑。后续三篇将分别深入 A2A、AP2 和 x402 的技术细节。


一、为什么 AI Agent 需要"协议"?

1.1 从工具到经济体:Agent 面临的三重断裂

2024~2025 年,AI Agent 的能力经历了指数级跃迁。从简单的对话助手,进化到能拆解复杂任务、调用外部工具、自主决策执行的"数字员工"。但当我们试图让 Agent 真正"干活"时,三个根本性问题暴露了出来:

断裂层级核心问题具体表现
通信断裂Agent 之间无法对话不同框架(LangChain、AutoGen、Google ADK)构建的 Agent 互为孤岛,无法协作
支付断裂(法币)Agent 无法代人花钱现有支付体系为"人"设计,没有验证 Agent 意图和授权的机制
支付断裂(Crypto)Agent 之间无法微支付API 调用按次计费、Agent 间服务交易缺乏原生支付层

三重断裂,对应三个协议:

  • A2A 解决通信断裂——让 Agent 之间能"说话"
  • AP2 解决法币支付断裂——让 Agent 能安全地"代人花钱"
  • x402 解决 Crypto 支付断裂——让 Agent 能原生地"按次付费"

1.2 协议 vs. 产品:为什么不能"各家自己搞"?

有人可能会问:支付宝可以开发自己的 Agent 支付接口,OpenAI 也可以定义自己的 Agent 通信格式,为什么需要开放协议?

答案是:碎片化会扼杀 Agent 经济。

类比互联网的发展:如果没有 HTTP 协议,每个网站都有自己的传输格式,浏览器就无法通用;如果没有 SMTP 协议,每个邮件服务商只能给自己的用户发邮件。

同理:

  • 没有 A2A,Google 的 Agent 就无法和 Salesforce 的 Agent 协作
  • 没有 AP2,每个支付公司都要发明自己的"Agent 授权"方案,商家要对接无数个接口
  • 没有 x402,每个 API 提供商都要搭建自己的付费墙系统

开放协议的价值 = 互操作性 + 降低接入成本 + 加速生态形成。


二、协议栈全景:四层架构

理解 A2A、AP2、x402 的关系,最好的方式是把它们放进一张完整的协议栈图中。加上 Anthropic 提出的 MCP(Model Context Protocol),AI Agent 的协议基础设施可以分为四层:

graph TB
    subgraph "AI Agent 协议栈"
        L4["<b>应用层</b><br/>AI Agent 应用(聊天助手、购物代理、编码 Agent...)"]
        L3["<b>Agent 通信层</b><br/>A2A 协议(Agent-to-Agent)<br/>Agent 发现、任务协作、状态同步"]
        L2["<b>支付层</b><br/>AP2(法币支付:信用卡/银行转账)<br/>x402(Crypto 支付:稳定币/链上结算)"]
        L1["<b>工具与数据层</b><br/>MCP 协议(Model Context Protocol)<br/>Agent 接入外部工具、数据库、API"]
    end

    L4 --> L3
    L4 --> L2
    L4 --> L1
    L3 --> L2
    L3 --> L1

    style L4 fill:#fff,stroke:#333,stroke-width:2px,color:#333
    style L3 fill:#fff,stroke:#333,stroke-width:2px,color:#333
    style L2 fill:#fff,stroke:#333,stroke-width:2px,color:#333
    style L1 fill:#fff,stroke:#333,stroke-width:2px,color:#333

2.1 Layer 1:工具与数据层——MCP

MCP(Model Context Protocol) 由 Anthropic 提出,解决的是 Agent 与外部世界的"纵向连接"问题。

打个比方:MCP 就像 USB 接口——让 AI Agent 能标准化地"插入"各种外部工具(搜索引擎、数据库、代码仓库、支付接口等)。

维度MCP
提出方Anthropic
解决的问题Agent 如何调用外部工具和数据
通信方向Agent → Tool(纵向,一对多)
类比USB 接口

2.2 Layer 2:支付层——AP2 + x402

支付层有两个协议,分别面向不同的支付体系:

AP2(Agent Payments Protocol):Google 联合 60+ 家传统支付巨头(Mastercard、PayPal、American Express、Visa 等)推出,解决的是 Agent 代人在传统金融体系中支付的问题。它的核心是通过**可验证数字凭证(VDC)**来证明用户确实授权了 Agent 的消费行为。

x402 支付协议:Coinbase 推出,解决的是 Agent 在 Crypto 世界中按次付费、微支付的问题。它的核心是利用 HTTP 402 状态码,让支付像访问网页一样自然。

维度AP2x402
提出方Google + 60 家机构Coinbase
支付方式信用卡、银行转账、稳定币链上稳定币
典型场景Agent 代人购物、订阅服务Agent 调用付费 API、按次计费
单笔金额中大额(几元~数千元)微额(0.001 0.001~10)
信任机制加密签名的 VDC 授权凭证HTTP 402 + 链上支付验证
类比给 Agent 一张"受限信用卡"给 API 装一个"投币口"

2.3 Layer 3:Agent 通信层——A2A

A2A(Agent-to-Agent Protocol):Google 提出并贡献给 Linux Foundation,50+ 家企业支持,解决的是不同 Agent 之间的"横向通信"问题。

MCP 让 Agent 能调用工具,但 Agent 之间怎么协作?你的"管家 Agent"怎么和航空公司的"订票 Agent"沟通?A2A 就是为此而生。

维度A2A
提出方Google(贡献给 Linux Foundation)
解决的问题不同框架、不同厂商的 Agent 之间如何通信与协作
通信方向Agent ↔ Agent(横向,多对多)
核心机制Agent Card(发现)+ Task(协作)+ JSON-RPC(通信)
类比Agent 之间的"HTTP 协议"

2.4 四层如何协同?一个完整的场景

用一个具体场景来说明四层协议如何协同工作:

场景:你对 AI 助手说"帮我买一台 4000 元以内的降噪耳机"

Step 1: MCP 层
   你的 Agent 通过 MCP 协议接入电商平台的 API,获取商品数据

Step 2: A2A 层
   你的 Agent 通过 A2A 协议,与京东的"导购 Agent"、
   苏宁的"比价 Agent" 进行多轮对话,协商最优方案

Step 3: AP2 层(传统支付)
   确定商品后,Agent 通过 AP2 协议生成"购物车授权"凭证,
   你用手机签名确认,Agent 代你完成信用卡支付

Step 3 (替代): x402 层(Crypto 支付)
   如果购买的是数字服务(如 API 调用次数),
   Agent 通过 x402 协议直接用稳定币按次付费,无需人工确认

一句话总结:MCP 让 Agent "接入世界",A2A 让 Agent "彼此对话",AP2 让 Agent "代人花钱",x402 让 Agent "自主付费"。


三、三个协议的深度对比

3.1 设计哲学对比

维度A2AAP2x402
核心目标Agent 间互操作性Agent 支付的安全与合规互联网原生微支付
设计哲学开放、不透明、去中心化发现可验证意图、责任可追溯零摩擦、零中心化
技术基础JSON-RPC + HTTP + SSE可验证数字凭证(VDC)+ 加密签名HTTP 402 + 链上结算
发布时间2025 年 4 月2025 年 9 月2025 年 5 月(V2:12 月)
组织归属Linux FoundationGoogle 主导的开放联盟Coinbase 开源
许可证Apache-2.0开放标准开源

3.2 生态参与方对比

协议核心发起方关键参与方支持企业数
A2AGoogleAtlassian、Salesforce、SAP、LangChain、CrewAI50+
AP2GoogleMastercard、PayPal、American Express、Visa、Coinbase、Shopee60+
x402Coinbase社区驱动,多语言实现(TypeScript、Rust)开源社区

3.3 适用场景对比

graph LR
    subgraph "Agent 通信"
        A["A2A"]
    end
    subgraph "传统支付"
        B["AP2"]
    end
    subgraph "Crypto 支付"
        C["x402"]
    end

    A -->|"Agent 协商后<br/>需要付款"| B
    A -->|"Agent 调用<br/>付费服务"| C
    B -.->|"AP2 可作为<br/>A2A 的扩展"| A
    C -.->|"x402 可嵌入<br/>A2A 交互流"| A

    style A fill:#fff,stroke:#333,stroke-width:2px,color:#333
    style B fill:#fff,stroke:#333,stroke-width:2px,color:#333
    style C fill:#fff,stroke:#333,stroke-width:2px,color:#333
场景使用的协议说明
Agent A 请求 Agent B 执行任务A2A任务发现、协商、状态同步
Agent 代用户在电商下单A2A + AP2A2A 负责与商家 Agent 通信,AP2 负责安全支付
Agent 调用付费天气 APIx402直接 HTTP 请求,402 触发微支付
Agent 代用户订酒店并支付A2A + AP2A2A 比价协商,AP2 处理信用卡支付
Agent 购买另一个 Agent 的推理能力A2A + x402A2A 发现服务,x402 完成链上结算
Agent 在用户不在场时自动购物AP2使用"意图授权"VDC,异步执行

四、协议的成熟度与发展现状

4.1 当前版本与成熟度

协议当前版本成熟度参考实现真实部署
A2A正式版⭐⭐⭐⭐Python/Go/JS/Java/.NET SDK多个框架已集成
AP2V0.1⭐⭐概念验证阶段尚无大规模商用
x402V2⭐⭐⭐TypeScript + Rust 实现7500 万+ 笔交易

4.2 发展路线展望

A2A:作为最成熟的协议,正在扩展动态 UX 协商(运行时切换交互模态)、QuerySkill() 技能查询等高级特性。已贡献给 Linux Foundation,正走向行业标准化。

AP2:当前 V0.1 专注"信用卡 + 用户在场"的基础场景。V1.x 将扩展到推送支付、订阅、用户不在场等复杂场景。长期愿景是支持多商家交易拓扑和实时谈判。

x402:V2 已从"单一 API 调用付费"扩展为"统一互联网支付层",正在构建更完整的支付基础设施。生态数据表现亮眼:7500 万+ 笔交易、2400 万+ 美元交易量。


五、写给不同读者的指南

5.1 如果你是 AI 应用开发者

最该关注:A2A + MCP。 这两个协议决定了你的 Agent 能否与其他 Agent 协作、能否接入外部工具。建议从 A2A 的 Python SDK 开始,体验 Agent Card 注册和 Task 交互。

5.2 如果你是支付/金融从业者

最该关注:AP2。 这个协议正在重新定义"谁能代你花钱"的规则。关注 VDC(可验证数字凭证)机制,思考你的支付系统如何接入 Agent 授权。

5.3 如果你是 Web3/Crypto 开发者

最该关注:x402。 它提供了目前最简洁的 Agent 微支付方案。一行中间件代码就能为你的 API 添加付费墙,稳定币即时到账。

5.4 如果你是创业者

三个协议叠加的交叉地带,就是最大的创业机会:

  • A2A + AP2:构建"Agent 商务中间件"
  • A2A + x402:构建"Agent 技能交易市场"
  • AP2 + x402:构建"混合支付路由"——自动选择法币还是 Crypto

六、本系列文章导读

篇次标题聚焦协议核心内容
第一篇(本文)AI Agent 协议全景图A2A + AP2 + x402协议栈定位、协同关系、生态对比
第二篇A2A 协议深度解析A2AAgent Card、Task 生命周期、通信机制、安全模型
第三篇AP2 协议深度解析AP2VDC 凭证、角色架构、交易流程、争议解决
第四篇x402 协议深度解析x402HTTP 402 原理、支付流程、代码示例、V2 演进

七、写在最后

2025 年是 AI Agent 协议基础设施的"奠基之年"。

就像 1990 年代的 HTTP、SMTP、FTP 奠定了互联网的基础一样,A2A、AP2、x402 正在为 AI Agent 经济铺设"管道"和"铁轨"。

这些协议现在还很年轻——AP2 还在 V0.1,A2A 的生态刚刚起步,x402 的交易量还在千万级——但它们指向的方向是确定的:AI Agent 将从"聊天工具"进化为"经济主体",而这些协议就是支撑这个进化的基础设施。

下一篇,我们将深入 A2A 协议的技术内核——看看 Google 是如何用 Agent Card、Task 和 JSON-RPC,构建一个让所有 Agent "说同一种语言"的通信协议。


关注公众号「coft」,获取更多 AI 时代的深度洞察和技术实战干货。