解密A2A核心：智能体如何通过"名片"和"技能"实现对话？在上一篇文章中，我们了解了Google A2A协议的基本概念和

在上一篇文章中，我们了解了Google A2A协议的基本概念和价值。这一次，我们将深入探讨A2A协议的核心机制：Agent Card（代理名片）和Agent Skills（代理技能）——这两者构成了智能体之间沟通的基础。

想象智能体社交圈：从"陌生人"到"合作伙伴"

想象一下，在人类社会中，当我们初次见面时，通常会交换名片并谈论各自的专长。A2A协议在智能体世界中构建了类似的社交机制：

名片交换（Agent Card）：每个智能体都有自己的"电子名片"，上面写明身份、擅长的事情和联系方式。
技能展示（Agent Skills）：就像你会在名片上注明"UI设计专家"或"数据分析师"，智能体也会明确声明自己能提供哪些服务。
协作邀请（Task）：了解彼此后，智能体之间就可以发起合作，共同完成用户交代的任务。

这套机制巧妙地解决了AI世界的一个核心问题：如何让彼此陌生的智能体快速建立信任和协作关系？

Agent Card：智能体的"社交名片"

在A2A协议中，Agent Card是一个JSON格式的元数据文档，通常可以在智能体服务的特定URL（例如/.well-known/agent.json）获取。它扮演着至关重要的角色：

Agent Card包含哪些信息？

{
  "name": "旅行助手",
  "description": "一个帮助规划旅行的智能体",
  "url": "https://travel-agent.example.com/",
  "version": "1.0.0",
  "capabilities": {
    "streaming": true,
    "pushNotifications": false,
    "stateTransitionHistory": true
  },
  "authentication": {
    "schemes": ["OAuth2", "API-Key"]
  },
  "defaultInputModes": ["text/plain", "application/json"],
  "defaultOutputModes": ["text/plain", "application/json"],
  "skills": [
    {
      "id": "flight_search",
      "name": "查找航班",
      "description": "根据日期、出发地和目的地查找可用航班",
      "tags": ["travel", "flights"],
      "examples": ["查找从北京到上海的航班"]
    },
    {
      "id": "hotel_booking",
      "name": "预订酒店",
      "description": "在指定位置查找并预订酒店",
      "tags": ["travel", "accommodation"],
      "examples": ["在上海找一个靠近外滩的酒店"]
    }
  ]
}

这个"名片"提供了丰富的信息：

基本身份：名称、描述、版本号等基本识别信息
服务地址：其他智能体可以通过这个URL与其联系
技术能力：是否支持流式响应、推送通知等高级功能
安全要求：需要什么形式的认证才能使用其服务
通信格式：支持哪些输入输出数据格式
提供的技能：这个智能体能做什么，包括每个技能的详细描述和使用示例

Agent Card的作用

Agent Card不仅仅是一份简单的介绍，它更像是智能体社交网络中的"LinkedIn个人主页"：

发现机制：其他智能体可以通过Agent Card了解这个智能体的存在和能力
兼容性检查：在请求服务前，先确认对方是否具备所需的能力和技能
安全协商：了解需要哪种认证方式才能进行安全通信
期望管理：通过示例和描述，明确说明每个技能能做什么、不能做什么

Agent Skills：智能体的"超能力集"

如果说Agent Card是名片，那么Agent Skills就是名片上列出的"专业技能"。在A2A中，每个技能都代表智能体可以执行的特定功能。

技能的构成要素

一个完整的技能定义通常包括：

唯一标识符：区分不同的技能
名称和描述：人类可读的技能介绍
输入参数：需要提供什么信息才能执行这项技能
输出格式：期待得到什么形式的结果
使用示例：如何正确调用这项技能
分类标签：帮助将相关技能分组

技能的实现方式

在实际编程中，技能通常以函数的形式实现。以Python为例：

from a2a import AgentSkill

@AgentSkill(
    id="flight_search",
    name="查找航班",
    description="根据日期、出发地和目的地查找可用航班",
    tags=["travel", "flights"]
)
def search_flights(
    departure: str,
    destination: str,
    date: str
) -> list:
    """
    搜索航班信息
    
    Args:
        departure: 出发城市
        destination: 目的地城市
        date: 出发日期 (YYYY-MM-DD格式)
        
    Returns:
        航班列表，每个航班包含航班号、时间、价格等信息
    """
    # 实现航班搜索逻辑...
    return flight_results

这种装饰器风格的定义既保留了函数的技术实现，又添加了A2A协议所需的元数据。

实际交互：智能体之间如何通过"名片"和"技能"完成对话？

让我们通过一个具体场景来说明整个流程：

场景：旅行规划

假设用户想规划一次从北京到东京的旅行，他的主要AI助手需要与专业的旅行智能体协作。

步骤1：发现与认识（Discovery）

主助手首先需要找到合适的旅行智能体：

查询已知的智能体目录，或通过预设的URL
获取并解析旅行智能体的Agent Card
确认该智能体提供所需的航班查询、酒店预订等技能

步骤2：能力确认（Capability Check）

主助手检查旅行智能体的能力是否满足需求：

确认支持的认证方式（如OAuth2）
验证通信格式兼容性（如JSON输入/输出）
检查是否支持必要的高级功能（如推送通知）

步骤3：任务委托（Task Delegation）

主助手创建一个任务，请求旅行智能体的帮助：

{
  "jsonrpc": "2.0",
  "method": "tasks/send",
  "params": {
    "id": "task_12345",
    "sessionId": "session_abcde",
    "message": {
      "role": "user",
      "parts": [
        {
          "type": "text",
          "text": "我需要在下周五从北京飞往东京，并在那里住3晚。请帮我规划行程。"
        }
      ]
    }
  }
}

步骤4：技能执行（Skill Execution）

旅行智能体接收到任务后：

分析用户需求，确定需要使用的技能（航班搜索和酒店预订）
执行相应的技能函数，可能需要调用外部API
整合结果，形成一份完整的旅行计划

步骤5：结果返回（Response）

旅行智能体将执行结果返回给主助手：

{
  "jsonrpc": "2.0",
  "result": {
    "task": {
      "id": "task_12345",
      "status": "completed",
      "message": {
        "role": "agent",
        "parts": [
          {
            "type": "text",
            "text": "已为您规划好行程："
          },
          {
            "type": "data",
            "data": {
              "flights": [
                {"flight": "CA123", "departure": "2023-11-10 10:00", "arrival": "2023-11-10 14:30", "price": "¥2500"},
                {"flight": "JL456", "departure": "2023-11-10 13:15", "arrival": "2023-11-10 17:45", "price": "¥2300"}
              ],
              "hotels": [
                {"name": "东京皇宫酒店", "location": "新宿区", "price": "¥1200/晚", "rating": 4.8},
                {"name": "东京湾景酒店", "location": "银座", "price": "¥1500/晚", "rating": 4.9}
              ]
            }
          }
        ]
      }
    }
  }
}

为什么这种设计如此巧妙？

A2A协议中的"名片"和"技能"机制之所以强大，主要体现在以下几点：

1. 松耦合与清晰边界

智能体之间不需要了解彼此的内部工作方式，只需要知道"你能做什么"和"如何请求你的帮助"。这种松耦合设计让不同公司、不同团队开发的智能体能够无缝协作。

2. 自描述与自文档化

通过标准化的Agent Card和Skill定义，每个智能体都能清晰地"自我介绍"，无需额外的集成文档或人工配置。

3. 动态发现与适配

系统可以在运行时发现新的智能体，并根据它们的能力动态调整工作流程，实现真正的即插即用。

4. 安全与隐私保护

每个智能体只暴露必要的接口，而不是内部实现细节或敏感数据，这保护了商业机密和用户隐私。

实践指南：如何定义自己的Agent Card和Skills？

如果你想开发A2A兼容的智能体，以下是一些实用建议：

Agent Card最佳实践

保持简洁明了：提供足够的信息，但避免过度复杂
实施版本控制：随着智能体能力的演进，确保版本号更新
提供丰富的示例：帮助其他智能体理解如何正确使用你的技能
明确能力边界：清晰说明你的智能体能做什么，也要说明不能做什么

Skills定义指南

原子化设计：每个技能应该专注于一个明确的功能
严格的参数验证：确保输入参数格式正确，提供有意义的错误信息
优雅的错误处理：预见可能的失败情况，并设计恰当的恢复策略
全面的文档：详细说明参数含义、约束条件和预期输出

未来展望

随着A2A协议的发展，我们可以期待更丰富的Agent Card和Skill定义标准，包括：

语义理解增强：更好地描述技能的语义和上下文要求
复合技能编排：支持多个基础技能组合成更复杂的工作流
动态技能发现：智能体可以在运行时"学习"新技能
信任与声誉机制：为智能体间建立更完善的信任体系

结语

Agent Card和Agent Skills构成了A2A协议的核心基础，它们共同为智能体之间的沟通搭建了桥梁。通过标准化的"自我介绍"和"能力声明"，智能体可以迅速找到合适的合作伙伴，共同解决复杂问题。

这种机制不仅优雅而高效，也为AI生态系统的蓬勃发展奠定了基础。正如人类社会中的专业分工催生了现代文明，智能体世界中的技能协作也将开启AI应用的新纪元。

下一篇预告：《A2A与MCP：Google如何打造智能体协作的"双引擎"？》

有兴趣深入了解Agent Card和Skills的技术实现？访问A2A 协议规范获取更多详情！