一. 前言
最近Skills已经火了2个月了,看到很多人对MCP和Skills理解都各有不同,现在AI发展都是按照日来更新,知识的沉淀也需要跟上步伐,抓紧时间写一篇文章,谈一谈我对MCP和Skills的理解,沉淀沉淀~
MCP 其实是协议,Agent借助MCP协议可以接入各种工具,让Agent获得了能力
Agent Skills 更像一种规范,通过这套规范,让 Agent 可以知道自己有哪些 Skills 可用,需要的时候去按需加载 Skill 的细节,知识可以作为 Skill 的一部分、Skills 可以指导 Agent 去调用 MCP 工具或者其他脚本
二. MCP:连接世界的“管道”协议
-
核心职能:标准化连接。
MCP 解决的是最基础、最繁杂的“方言”问题。在没有 MCP 之前,Agent 要连接数据库需要一套代码,连接 Slack 需要另一套代码,读取本地文件又要一套代码。MCP 统一定义了 Agent (Client) 和外部能力 (Server) 之间如何握手、如何列出可用工具、如何发送请求、如何接收响应。
-
它提供了什么?
它提供了通用的“原子能力”(Atomic Capabilities)。MCP Server 暴露出来的是一个个具体的
Resources(资源,如文件内容)、Prompts(预设提示词)和Tools(可执行函数,如“执行SQL查询”)。 -
它的局限性:
MCP 本身是“哑”的。它只负责把工具送达给 Agent,但它不负责告诉 Agent 在什么场景下、以什么顺序、组合哪些工具来解决一个复杂问题。
类比: MCP 就像是 USB 协议。只要符合 USB 标准,鼠标插上电脑就能通电、能传输信号。但 USB 协议本身并不知道这个鼠标是用来打游戏的还是用来做设计的。
三. Agent Skills:能力的“说明书”与“指挥棒”
Skills 是在原子工具之上构建的更高层次的抽象。
-
核心职能:封装与编排。
Skill 是为了完成某个特定任务(Task)而对知识、逻辑和工具的打包。一个 Skill 可能包含了一段特定的业务知识(比如税务法规),然后指导 Agent 去调用底层的 MCP 工具(比如“搜索工具”和“计算器工具”)来得出一个结论。
-
它提供了什么?
-
元数据与发现机制 (Discovery): Skill 规范首先定义了 Skill 的名称、描述、适用场景的 Trigger(触发器)。这让 Agent 在面对用户问题时,能快速检索到“我应该用哪个 Skill”。
-
按需加载 (On-demand Loading): 这是企业级 Agent 的关键。一个强大的 Agent可能有上千种能力,不可能每次对话都把所有能力的 prompt 和逻辑全部加载到上下文中(Context Window 会爆炸)。Skill 规范允许 Agent 只加载“目录”,确定要用某个 Skill 后,再动态加载其详细的执行逻辑(Execution details)。
-
知识融合 (Knowledge Inclusion): 如你所言,Skill 不仅仅是动作,还包含知识。比如一个“撰写法律合同 Skill”,它内部包含了合同模板的知识,它会指导 Agent 去调用 MCP 工具填充内容。
-
-
它的局限性:
Skills 需要依赖底层的执行机制。它最终落地干活,往往还得靠调用 MCP 工具、API 或运行本地脚本。
类比: Agent Skills 就像是电脑里的 “应用程序”或“驱动程序” 。Photoshop (一个 Skill) 知道它的目的是修图,它知道在用户点击“裁剪”时,需要去调用鼠标 (通过 USB/MCP 协议连接的工具) 的坐标数据来完成操作。
四. 二者的协同工作流 (The Synergy)
我们可以通过一个具体的例子来看看这两层是如何配合的。
场景:用户问 Agent:“帮我查一下上个月 阿里云 的 账单是不是超支了?”
-
Agent 思考 (基于 Skills 规范层):
- Agent 接收到请求,扫描自己已注册的 Agent Skills 目录。
- 它根据语义匹配,找到了一个名为
AliCloud_Cost_Analyzer的 Skill。 - Agent 按需加载了这个 Skill 的详细规范。
- Skill 的规范告诉 Agent:“要完成这个任务,你需要分两步:第一,获取上月账单数据;第二,对比预算标准进行分析。”
-
Agent 执行 (调用 MCP 协议层):
- 在 Skill 的指导下,Agent 知道第一步需要数据。它查找已连接的 MCP Servers。
- 它发现了一个
AliCloud_Integration_Server(通过 MCP 协议连接)。 - Agent 通过 MCP 协议向该 Server 发送请求,调用其中的
get_cost_and_usage工具 (Tool)。 - MCP Server 返回了 JSON 格式的账单数据。
-
Agent 回归 Skills 逻辑:
- 拿到数据后,Skill 的后续逻辑可能是:“现在调用内置的代码解释器脚本,计算是否超过了预设的 $500 阈值,并生成总结报告。”
- Agent 完成计算并最终回复用户。
五. 总结
最后用一张图来总结一下我们这篇文章
| 特性 | MCP (协议层) | Agent Skills (规范/应用层) |
|---|---|---|
| 关注点 | Connectivity (连接性) :如何稳定地对话和传输数据。 | Capability & Orchestration (能力与编排) :做什么任务,怎么组合工具。 |
| 抽象级别 | 低级、技术性、原子化工具。 | 高级、语义化、任务导向。 |
| 主要载体 | Server, Client, Protocol, Transport. | Metadata, Triggers, Logic, Knowledge. |
| 加载方式 | 通常连接时全量暴露工具定义。 | 目录式检索,详细逻辑按需加载。 |