2026年2月了,MCP和Skills不要再分不清了

0 阅读5分钟

一. 前言

image.png

最近Skills已经火了2个月了,看到很多人对MCP和Skills理解都各有不同,现在AI发展都是按照日来更新,知识的沉淀也需要跟上步伐,抓紧时间写一篇文章,谈一谈我对MCP和Skills的理解,沉淀沉淀~

MCP 其实是协议,Agent借助MCP协议可以接入各种工具,让Agent获得了能力

Agent Skills 更像一种规范,通过这套规范,让 Agent 可以知道自己有哪些 Skills 可用,需要的时候去按需加载 Skill 的细节,知识可以作为 Skill 的一部分、Skills 可以指导 Agent 去调用 MCP 工具或者其他脚本

二. MCP:连接世界的“管道”协议

  • 核心职能:标准化连接。

    MCP 解决的是最基础、最繁杂的“方言”问题。在没有 MCP 之前,Agent 要连接数据库需要一套代码,连接 Slack 需要另一套代码,读取本地文件又要一套代码。MCP 统一定义了 Agent (Client) 和外部能力 (Server) 之间如何握手、如何列出可用工具、如何发送请求、如何接收响应。

  • 它提供了什么?

    它提供了通用的“原子能力”(Atomic Capabilities)。MCP Server 暴露出来的是一个个具体的 Resources(资源,如文件内容)、Prompts(预设提示词)和 Tools(可执行函数,如“执行SQL查询”)。

  • 它的局限性:

    MCP 本身是“哑”的。它只负责把工具送达给 Agent,但它不负责告诉 Agent 在什么场景下、以什么顺序、组合哪些工具来解决一个复杂问题。

类比: MCP 就像是 USB 协议。只要符合 USB 标准,鼠标插上电脑就能通电、能传输信号。但 USB 协议本身并不知道这个鼠标是用来打游戏的还是用来做设计的。

三. Agent Skills:能力的“说明书”与“指挥棒”

Skills 是在原子工具之上构建的更高层次的抽象。

  • 核心职能:封装与编排。

    Skill 是为了完成某个特定任务(Task)而对知识、逻辑和工具的打包。一个 Skill 可能包含了一段特定的业务知识(比如税务法规),然后指导 Agent 去调用底层的 MCP 工具(比如“搜索工具”和“计算器工具”)来得出一个结论。

  • 它提供了什么?

    • 元数据与发现机制 (Discovery): Skill 规范首先定义了 Skill 的名称、描述、适用场景的 Trigger(触发器)。这让 Agent 在面对用户问题时,能快速检索到“我应该用哪个 Skill”。

    • 按需加载 (On-demand Loading): 这是企业级 Agent 的关键。一个强大的 Agent可能有上千种能力,不可能每次对话都把所有能力的 prompt 和逻辑全部加载到上下文中(Context Window 会爆炸)。Skill 规范允许 Agent 只加载“目录”,确定要用某个 Skill 后,再动态加载其详细的执行逻辑(Execution details)。

    • 知识融合 (Knowledge Inclusion): 如你所言,Skill 不仅仅是动作,还包含知识。比如一个“撰写法律合同 Skill”,它内部包含了合同模板的知识,它会指导 Agent 去调用 MCP 工具填充内容。

  • 它的局限性:

    Skills 需要依赖底层的执行机制。它最终落地干活,往往还得靠调用 MCP 工具、API 或运行本地脚本。

类比: Agent Skills 就像是电脑里的 “应用程序”或“驱动程序” 。Photoshop (一个 Skill) 知道它的目的是修图,它知道在用户点击“裁剪”时,需要去调用鼠标 (通过 USB/MCP 协议连接的工具) 的坐标数据来完成操作。

四. 二者的协同工作流 (The Synergy)

我们可以通过一个具体的例子来看看这两层是如何配合的。

场景:用户问 Agent:“帮我查一下上个月 阿里云 的 账单是不是超支了?”

  1. Agent 思考 (基于 Skills 规范层):

    • Agent 接收到请求,扫描自己已注册的 Agent Skills 目录
    • 它根据语义匹配,找到了一个名为 AliCloud_Cost_Analyzer 的 Skill。
    • Agent 按需加载了这个 Skill 的详细规范。
    • Skill 的规范告诉 Agent:“要完成这个任务,你需要分两步:第一,获取上月账单数据;第二,对比预算标准进行分析。”
  2. Agent 执行 (调用 MCP 协议层):

    • 在 Skill 的指导下,Agent 知道第一步需要数据。它查找已连接的 MCP Servers。
    • 它发现了一个 AliCloud_Integration_Server (通过 MCP 协议连接)。
    • Agent 通过 MCP 协议向该 Server 发送请求,调用其中的 get_cost_and_usage 工具 (Tool)。
    • MCP Server 返回了 JSON 格式的账单数据。
  3. Agent 回归 Skills 逻辑:

    • 拿到数据后,Skill 的后续逻辑可能是:“现在调用内置的代码解释器脚本,计算是否超过了预设的 $500 阈值,并生成总结报告。”
    • Agent 完成计算并最终回复用户。

五. 总结

最后用一张图来总结一下我们这篇文章

Gemini_Generated_Image_a4y232a4y232a4y2.png

特性MCP (协议层)Agent Skills (规范/应用层)
关注点Connectivity (连接性) :如何稳定地对话和传输数据。Capability & Orchestration (能力与编排) :做什么任务,怎么组合工具。
抽象级别低级、技术性、原子化工具。高级、语义化、任务导向。
主要载体Server, Client, Protocol, Transport.Metadata, Triggers, Logic, Knowledge.
加载方式通常连接时全量暴露工具定义。目录式检索,详细逻辑按需加载。