Agent Skills 与 MCP:最新定义、使用场景、优缺点与选型指南

1,441 阅读10分钟

Agent Skills 与 MCP:最新定义、使用场景、优缺点与选型指南

更新时间:2026-01-08(JST)
目标读者:做企业 AI 助手 / Dev Agent / 数据分析助手 / 平台化接入的后端与架构同学
本文重点:用“最新官方定义”把边界讲清楚,再给你一套可落地的场景、优缺点与选型策略,最后附上安全与工程化清单


1. Agent Skills 和 MCP 到底是什么?

1.1 Agent Skills(最新官方定义)

Anthropic 对 Agent Skills 的核心定义非常明确:

  • Skills 是“文件夹化”的能力包:由 instructions(指令)scripts(脚本)resources(资源) 组成
  • 可被 Agent 动态发现并按需加载,用来在特定任务上表现得更稳定、更专业
  • 目的:把你的组织流程、最佳实践、模板、校验规则沉淀为可复用能力,让通用 Agent 变成“专项 Agent”

简单理解:Skill = “怎么做这件事”的可复用 SOP +(可选)脚本与资源
它解决的是“工作方法/流程固化、输出一致性、少写 prompt”的问题。

参考(官方)


1.2 MCP(Model Context Protocol,最新官方定义)

MCP 官网给出的定义也很“工程化”:

  • MCP 是一个开源标准,用于把 AI 应用连接到外部系统
  • 通过 MCP,像 Claude、ChatGPT 这类 AI 应用可以接入:
    • 数据源(本地文件、数据库、应用上下文)
    • 工具(搜索、计算器、业务 API)
    • 工作流(专用 prompts / 模板化流程)
  • 官网的比喻非常直白:“MCP 像 AI 应用的 USB-C 口”(统一插座)

简单理解:MCP = “把外部能力标准化接入 AI 应用/Agent”的协议与生态
它解决的是“系统接入碎片化、跨客户端/跨模型复用、统一治理(鉴权/审计/脱敏)”的问题。

参考(官方)


2. 关键差异:一个是“怎么做”,一个是“怎么连”

下面这张表能帮你避免概念混用:

维度Agent SkillsMCP
关注点程序性知识 / SOP:怎么做更专业、更一致连接与上下文:怎么把外部系统接给模型
解决的问题prompt 难复用、流程不统一、输出不稳定工具/数据源接入碎片化、N×M 集成成本高
形态“技能包”:指令+脚本+资源,按需加载“协议+服务端”:标准化暴露 tools/resources/prompts
最适合固化流程、模板化产出、稳定写作/审查/分析多系统统一接入、跨客户端复用、平台化治理
代价需要版本与安全治理(脚本/资源供应链)初期工程成本更高(server、鉴权、观测、运维)

一句话:Skills 让 Agent 更像“专家”,MCP 让 Agent 有“插座”去连世界。


3. MCP 的结构:为什么它能当“统一插座”?

MCP 官方规范把 server 能力拆成三类核心原语(非常重要):

  1. Prompts:服务器提供“模板化提示词/结构化指令”,客户端可发现并带参数获取
    modelcontextprotocol.io/specificati…

  2. Resources:服务器暴露结构化资源(文件、DB schema、应用信息等),每个资源有 URI
    modelcontextprotocol.io/specificati…

  3. Tools:服务器暴露可调用工具(查库、调 API、计算),每个工具有 schema/元数据
    modelcontextprotocol.io/specificati…

此外,规范说明 MCP 基于 JSON-RPC 2.0 进行消息交互(请求/响应/通知等),从而让“工具调用”变得标准化、可互操作:


4. Agent Skills 的结构:为什么它能提升“专项能力稳定性”?

Agent Skills 的标准站点给出了技能内容的组织方式(典型包含):

  • SKILL.md:技能说明与操作步骤(建议包含 step-by-step、示例、边界情况)
  • 可选目录:脚本、资源文件、补充说明等
  • 关键设计理念:progressive disclosure(渐进披露) —— 只有在需要时加载技能内容,减少上下文占用

参考:


5. 使用场景大全:什么时候用 Skills?什么时候用 MCP?什么时候一起用?

5.1 适合 Agent Skills 的场景(偏“流程固化 / 输出一致性”)

场景 A:组织级写作与审查(最容易见效)
  • 事故复盘模板、周报/月报结构、PRD 规范、法务条款审查清单、品牌风格指南
  • 你希望把“公司最佳实践”做成一键复用,而不是每次重新 prompt

为什么 Skills 更合适?
因为它是“把流程与示例写死”的复用包:同类任务的输出一致性会显著提升。

场景 B:复杂格式产出(文档/表格/报告)
  • 固定格式的 Markdown 报告、投标书、合规报告、数据解读报告
  • Skills 可以内置:字段约束、输出结构、常见错误与纠正方式
场景 C:需要脚本兜底的确定性处理
  • PDF/日志解析、批量清洗、格式化、校验(如 JSON schema 校验、正则提取)
  • 让脚本做“确定性部分”,模型做“解释与决策部分”,整体更稳

5.2 适合 MCP 的场景(偏“多系统接入 / 平台化治理”)

场景 D:企业内部系统很多,接入开始爆炸
  • 你要连:DB、知识库、工单、IM、代码仓库、内部微服务……
  • 如果每个 Agent / 每个客户端都自己接一遍,维护会崩

为什么 MCP 更合适?
因为它把外部能力统一成:Prompts / Resources / Tools,并通过标准协议让不同客户端复用。

场景 E:多模型、多客户端并存(可移植性需求高)
  • Web 控制台 + IDE 插件 + IM 机器人 + 内部服务
  • 你不想为每种客户端、每个模型重复写“接入胶水层”
场景 F:需要统一的权限、审计、脱敏与限流
  • 工具能改数据、能触发真实动作(退款、封禁、发通知)
  • 你需要集中治理与审计链路(谁查了什么、触发了什么、结果如何)

5.3 最推荐:Skills + MCP 组合拳(企业里通常会走到这里)

MCP 负责“把系统接进来”,Skills 负责“教会 Agent 怎么用这些系统做对事”。

一个典型组合例子(客服/运营/工单助手):

  • MCP 提供 Tools:query_orderget_ticketpost_commentsend_notice
  • MCP 提供 Resources:订单 schema、客服政策、SLA 规则
  • Skills 提供 SOP:分级规则、话术模板、升级路径、异常兜底策略

最终效果:既能“按规范思考”,又能“安全执行动作”。


6. 优缺点对比(写给“要落地”的你)

6.1 Agent Skills:优点

  1. 输出一致性强:SOP + 示例 + 边界条件写清楚后,同类任务不容易漂移
  2. 复用成本低:少写 prompt,多用技能包
  3. 按需加载更省上下文:只在触发时加载技能内容
  4. 可脚本化提升可靠性:确定性处理交给脚本,减少模型“编”的概率

6.2 Agent Skills:缺点/风险

  1. 供应链风险:技能可能包含脚本与资源,必须做来源可信与执行隔离
  2. 治理成本:版本管理、审核发布、权限控制、变更影响评估都要配套
  3. 过度封装风险:写成“万能技能”反而不好用,应保持单一职责、可组合

6.3 MCP:优点

  1. 标准化接入:Prompts/Resources/Tools 一套原语统一外部能力
  2. 跨客户端复用:同一个 MCP server 可被多个客户端消费(减少重复集成)
  3. 平台化治理更容易:鉴权、审计、脱敏、限流放在 server 层统一做
  4. 降低 N×M 集成成本:多个模型 × 多个工具 的组合不再需要每对都定制

6.4 MCP:缺点/风险

  1. 初期工程成本高:需要 server、鉴权、可观测、运维体系
  2. 调试链路更长:模型 ↔ 客户端 ↔ MCP server ↔ 下游系统,任何一层都可能出错
  3. 安全面更大:工具能触发真实动作,必须严格 human-in-the-loop 与权限隔离

7. Tool Calling / Function Calling 和 MCP / Skills 的关系(别混淆术语)

很多工程团队口中的“skill”其实更接近 tool calling(函数调用)

  • OpenAI 文档把 tool calling 描述为:模型提出工具调用 → 应用执行 → 再把结果回传模型的多步流程
    platform.openai.com/docs/guides…

  • OpenAI Agents SDK 也把 Tools 分成 hosted tools、function calling、agents as tools
    openai.github.io/openai-agen…

  • Skills(Anthropic 语境):流程/规范/脚本/资源的“能力包”

  • Tool Calling(通用语境):让模型调用外部函数/工具执行动作

  • MCP:标准化把 prompts/resources/tools 暴露给客户端/模型的协议


8. 选型建议:什么时候先做 Skills?什么时候先上 MCP?

8.1 先做 Skills(快速见效路线)

满足任意两条,就先 Skills:

  • 你最大的痛点是“输出不稳定 / SOP 不统一”
  • 工具与系统不多(< 5~8 个),接入成本可控
  • 目标是快速做出 1~2 个高频场景闭环(报告/审查/总结/标准答复)

落地步骤(推荐)

  1. 选 3 个最高频任务
  2. 每个任务写成:输入 → 步骤 → 输出模板 → 边界情况 → 示例
  3. 可确定性的环节用脚本兜底(解析/校验/格式化)

8.2 先做 MCP(平台化路线)

满足任意两条,就考虑 MCP:

  • 需要连很多系统(DB、KB、IM、工单、仓库、内部服务…)
  • 多个团队/多个客户端都要用同一套接入能力
  • 有强治理需求(权限、审计、脱敏、限流、分级授权)

落地步骤(推荐)

  1. 先挑 2 个最常用系统做 MCP server:例如 数据库 + 工单
  2. 把最常用动作做成 Tools,把最常用上下文做成 Resources
  3. 再逐步补 Prompts(组织级模板)与更严格的 auth/审计/风控

9. 工程化与安全清单(强烈建议直接贴到团队 Wiki)

9.1 权限与风控(必做)

  • 最小权限原则:按用户/角色/环境(prod/uat)隔离
  • 高风险动作必须二次确认:退款、封禁、删除、转账、批量修改
  • 审计:记录 tool 调用参数、结果摘要、操作者、trace_id
  • 脱敏:PII、token、密钥、内部地址等统一脱敏策略

9.2 可观测性(必须能排障)

  • 每次 agent run 的调用链:耗时、失败率、重试次数、下游错误码
  • 将模型决策与工具调用串成 trace(方便复盘与优化)

9.3 结果结构化(减少上下文污染)

  • Tools 输出尽量结构化(JSON),并支持分页/游标
  • 返回“摘要 + 指针”,避免一次塞入大量原始数据

9.4 成本与延迟控制(上线必踩的坑)

  • 规划-调用次数越多越慢:能批量就批量,能缓存就缓存
  • 把“重活”交给系统:LLM 做理解与决策,工具做确定性处理

10. 最后总结(适合当结尾金句)

  • Agent Skills 让你的 Agent 具备“专项能力与一致流程”,核心是 SOP 的可复用与按需加载
  • MCP 让你的 Agent 具备“连接真实世界系统的标准接口”,核心是 prompts/resources/tools 的标准化暴露与治理
  • 企业落地最佳实践通常是:先 Skills 跑通高频闭环 → 再 MCP 平台化统一接入与治理 → 最后形成可复用的 Agent 基础设施

参考资料(官方优先)

  1. MCP 官网(What is MCP):modelcontextprotocol.io/
  2. MCP 规范(2025-11-25):modelcontextprotocol.io/specificati…
  3. MCP Prompts(2025-06-18):modelcontextprotocol.io/specificati…
  4. MCP Resources(2025-06-18):modelcontextprotocol.io/specificati…
  5. MCP Tools(2025-06-18):modelcontextprotocol.io/specificati…
  6. MCP GitHub(规范与 schema):github.com/modelcontex…
  7. Anthropic Agent Skills 工程博客:www.anthropic.com/engineering…
  8. Claude Help Center - Skills:support.claude.com/en/articles…
  9. Agent Skills 标准站点(Overview):agentskills.io/home
  10. Agent Skills 规范:agentskills.io/specificati…
  11. OpenAI Function / Tool calling:platform.openai.com/docs/guides…
  12. OpenAI Agents SDK - Tools:openai.github.io/openai-agen…