Agent Skills:工具会连了,还差一本「上岗手册」

13 阅读5分钟

通用 Agent 已经能操作完整计算环境(例如 Claude Code 的本地执行与文件系统),但要稳定干真实工作,缺的不只是「能调什么」,而是程序性知识组织上下文——报销怎么填、发布 checklist 怎么走、你们内部术语到底指啥。Skills 做的事,是把这类东西打成可组合、可扩展、可迁移的资源包:一个目录、SKILL.md 当目录页,正文和附件按需加载。和 MCP 的分工可以记一句:连接器解决能连,Skill 解决会用。[1]**
**

Agent Skills 已作为跨平台可移植的开放标准发布(2025-12-18),见 agentskills.io(以官网为准)。[1]

先看主线

  • 主线:为什么「会调工具」仍不够 → Skill 包长什么样 → 渐进加载怎么省上下文 → 安全与维护别踩坑。
  • 跳读位:文内 ### 深度解析 与「材料勘读」。

一、背景:能跑 bash,不等于知道你们公司怎么干活

能跑 bash、能读文件,不等于知道「你们公司报销单第 7 栏怎么填」。Skills 把这类领域能力从「写死在超长 system prompt」里抽出来,变成可安装、可版本化的包——以后改流程,改包比改一坨 prompt 更像在维护代码。[1]


二、演进:从超长 prompt 到「一个文件夹」

Skill = 一个目录,核心是 SKILL.md (说明、脚本、资源等,按需发现与加载)。 激活方式:在 SKILL.md 里用 YAML frontmatter 填必填元数据 name 与 description。[1]

做 Skill 很像给新人写入职指南:用可复用模块替代「每个场景各造一个碎片化 Agent」。[1]

图片


三、机制:Skill 怎么一层层展开(渐进披露)

图片

第一层:启动时把每个已安装 Skill 的 name / description 放进 system prompt——只够判断「该不该用」,不把全文塞满。
第二层:任务相关,再读完整 SKILL.md 正文
第三层及更深:目录里其它文件(如 reference.mdforms.md),按名引用,需要时再读。博文里的 PDF Skill 示例在 GitHub anthropics/skills · document-skills/pdf,可对照看 SKILL.md 与 forms.md 怎么拆。[1][5]

设计原则像手册:目录 → 章节 → 附录。有文件系统与代码执行时,不必把整包 Skill 一次性塞进上下文,所以包里 bundled 的内容可以看成几乎无上限。[1]

深度解析:开放标准 agentskills.io 和各家怎么接

事实:博客与 agentskills.io 讲跨平台标准;Claude Skills 文档写的是具体怎么挂载。[1][2][3]

原文观点:Skills 和 MCP 互补。[1][7]

本文解读:你把 Skill 文件夹拷到另一个客户端,能不能原样跑,取决于那边的技能加载器、沙箱和 API——「同一份目录」往往还要改 compatibility 或脚本解释器路径,别假设零成本迁移。


3.1 和上下文窗口怎么配合

典型顺序(以 PDF Skill 为例):[1]

  1. 上下文里有核心 system prompt、各 Skill 元数据和用户首条消息;
  2. 通过 Bash 等读 pdf/SKILL.md
  3. 再按需读 forms.md
  4. 带着相关指令继续执行任务。

3.2 和代码执行

图片

Skill 里可以塞 Python 等脚本:比如从 PDF 确定性抽表单字段——模型不必先把整份 PDF 和脚本全塞进上下文再「口算」。[1]


3.3 怎么写、怎么评

  • 先评测:在代表性任务上找短板,再增量补 Skill。
  • 为规模拆分SKILL.md 太大就拆文件、走互斥路径,省 token;代码要分清「直接执行」还是「读进来当文档」。
  • 站在模型侧看触发:有没有误触发、有没有过度啃某段上下文;name / description 基本决定触发质量。
  • 和模型一起迭代:把成功路径和常见错误沉淀进 Skill;跑偏了就复盘改包。[1]

四、应用边界:安全不是「装完再说」

Skill 通过指令和代码扩能力,恶意 Skill 一样能带来漏洞、诱导外泄或越权。[1]

只装可信来源;来源不明就先审计再跑。把包内文件过一遍,盯 代码依赖、捆绑资源、以及有没有诱导连不可信外网的指令。[1]

材料勘读:博客讲得很亮,供应链你得自己管

事实:原文明确提恶意 Skill 风险。[1]

原文观点:只装可信来源、先审计。[1]

本文解读:企业里更现实的做法,是把 Skill 当成和依赖包同级的供应链:SBOM、签名、准入流程——博客替不了你们安全团队的威胁模型。


五、路线图摘要

Skills 已支持 Claude.ai、Claude Code、Claude Agent SDK、Claude Developer Platform——产品侧总述见 Anthropic Skills 发布说明(以官网更新为准)。后续会补全创建、编辑、发现、分享与使用整条链路;和 MCP 一起,把更复杂的外部工具工作流教给 Agent;远期还有 Agent 自创建/自评估 Skill 等叙事。[1][6]

入门:Skills 文档 cookbook。[1][3][4]


结论与讨论

技术坐标

这篇把 程序性知识 从「写死在 prompt」推进到 可分发、可审计、渐进加载的包——在 Claude 生态里,很像给 Agent 加了一层上岗层

批判性问题

  1. description 有没有写清负例(什么时候别用这个 Skill)?
  2. 脚本和依赖在 离线/内网 能不能复现?
  3. 开放标准更新时,版本钉死有没有进 CI?

独立判断(事实 / 原文观点 / 本文解读)

类型内容
事实原文 URL;agentskills.io;文档、cookbook 与示例仓库见延伸阅读。[1][2]
原文观点渐进披露;与 MCP 分工;安全警告。[1]
本文解读Skill 真正难的是 评测与长期维护,不是 YAML 写得多漂亮。批判性补一句:线上事故里更常见的是 description 写飘导致误触发/漏触发,比「frontmatter 不够美」更伤——评测要盯触发分布,别只盯格式。[1]

参考文献与延伸阅读

  • [1] Equipping agents for the real world with Agent Skills — Claude 博客,2025-10-16(文内 2025-12-18 开放标准更新以原文为准)
  • [2] agentskills.io — Agent Skills 跨平台开放标准站点
  • [3] Agent Skills — 文档概览 — Claude 产品文档
  • [4] claude-cookbooks / skills — GitHub cookbook
  • [5] anthropics/skills · document-skills/pdf — 博文引用的 PDF Skill 示例目录
  • [6] Introducing Agent Skills — Anthropic 产品/支持面叙事
  • [7] Model Context Protocol — 与 Skill 互补的官方 MCP 入口