通用 Agent 已经能操作完整计算环境(例如 Claude Code 的本地执行与文件系统),但要稳定干真实工作,缺的不只是「能调什么」,而是程序性知识和组织上下文——报销怎么填、发布 checklist 怎么走、你们内部术语到底指啥。Skills 做的事,是把这类东西打成可组合、可扩展、可迁移的资源包:一个目录、SKILL.md 当目录页,正文和附件按需加载。和 MCP 的分工可以记一句:连接器解决能连,Skill 解决会用。[1]**
**
Agent Skills 已作为跨平台可移植的开放标准发布(2025-12-18),见 agentskills.io(以官网为准)。[1]
先看主线
- 主线:为什么「会调工具」仍不够 → Skill 包长什么样 → 渐进加载怎么省上下文 → 安全与维护别踩坑。
- 跳读位:文内
### 深度解析与「材料勘读」。
一、背景:能跑 bash,不等于知道你们公司怎么干活
能跑 bash、能读文件,不等于知道「你们公司报销单第 7 栏怎么填」。Skills 把这类领域能力从「写死在超长 system prompt」里抽出来,变成可安装、可版本化的包——以后改流程,改包比改一坨 prompt 更像在维护代码。[1]
二、演进:从超长 prompt 到「一个文件夹」
Skill = 一个目录,核心是 SKILL.md (说明、脚本、资源等,按需发现与加载)。 激活方式:在 SKILL.md 里用 YAML frontmatter 填必填元数据 name 与 description。[1]
做 Skill 很像给新人写入职指南:用可复用模块替代「每个场景各造一个碎片化 Agent」。[1]
三、机制:Skill 怎么一层层展开(渐进披露)
第一层:启动时把每个已安装 Skill 的 name / description 放进 system prompt——只够判断「该不该用」,不把全文塞满。
第二层:任务相关,再读完整 SKILL.md 正文。
第三层及更深:目录里其它文件(如 reference.md、forms.md),按名引用,需要时再读。博文里的 PDF Skill 示例在 GitHub anthropics/skills · document-skills/pdf,可对照看 SKILL.md 与 forms.md 怎么拆。[1][5]
设计原则像手册:目录 → 章节 → 附录。有文件系统与代码执行时,不必把整包 Skill 一次性塞进上下文,所以包里 bundled 的内容可以看成几乎无上限。[1]
深度解析:开放标准 agentskills.io 和各家怎么接
事实:博客与 agentskills.io 讲跨平台标准;Claude Skills 文档写的是具体怎么挂载。[1][2][3]
原文观点:Skills 和 MCP 互补。[1][7]
本文解读:你把 Skill 文件夹拷到另一个客户端,能不能原样跑,取决于那边的技能加载器、沙箱和 API——「同一份目录」往往还要改 compatibility 或脚本解释器路径,别假设零成本迁移。
3.1 和上下文窗口怎么配合
典型顺序(以 PDF Skill 为例):[1]
- 上下文里有核心 system prompt、各 Skill 元数据和用户首条消息;
- 通过 Bash 等读
pdf/SKILL.md; - 再按需读
forms.md; - 带着相关指令继续执行任务。
3.2 和代码执行
Skill 里可以塞 Python 等脚本:比如从 PDF 确定性抽表单字段——模型不必先把整份 PDF 和脚本全塞进上下文再「口算」。[1]
3.3 怎么写、怎么评
- 先评测:在代表性任务上找短板,再增量补 Skill。
- 为规模拆分:
SKILL.md太大就拆文件、走互斥路径,省 token;代码要分清「直接执行」还是「读进来当文档」。 - 站在模型侧看触发:有没有误触发、有没有过度啃某段上下文;
name/description基本决定触发质量。 - 和模型一起迭代:把成功路径和常见错误沉淀进 Skill;跑偏了就复盘改包。[1]
四、应用边界:安全不是「装完再说」
Skill 通过指令和代码扩能力,恶意 Skill 一样能带来漏洞、诱导外泄或越权。[1]
只装可信来源;来源不明就先审计再跑。把包内文件过一遍,盯 代码依赖、捆绑资源、以及有没有诱导连不可信外网的指令。[1]
材料勘读:博客讲得很亮,供应链你得自己管
事实:原文明确提恶意 Skill 风险。[1]
原文观点:只装可信来源、先审计。[1]
本文解读:企业里更现实的做法,是把 Skill 当成和依赖包同级的供应链:SBOM、签名、准入流程——博客替不了你们安全团队的威胁模型。
五、路线图摘要
Skills 已支持 Claude.ai、Claude Code、Claude Agent SDK、Claude Developer Platform——产品侧总述见 Anthropic Skills 发布说明(以官网更新为准)。后续会补全创建、编辑、发现、分享与使用整条链路;和 MCP 一起,把更复杂的外部工具工作流教给 Agent;远期还有 Agent 自创建/自评估 Skill 等叙事。[1][6]
入门:Skills 文档 、 cookbook。[1][3][4]
结论与讨论
技术坐标
这篇把 程序性知识 从「写死在 prompt」推进到 可分发、可审计、渐进加载的包——在 Claude 生态里,很像给 Agent 加了一层上岗层。
批判性问题
description有没有写清负例(什么时候别用这个 Skill)?- 脚本和依赖在 离线/内网 能不能复现?
- 开放标准更新时,版本钉死有没有进 CI?
独立判断(事实 / 原文观点 / 本文解读)
| 类型 | 内容 |
|---|---|
| 事实 | 原文 URL;agentskills.io;文档、cookbook 与示例仓库见延伸阅读。[1][2] |
| 原文观点 | 渐进披露;与 MCP 分工;安全警告。[1] |
| 本文解读 | Skill 真正难的是 评测与长期维护,不是 YAML 写得多漂亮。批判性补一句:线上事故里更常见的是 description 写飘导致误触发/漏触发,比「frontmatter 不够美」更伤——评测要盯触发分布,别只盯格式。[1] |
参考文献与延伸阅读
- [1] Equipping agents for the real world with Agent Skills — Claude 博客,2025-10-16(文内 2025-12-18 开放标准更新以原文为准)
- [2] agentskills.io — Agent Skills 跨平台开放标准站点
- [3] Agent Skills — 文档概览 — Claude 产品文档
- [4] claude-cookbooks / skills — GitHub cookbook
- [5] anthropics/skills · document-skills/pdf — 博文引用的 PDF Skill 示例目录
- [6] Introducing Agent Skills — Anthropic 产品/支持面叙事
- [7] Model Context Protocol — 与 Skill 互补的官方 MCP 入口