最近 Anthropic 官方发布了一份 33 页的 Claude Skills 构建指南。
很多人看到这个消息时的第一反应是:
Skills 不就是 Prompt 模板吗?
如果只是这么理解,那就低估它了。
这份指南其实透露了一件更大的事情:
AI 应用的开发方式正在发生变化。
过去几年,大多数 AI 应用是这样的:
用户 → Prompt → LLM → 输出
但现在越来越多 AI 系统开始变成:
用户 → Agent → Skills → 工具 → 结果
也就是说:
Prompt 在减少,能力模块在增加。
Anthropic 的这份 Skills 指南,本质是在告诉开发者:
如何把 AI 能力做成模块化系统。
1 Claude Skills 到底是什么
Anthropic 的官方定义其实很简单:
Skill = 一组可复用的任务流程。
本质上,它就是一个 能力模块。
一个 Skill 的典型结构是:
your-skill-name/
SKILL.md
scripts/
references/
assets/
其中最重要的是:
SKILL.md
这个文件包含:
- YAML 元信息
- 技能描述
- 执行步骤
- 示例
- 错误处理
例如:
---
name: sprint-planning
description:
自动规划项目冲刺任务
当用户说“规划冲刺”“创建任务”时使用
---
执行流程:
1 获取项目状态
2 分析团队容量
3 建议任务优先级
4 创建任务
简单来说:
Skill = 把经验封装成模块。
2 Skills 的核心设计思想
Anthropic 在文档中提出了三个核心理念。
1 渐进式加载
Skill 不会一次性加载全部内容。
而是三层结构:
Layer1 YAML metadata
Layer2 SKILL.md
Layer3 references
加载流程如下:
这种设计带来的好处:
- 节省 token
- 保留复杂知识
- 降低上下文污染
2 可组合性
Claude 可以 同时加载多个 Skills。
例如:
design-skill
coding-skill
analysis-skill
report-skill
一个 Agent 任务中可能变成:
Agent
├ design skill
├ coding skill
└ report skill
所以设计 Skill 时必须注意:
不要假设自己是唯一技能。
3 可移植性
同一个 Skill 可以运行在:
- Claude.ai
- Claude Code
- API
- Agent 系统
也就是说:
写一次,到处使用。
3 Skills 的工程结构
官方推荐的工程结构如下:
skill-name
│
├── SKILL.md
├── scripts
├── references
└── assets
每个组件的作用:
| 组件 | 作用 |
|---|---|
| SKILL.md | 核心逻辑 |
| scripts | 自动执行脚本 |
| references | 知识文档 |
| assets | 模板资源 |
一个 Skill 的典型执行流程:
4 Skills + MCP 的 Agent 架构
如果说:
MCP 是连接层
那么:
Skills 就是知识层。
架构如下:
一句话总结:
MCP 解决:AI 能做什么
Skills 解决:AI 应该怎么做
5 Skills 的五种设计模式
Anthropic 总结了五种常见设计模式。
顺序工作流
适合:
多步骤自动化任务。
创建账户
↓
设置支付
↓
创建订阅
↓
发送欢迎邮件
多 MCP 协同
例如设计交接流程:
迭代优化
适合:
报告生成、数据分析。
生成初稿
↓
质量检查
↓
修改
↓
重新验证
情境工具选择
大文件 → 云存储
协作文档 → Notion
代码文件 → GitHub
领域知识 Skill
例如金融风控系统:
- 风险规则
- 合规流程
- 审计记录
都可以嵌入 Skill 中。
Skills 如何测试
官方给出三种测试方式。
触发测试
验证 Skill 是否正确触发。
例如:
应该触发:
帮我创建项目
帮我规划冲刺
创建任务
不应该触发:
今天天气
写Python脚本
功能测试
验证任务是否成功执行。
例如检查:
任务是否创建
参数是否正确
MCP调用是否成功
对比测试
比较:
无 Skill
vs
有 Skill
官方示例:
| 指标 | 无技能 | 有技能 |
|---|---|---|
| 消息数 | 15 | 2 |
| API错误 | 3 | 0 |
| token消耗 | 12000 | 6000 |
7 Prompt工程 vs Agent工程
对比:
传统AI应用
Prompt → LLM → 输出
Agent系统
Agent → Skills → 工具 → 结果
8 AI Agent 技术栈
如果从系统架构看,AI Agent 的技术栈大致如下:
系统分层:
用户
↓
Agent
↓
Skills
↓
MCP
↓
外部系统
9 为什么 Skills 会成为 Agent 的核心能力
Prompt 最大的问题是:
经验无法沉淀。
每次都要重新写。
但 Skills 可以:
把经验封装成能力模块
例如:
coding-skill
analysis-skill
report-skill
design-skill
未来 AI 系统很可能变成:
也就是:
Agent
+ Skills
+ MCP
+ Tools
这非常像软件系统:
操作系统
+ 函数库
+ 插件
关于我们
霍格沃兹测试开发学社,隶属于 测吧(北京)科技有限公司,是一个面向软件测试爱好者的技术交流社区。
学社围绕现代软件测试工程体系展开,内容涵盖软件测试入门、自动化测试、性能测试、接口测试、测试开发、全栈测试,以及人工智能测试与 AI 在测试工程中的应用实践。
我们关注测试工程能力的系统化建设,包括 Python 自动化测试、Java 自动化测试、Web 与 App 自动化、持续集成与质量体系建设,同时探索 AI 驱动的测试设计、用例生成、自动化执行与质量分析方法,沉淀可复用、可落地的测试开发工程经验。
在技术社区与工程实践之外,学社还参与测试工程人才培养体系建设,面向高校提供测试实训平台与实践支持,组织开展 “火焰杯” 软件测试相关技术赛事,并探索以能力为导向的人才培养模式,包括高校学员先学习、就业后付款的实践路径。
同时,学社结合真实行业需求,为在职测试工程师与高潜学员提供名企大厂 1v1 私教服务,用于个性化能力提升与工程实践指导。