Claude Skills 官方指南发布:AI Agent开发进入“能力模块时代”

0 阅读5分钟

最近 Anthropic 官方发布了一份 33 页的 Claude Skills 构建指南

很多人看到这个消息时的第一反应是:

Skills 不就是 Prompt 模板吗?

如果只是这么理解,那就低估它了。

这份指南其实透露了一件更大的事情:

AI 应用的开发方式正在发生变化。

过去几年,大多数 AI 应用是这样的:

用户 → Prompt → LLM → 输出

但现在越来越多 AI 系统开始变成:

用户 → Agent → Skills → 工具 → 结果

也就是说:

Prompt 在减少,能力模块在增加。

Anthropic 的这份 Skills 指南,本质是在告诉开发者:

如何把 AI 能力做成模块化系统。

1 Claude Skills 到底是什么

Anthropic 的官方定义其实很简单:

Skill = 一组可复用的任务流程。

本质上,它就是一个 能力模块

一个 Skill 的典型结构是:

your-skill-name/

SKILL.md
scripts/
references/
assets/

其中最重要的是:

SKILL.md

这个文件包含:

  • YAML 元信息
  • 技能描述
  • 执行步骤
  • 示例
  • 错误处理

例如:

---
name: sprint-planning
description:
  自动规划项目冲刺任务
  当用户说“规划冲刺”“创建任务”时使用
---

执行流程:

1 获取项目状态
2 分析团队容量
3 建议任务优先级
4 创建任务

简单来说:

Skill = 把经验封装成模块。

2 Skills 的核心设计思想

Anthropic 在文档中提出了三个核心理念。

1 渐进式加载

Skill 不会一次性加载全部内容。

而是三层结构:

Layer1  YAML metadata
Layer2  SKILL.md
Layer3  references

加载流程如下:

这种设计带来的好处:

  • 节省 token
  • 保留复杂知识
  • 降低上下文污染

2 可组合性

Claude 可以 同时加载多个 Skills

例如:

design-skill
coding-skill
analysis-skill
report-skill

一个 Agent 任务中可能变成:

Agent
 ├ design skill
 ├ coding skill
 └ report skill

所以设计 Skill 时必须注意:

不要假设自己是唯一技能。

3 可移植性

同一个 Skill 可以运行在:

  • Claude.ai
  • Claude Code
  • API
  • Agent 系统

也就是说:

写一次,到处使用。

3 Skills 的工程结构

官方推荐的工程结构如下:

skill-name
│
├── SKILL.md
├── scripts
├── references
└── assets

每个组件的作用:

组件作用
SKILL.md核心逻辑
scripts自动执行脚本
references知识文档
assets模板资源

一个 Skill 的典型执行流程:

4 Skills + MCP 的 Agent 架构

如果说:

MCP 是连接层

那么:

Skills 就是知识层。

架构如下:

一句话总结:

MCP 解决:AI 能做什么
Skills 解决:AI 应该怎么做

5 Skills 的五种设计模式

Anthropic 总结了五种常见设计模式。

顺序工作流

适合:

多步骤自动化任务。

创建账户
↓
设置支付
↓
创建订阅
↓
发送欢迎邮件

多 MCP 协同

例如设计交接流程:

迭代优化

适合:

报告生成、数据分析。

生成初稿
↓
质量检查
↓
修改
↓
重新验证

情境工具选择

大文件 → 云存储
协作文档 → Notion
代码文件 → GitHub

领域知识 Skill

例如金融风控系统:

  • 风险规则
  • 合规流程
  • 审计记录

都可以嵌入 Skill 中。

Skills 如何测试

官方给出三种测试方式。

触发测试

验证 Skill 是否正确触发。

例如:

应该触发:

帮我创建项目
帮我规划冲刺
创建任务

不应该触发:

今天天气
写Python脚本

功能测试

验证任务是否成功执行。

例如检查:

任务是否创建
参数是否正确
MCP调用是否成功

对比测试

比较:

无 Skill
vs
有 Skill

官方示例:

指标无技能有技能
消息数152
API错误30
token消耗120006000

7 Prompt工程 vs Agent工程

对比:

传统AI应用
Prompt → LLM → 输出

Agent系统
Agent → Skills → 工具 → 结果

8 AI Agent 技术栈

如果从系统架构看,AI Agent 的技术栈大致如下:

系统分层:

用户
↓
Agent
↓
Skills
↓
MCP
↓
外部系统

9 为什么 Skills 会成为 Agent 的核心能力

Prompt 最大的问题是:

经验无法沉淀。

每次都要重新写。

但 Skills 可以:

把经验封装成能力模块

例如:

coding-skill
analysis-skill
report-skill
design-skill

未来 AI 系统很可能变成:

也就是:

Agent
+ Skills
+ MCP
+ Tools

这非常像软件系统:

操作系统
+ 函数库
+ 插件

关于我们

霍格沃兹测试开发学社,隶属于 测吧(北京)科技有限公司,是一个面向软件测试爱好者的技术交流社区。

学社围绕现代软件测试工程体系展开,内容涵盖软件测试入门、自动化测试、性能测试、接口测试、测试开发、全栈测试,以及人工智能测试与 AI 在测试工程中的应用实践

我们关注测试工程能力的系统化建设,包括 Python 自动化测试、Java 自动化测试、Web 与 App 自动化、持续集成与质量体系建设,同时探索 AI 驱动的测试设计、用例生成、自动化执行与质量分析方法,沉淀可复用、可落地的测试开发工程经验。

在技术社区与工程实践之外,学社还参与测试工程人才培养体系建设,面向高校提供测试实训平台与实践支持,组织开展 “火焰杯” 软件测试相关技术赛事,并探索以能力为导向的人才培养模式,包括高校学员先学习、就业后付款的实践路径。

同时,学社结合真实行业需求,为在职测试工程师与高潜学员提供名企大厂 1v1 私教服务,用于个性化能力提升与工程实践指导。