引言:AI智能体的能力新范式
在2023-2025年的大模型爆发初期,开发者主要依赖“提示词工程(Prompt Engineering)”来控制模型行为。然而,随着企业级应用向Agentic Workflow(代理工作流) 演进,单纯依靠System Prompt面临两大瓶颈:一是上下文污染——为了覆盖所有边界情况,Prompt往往长达数万Token,导致模型注意力分散;二是复用性极差——复杂的业务逻辑被硬编码在对话历史中,难以跨项目、跨团队迁移。
2025年10月,Anthropic正式发布Agent Skills技术协议,随后在2025年12月被确立为开放标准,标志着AI开发进入了 “技能工程(Skill Engineering)” 的新阶段。OpenAI、GitHub、Cursor、VS Code等主流平台均已跟进支持。
那么,Agent Skills究竟是什么?它的内部原理如何运作?本文将为你层层拆解。
一、Agent Skills概念解析:不仅仅是“工具调用”
1.1 核心定义
Agent Skills可以理解为 “可复用的任务完成能力单元” ——它把目标、流程、工具、知识、约束与验收标准封装在一起,让智能体能稳定交付特定任务。更形象地说,Skill就像给Agent准备的“工作交接SOP大礼包” :
- 任务的执行SOP与必要背景知识(这件事大致怎么做)
- 工具的使用说明(用什么软件、怎么操作)
- 要用到的模板、素材(历史案例、格式规范)
- 可能遇到的问题、规范、解决方案(细节指引补充)
1.2 Skills与MCP的本质区别
这是最常见的困惑点。MCP(Model Context Protocol) 和Agent Skills解决的是不同层面的问题:
- MCP是数据管道:解决“数据怎么来”的问题,提供标准化接口让AI调用外部工具和数据服务
- Skill是认知模具:解决“数据怎么用”的问题,封装工作流程和专业知识
用一句话概括:MCP让Agent“能接工具”,Skill让Agent“用得像个专业人士” 。两者协同构成AI应用的“双引擎”——MCP负责获取实时数据,Skill负责按专业流程处理这些数据。
二、核心架构:渐进式披露(Progressive Disclosure)
Agent Skills最精妙的设计在于渐进式披露机制——技能的信息分为多个层次,Agent按需逐步加载,既确保不遗漏细节,又避免一次性将所有内容塞入上下文。
2.1 四层信息架构
| 层级 | 组件名称 | 内容类型 | 加载策略 | Token消耗 | 设计目的 |
|---|---|---|---|---|---|
| L1 | Metadata | 技能名称、描述、版本号 | Always-On(常驻) | <1%(约100 tokens) | 供模型进行路由决策与意图识别 |
| L2 | Instruction | SKILL.md正文规则 | On-Demand(命中后加载) | 5-10%(建议<5000 tokens) | 定义具体的业务处理逻辑与SOP |
| L3 | Reference | 外部文档、手册、规范 | Context-Triggered(条件触发) | 可变 | 提供必要的领域知识,用完即弃 |
| L4 | Script | Python/Shell/JS脚本 | Execution-Only(仅执行,不读代码) | 零 | 实现物理世界的副作用(Side Effects) |
2.2 渐进式加载的工作流程
- 启动阶段:Agent扫描所有技能目录,仅加载每个技能的
name和description元数据到系统提示中。这一步让模型了解“有哪些能力可用”,几乎不占用上下文窗口。 - 匹配阶段:当用户输入任务时,模型根据元数据判断哪些技能相关。如果某个技能的
description与任务匹配,Agent会读取该技能的完整SKILL.md正文。 - 执行阶段:在
SKILL.md的指导下,模型进一步决定是否需要加载references/中的参考文档,或直接执行scripts/中的脚本。脚本代码本身不会被读入上下文,只执行并返回结果。
这种设计使得技能可以包含海量信息却不怕超出上下文窗口限制。实测数据显示,在处理长链条业务流程时,该架构能将上下文Token消耗降低60%-80% 。
三、技能包结构:标准化的能力封装
3.1 标准目录结构
skill-name/
├── SKILL.md # 核心技能定义文件(必需)
├── LICENSE.txt # 许可证信息(可选)
├── reference.md # 详细参考材料(可选)
├── resources/ # 额外资源文件(可选)
│ ├── template.xlsx
│ └── data.json
├── references/ # 参考文档目录(可选)
│ └── REFERENCE.md
├── scripts/ # 可执行脚本(可选)
│ ├── main.py
│ └── helper.py
└── assets/ # 静态资源(可选)
└── template.json
3.2 SKILL.md文件格式规范
SKILL.md采用YAML Frontmatter + Markdown正文的混合格式:
---
name: mysql-employees-nl2sql-analysis
description: 基于MySQL官方employees数据库,将中文业务问题转换为受控的SQL,执行后输出结构化分析报告
version: 1.0.2
author: Enterprise_Ops_Team
license: MIT
compatibility: Requires Python 3.8+ and MySQL client
allowed-tools: execute_sql.py
---
# 技能正文
## 角色定义
你是一名数据分析专家,专精于员工信息库的查询分析。
## 核心指令
1. 理解用户中文问题
2. 生成符合规范的MySQL SQL
3. 调用execute_sql.py执行查询
4. 基于返回结果输出分析报告
## SQL生成规则(硬约束)
- 只允许SELECT查询
- 必须包含LIMIT子句
- 禁止使用DROP、DELETE、UPDATE等危险操作
...
3.3 字段规则
name字段约束:
- 长度:1-64字符
- 字符:仅允许小写字母、数字和连字符(
a-z、0-9、-) - 不能以连字符开头或结尾
- 不能包含连续的连字符(
--) - 必须与父目录名完全一致
description字段约束:
- 长度:1-1024字符
- 应说明技能的功能和使用时机
- 包含关键词帮助Agent识别适用场景
四、执行机制:从“建议者”到“执行者”
4.1 技能执行闭环
以MySQL数据分析Skill为例,展示完整的执行流程:
用户输入:"分析公司里谁的话语权最高?"
↓
Step 1: 模型理解问题(需要综合管理职级、薪资、部门影响力)
↓
Step 2: 生成第一条SQL → 查询管理层信息
↓
Step 3: 调用execute_sql.py执行,获取结果
↓
Step 4: 分析结果,判断还需要什么信息
↓
Step 5: 生成第二条SQL → 查询最高薪资员工
↓
Step 6: 再次调用脚本执行
↓
Step 7: 综合所有结果,输出结构化分析报告
这种 “规划-执行-观察”的交错式反馈循环让Agent能够自主完成多步骤复杂任务,而无需人为将任务拆解成多次提问。
4.2 脚本执行与沙箱安全
Skills中的scripts/目录支持Python、Shell、JavaScript等多种语言。执行方式有两种:
- 本地执行:脚本在本地环境中直接运行,速度快但需信任脚本来源
- 沙箱执行:通过Docker容器隔离执行,自动安装依赖,防止对宿主系统造成危害
沙箱模式要求Docker Daemon运行,脚本在容器中执行后返回结果给Agent,实现 “代码不读入上下文,只执行并返回” 的安全机制。
五、与传统方案的对比优势
| 维度 | 传统System Prompt模式 | Agent Skill模式 |
|---|---|---|
| 规则载体 | 纯文本,随会话发送 | 本地结构化文件(.md/.py) |
| 上下文占用 | 全量占用(无论是否用到) | 按需占用(仅加载被触发的技能) |
| 可维护性 | 极低(修改一处需测试整体影响) | 高(模块化独立封装) |
| 执行能力 | 仅限于文本生成 | 原生支持脚本执行与文件操作 |
| 复用性 | 难以跨项目迁移 | 可版本化、可分享、可跨平台 |
| 非技术人员门槛 | 需掌握提示词技巧 | 用自然语言编写SKILL.md即可 |
六、与MCP的协同:双引擎架构
在实际应用中,MCP和Skills形成互补关系:
用户需求:"分析NVDA当前估值是否合理"
↓ [MCP层:数据获取]
Yahoo Finance MCP Server → 返回实时股价、PE Ratio等JSON数据
↓ [Skill层:数据处理与呈现]
Investment_Analyst Skill激活 → 按规则处理数据:
- 当PE Ratio > 50时,引用risk_assessment.md进行风险提示
- 以专业研报表格格式输出技术指标
- 加入合规免责声明
↓ [最终输出]
用户得到既包含实时数据,又符合专业研报格式的分析报告
MCP是工具面(capability surface) :工具名、参数、鉴权、返回值协议;Skills是流程面(procedure layer) :触发条件、步骤编排、失败回滚、输出格式、以及“什么时候别乱用工具”。
七、前沿发展:Skills的自我进化
最新研究已开始探索让Agent自动优化自身的Skills。Sentient与弗吉尼亚理工提出的EvoSkill框架,能让系统通过失败分析自动发现并优化Agent Skills。
7.1 EvoSkill的三Agent协作机制
- 执行Agent(A) :在现有Skills支持下处理任务,生成执行轨迹和答案
- 提议Agent(P) :接收失败案例,结合历史反馈,提出Skill创建或修改建议
- Skills构建Agent(S) :将提议转化为具体的Skills文件夹(元数据、指令文件、脚本)
7.2 实验效果
- OfficeQA金融文档问答:准确率从60.6%提升至67.9%
- SealQA对抗性搜索问答:提升12.1个百分点(26.6%→38.7%)
- 跨任务迁移:在SealQA上进化出的“搜索持久性协议”迁移到BrowseComp任务,零样本下准确率从43.5%提升至48.8%
这表明Skills层面的自动进化有望成为提升Agent专业能力的新方向。
结语:从“提示词玄学”到“技能工程”
Agent Skills的标准化,标志着AI应用开发正在经历从 “炼金术”到“工程学” 的范式转移。它将“模型会不会”的问题,转化为“系统能不能稳定交付”的工程问题——把靠提示词试错的经验主义,升级为可复用、可迭代、可观测的模块化能力体系。
对于开发者而言,这意味着一项重要变化:非技术人员可以用自然语言编写专业技能,领域专家可以把自己的工作流程封装成“AI可执行的入职手册”。当每一个行业的知识都能被标准化为可复用的Skills,通用Agent才能真正走向垂直领域的深度应用。
常见Agent Skills大全:使用场景与安装指南
在了解了Agent Skills的内部原理之后,本文将进一步介绍目前生态中常见的Agent Skills,涵盖前端开发、后端工程、测试运维、文档处理等多个领域,并提供详细的使用场景和安装方式。
一、技能分类总览
根据工作领域,可以将常见技能分为以下几类:
| 工作领域 | 典型技能 | 主要用途 |
|---|---|---|
| 前端开发 | frontend-design, figma-implement-design, theme-factory | UI实现、设计稿转代码、主题管理 |
| 后端工程 | mcp-builder, backend-development, database-design | MCP服务开发、API设计、数据库建模 |
| 测试与QA | playwright-testing, qa-regression, gh-fix-ci | E2E测试、回归测试、CI问题修复 |
| 文档处理 | pdf-processing, docx-creation, xlsx-analysis | PDF解析、Word生成、Excel数据分析 |
| 运维部署 | railway-deploy, vercel-deploy, gh-actions | 应用部署、CI/CD配置 |
| 工作流管理 | pr-review, commit-message, notion-spec | PR审查、提交规范、需求管理 |
二、常用技能详细介绍
2.1 前端开发类技能
frontend-design(前端设计技能)
使用场景:当需要创建高质量的前端界面时触发,适用于React/Vue组件开发、响应式布局实现、动画效果设计等场景。
触发示例:
- “帮我实现一个响应式的导航栏组件”
- “设计一个带有动画效果的商品卡片”
- “创建暗色主题的仪表盘布局”
安装方式:
# 全局安装
npx ai-agent-skills install frontend-design -g
# 项目安装(团队共享)
npx ai-agent-skills install frontend-design -p
figma-implement-design(Figma设计实现技能)
使用场景:当需要将Figma设计稿转换为前端代码时触发。该技能会指导AI读取设计稿的布局、颜色、字体等规范,生成符合设计系统的代码。
触发示例:
- “按照这个Figma链接实现登录页面”
- “将设计稿中的卡片组件转换成React代码”
安装方式:
npx skills add anthropic/skills --skill figma-implement-design
2.2 后端工程类技能
mcp-builder(MCP服务构建技能)
使用场景:当需要创建或维护Model Context Protocol服务时触发。该技能提供MCP服务的架构设计、实现规范和最佳实践。
触发示例:
- “帮我创建一个MCP server来获取数据库数据”
- “为这个API封装MCP协议接口”
安装方式:
npx skills add anthropic/skills --skill mcp-builder
database-design(数据库设计技能)
使用场景:数据库建模、SQL优化、表结构设计时触发。该技能包含MySQL/PostgreSQL的设计规范和最佳实践。
触发示例:
- “为电商系统设计用户订单表结构”
- “优化这个慢查询SQL”
安装方式:
npx ai-agent-skills install database-design
2.3 测试与QA类技能
playwright-testing(Playwright测试技能)
使用场景:当涉及浏览器自动化测试时自动触发。该技能包含E2E测试编写、定位器策略、调试技巧等专业知识。
触发示例:
- “为登录流程编写Playwright测试”
- “修复这个不稳定的端到端测试”
- “添加购物车结算的测试用例”
- “配置测试的CI并行执行”
涵盖能力:
- E2E测试、组件测试、API测试
- 移动端响应式布局测试
- 文件上传/下载、WebSocket测试
- OAuth弹窗、多标签页处理
- iframe、Canvas/WebGL测试
安装方式:
# 通过skills CLI安装
npx skills add currents-dev/agent-skills --skill playwright-best-practices
# 或通过ai-agent-skills安装
npx ai-agent-skills install playwright
qa-regression(回归测试技能)
使用场景:执行回归测试、分析测试覆盖率、编写测试计划时触发。
触发示例:
- “对用户模块执行完整的回归测试”
- “分析这次变更影响的测试用例范围”
安装方式:
npx ai-agent-skills install qa-regression
gh-fix-ci(CI修复技能)
使用场景:当GitHub Actions CI失败时自动触发,帮助诊断和修复CI问题。
触发示例:
- “修复失败的CI构建”
- “帮我排查为什么测试在CI上超时”
安装方式:
npx ai-agent-skills install gh-fix-ci
2.4 文档处理类技能
pdf-processing(PDF处理技能)
使用场景:PDF文件解析、表单填充、文档合并、文本提取等任务。
触发示例:
- “从这个PDF中提取所有表格数据”
- “填写这份PDF表单并保存”
安装方式:
# 通过skills CLI安装
npx skills add anthropic/skills --skill pdf
# 或通过ai-agent-skills安装
npx ai-agent-skills install pdf
xlsx-analysis(Excel数据分析技能)
使用场景:Excel文件读取、数据分析、报表生成。该技能典型应用是基于MySQL employees数据库的NL2SQL分析。
触发示例:
- “分析这份销售数据Excel,找出季度增长趋势”
- “将CSV数据转换为带图表的分析报告”
安装方式:
npx skills add anthropic/skills --skill xlsx
完整实践案例(MySQL employees数据库分析):
name: mysql-employees-nl2sql-analysis
description: 基于MySQL官方employees数据库,将中文业务问题转换为受控SQL并输出分析报告
该技能包含:
- SKILL.md:SQL生成规则、数据库背景、输出格式要求
- scripts/execute_sql.py:SQL执行脚本(通过环境变量配置数据库连接)
典型交互示例:
-
用户问:“分析公司里谁的话语权最高?”
-
Agent自动拆解为多条SQL:
- 查询管理层薪资分布
- 查询最高薪资员工(实际为Senior Staff)
- 查询部门管理者信息
-
综合分析输出结构化报告,指出非正式权力(高薪高级职员)可能高于正式管理者
2.5 运维部署类技能
use-railway(Railway部署技能)
使用场景:将应用部署到Railway平台时触发。该技能采用“路由优先”设计,核心意图路由在SKILL.md中定义,执行细节分布在各个action-oriented参考文档中。
覆盖工作流:
- 项目和服务创建
- 部署和发布操作
- 环境变量配置
- 日志查看与故障排查
- 存储桶管理
- 域名和网络配置
- 资源使用监控(CPU、内存、网络、磁盘)
触发示例:
- “部署这个Next.js应用到Railway”
- “检查我的服务为什么响应变慢了”
- “配置生产环境变量”
- “添加自定义域名到我的项目”
安装方式:
npx skills add railway/agent-skills --skill use-railway
2.6 工作流管理类技能
pr-review(PR审查技能)
使用场景:当进行代码审查时触发,提供团队统一的审查标准和检查清单。
触发示例:
- “审查这个PR的代码质量”
- “检查是否符合团队的代码规范”
安装方式:
npx ai-agent-skills install pr-review
notion-spec-to-implementation(需求文档转代码技能)
使用场景:将Notion中的需求文档转换为可执行代码,自动创建任务计划和实现方案。
触发示例:
- “根据这个Notion需求文档实现用户认证功能”
- “将产品规格书拆解为开发任务”
安装方式:
npx ai-agent-skills install notion-spec-to-implementation
三、技能安装与管理工具
3.1 skills CLI(官方推荐)
skills是Agent Skills生态的官方命令行工具,支持38+种AI编程助手。
安装:
# 全局安装
npm install -g skills
# 或直接使用npx(无需安装)
npx skills
常用命令:
| 命令 | 说明 | 示例 |
|---|---|---|
skills add <source> | 从Git仓库安装技能 | skills add vercel-labs/agent-skills |
skills list | 列出已安装技能 | skills list -a claude-code |
skills find [query] | 搜索技能 | skills find python |
skills update | 更新所有技能 | skills update |
skills init [name] | 创建新技能模板 | skills init my-skill |
安装示例:
# 从GitHub仓库安装所有技能
npx skills add vercel-labs/agent-skills
# 安装特定技能
npx skills add anthropic/skills --skill pdf --skill xlsx
# 安装到特定Agent(如Claude Code和Cursor)
npx skills add anthropic/skills -a claude-code -a cursor
# 全局安装(跨项目可用)
npx skills add vercel-labs/agent-skills -g
3.2 agent-skills-cli(通用CLI)
另一个流行的技能管理工具,支持10种主流AI Agent。
安装:
npm install -g agent-skills-cli
常用命令:
# 安装技能
skills install xlsx
# 安装到指定平台
skills install @anthropic/pdf -t claude,cursor
# 从Git仓库安装
skills add vercel-labs/agent-skills
# 搜索并安装
skills search python
# 列出已安装技能
skills list
3.3 ai-agent-skills(精选技能库)
这是一个精选的技能库,每个技能都带有信任度标记(trust: verified/reviewed/listed)和来源说明。
使用方式:
# 浏览技能库
npx ai-agent-skills browse
# 按工作领域列出技能
npx ai-agent-skills list --work-area frontend
# 查看技能详情
npx ai-agent-skills info frontend-design
# 安装技能
npx ai-agent-skills install frontend-design
# 安装到项目(团队共享)
npx ai-agent-skills install frontend-design -p
3.4 安装位置说明
技能安装有两种作用域:
| 作用域 | 命令参数 | 安装位置 | 适用场景 |
|---|---|---|---|
| 项目 | 默认或 -p | ./<agent>/skills/ | 提交到Git仓库,团队共享 |
| 全局 | -g | ~/.<agent>/skills/ | 个人所有项目通用 |
不同Agent的安装路径示例:
| Agent | 项目路径 | 全局路径 |
|---|---|---|
| Claude Code | .claude/skills/ | ~/.claude/skills/ |
| Cursor | .cursor/skills/ | ~/.cursor/skills/ |
| Codex | .codex/skills/ | ~/.codex/skills/ |
| GitHub Copilot | .github/skills/ | ~/.copilot/skills/ |
四、常用技能速查表
| 技能名称 | 适用场景 | 安装命令 |
|---|---|---|
| frontend-design | 前端界面实现 | npx ai-agent-skills install frontend-design |
| figma-implement-design | Figma设计稿转代码 | npx skills add anthropic/skills --skill figma-implement-design |
| mcp-builder | MCP服务开发 | npx skills add anthropic/skills --skill mcp-builder |
| playwright-testing | 浏览器自动化测试 | npx skills add currents-dev/agent-skills --skill playwright-best-practices |
| PDF处理 | npx skills add anthropic/skills --skill pdf | |
| xlsx | Excel数据分析 | npx skills add anthropic/skills --skill xlsx |
| use-railway | Railway部署 | npx skills add railway/agent-skills --skill use-railway |
| pr-review | PR代码审查 | npx ai-agent-skills install pr-review |
| gh-fix-ci | CI问题修复 | npx ai-agent-skills install gh-fix-ci |
| database-design | 数据库建模 | npx ai-agent-skills install database-design |
五、创建自定义技能
当现有技能无法满足需求时,可以创建自定义技能:
步骤1:初始化技能目录
mkdir -p ~/.claude/skills/my-skill
cd ~/.claude/skills/my-skill
步骤2:创建SKILL.md文件
---
name: my-skill
description: 技能功能描述和使用时机。当用户提到XX时使用。
---
# 技能名称
## 核心指令
1. 理解用户需求
2. 执行步骤A
3. 执行步骤B
4. 输出结果
## 约束条件
- 约束1
- 约束2
## 示例
输入: "用户输入示例"
输出: "预期输出示例"
步骤3:验证技能
npx ai-agent-skills validate ./my-skill
步骤4:重启Agent,技能即可生效。