Agent Skills:让 AI Agent 轻量扩展的“带目录说明书”

127 阅读4分钟

当下 AI 圈最热的话题之一,莫过于 Agent Skill。 最早的实践来自 Claude 中的一类“模块化能力”,随后 Codex、Cursor、OpenCode 等编程工具也开始跟进并支持。 越来越多团队尝试把 Skills 当作一种 跨平台、通用、可复用 的能力扩展方式。

本文结合近期实践与社区经验,系统梳理 Agent Skills 的定义、机制与落地方式,并给出可执行的入门路径。 也是部门内AI分享的一次技术讲义,同时在博文中作为记录。


1. Agent Skills 是什么?

Agent Skills 是一种 lightweight、开放的能力扩展格式,用“专门的知识与工作流”来增强 AI Agent。

它的本质很简单: 一个包含 SKILL.md 的文件夹

my-skill/
├── SKILL.md          # 必须: 说明 + 元数据
├── scripts/          # 可选: 可执行脚本
├── references/       # 可选: 参考文档
└── assets/           # 可选: 模板与资源

可以把 Skill 理解为: “带目录的说明书” = 元数据 + 指令 + 资源


2. 它怎么工作?关键机制:渐进式上下文加载

Agent Skills 的关键机制是 Progressive Disclosure(渐进式上下文加载)

  1. 发现:启动时仅加载 name + description,告诉 Agent “有哪些技能”。
  2. 激活:任务匹配到某个 skill,才加载完整 SKILL.md
  3. 执行:按技能步骤执行,必要时再加载引用或运行脚本。

这一机制的好处很明显:

  • 降低 token 消耗
  • 减少 prompt 复杂度
  • 保持 agent 轻量,但仍可深度扩展

3. SKILL.md 长什么样?

Skill 的核心是 SKILL.md,结构为 YAML frontmatter + Markdown instructions

---
name: pdf-processing
description: Extract text and tables from PDF files, fill forms, merge documents.
---

# PDF Processing

## When to use this skill
Use this skill when the user needs to work with PDF files...

## How to extract text
1. Use pdfplumber for text extraction...

要点:

  • frontmatter 是必须的:用于技能发现与匹配
  • 正文是执行说明:如何做、做什么、注意事项

4. 实操:先在 Claude Code 验证

如果要快速体验 Skill,建议先用 Claude Code 做验证。

4.1 使用国内厂商 GLM 作为 Claude Code 的后端

可参考智谱官方文档: https://docs.bigmodel.cn/cn/guide/develop/claude#claude-code

步骤如下:

1)在 ~/.claude/ 下添加 settings.json

{
  "env": {
    "ANTHROPIC_AUTH_TOKEN": "your own token",
    "ANTHROPIC_BASE_URL": "https://open.bigmodel.cn/api/anthropic",
    "API_TIMEOUT_MS": "3000000",
    "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": 1
  }
}

2)跳过登录:修改 ~/.claude.json

{
  "hasCompletedOnboarding": true
}

5. 安装 Skills:三种路径

结合上面的概念,目录结构如下:

skill_struct.png

5.1 使用现成的

以 UI UX Pro 为例: https://ui-ux-pro-max-skill.nextlevelbuilder.io/

一个典型体验流程:

npm create vue@latest
claude
# 这是一个 vue3 空项目,帮我实现一个简单的 dashboard 的页面,包含如下内容
# 1. 顶部 title,左侧系统名,右侧用户登录信息
# 2. 左侧菜单功能列表
# 3. 中间图标信息展示模块 + 列表展示
npm run dev

demo.png

再使用 UI/UX skill 进行美化:

npm install -g uipro-cli
uipro init --ai claude
claude
# 使用 ui-ux skill 帮我把页面变成有科技感的 UI

after.png

效果因人而异,但整体流程已经非常清晰: Skill 可以把“好的指令模板 + 设计资源 + 过程经验”标准化


5.2 Skills 大合集

集合站点: https://skills.sh/

以 OpenCode 为例: https://opencode.ai/

安装一个集合中的 skill,如 commit-work

npx skills add https://github.com/softaworks/agent-toolkit --skill commit-work

在 CLI 中直接使用:

使用 commit skill 来帮我把本地变更提交

5.3 自己创建 Skill

一个账单分析的示例:

---
name: 账单分析
description: "自动化的账单分析,并整理成消费列表,用于报销汇总"
---

核心功能:
1. 读取本地图片(png, jpg, pdf)数据
2. OCR 提取图片中的文字
3. 信息抽取与清洗,重复性检测
4. 导出 CSV,表头为:| 序号 | 商户名称 | 消费日期 | 金额(元) | 支付方式 | 备注 |

输入参数:
- 图片文件路径或文件夹路径

输出结果:
- 格式化的 CSV 报销单

调用方式示例:

@202601/ 文件夹中是上个月的账单截图,帮我分析汇总生成报销汇总

process.png


6. MCP 与 Skill:有什么不同?

类比侧重点主体Token 消耗编写难度
Skills带目录的说明书提示词与流程Markdown 文件
MCP标准化的工具箱工具调用软件包

补充说明:

  • Skills 更依赖本地环境(脚本和依赖可能失败)
  • 复用性低于 MCP,但轻量、上手快
  • 两者组合 可以极大提升 Agent 的实用性

7. AI 未来的样子

当 Skill、MCP、Agent 框架开始形成共识后,AI Native 的形态会越来越像过去云原生的发展路径:

  • 标准化 + 组合式能力
  • 工具链被拆分再编排
  • 由“提示词工程”走向“能力工程”

未来的关键不是“模型有多强”,而是: “能力如何被组织、复用、迁移、共享”

Skill 很可能是这个转折点的第一步。


结语

Agent Skills 不只是“提示词模板的进化版”,而是 一种轻量、低成本、可迁移的 Agent 能力封装方式

如果你正在:

  • 搭建自己的 AI 开发工作流
  • 希望把团队经验标准化
  • 期待跨平台复用能力

那么从写一个 SKILL.md 开始,是最简单且有效的尝试。

原文地址