Agent Skills 从原理到实战一文彻底搞懂!

75 阅读14分钟

谁的工具能被 AI 调用,谁就能获得话语权。

去年年中的时候红衫资本说下一轮 AI 就是卖结果,从今天 AI 的情况来看,确实如此。

今天的小龙虾直接给指令能给出任务的结果,而不是只是参考意见。

因此不难推断出未来出的 AI 产品也一定是往生成结果上面靠。

所以往后的各大厂商卷的就是谁家的产品能完成用户的结果,能更好的完成用户的结果,谁就能拿下用户。

那么这里就出现下一个普通人的机会。

谁能让自己的工具被 AI 检索、应用到,谁就能拿到流量入口,谁就能在其中通过出售工具,或者调用你的工具获得收益。

加上编程的门槛不断降低,很多人都能手搓小工具,网站了。

所以接下来只需要往被 AI 调用这个方向,以及能完成用户所需要实现的某个工具上去靠。

大概率是能获得一定结果的。

比如视频转文字这个工具,如果用户的任务用到了这个工具,当它使用 AI 来完成相关任务时,AI 在执行的过程中就有可能检索到这个工具。

再比如别人使用小龙虾去执行某个任务的时候,小龙虾会去全网寻找一些工具来完成任务,刚好这个工具是收费的还是你的工具,那你就有可能有机会获得收益。

刚好前几天我在刷某书的时候也看到了相关的案例。

我发现一个博主在 clawhub 上,发布了两个skill,这个clawhub就像我们手机里面的软件管家、app store。

然后这两个 skills 就被小龙虾进行调用了,这两个 skills 是收费的。

然后博主就获得了收益!

本文目录

Image

学习 Skills 前,我们需要先安装一下 claude ,大家先安装吧,后面我出 AI 编程相关的文章也是需要用到的。

安装 Claude Code

安装前的前置工作:

在开始之前需要处理一下魔法的问题,懂的都懂吧,不必多说!

1、开始安装

打开 Trae / CodeBuddy (关于怎么下载 Trae / CodeBuddy 百度就行)在输入框中输入:

请自动完成 Claude Code CLI 的环境检测与安装流程,整体逻辑如下:

## 环境与安装状态校验  
- 识别当前操作系统类型(Mac / Linux / Windows)。  
- 执行 `claude --version` 判断 Claude Code 是否已存在。  
  - 若已安装:输出当前版本号,并提示“Claude Code 已就绪,直接运行 claude 即可使用”,随后终止流程。  
  - 若未安装:进入下一阶段。

## Node.js 依赖检查  
- 通过 `node -v` 判断 Node.js 是否已安装。  
- 若未安装,根据操作系统给出对应安装指引:  
  - Mac:`brew install node`,或前往 nodejs.org 下载。  
  - Linux:`sudo apt install nodejs npm`,或前往 nodejs.org 下载。  
  - Windows:推荐使用 `winget install -e --id OpenJS.NodeJS`,或前往 nodejs.org 下载。

## Claude Code 安装  
- 执行统一安装命令:  
`npm install -g @anthropic-ai/claude-code`
- 针对不同系统的处理说明:  
  - Windows:在 PowerShell 或 CMD 中直接执行,无需 WSL。  
  - Mac / Linux:若出现 EACCES 权限问题,提醒使用 `sudo` 重新执行。

## 安装结果确认  
- 再次运行 `claude --version` 进行校验。  
- 若验证通过,提示用户可直接输入 `claude` 启动工具,并继续完成 OAuth 登录流程。

Image

我用的是腾讯的 CodeBuddy(这个软件怎么安装,我这里不做解释了) 指令是参考熊猫大佬的,这是最适合小白安装 Claude Code 的方式。

因为这个方式可以让 AI 自动安装 Node.js 和 Claude Code,同时帮我们解决一些安装时候出现的 Bug 。

2、安装结果检查

这里我们直接在对话框中进行询问它是否完成安装。

Image

安装 Git

安装 Claude Code时要求安装 Git,核心原因是 Git 是代码分发、版本管理和依赖拉取的核心工具,几乎所有开源 / 第三方代码工具的安装流程都会依赖 Git 完成关键步骤

如果不安装你在 win+R 输入 Claude 运行的时候,就可能出现下面这个 Bug。

(忘记截图了,贴个代码吧)

Claude Code on Windows requires git-bash (https://git-scm.com/downloads/win). If installed but not
in PATH, set environment variable pointing to your bash.exe, similar to:
CLAUDE_CODE_GIT_BASH_PATH=C:\Program Files\Git\bin\bash.exe
git 安装网址:https://git-scm.com/install/windows 

Image

安装的话,直接一直点下一步就行了,没什么要注意的,所以我就不截图了!

这里我贴一个 bug ,是由于环境变量未进行配置导致的。

Image

出现这个 bug 的解决方案是:进入此电脑->鼠标右键点击属性->点击高级系统设置->高级->环境变量。

在用户变量的 Path 中添加 C:\Users\你的用户名.local\bin 然后点击确定。

Image

安装 CC Switch

CC Switch 是一个用于管理和切换 Claude Code 和其它模型相关配置或环境的工具,可以帮助用户在不同的 Claude Code 环境或版本之间快速切换。

对普通玩家翻译一下的意思就是:官方的模型很贵,想用国产或者中转站的。

但是灵活切换模型使用,改配置文件太麻烦了。

所以可以安装一个模型供应商管理工具:CC Switch。

CC Switch 网址:https://github.com/farion1231/cc-switch/releases

Windows 的我是下载的这个。

Image

下载完之后,我们为 Claude Code 配置一下模型,国内推荐 GLM 5 ,Kimi-k2,国外的话 Claude 4.6 ,gpt 5.4。

这里我用 DeepSeek 做一个演示,先点 Claude 然后再点添加

Image

我们进入 DeepSeek API 网址:platform.deepseek.com/api_keys ,获… API key

Image

选择 DeepSeek 把 key 填写上去,添加就行了。

Image

启动 Claude Code

键盘直接按 win+R 输入 cmd ,在输入 claude 。

Image

选择 yes 信任,就可以进入 claude code 愉快的玩耍了。

Image

如果你需要退出,可以输入 /exit 或者连按两次 Ctrl + C 。

Image

如果你想卸载 Clauce Code 那你就输入:

npm uninstall -g @anthropic-ai/claude-code

什么是 Skills、Prompt 、MCP?

由于是小白教程,我这里先大概的解释一下skill, prompt,MCP 。

什么是 prompt ?

Prompt 就是:你给 AI 的「指令、问题、要求、描述」

你可以把它理解成: 你给 AI 下的命令、说的话、提的需求

只要是你发给 AI 的文字,都叫 prompt。

比如:帮我写一段新年祝福语,这句话就是 prompt。

什么是 skills ?

Skills 是给 Agent 使用的、可复用的能力封装机制。

它和提示词还不一样,提示词你需要每次都给他设置人设,步骤,能力.....等等

而 skills 你只需要设置一次,它就能长期持久的知道该怎么做,是什么人设。

比如 AI 是一个超级大脑,我需要它写我的公众号文章,是需要关于我的文案风格,排版的。

但它肯定是不会的,这时候我把我的文案风格、排版封装成一个技能(Skills)给它学习,那它学完之后就具备写我公众号的这个技能了。

什么是 MCP ?

MCP 是 Anthropic 官方在 2024 年 11 月推出的一种连接协议。

我们可以理解成:给 AI 接上“外部世界”的一套标准接口(工具)。

比如:AI 是一个超强大脑(人),你要让他去维修桌子,但是他没有工具,这个时候就可以通过 MCP 这种方式让它在外界拿工具,然后对桌子进行维修。

有了 MCP,它可以直接连数据库、代码仓库、设计稿、部署平台,拿到真实的数据和状态。

它不再是一个只会给你参考意见的问答助手,而是把工具递给它,让它在你的真实环境里一起干活。

Skills 和 Prompt 、MCP 有什么关联?

持久性:

Prompt:一次性提问,关掉重启之后就要重新发一次。

Skills:永久生效

MCP:永久生效

三者关系:

Skills vs Prompt :

包含关系 一- Skills 内部包含精心设计的 Prompt 。

Skills vs MCP :

MCP 解决的是连接问题,它决定 Agent 能访问哪些外部系统、数据源和工具。

Skills 是定义在拿到这些工具之后,应该如何规范、稳定地使用它们。

一句话解释:

Prompt:你让 AI 做什么

Skills:AI 会做什么

MCP:给 AI 加功能的插件

Skills 解决的三大痛点

每次对话重复解释背景 一 Skills 持久化上下文,无需重复。

AI 输出质量不稳定 一 Skills 标准化输出,质量可控。

团队使用方式各异 一 Skills 可共享复用,统一规范。

Skills 的两种用法

第一种:网络调用(非本文重点可跳过)

这一种方式是通过 MCP 技能这个 MCP 工具,Claude 通过 MCP 协议,调用运行在你电脑或远程服务器上的外部 Skills 服务 / 工具。

这些服务提供了各种技能,比如 Excel 处理、PDF 解析、浏览器操作等等。

安装方式:键盘 win + R 输入 cmd 进入命令提示符界面输入:

Skills 的安装指令:npx skills add anthropics/skills

这里是给 MCP 工具安装一些具体的技能包。

Image

这里说的是把这些技能包给哪个 AI 工具,我这里选择 Claude Code。

Image

选择 Project,然后一直回车。

图片

下载完成的提示。

Image

安装完成后,只需要在 Claude 里面发指令就可以使用了。

比如:帮我用你安装的 xlsx 技能,生成一个包含佳能、富士相机型号和价格的 Excel 表格。

如果 Claude 能生成表格,就代表 MCP 技能生效了。

第二种:本地执行(小白重点)

执行前,我们需要下载一下 skills 。

下载 skills 有两种方法,手动和 AI 自动,我是建议手动下载的,我用的手动下载,下载后解压就行了。

进入网址:https://github.com/anthropics/skills

Image

注意小白我不建议自动下载,因为可能会出现意外,然后 CC 乱下载,把你的钱烧没了。

如果头铁想 AI 下载直接在 Claude Code 输入指令。

请帮我安装Skill,对应的项目地址为:https://github.com/anthropics/skills/tree/main/skills/skill-creator

安装完成后,我们在你的文件夹中创建一个 Agent skills 结构,我是在【学习 skills】 这个文件夹下创建 .claude/skills/ 下创建的 ouran-ceshi skils。

Image

ouran-ceshi/
├── SKILL.md 
├── scripts/
├── references/
└── assets/

创建处理完后,进入 claude 中输入 /你的技能 再按回车键就可以运行了。

Image

MCP 技能 vs 本地技能

维度MCP 技能(MCP工具)本地技能目录(.claude/skills/)
本质独立运行的「外部服务」(比如 Excel/PDF 处理工具)存放在 Claude 本地的「脚本文件」(js/py 等)
存放位置电脑全局 npm 目录(比如 C:\Users\admin\AppData\Roaming\npm)Claude 专属目录(.claude/skills/)
查看方式npx skills list 或 Claude 里输 /mcp,使用 /skills 看不到直接打开 .claude/skills/ 文件夹 或 Claude 输 /skills
运行方式作为独立服务器运行,Claude 通过网络调用Claude 直接读取并执行本地脚本
功能范围支持复杂功能(Excel/PDF/ 浏览器操作)仅支持简单脚本(比如格式化文本、小工具)
配置方式改 .claude.json 里的 mcpServers把脚本文件丢进 .claude/skills/ 即可

Skills 结构与运行详解

Skills 的基本结构:

my-skill/
├── SKILL.md          # 必须: 元数据 + 指导文档
├── scripts/          # 可选: 执行脚本
├── references/       # 可选: 参考文档
└── assets/           # 可选: 资源

一个完整的 Skill,本质是标准化、模块化、可触发、支持按需加载的 AI 能力封装单元。

Skills 整体分为包目录结构、核心文件内部结构、附属资源结构三大模块,它遵循分层隔离、按需加载、边界清晰的设计原则。

Skills 的运行方式:

传统模式会把所有技能指令、工具定义、领域知识一次性全量写进系统提示词里面。

这就会导致上下文被无效信息挤占,很易出现推理偏题、幻觉、上下文截断、Token 飙升、准确率下降等问题。

渐进式披露是以 Claude Agent Skills 为代表的 AI 智能体体系的核心设计理念和工程创新机制。

它通过分层封装、按需加载、用完就释放的机制,让模型在任何时刻,上下文中只保留当前任务必需的信息,最大化保留核心推理空间。

这里我用一个官方的例子,进行讲解。

skills 官方网址:https://github.com/anthropics/skills/tree/main/skills/webapp-testing

Image

我们下载之后,用 CodeBuddy 打开 SKILL.md 文档。

第一层,元数据

核心作用:相当于技能的目录索引,让模型快速识别自身可用能力、匹配用户任务意图,几乎不占用核心推理空间。

核心内容:技能名称、一句话描述功能、触发条件

加载时机:Agent 启动时全量扫描、常驻加载

token消化:单技能约 30-100 tokens(对比prompt,无需全量加载,可减少 90% 以上的无效 Token 占用)

Image

这里需要注意的是我们可以添加更多的元数据字段,但 name 和 description 这两个字段是必备的!

在 webapp-testing 中,这一层只告诉 Agent 一件事:这是一个用于使用 Playwright 测试本地 Web 应用的能力。

到这里为止,Agent 只是知道:这个 Skill 会做 Web 应用测试,但还不知道具体应该怎么做。

这一层内容相对较少,只用于能力发现,不涉及任何执行细节,所以占用上下文的空间也少。

第二层:核心指令层

核心作用:相当于技能的【操作手册正文】,为模型提供完成任务的完整执行逻辑。

核心内容:SKILL.md 主体内容,含完整 SOP 流程、步骤规范、工具调用规则、输出要求、边界条件。

加载时机:只有当用户提出需求,匹配到该技能、或手动调用该技能时,Agent 才会去读取核心指令层,才会把它加载到上下文。。

比如说:帮我测试一个本地 Web 页面,当需求和 webapp-testing 的元数据匹配了,Agent 才会去读取。

Token 消耗:单技能通常 2000-5000 tokens,只加载匹配的技能,还不涉及执行。

Image

在 webapp-testing 中这一层描述的技能作用是 Web 应用程序测试。

而且是通过一棵清晰的决策树来判断。

Agent 会先判断任务面对的是静态 HTML 页面,还是动态 Web 应用。

如果是动态应用,再进一步判断服务器是否已经运行。

通过这一步,Agent 同时完成了两件事:

1,确认 Skill 是否适用。

2,确定后续应该走哪条执行路径。

第三层:资源附属层

Image

核心作用:相当于技能的附录 / 工具包,为复杂任务提供专项支持,不占用常驻上下文。

核心内容:技能配套的脚本、参考文档、模板、示例、数据集、API 规范等附属文件。

加载时机:只有在执行流程中明确需要用到对应资源时,才精准读取注入。

Token 消耗:无固定上限,只有在使用时产生消耗

当任务真正进入执行阶段,如果需要更具体、更稳定的能力,Agent 才会按需调用脚本、示例或参考资料。

在 webapp-testing 中,通过 examples 里的示例,Agent 可以参考问题通常是怎么处理的。

一些更复杂、更容易出错的操作,可以直接调用可执行脚本。

比如 scripts/with_server.py,把启动服务、等待就绪、清理环境这些步骤,用更确定的方式跑完。

Image

正是因为这种按需加载的机制,一个 Skill 才能同时打包大量说明和工具,还不会带来持续的上下文负担。

总结

本文我们学习了,从 0-1 安装 claude code ,skills,mcp,prompt。

同时还讲述了关于 skills 的用法,解决的痛点,结构与运行。

本文之后,我会持续更新 Agent Skills 和 AI 编程快速开发相关的知识,如果你感兴趣可以持续跟我一起学习。