Agent Skills 从原理到实战一文彻底搞懂!

0 阅读14分钟

谁的工具能被 AI 调用,谁就能获得话语权。

去年年中的时候红衫资本说下一轮 AI 就是卖结果,从今天 AI 的情况来看,确实如此。

今天的小龙虾直接给指令能给出任务的结果,而不是只是参考意见。

因此不难推断出未来出的 AI 产品也一定是往生成结果上面靠。

所以往后的各大厂商卷的就是谁家的产品能完成用户的结果,能更好的完成用户的结果,谁就能拿下用户。

那么这里就出现下一个普通人的机会。

谁能让自己的工具被 AI 检索、应用到,谁就能拿到流量入口,谁就能在其中通过出售工具,或者调用你的工具获得收益。

加上编程的门槛不断降低,很多人都能手搓小工具,网站了。

所以接下来只需要往被 AI 调用这个方向,以及能完成用户所需要实现的某个工具上去靠。

大概率是能获得一定结果的。

比如视频转文字这个工具,如果用户的任务用到了这个工具,当它使用 AI 来完成相关任务时,AI 在执行的过程中就有可能检索到这个工具。

再比如别人使用小龙虾去执行某个任务的时候,小龙虾会去全网寻找一些工具来完成任务,刚好这个工具是收费的还是你的工具,那你就有可能有机会获得收益。

刚好前几天我在刷某书的时候也看到了相关的案例。

我发现一个博主在 clawhub 上,发布了两个skill,这个clawhub就像我们手机里面的软件管家、app store。

然后这两个 skills 就被小龙虾进行调用了,这两个 skills 是收费的。

然后博主就获得了收益!

本文目录

Image

学习 Skills 前,我们需要先安装一下 claude ,大家先安装吧,后面我出 AI 编程相关的文章也是需要用到的。

安装 Claude Code

安装前的前置工作:

在开始之前需要处理一下魔法的问题,懂的都懂吧,不必多说!

1、开始安装

打开 Trae / CodeBuddy (关于怎么下载 Trae / CodeBuddy 百度就行)在输入框中输入:

请自动完成 Claude Code CLI 的环境检测与安装流程,整体逻辑如下:

## 环境与安装状态校验  
- 识别当前操作系统类型(Mac / Linux / Windows)。  
- 执行 `claude --version` 判断 Claude Code 是否已存在。  
  - 若已安装:输出当前版本号,并提示“Claude Code 已就绪,直接运行 claude 即可使用”,随后终止流程。  
  - 若未安装:进入下一阶段。

## Node.js 依赖检查  
- 通过 `node -v` 判断 Node.js 是否已安装。  
- 若未安装,根据操作系统给出对应安装指引:  
  - Mac:`brew install node`,或前往 nodejs.org 下载。  
  - Linux:`sudo apt install nodejs npm`,或前往 nodejs.org 下载。  
  - Windows:推荐使用 `winget install -e --id OpenJS.NodeJS`,或前往 nodejs.org 下载。

## Claude Code 安装  
- 执行统一安装命令:  
`npm install -g @anthropic-ai/claude-code`
- 针对不同系统的处理说明:  
  - Windows:在 PowerShell 或 CMD 中直接执行,无需 WSL。  
  - Mac / Linux:若出现 EACCES 权限问题,提醒使用 `sudo` 重新执行。

## 安装结果确认  
- 再次运行 `claude --version` 进行校验。  
- 若验证通过,提示用户可直接输入 `claude` 启动工具,并继续完成 OAuth 登录流程。

Image

我用的是腾讯的 CodeBuddy(这个软件怎么安装,我这里不做解释了) 指令是参考熊猫大佬的,这是最适合小白安装 Claude Code 的方式。

因为这个方式可以让 AI 自动安装 Node.js 和 Claude Code,同时帮我们解决一些安装时候出现的 Bug 。

2、安装结果检查

这里我们直接在对话框中进行询问它是否完成安装。

Image

安装 Git

安装 Claude Code时要求安装 Git,核心原因是 Git 是代码分发、版本管理和依赖拉取的核心工具,几乎所有开源 / 第三方代码工具的安装流程都会依赖 Git 完成关键步骤

如果不安装你在 win+R 输入 Claude 运行的时候,就可能出现下面这个 Bug。

(忘记截图了,贴个代码吧)

Claude Code on Windows requires git-bash (https://git-scm.com/downloads/win). If installed but not
in PATH, set environment variable pointing to your bash.exe, similar to:
CLAUDE_CODE_GIT_BASH_PATH=C:\Program Files\Git\bin\bash.exe
git 安装网址:https://git-scm.com/install/windows 

Image

安装的话,直接一直点下一步就行了,没什么要注意的,所以我就不截图了!

这里我贴一个 bug ,是由于环境变量未进行配置导致的。

Image

出现这个 bug 的解决方案是:进入此电脑->鼠标右键点击属性->点击高级系统设置->高级->环境变量。

在用户变量的 Path 中添加 C:\Users\你的用户名.local\bin 然后点击确定。

Image

安装 CC Switch

CC Switch 是一个用于管理和切换 Claude Code 和其它模型相关配置或环境的工具,可以帮助用户在不同的 Claude Code 环境或版本之间快速切换。

对普通玩家翻译一下的意思就是:官方的模型很贵,想用国产或者中转站的。

但是灵活切换模型使用,改配置文件太麻烦了。

所以可以安装一个模型供应商管理工具:CC Switch。

CC Switch 网址:https://github.com/farion1231/cc-switch/releases

Windows 的我是下载的这个。

Image

下载完之后,我们为 Claude Code 配置一下模型,国内推荐 GLM 5 ,Kimi-k2,国外的话 Claude 4.6 ,gpt 5.4。

这里我用 DeepSeek 做一个演示,先点 Claude 然后再点添加

Image

我们进入 DeepSeek API 网址:platform.deepseek.com/api_keys ,获… API key

Image

选择 DeepSeek 把 key 填写上去,添加就行了。

Image

启动 Claude Code

键盘直接按 win+R 输入 cmd ,在输入 claude 。

Image

选择 yes 信任,就可以进入 claude code 愉快的玩耍了。

Image

如果你需要退出,可以输入 /exit 或者连按两次 Ctrl + C 。

Image

如果你想卸载 Clauce Code 那你就输入:

npm uninstall -g @anthropic-ai/claude-code

什么是 Skills、Prompt 、MCP?

由于是小白教程,我这里先大概的解释一下skill, prompt,MCP 。

什么是 prompt ?

Prompt 就是:你给 AI 的「指令、问题、要求、描述」

你可以把它理解成: 你给 AI 下的命令、说的话、提的需求

只要是你发给 AI 的文字,都叫 prompt。

比如:帮我写一段新年祝福语,这句话就是 prompt。

什么是 skills ?

Skills 是给 Agent 使用的、可复用的能力封装机制。

它和提示词还不一样,提示词你需要每次都给他设置人设,步骤,能力.....等等

而 skills 你只需要设置一次,它就能长期持久的知道该怎么做,是什么人设。

比如 AI 是一个超级大脑,我需要它写我的公众号文章,是需要关于我的文案风格,排版的。

但它肯定是不会的,这时候我把我的文案风格、排版封装成一个技能(Skills)给它学习,那它学完之后就具备写我公众号的这个技能了。

什么是 MCP ?

MCP 是 Anthropic 官方在 2024 年 11 月推出的一种连接协议。

我们可以理解成:给 AI 接上“外部世界”的一套标准接口(工具)。

比如:AI 是一个超强大脑(人),你要让他去维修桌子,但是他没有工具,这个时候就可以通过 MCP 这种方式让它在外界拿工具,然后对桌子进行维修。

有了 MCP,它可以直接连数据库、代码仓库、设计稿、部署平台,拿到真实的数据和状态。

它不再是一个只会给你参考意见的问答助手,而是把工具递给它,让它在你的真实环境里一起干活。

Skills 和 Prompt 、MCP 有什么关联?

持久性:

Prompt:一次性提问,关掉重启之后就要重新发一次。

Skills:永久生效

MCP:永久生效

三者关系:

Skills vs Prompt :

包含关系 一- Skills 内部包含精心设计的 Prompt 。

Skills vs MCP :

MCP 解决的是连接问题,它决定 Agent 能访问哪些外部系统、数据源和工具。

Skills 是定义在拿到这些工具之后,应该如何规范、稳定地使用它们。

一句话解释:

Prompt:你让 AI 做什么

Skills:AI 会做什么

MCP:给 AI 加功能的插件

Skills 解决的三大痛点

每次对话重复解释背景 一 Skills 持久化上下文,无需重复。

AI 输出质量不稳定 一 Skills 标准化输出,质量可控。

团队使用方式各异 一 Skills 可共享复用,统一规范。

Skills 的两种用法

第一种:网络调用(非本文重点可跳过)

这一种方式是通过 MCP 技能这个 MCP 工具,Claude 通过 MCP 协议,调用运行在你电脑或远程服务器上的外部 Skills 服务 / 工具。

这些服务提供了各种技能,比如 Excel 处理、PDF 解析、浏览器操作等等。

安装方式:键盘 win + R 输入 cmd 进入命令提示符界面输入:

Skills 的安装指令:npx skills add anthropics/skills

这里是给 MCP 工具安装一些具体的技能包。

Image

这里说的是把这些技能包给哪个 AI 工具,我这里选择 Claude Code。

Image

选择 Project,然后一直回车。

图片

下载完成的提示。

Image

安装完成后,只需要在 Claude 里面发指令就可以使用了。

比如:帮我用你安装的 xlsx 技能,生成一个包含佳能、富士相机型号和价格的 Excel 表格。

如果 Claude 能生成表格,就代表 MCP 技能生效了。

第二种:本地执行(小白重点)

执行前,我们需要下载一下 skills 。

下载 skills 有两种方法,手动和 AI 自动,我是建议手动下载的,我用的手动下载,下载后解压就行了。

进入网址:https://github.com/anthropics/skills

Image

注意小白我不建议自动下载,因为可能会出现意外,然后 CC 乱下载,把你的钱烧没了。

如果头铁想 AI 下载直接在 Claude Code 输入指令。

请帮我安装Skill,对应的项目地址为:https://github.com/anthropics/skills/tree/main/skills/skill-creator

安装完成后,我们在你的文件夹中创建一个 Agent skills 结构,我是在【学习 skills】 这个文件夹下创建 .claude/skills/ 下创建的 ouran-ceshi skils。

Image

ouran-ceshi/
├── SKILL.md 
├── scripts/
├── references/
└── assets/

创建处理完后,进入 claude 中输入 /你的技能 再按回车键就可以运行了。

Image

MCP 技能 vs 本地技能

维度MCP 技能(MCP工具)本地技能目录(.claude/skills/)
本质独立运行的「外部服务」(比如 Excel/PDF 处理工具)存放在 Claude 本地的「脚本文件」(js/py 等)
存放位置电脑全局 npm 目录(比如 C:\Users\admin\AppData\Roaming\npm)Claude 专属目录(.claude/skills/)
查看方式npx skills list 或 Claude 里输 /mcp,使用 /skills 看不到直接打开 .claude/skills/ 文件夹 或 Claude 输 /skills
运行方式作为独立服务器运行,Claude 通过网络调用Claude 直接读取并执行本地脚本
功能范围支持复杂功能(Excel/PDF/ 浏览器操作)仅支持简单脚本(比如格式化文本、小工具)
配置方式改 .claude.json 里的 mcpServers把脚本文件丢进 .claude/skills/ 即可

Skills 结构与运行详解

Skills 的基本结构:

my-skill/
├── SKILL.md          # 必须: 元数据 + 指导文档
├── scripts/          # 可选: 执行脚本
├── references/       # 可选: 参考文档
└── assets/           # 可选: 资源

一个完整的 Skill,本质是标准化、模块化、可触发、支持按需加载的 AI 能力封装单元。

Skills 整体分为包目录结构、核心文件内部结构、附属资源结构三大模块,它遵循分层隔离、按需加载、边界清晰的设计原则。

Skills 的运行方式:

传统模式会把所有技能指令、工具定义、领域知识一次性全量写进系统提示词里面。

这就会导致上下文被无效信息挤占,很易出现推理偏题、幻觉、上下文截断、Token 飙升、准确率下降等问题。

渐进式披露是以 Claude Agent Skills 为代表的 AI 智能体体系的核心设计理念和工程创新机制。

它通过分层封装、按需加载、用完就释放的机制,让模型在任何时刻,上下文中只保留当前任务必需的信息,最大化保留核心推理空间。

这里我用一个官方的例子,进行讲解。

skills 官方网址:https://github.com/anthropics/skills/tree/main/skills/webapp-testing

Image

我们下载之后,用 CodeBuddy 打开 SKILL.md 文档。

第一层,元数据

核心作用:相当于技能的目录索引,让模型快速识别自身可用能力、匹配用户任务意图,几乎不占用核心推理空间。

核心内容:技能名称、一句话描述功能、触发条件

加载时机:Agent 启动时全量扫描、常驻加载

token消化:单技能约 30-100 tokens(对比prompt,无需全量加载,可减少 90% 以上的无效 Token 占用)

Image

这里需要注意的是我们可以添加更多的元数据字段,但 name 和 description 这两个字段是必备的!

在 webapp-testing 中,这一层只告诉 Agent 一件事:这是一个用于使用 Playwright 测试本地 Web 应用的能力。

到这里为止,Agent 只是知道:这个 Skill 会做 Web 应用测试,但还不知道具体应该怎么做。

这一层内容相对较少,只用于能力发现,不涉及任何执行细节,所以占用上下文的空间也少。

第二层:核心指令层

核心作用:相当于技能的【操作手册正文】,为模型提供完成任务的完整执行逻辑。

核心内容:SKILL.md 主体内容,含完整 SOP 流程、步骤规范、工具调用规则、输出要求、边界条件。

加载时机:只有当用户提出需求,匹配到该技能、或手动调用该技能时,Agent 才会去读取核心指令层,才会把它加载到上下文。。

比如说:帮我测试一个本地 Web 页面,当需求和 webapp-testing 的元数据匹配了,Agent 才会去读取。

Token 消耗:单技能通常 2000-5000 tokens,只加载匹配的技能,还不涉及执行。

Image

在 webapp-testing 中这一层描述的技能作用是 Web 应用程序测试。

而且是通过一棵清晰的决策树来判断。

Agent 会先判断任务面对的是静态 HTML 页面,还是动态 Web 应用。

如果是动态应用,再进一步判断服务器是否已经运行。

通过这一步,Agent 同时完成了两件事:

1,确认 Skill 是否适用。

2,确定后续应该走哪条执行路径。

第三层:资源附属层

Image

核心作用:相当于技能的附录 / 工具包,为复杂任务提供专项支持,不占用常驻上下文。

核心内容:技能配套的脚本、参考文档、模板、示例、数据集、API 规范等附属文件。

加载时机:只有在执行流程中明确需要用到对应资源时,才精准读取注入。

Token 消耗:无固定上限,只有在使用时产生消耗

当任务真正进入执行阶段,如果需要更具体、更稳定的能力,Agent 才会按需调用脚本、示例或参考资料。

在 webapp-testing 中,通过 examples 里的示例,Agent 可以参考问题通常是怎么处理的。

一些更复杂、更容易出错的操作,可以直接调用可执行脚本。

比如 scripts/with_server.py,把启动服务、等待就绪、清理环境这些步骤,用更确定的方式跑完。

Image

正是因为这种按需加载的机制,一个 Skill 才能同时打包大量说明和工具,还不会带来持续的上下文负担。

总结

本文我们学习了,从 0-1 安装 claude code ,skills,mcp,prompt。

同时还讲述了关于 skills 的用法,解决的痛点,结构与运行。

本文之后,我会持续更新 Agent Skills 和 AI 编程快速开发相关的知识,如果你感兴趣可以持续跟我一起学习。