Anthropic 内部用了数百个 Skills,这份清单他们第一次公开

0 阅读12分钟

Image

Anthropic 内部,有数百个 Skills 每天在运行。

这个数字,第一次出现在公开渠道里,是 Anthropic 的 Thariq Shihipar(DevRel)在最近一篇长文里披露的。他的身份不是普通的布道者,而是深度参与 Claude Code 推广和实践的 Anthropic 内部人员——他讲的不是“你应该怎么用”,而是“我们自己就是这么用的”。

这个数字震撼我的,不是它的量级,而是它背后的含义:Skills 在 Anthropic 内部,已经不是 Claude Code 的一个功能,而是工程团队的核心基础设施。 他们用自己的工具,验证了一套外部开发者还没看懂的范式,并且跑出了数百个活跃案例。

而绝大多数正在用 Claude Code 的开发者,还把 Skills 当成“存 Prompt 的地方”——写几行 Markdown,告诉 Claude 你是谁、做什么风格的代码。把瑞士军刀当开瓶器在用,没出错,但你只用了一个功能。

这就是认知差距的起点,也是这篇文章想打破的东西。

Thariq 的这篇文章,是 Anthropic 内部 Skills 实践的第一次系统性公开。他们到底是怎么用的?这套范式,会怎样重新定义工程团队的竞争力?

一、先破除最大的误解

Thariq 在文章开头就点名了:“Skills 是一个常见的误解,大家以为它们只是 Markdown 文件。”

这个误解的代价是巨大的。

Skills 本质上是一个文件夹,不是一个文件。 这个文件夹里可以有脚本、静态资源、数据文件、配置文件、代码库……代理可以发现、读取、调用、操作这里面的一切。更关键的是,Skills 还可以注册动态 Hook——在特定的工具调用时机触发特定行为。

这意味着什么?

意味着 Skills 不只是“给 Claude 的知识”,而是给 Claude 的工具、给 Claude 的记忆、给 Claude 的行为约束体系。把它理解成 Markdown,就像把瑞士军刀当成开瓶器在用——没出错,但你只用了一个功能。

二、Anthropic 内部把 Skills 分成了 9 类

Image

在整理了内部数百个 Skills 之后,Thariq 发现它们自然聚类成 9 种类型。这份分类清单非常值得每个开发团队对照着检查一遍——因为你很可能少做了几类。

  1. 库与工具使用(Library / CLI / SDK Skills)

帮助 Claude 正确使用特定库、CLI 或 SDK。不是官方文档的复制,而是你们内部使用该工具时踩过的坑、正确的调用模式、危险操作的警示。

示例:billing-lib(内部计费库的边界情况与陷阱)、frontend-design(你们的设计系统风格指南,让 Claude 写出符合 UI 规范的代码)

  1. 验证技能(Verification Skills)

告诉 Claude 如何验证代码是否正确运行。通常配合 Playwright、tmux 等外部工具。

Thariq 说了一句很重的话:“花一周时间专门打磨你的验证 Skills,是值得的。” 考虑在 Skill 里内置录像功能,让 Claude 自己录下操作过程;或者在每一步强制做程序化的断言。验证 Skills 的质量,直接决定了 Claude 输出的可信度上限。

示例:signup-flow-driver(完整走完注册→邮件验证→引导流程,带状态断言)、checkout-verifier(Stripe 测试卡驱动结账 UI 验证)

  1. 数据访问(Data Access Skills)

连接你的数据仓库和监控系统。包括获取数据的脚本、凭据配置、常用查询模式、看哪个 Dashboard 看什么问题。

示例:funnel-query(哪些事件表 JOIN 在一起能看到从注册到激活到付费的完整漏斗)、grafana(数据源 UID、集群名、问题→仪表盘的对照表)

  1. 工作流自动化(Workflow Automation Skills)

把重复性工作流封装成一条命令。可以保存历史运行记录,让 Claude 在下次执行时参考上次的结果,保持一致性。

示例:standup-post(聚合 Jira、GitHub、Slack → 生成站会更新,只展示 delta 变化)、weekly-recap(合并 PR + 关闭 Ticket + 部署记录 → 格式化周报)

  1. 脚手架生成(Scaffolding Skills)

生成框架样板代码,专门用于你们代码库的特定模块类型。在纯代码无法覆盖的地方,用自然语言描述约束条件。

示例:new-migration(你们的迁移文件模板 + 常见陷阱)、create-app(预置鉴权、日志、部署配置的新应用脚手架)

  1. 代码质量(Code Quality Skills)

执行你们团队的代码规范,也可以做代码审查。可以包含确定性脚本,增加鲁棒性。配合 Hook 在代码提交时自动触发。

示例:adversarial-review(启动一个独立子 Agent 扮演挑剔的审查者,反复迭代直到问题降级为小改动)、code-style(强制执行 Claude 默认风格下不擅长的那些规范)

  1. DevOps 操作(DevOps Skills)

拉取、推送、部署代码,可以引用其他 Skills 来收集数据。

示例:deploy-(构建→冒烟测试→渐进式流量切换→与错误率对比→超阈值自动回滚)、babysit-pr(监控 PR → 重试 Flaky CI → 解决合并冲突 → 开启自动合并)

  1. 调试与运维(Debug &; Ops Skills)

给定一个症状(Slack 线程、告警、报错特征),自动走完多工具调查流程,产出结构化的排查报告。

示例:oncall-runner(拉取告警 → 检查常见嫌疑 → 格式化发现结论)、log-correlator(给定 Request ID,从所有可能处理过它的系统拉对应日志)

  1. 维护与运维(Maintenance &; Ops Skills)

执行例行维护和运维操作——其中有些是破坏性操作,需要内置安全护栏。这类 Skills 的价值在于:把高风险操作规范化,让工程师在执行关键操作时有明确的最佳实践可循,而不是全靠个人经验和胆量。

示例:<;resource>;-orphans(查找孤立的 Pod/Volume → 发到 Slack → 等待确认期 → 用户确认 → 级联清理)、cost-investigation(「为什么我们的存储/出口账单暴涨」,带具体的桶名和查询模式)

对照这份清单,你们团队现在有哪几类?我猜大多数团队只有第一类。

三、让 Skills 真正强大的 8 个核心原则

Image

有了分类框架,下一步是怎么写好一个 Skill。Thariq 给出了 7 条经验,每一条背后都是内部踩坑踩出来的。

原则一:只写 Claude 不知道的东西

Claude 本身已经非常了解代码,也有很多默认观点。如果你的 Skill 是通用知识,它基本上已经内化了。真正有价值的 Skill,是把 Claude 从它的“默认路径”推出去,引导它进入你们的特定路径。

frontend-design 这个 Skill 就是典型:一个 Anthropic 工程师通过跟客户迭代,专门打磨了 Claude 对 UI 设计的品味——避开经典的 Inter 字体和紫色渐变,让它符合更有质感的设计标准。

原则二:Gotchas 是 Skill 里含金量最高的部分

每个 Skill 都应该有一个“踩坑记录”章节。这里记录的是 Claude 在使用这个 Skill 时反复触发的失败模式。每次 Claude 踩了新坑,就更新进去。

这个章节不是文档,它是你们团队与 AI 协作经验的活体积累。

原则三:把 Skill 当文件系统工程来做

Skills 是文件夹。充分利用文件结构做“渐进式上下文披露”——告诉 Claude 里面有哪些文件,它会在合适的时机按需读取,而不是一次性把所有内容塞进上下文。

references/api.md 放详细 API 文档;assets/ 放模板文件;scripts/ 放可执行脚本。Claude 自己会决定什么时候读哪个文件。

原则四:给 Claude 自由度,不要过度指令化

Skills 会被反复复用。如果指令太刚性,Claude 在不同情境下都会用同一种方式处理,效果会很差。给它足够的信息,也给它足够的灵活性去适应每次不同的上下文。

原则五:用 Config 文件做动态初始化

有些 Skill 需要用户在第一次运行时提供配置信息(比如 Slack 频道)。把这些配置存在 config.json,如果文件不存在,Claude 会自动引导用户填写。这是一个非常干净的交互模式。

原则六:Skill 的 Description 是触发器,不是摘要

Claude Code 启动时会扫描所有 Skill 的 Description 字段,决定什么请求该用哪个 Skill。所以 Description 不是用来给人看的介绍,而是用来告诉 Claude“在什么情况下触发我”。这个字段的措辞直接决定了 Skill 的触发率。

原则七:给 Skill 配记忆,让它越用越聪明

Skill 可以用文件存储历史状态——追加日志、JSON 文件,甚至 SQLite 数据库。standup-post 保存历史 standup 记录,让 Claude 下次运行时自动对比变化,只输出 delta。这种“记忆”把一次性工具变成了真正的长期助手。

原则八:给 Claude 配脚本,让它把精力花在决策上

这是最容易被忽视、也最有技术深度的一条。Claude 很擅长组合和推理,不擅长的是从零重建样板代码。在 Skill 里预置好脚本和 helper 函数库,Claude 就能把每一个 Token 花在“做什么”而不是“怎么取数”上。

举个具体例子:你的数据分析 Skill 里预置了一套从事件数据源取数的 helper 函数。当你问 Claude「上周二发生了什么」,它不需要重新写取数逻辑,直接调用 helper 组合出分析脚本,把精力全放在解读数据上。这个差距,用了才知道有多大。

好的 Skill,是你们团队与 AI 协作经验的活体积累——写进去的每一条 Gotcha、每一个脚本,都在持续放大 Claude 的实际能力上限。

四、Skills 正在重塑工程团队的协作方式

到这里,大多数文章会就此结束——介绍完了,收工。但我觉得最重要的一层还没说到。

Skills 不只是工程效率工具,它正在改变团队的知识流动方式。这个变化的意义,比你想象的深得多。

想象一下过去的情况:一个高级工程师花了两周搞清楚了内部计费库的所有陷阱。这些知识存在哪里?存在他的脑子里,或者一个没人维护的 Confluence 页面里。下一个接手的工程师,大概率要重新踩一遍同样的坑。知识在人与人之间传递,但传递效率极低,而且每次传递都有损耗。

现在呢?他把这些知识写进 billing-lib Skill,推到团队的内部插件市场。每个用 Claude Code 的工程师,都自动获得了他两周积累的经验,并且每次踩新坑都会迭代进去。Anthropic 内部没有一个集中的团队来维护所有 Skills,而是由各个工程师自己上传、分发、迭代。当一个 Skill 在 Slack 里获得了足够的关注和使用,它就会被 PR 进正式的 Marketplace。

经验,第一次有了可以复用的载体。

这句话的含义,在个人和组织两个层面都值得细想。

个人层面:会不会系统性地建设 Skills 库,正在成为工程师的新能力分水岭。不是“加分项”,而是“基础门槛”。就像十年前,在很多团队中,会不会用 Git、会不会写单元测试,曾经是区分工程师水平的标志——今天,会不会把自己的经验沉淀成高质量的 Skills,会成为下一个分水岭。一个把踩坑经验系统化进 Skills 的工程师,和一个把经验装在脑子里的工程师,在 AI 协作效率上的差距会越来越大。

组织层面:Skills 库的质量,正在成为工程团队的隐性资产。两个规模相同的团队,一个有 200 个高质量 Skills,一个只有 10 个——在我看来,他们的 AI 协作效率差距,不是 2 倍,可能是 10 倍。更关键的是,这种差距是复利式的,而且是不可见的。高质量 Skills 库会吸引更多工程师贡献新 Skills,新 Skills 又进一步放大团队效率,形成飞轮。而旁观者什么都看不到——他们看到的只是“这个团队的 AI 用得特别好”,却不知道背后跑着多少隐形的基础设施。

这就是 Thariq 说的“插件市场”背后真正的价值逻辑:它不是工具的分发,而是组织智慧的结晶与传承。 好的 Skills 库,是一个团队与 AI 协作经验的活体积累——它会生长,会迭代,会在每次踩坑之后变得更强。

那些在今天开始系统性建设 Skills 库的团队,正在积累一种别人追不上的先发优势。而那些依然把 Skills 当成“偶尔用用的 Prompt 存档”的团队,差距正在以你看不见的速度拉开。

结语:你们团队的 Skills 库,今天有几个?

Thariq 在文章末尾说了一句很诚实的话:“我们还都在摸索怎么用好 Skills,这更像是一把有用的技巧,而不是最终答案。”

这种坦诚,反而更有说服力。

Skills 不是魔法,也没有标准答案。但有一点已经被 Anthropic 内部实践验证:当你把工程经验系统性地沉淀进 Skills,它就不再只是你一个人的资产,而是整个团队的基础设施。 这是工程知识第一次有了可以复利增长的载体。

这不是程序员的威胁,而是工程团队的新机遇。第一次,你们踩过的坑、趟过的路、积累的判断力,可以被系统性地编码、分发、传承——不再依赖老手带新手,不再依赖文档被动等人来读,而是直接嵌入每一次 AI 协作的过程里。

从今天开始,建议每个使用 Claude Code 的团队做一件事:对照上面的 9 类 Skills,检查你们缺了哪几类,从最痛的那个地方开始补。

会用 Skills 的工程师和团队,与不会用的,正在快速分化。

你们团队的 Skills 库,今天有几个?

参考来源:

Thariq Shihipar, “Lessons from Building Claude Code: How We Use Skills”, X (Twitter), 2026