从 Claude Code 到 Codex Skills ：AI 编程的新变化是从生成代码到沉淀工程经验Claude C

导语

前两天我刷 GitHot，本来只是想随便找几个新项目看看。结果越看越觉得，这次不太像往常那种“又一个 AI 工具火了”的热榜。几个与 Claude Code、skills、Codex 相关社区项目和 AI 编程工作流有关的仓库，几乎在同一时间成为了开发者的讨论的热点。你说它们是一类吧，也不能说完全是。
你说它们没关系吧，却也不能说没有。

我后来把几个仓库 README、Anthropic 的 Claude Code 公开文档，乃至一些社区说明来回看了几遍，脑子里慢慢冒出一个比“AI 编程进入新阶段”更精准的判断： 这波变化真正值得我们关注的，不只是 AI 能不能写代码，而是工程经验正在被拆成可以复制使用、可调用的方法模块。

接下来我展开讲一下。之前，大家聊到AI 编程，主线几乎都是“模型能不能写代码”“能不能修 bug”“能不能读仓库”。这条线并没有错，但它却只讲了表面的一层。真正难复制的，从来不是一段代码。真正难复制的，是一个有经验的工程师处理问题时脑子里的那道程序。他看到 bug，不会直接去改。
他会先判断范围，再确认是否重复出现，再看是不是最近提交引起的，再决定要不要先补测试，再决定修补还是重构。

这个顺序，可谓真是好家伙。以前，这些东西基本都是人的脑子里的东西，或者散落在团队文档、代码规范、review 习惯和老同事的经验里的。可现在，Claude Code、skills 相关项目，以及 Codex 相关社区整理内容，正在指向一个变化： 工程经验正在从“人脑里的东西”，逐渐变成“系统可以调用的模块”。 这个件事情一旦成立，那么AI 编程就不仅仅是“代码生成工具”了。

在这里插入图片描述图片来源：Unsplash（免费可商用）

一、先别急着看模型能力，这次更值得看的是“经验开始资产化”

如果只看表面，这一波热度很容易被理解成：

Claude Code 生态热度还在持续上涨；
开发者开始收集模板；
大家都在研究 skills；
不同 AI 编程工具的 agent 使用方式越来越接近。

这些都对。但这些说法都还只是停留在工具层。我觉得换个说法更直观些： 为什么开发者们最近都在关注这个skills 是否重要了？ 根据如今情况来看，模型变得够聪明之后，真正稀缺的并不是“答案”，是解决问题的方法。

现在很多人都在用 AI 写代码，最大的问题不是“模型会不会写”，而是“如何用模型怎么写”。它的随机性很高有时会给你一个准确无误的答案，但也可能会给你一段看似很顺、很对、却有一大堆坑的东西。

工程师真正值钱的地方，不是每次写出来的代码都是最好的。而是不断重复复杂的工作，琢磨出一套自己独有的处理问题的方法。这就是引出我这篇文章的核心框架。在这里插入图片描述图片来源：Unsplash（免费可商用）

二、我们把这些变化拆成三层：模型层、经验层、执行层

接下来我就把自己的理解框架直接亮出来。这个框架不是官方定义，只是我的个人归纳。各位只作参考即可。

第一层：模型层

这层可以理解是负责的是基础能力，例如：

理解用户需求；
生成代码；
推理；
改写；
解释；
长上下文阅读。

这一层是大家最熟悉的地方。 OpenAI、Anthropic、Google 等公司这些年卷的核心，也基本都是这些。

第二层：经验层

这层才是我觉得这次真正冒头的地方。它不直接等同于输出代码，而是把工程经验压缩成可复用的动作模块。比如：

怎么拆 PRD；
怎么拆 issue；
怎么 triage 一个 bug；
怎么做 TDD；
怎么写重构计划；
怎么给 git 操作加护栏。

这层的本质，不只是智力，而是方法存档。

第三层：执行层

这一层负责把前两层真正接到开发现场里，比如：

终端；
Git；
GitHub CLI；
测试命令；
hooks；
API；
调度逻辑。

没有这一层，前面两层整的再漂亮，也都是徒劳。工程认的并不是“会说”，却是能落地。这个可以简单理解为：

模型层：负责理解和生成
↓
经验层：负责定义做事方法
↓
执行层：负责把方法跑起来

如果能看懂这三层框架，后面的那就更容易能看懂了。 Claude Code 为什么重要？因为它更像是执行层的入口。
skills 为什么会备受关注？因为它卡在了经验层。
Codex 相关社区项目为什么值得去看？因为它说明“经验模块化”不是单一产品现象，可以理解为是在跨生态扩散。在这里插入图片描述图片来源：Unsplash（免费可商用）

三、Claude Code 真正补上的，不只是能力，而是“经验的宿主”

很多人聊 Claude Code，容易把重点放在“它能读代码库”“能跨文件修改”“能运行测试”。根据 Anthropic 公开文档表示，目前Claude Code 已经具备读取项目上下文、跨文件修改、在终端环境中辅助执行开发任务等部分能力。部分扩展能力如 memory、hooks、subagents 等，具体支持范围和使用方式应以官方通报为准。

不过说实话，我倒是觉得这些还不是最关键的描述。我倒是觉得可以把 Claude Code 理解成： 它给工程经验找到了一个默认宿主。 这话听起来有些抽象，我这里解释一下：就好比以前你写 prompt，本质上是在临场指挥一个模型： “帮我看这个 bug。”
“然后帮我测试，修改。”
“最后帮我重构一下。” 问题是，这些 prompt 却很难沉淀。

今天你这么写，明天同事那么写，后天另一个项目代码又换了一种写法。大模型都能回答解决，但其回答的稳定性、动作顺序和边界感，却是没有预想的那么理想。 Claude Code 这类终端型 agent 的出现，像是把事情给改变了。给人的感觉它不仅是个聊天窗口，还是一个有工具接口、运行环境、行为能力的执行者。

也就是说，如果这个说法成立，那么我们可以这样理解： Prompt 只是是一次性的指令。
Skill 就是一种可重复调用的方法。
Claude Code 这类 agent，就好比是承载理论方法的工作台。

比如以前你是要请一个人帮忙。
而现在你可直接分配岗位配操作手册。在这里插入图片描述图片来源：Unsplash（免费可商用）

四、一些工程场景：以前可以靠老同事帮忙，现在开始靠 skill

我们可以这样假设到一个常见工程场景里。如果团队接到一个 issue：

用户反馈导出功能偶发失败，日志里出现超时，但只有部分租户会复现。

这类似的问题非常典型，也特别烦。并不是那种一眼就能看出来问题，也不是简单改一下配置就能完事。以前，一些有经验的工程师都会这样去处理：

接到 issue
↓
先确认被影响的范围
↓
查询最近相关提交
↓
看看日志和监控
↓
尝试复现 ↓
判断是环境、数据、并发还是逻辑问题
↓
决定先补测试还是先打临时日志
↓
再进入修复或重构

注意，真正值钱的不是最后那几行修复代码。真正值钱的是这个排查顺序。现在如果你去看一些 skills 相关仓库里的命名，比如 triage-issue、request-refactor-plan、tdd 等，会发现它们想做的，恰恰是把这个顺序拆出来。也就是说，未来一个更完整的 agent 工作流，可能是这样：

收到 issue
↓
调用 triage-issue
↓
先整理问题范围、复现条件、怀疑路径
↓
如果确认要结构性调整
↓
调用 request-refactor-plan
↓
生成分阶段改动建议
↓
如果要补验证
↓
调用 tdd 或测试相关 skill
↓
最后交给 Claude Code 等工具执行具体改动、跑测试、检查结果

你看，最重要的那些变化并不在“AI 会不会写修复代码”。最重要的变化在于： 那些存在人脑子里的排查顺序，第一次有机会变成团队可循环复制使用的东西。

这也就是我为什么一直强调的经验资产化。以前，团队最怕的是什么？怕资深同事走了，很多有点经验也跟着走了。现在的skills 真正有意思的地方在于它给了工程经验一种全新的存储形式。它目前还不够成熟，但大体方向是已经出来了。在这里插入图片描述图片来源：Unsplash（免费可商用）

五、skills 项目让我停下来的思考的不是热度，而是它确实很像一个“经验仓库”

我去查找一些 skills 相关项目时，却发现不是 README 写得多花多漂亮，而很多 skill 名字真的太像工程师了。比如：

to-prd；
to-issues；
triage-issue；
request-refactor-plan；
tdd；
design-an-interface；
improve-codebase-architecture；
git-guardrails；
write-a-skill。

这些名字很诚实。它们没有那种“万能生成器”的浮夸感。相反，它们全都指向真实工作流里的固定动作。我后来反应过来，这类项目真正有价值的地方，不是“提供很多 skill”。而是它在提醒开发者一件事：

以后最值钱的，可能不是你临时写出来的 prompt，而是你能不能把自己的做事方式沉淀成一个别人也能调用的 skill。

这个变化其实很深。因为 prompt 是个人习惯。 skill 更像团队资产。这两者的差别，跟“会做事”和“能教会别人做事”有点像。后者的杠杆明显更大。

六、Codex 相关社区项目说明：经验不只要能存，还要能按条件加载

需要说明的是，本文提到的 Codex 相关 skills 内容，主要来自开源社区整理和讨论，不等同于 OpenAI 官方发布或背书。具体能力边界，应以官方文档和相关项目说明为准。

如果只有 Claude 生态在讲 skill，我还会觉得这件事有一点产品策略色彩。但 Codex 相关社区项目的出现，让我更确定这不是某一家公司的单独动作。从部分社区项目的设计思路看，skills 正在尝试通过 metadata、触发条件、正文延迟加载、CLI/API 调用等方式，降低上下文压力，并让经验模块更容易被系统调用。

不同项目的实现方式并不相同，具体能力仍需以各自文档为准。这几个点放在一起看，其实指向的是一个更成熟的问题： 经验不只是要存下来，还要在合适的时候被系统准确调出来。

这属于另一个层级了。很多团队其实并不是没有方法。是方法太散、太碎、太依赖具体的的某人了，而这个人却没法100%的稳定。如果说 Claude Code 解决的是“经验有没有执行者”，那么 Codex 关于 skills 的讨论更像是在补全另一个问题： 经验能不能被系统按条件调度，不是每次都靠人手动提醒。 这就更像工程系统，而不仅仅是提示词技巧了。

七、接下来拼的很可能不是模型是否更强，是更低成本的经验复制模式

这句话说得更直白一点。现在行业里都在谈ai大模型替代程序员。我觉得这个说法既粗糙，也没说到重点。程序员真正不可替代的，不是写代码的能力，而是经验丰富的密度。而 AI 编程如果想真正走进团队，迟早要面对一个问题：

怎么把人的经验密度，拆成机器能持续调用的东西。

所以我现在的判断是： AI 编程接下来的竞争，表面上看还是模型竞争，底层其实会越来越像“经验复制效率”的竞争。谁能更低成本地复制经验，谁就更有生产力杠杆。这个逻辑一旦成立，很多事情都要重写：

skill 市场会变得重要；
工作流模板会变得重要；
团队自己的方法库会变得重要；
经验沉淀方式会变得重要；
甚至“谁来维护经验资产”都会变成一个新角色。

这个方向，我觉得比“下一个模型还能多强一点”更值得长期关注。

八、当然，冷水还是要泼：经验资产化没那么简单

写到这儿，我只负责鼓吹，不够还是得把问题说完。

第一，很多所谓的 skill 还只是“包装过的提示词”

这点特别现实。有些 skill 看起来像模块，其实只是换了一个很长目录结构的 prompt。它没有真的定义：

输入边界；
触发条件；
失败处理；
输出格式；
权限限制。

这种东西可以演示，但不太像是经验资产化。真正能沉淀成团队资产的东西，必须是可维护、可解释、可复用。

第二，经验一旦资产化，就会遇到治理问题

一旦团队开始积累 skill，很快就会碰到这些问题：

谁能创建 skill？
谁来审核？
谁负责淘汰旧版本？
skill 冲突怎么办？
skill 和团队规范不一致怎么办？

以前经验在脑子里，问题是“传不下来”。现在经验写成 skill，问题是成了“谁来管理”。这其实是好问题，但也是难问题。在这里插入图片描述图片来源：Unsplash（免费可商用）

第三，个人爽感不等于团队效率

个人开发者用 Claude Code 加 skills，往往很爽。这我完全信。但团队场景更复杂。团队还要面对：

权限边界；
代码审查；
CI/CD；
安全审计；
回滚；
合规要求。

所以我不会说“skills 一来，开发流程就被重构了”。这太早了。我更愿意说： 我们终于看到了一个可能成立的方向，但这个方向刚刚从概念走到工程起点。

九、最后：真正值得写下来的，是工程经验开始变成可调用资产

如果你读到这里，只想记住一句，那我希望是这一句： 从 Claude Code 到 skills 相关项目，这波变化真正开始沉淀的，不只是代码，而是工程经验。 我为什么觉得这句话比“AI 编程进入新阶段”更重要？因为“进入新阶段”太空了。而“工程经验开始从个人经验，变成可调用资产”，是一个非常具体的判断。

这意味着什么？意味着未来团队里最值钱的，不一定是谁最会写 prompt，却是：

谁能把方法讲清楚；
谁能把经验知识封装出来；
谁能把这些封装成稳定的 skill；
谁能让这些 skill 真的跑进工作流。

过去我们说知识管理。也许现在开始要说知识经验管理了。而且这一次，知识经验管理不只是写在 wiki 里等人看。它有机会直接接到 agent 身上，接到终端里，接到代码库旁边。说实话，我觉得这件事的分量，比热榜本身大得多。热榜只是在提醒我们：风向变了。真正变的，不是 AI 会不会写。是工程师终于开始想办法，把自己的做事方式也可以交给系统。这一步，才像是 AI 编程真正摸到生产力天花板之前，最值得认真准备的一步。