CLAUDE.md 的12条规则一套旨在将 AI 编程助手（如 Claude）的错误率从 41% 降至 3% 的 CLA

这是一套旨在将 AI 编程助手（如 Claude）的错误率从 41% 降至 3% 的 CLAUDE.md 指令规范。既保留了 Karpathy 提出的 4 条基础代码编写原则，又补充了 8 条面向 AI 代理协作的高级规则，并对每一条都给出可操作的说明。

一、Karpathy 的 4 条基础规则（针对代码编写）

这些规则从根本上改变“人给指令，AI 写代码”的模式，强调思考、克制、精准和目标导向。

不要急于生成代码，先把问题想清楚。

只解决问题本身，不要替未来做多余的决策。

每一次变更都要像外科手术一样精准，只碰必须碰的部分。

告诉 AI “成功长什么样”，而不是手把手教它怎么走路。

当 AI 不再是简单的代码补全工具，而是以“代理”身份参与协作时，需要这 8 条规则防止它越界、忘掉上下文或隐藏风险。

模型只做它擅长的事，确定性逻辑留给代码。

负责：分类、草稿撰写、摘要提炼、语义理解、模式识别等需要“判断”的任务。
代码负责：路由分发、重试机制、确定性数据转换、精确计算等需要 100% 准确和可预测的逻辑。
不要让模型去计算 2+3，也不要让它决定哪个微服务处理请求——这是代码层的职责。

像管理金钱一样管理上下文窗口，避免注意力稀释。

遇到代码库中的模式冲突，不要缝合，要亮出来。

如果发现同一概念有两种互斥的实现方式（例如同时存在 snake_case 和 camelCase 的命名），选择其中一种作为本次任务的标准，并在注释或消息中明确标记另一种为“待统一”。
严禁为了表面和谐而把两种风格混合在一起（Blend），那会让后续维护者完全不知道应该遵循哪一套。
这种显式暴露冲突的做法，让技术债务可见、可控。

每一次新增代码之前，必须先理解现有的依赖和接口，杜绝重复造轮子。

测试的锚点是“为什么这么做”，不是“怎么做”。

测试名和断言必须直接反映业务意图，比如 should not allow checkout with expired coupon，而不是 should call validateCoupon with false。
如果只是重构实现却导致测试大面积失败，那测试就是无效的——它耦合了实现细节而不是接口契约。
这种测试即使逻辑改变也能保持稳定，反过来保护重构的安全。

在多步流程中主动插入“心跳”，防止偏离主线。

融入现有代码库的习惯，比引入个人偏好重要得多。

不确定的成功等同于隐藏的炸弹，必须让它发出声响。

这 12 条规则组合在一起，构成了一个严谨的 AI 协作契约：它既要求人类思考清楚、设定边界，也要求 AI 在约束下交出可信、可控、低噪声的代码。实践表明，严格执行这份 CLAUDE.md，代码生成的错误率可以从 41% 大幅压降到 3% 左右，将 AI 编程从“能写”真正推向“敢用”。