AI 编码的探索与思考本文由 gemini 自动整理自 2026 年 1 月 16 日做的《AI 编码的探索与思考》分享

本文由 gemini 自动整理自 2026 年 1 月 16 日做的《AI 编码的探索与思考》分享的文字稿。

引言：打破刻板印象

AI 编码领域的变化可谓“一日千里”。很多开发者对 AI 编程的印象还停留在一年多前——试用了一下，发现效果平平，便束之高阁。然而，今天的 AI 编码能力已经远超大家的想象。

在这个时间点，企业端的 AI 渗透率依然严重不足，而个体开发者之间已经出现了巨大的分化。一部分“保守党”坚持古法编程，认为只有手敲的代码才可信；另一部分“激进党”则完全依赖 AI，生成了大量未经审查的代码。

真正的未来，属于那些能够驾驭 AI、在“控制”与“放权”之间找到平衡的开发者。

一、行业巨变的信号：大神的转身

如果说普通开发者的体验还带有主观性，那么顶尖开发者的动态则清晰地预示了风向：

Linus Torvalds 的新玩具： Linux 之父 Linus 最近分享了一个视频，他使用 Google 的“反重力”（Antigravity）编辑器（注：指 Google 的前沿 AI 辅助开发工具）开发了一个音频可视化的 Python 项目。 Linus 自谦说自己并不精通 Python，以前写 Python 是“先 Google，理解后再写”。而现在，他直接让 AI 生成代码，“中间商（我自己）被干掉了”。他直言，AI 写得比他自己好太多了。
Redis 作者 Antirez 的爆发： Redis 的作者 Antirez 在过去一周内，基于 Redis 源码完成了四个非常复杂的项目，包括向量集支持和 FLUX 模型的实现。他感慨道：“作为一个程序员，我比以往任何时候都更想编写代码。” AI 极大地缩短了从想法到交付的周期，让他重获了构建复杂系统的乐趣。
Cursor CEO 的“300万行代码”奇迹：这是一个更激进的案例。Cursor 的 CEO 分享说，他们利用 AI（GPT-5.2 Agent）在一周内生成了 300 万行代码，从零实现了一个可运行的浏览器。想象一下，手搓一个 Chrome 的难度有多大？虽然目前的性能还不够完美，但在几乎没有人工深度介入的情况下完成如此庞大的工程，足以证明 AI 编码的上限已被推高到了惊人的程度。
我的实践：OpenWAF：作为分享者，我自己开发了一个名为 OpenWAF 的项目，整个项目我使用 conductor 来开发，全程没有打开过 ide，通过小步迭代和代码 review 完成了基本的框架功能。这是一个对标阿里云 WAF 的硬核企业级 WEB 应用防火墙项目，包含三大核心模块：
1. DSL 虚拟机：用于处理高性能规则匹配，涉及编译原理、字节码执行、JIT 优化等。
2. 深度检测引擎：深度的 payload 检测，集成 AI 算法进行攻击识别。
3. Nginx 内核模块开发实现底层流量转发：涉及复杂的 Nginx C 代码开发。整个项目包含 1.5 万行 Rust 代码 和 几千行 C 代码。在此之前，我并不熟悉 Nginx内核模块开发，但在 AI 的辅助下，我不仅完成了开发，还通过高频的交互彻底掌握了这些代码。

二、核心理念：编码即控制

AI 编码不仅仅是效率工具，它带来了一种全新的控制论视角。

1. 开发者角色的转变

在传统的软件工程中，我们是执行者（Worker）。但在 AI 时代，我们变成了控制器（Controller）。

被控对象：AI 模型、代码库、软件系统。
输入：我们的需求规格（Spec）、Prompt。
输出：可运行的软件功能。
反馈：编译报错、测试失败、Code Review 发现的问题。

2. 高增益系统的风险

AI 是一个高增益放大器。你输入一句简单的 Prompt（少量信息），AI 可能会生成几百行代码（大量信息）。这种“高增益”带来了巨大的风险：熵增和失控。如果你缺乏有效的**负反馈（Negative Feedback）**机制，系统就会迅速发散，产生大量你无法理解、无法维护的“黑盒代码”。

3. 艾什比必要多样性定律 (Ashby's Law)

控制论中有一个重要定律：“只有多样性才能吸收多样性”。 简单来说，控制器的复杂度和状态数，必须至少等于被控系统的复杂度和状态数。

现状：现代软件系统的复杂度（多样性）极高。
传统模式：资深工程师通过多年的经验，在大脑中建立了足够复杂的模型（高 Variety）来匹配软件系统。
AI 模式的陷阱： AI 编码充当了一个降维过滤器。
- 开发者通过自然语言（低 Variety）指挥 AI。
- AI 生成了复杂的逻辑代码（高 Variety）。
- 危机：如果开发者为了图省事，不再阅读和理解 AI 生成的代码，那么开发者大脑中的“多样性”就会低于代码库的“多样性”。
- 结果：系统一旦出现边缘情况（Bug），开发者将失去控制能力，因为他的心理模型已经无法覆盖系统的实际复杂度。这就是所谓的**“丧失控制权”**。

4. 熵（Entropy）与系统耗散

软件工程本质上是一个对抗熵增的过程。我们将无序的需求变成有序的代码。

AI 的双向作用：

减熵（理想情况）： AI 遵循最佳实践，生成结构清晰、命名规范的代码，帮助系统维持低熵状态。
增熵（实际风险）： AI 往往倾向于“堆砌代码”而非“重构抽象”。它更容易生成冗余的样板代码，而不是提取通用的函数（因为提取抽象需要跨文件的全局视野，目前 AI 的 Context Window 有限）。

结论：如果没有强力的人类干预进行重构，AI 编码系统倾向于加速系统的热寂（Heat Death）——代码库迅速膨胀，直到没有任何人能理解，维护成本趋于无穷大。

5. 负反馈环的延迟与失效

一个健康的控制系统依赖于快速且准确的负反馈。

编译与测试（硬反馈）： AI 编码工具现在已经开始集成“自我修复”循环（生成 -> 报错 -> AI 修正）。这是一个非常高效的短路负反馈，能解决语法级错误。
逻辑与业务意图（软反馈）：这是最危险的环节。当人类产生“Review 疲劳”时，对 AI 代码的检查会变得肤浅。

5. 二阶控制论：观察者的观察

二阶控制论关注的是“观察系统的观察者”。在 AI 编码中，开发者不再直接与代码交互，而是与“AI 代理”交互。

黑盒化： AI 模型是一个黑盒。代码库本身因为生成速度太快，对人类来说也逐渐变成了黑盒。
信任校准（Trust Calibration）：开发者对 AI 的信任度是一个动态变量。
- 过度信任（Over-trust）：导致自满，忽略错误。
- 信任不足（Under-trust）：导致弃用，效率降低。

人机共生系统的演化：未来的编程不是“写代码”，而是**“训练那个帮你写代码的神经网络”**。你的每一次修改（Refinement）、每一次采纳或拒绝，实际上都是在调整这个控制器的参数。

过去我们写代码，就像是在雕刻石头，每一刀都由我们精准控制（一阶）。现在用 AI 写代码，更像是和一位画师对话。我不仅要看画本身，还要观察‘我描述画的方式’是如何影响画师的。这种‘观察我们与 AI 互动过程’的思维，就是二阶控制论。它提醒我们：在 AI 时代，编程的本质变成了沟通与反馈的管理。

在 AI 时代，编程的本质演变成了**“沟通与反馈”。我们在做什么？我们本质上是在训练**那个帮你写代码的神经网络。你给出的每一个 Prompt、每一个约束条件、每一个停止词，都是在收敛它的输出空间，将其引导到你预期的结果上。

三、工程实践：规范驱动开发 (SDD)

为了解决 AI 编码的“幻觉”和“发散”问题，规范驱动开发（Spec-Driven Development, SDD） 成为了关键模式。

什么是 SDD？

传统的开发流程是：想法 -> 文档/PRD -> 编码。 SDD 的流程是：想法 (Idea) -> 规范 (Spec) -> 计划 (Plan) -> 实现 (Code)。 Spec 是连接“高熵值”（混乱的用户想法）和“低熵值”（工程化产出）的桥梁。

核心工具与工作流

Claude Code：后端 Agent 的标杆
- Claude Code 是目前对 Agent 理解最深的产品。它支持 Sub-agent（子智能体） 模式。
- 场景：当你需要对 N 个文件进行重构或清理时，可以开启 N 个 Sub-agent 并行处理，互不干扰，最后汇总。这极大地扩展了单人的作战半径。
轻量级 Skill： Superpowers
- 这是一个轻量级的 Skill 插件，非常适合做需求澄清。
- 特点：它一次只问一个问题（避免了像 Claude 原生那样一次抛出 10 个问题带来的认知负担）。它会将大需求拆解为 2-5 分钟的微任务，并生成详细的文件路径规划。
- 这种“小步快跑”的交互模式，能显著降低 Token 消耗并提高准确率。

万变不离其宗，不管是 SDD 和 superpowers，本质上都是一个提示词工程

Kiro (AWS)
- AWS 开源的一个完全基于 SDD 理念的 IDE。
- 它的第一入口不是代码编辑器，而是 Spec。你定义好 Spec，它会自动生成计划并执行。
- 可视化：它的界面动效非常直观，任务执行时会有圆圈转动，完成后打钩，完美契合了 SDD 的流程。

四、下一代 IDE 的设计

如果说 Cursor 和 VS Code Copilot 是 AI 辅助编程的“第一代”产品，那么现在的创业公司正在构建“下一代” IDE。它们的共同特征是：

不在开发自己的 coding agent，而是通过 SDK 或者 ACP 集成 Claude-code、OpenAI Codex、 Gemini
不再仅仅是补全代码，而是接管整个软件工程流程。
任务流并行：多 Git Worktree 编排、沙箱（容器、虚拟机、serverless 等），践行 best of N
多 Agent 编排是必然：Claude-code、OpenAI Codex、 Gemini 各有千秋

1. Conductor (Melty)：并行开发的指挥官

定位：开源的 AI 原生编辑器，专注于并行任务处理。
核心逻辑：它不仅仅是一个写代码的界面，更是一个任务调度器。它允许你同时开启多个 "Track"（轨道），每个 Track 对应一个独立的 Git Worktree。
特性：
- 环境隔离：每个任务都在独立的文件系统和进程中运行，互不干扰。
- 人类介入：它提供了一个类似终端的 Chat 界面用于下达指令，以及一个实时的 Diff 界面用于 Review。
- 工作流：你可以同时指挥 3 个 Agent：Agent A 修 Bug，Agent B 写新功能，Agent C 做重构。你只需要坐在指挥台上进行 Code Review 和合并。

2. ZenFlow ：多模型编排的大师

定位：集成了 SDD（规范驱动开发）理念的全流程开发工具。
核心逻辑：它将软件开发拆解为“需求澄清 -> 计划生成 -> 代码实现 -> 测试验收”的标准流水线。
级特性：
- 左右互搏：它内置了多模型编排引擎。你可以配置“用 Claude 写代码，用 GPT 来 Review”。这种机制在工具内部自动流转，无需人工切换。
- 可视化看板：它将开发流程可视化为看板（Kanban），你可以清晰地看到每个 Agent 正在执行哪个步骤，进度如何。

3. Vibe-Kanban：从“心流”到“工作流”

概念来源：源自 Linus Torvalds 的 "Vibe Coding"（凭感觉编程）与敏捷看板的结合。
核心逻辑：这不仅仅是一个工具，更是一种新的人机协作形态。在 Conductor 或 ZenFlow 中，看板不再是给人看的静态任务板，而是 Agent 的活动区域。
特性：
- 动态流转：任务卡片的状态流转（Doing -> Testing -> Done）是由 Agent 自动触发的。
- 透明化：开发者通过观察看板的流动，就能掌握系统的“脉搏”（Vibe），而无需深入每一行代码的细节。这让“凭感觉编程”变得可控、可落地。

不要迷信单一模型。目前的最佳实践是**“左右互搏” (Adversarial Workflow)**。

生产 vs 审查：让擅长编码的模型（如 Claude）负责写代码，让擅长逻辑推理的模型（如 Gemini 或 GPT）负责Review 代码。
实战效果：我经常让 Claude 写完后，让 Gemini 给代码打分。Gemini 经常会打出“D-”的低分，并精准指出 Claude 忽略的边界情况或安全漏洞。
价值：利用 AI 的随机性和不同模型的“偏见”，能发现人工 Review 难以察觉的盲点。

五、开发者需要具备的“新能力”

在 AI 时代，依然只有能够驾驭工具的人才能生存。我们需要完成从“写代码”到“品味代码”的进化。

技术品味 (Taste) 是核心竞争力
- 如果你的品味不够，无法判断什么是好的架构、什么是优雅的代码，那么 AI 生成的就是一堆“垃圾”。
- 你是 AI 的把关人。你的 Prompt 决定了下限，你的 Taste 决定了上限。
费曼名言的再诠释
- 费曼曾说：“我不能创造的，我就不能理解。” (What I cannot create, I do not understand.)
- 在 AI 时代，这句话可以辩证地看。对于我不懂的技术（如 Rust），我可以先让 AI 创造出来，然后我通过阅读、调试、向 AI 提问来反向理解。
- 通过多轮的“生成-解释-修改”循环，原本不理解的东西最终也能被深刻掌握。
管理者的回归
- 很多管理者早已不写代码，这在 AI 时代是非常危险的。
- 如果不亲自体验 AI Coding，你就无法理解现在的生产力变革，无法做出准确的排期，也无法识别团队中的“虚假繁荣”（只生成不 Review）。
- No Moat：前端与后端的界限正在消失。只要有自然语言能力和良好的工程品味，全栈开发已是常态。

新一代效能度量

Acceptance Rate：AI 建议的代码中有多少被人类未修改接受？(衡量质量)
Task Autonomy: 多少任务在初始提示后无需人类干预即可完成？(衡量独立性)
Review Time: 审查 AI 代码是否比人类代码耗时更长？(警惕生产力悖论)

七、结语

创新没有鸿沟，如果你现在不上车，可能就永远被甩在身后了。

不要验证偏见：不要因为试了 5 分钟觉得 AI 很蠢就放弃。请给自己几周时间，用 AI 真正从头到一个完整项目。只有在复杂的真实场景中，你才能体会到它的颠覆性。
寻找乐趣：AI 让我们能够以极低的成本构建以前不敢想的复杂系统。找回构建事物的乐趣，去创造更多、更好的东西。

AI 编码的探索与思考