从混乱氛围编程到AI优先工程的飞跃氛围编程虽启发创造，但效率受限。AI优先工程通过规范驱动开发、自我验证、测试驱动开发、

氛围编程虽启发创造，但效率受限。AI优先工程通过规范驱动开发、自我验证、测试驱动开发、KISS原则等系统方法，结合基础设施，将混乱编程转化为生产力，实现吞吐量翻倍甚至十倍增长。

译自：From Chaotic Vibes to Real Velocity With AI-First Engineering

作者：Andrew Filev

2025年，氛围编程不再仅仅是一个网络迷因；它演变成了一场全面的运动。突然间，非开发人员在一夜之间就能快速开发应用，个体创业者沉迷于16小时的“再来一个提示”的狂热中，工程师们则以多巴胺冲击的速度分享着“脑洞大开”的时刻。

是的，氛围编程是混乱的。是的，它经常生成AI辅助的意大利面条式代码。但它也为数百万从未接触过编译器的人打开了软件创造的大门。它民主化了构建的乐趣，并激励了一代人去畅想。

挑战在于灵感不等于生产力。在某个时候，你需要一个系统。

氛围编程的瓶颈

研究通常将AI编程的生产力提升定在20%左右。这并非因为工具本身薄弱；而是因为大多数团队只是在旧工作流程上点缀AI。他们仍然以AI出现前的方式进行编码，只不过有了更花哨的自动补全功能。

另一方面是那些精通代理（agent）集群，系统地解决问题的人。例如，我的一位工程师在一个月内处理了35亿个token，经常并行运行四个代理，并让代理审查其他代理的工作。当我们采纳了一个有纪律的系统时，我们的吞吐量在几个月内翻了一番。

AI优先工程：系统

就像21世纪初的敏捷开发一样，AI优先工程是一个系统，而不是一系列技巧。其关键实践包括：

规范驱动开发（SDD）: 将工作分解为三个步骤：从高层规范开始 → 技术规范（包含真实的接口，而非伪代码） → 逐步执行计划。让代理共同创建，但要保持人类的参与。例如，如果你想为你的应用程序添加Google日历集成，你将首先要求代理帮助你编写产品需求。然后你将审查这些需求并进行编辑（手动或通过后续提示）。接着，你将要求另一个代理阅读产品需求，深入分析你的代码库并创建技术规范。然后你将（自行或在另一个代理的帮助下）审查技术规范。然后，你将要求下一个代理根据规范创建一份逐步执行计划。

上述实践允许你频繁重置代理的上下文。代理运行的时间越长，上下文长度开始干扰其推理能力的可能性就越高。规范驱动开发是一种将正确上下文与正确提示相结合的自然方式。打个比方，可以将其视为人类专注工作与分心工作之间的区别。

下一个重要概念是自我验证：这使得编码代理比早期版本的GPT强大得多。当得到正确提示时，它们会尝试测试自己的工作并纠正在过程中发现的错误。日志记录和遥测帮助代理自行调试——这是一个巨大的进步。当我进入一个新的代码库时，在启动我的编码代理之前，我首先要求它们为未来的参考构建一些基本文档，然后要求代理审查并改进日志记录和遥测，以使调试更加容易。

如今，我很少要求代理直接编写代码。我提示它们先编写测试，这种实践被称为测试驱动开发（TDD）。这极大地提高了代理的自我验证能力。

最后但同样重要的是，保持简单（KISS）。我们的主代码库变得如此复杂，以至于我们的新员工都很难理解。在这种设置下，任何AI代理都无法成功。是时候刷新和简化架构了。更清晰的代码库不仅对人类有益；它们还能使代理更有效率。

这些实践共同创建了一个足够强大的系统，可以将氛围编程引导成真正的速度。

基础设施层

像Claude Code和Codex这样的工具正在彻底改变开发者体验。但如果没有编排，它们可能会变得碎片化：重复的配置、孤立的代理、丢失的上下文。

这就是像Zencoder这样的平台的作用：一个在你现有AI订阅之上构建的UI和编排层。你无需在ChatGPT、Claude或Gemini之间做出选择，你可以将它们全部接入一个工作流程，合并限制，并行运行代理，并开箱即用地获得合规性、分析和团队协作。

超越炒作曲线

我们仍处于早期阶段。如今，最优秀的团队可以将吞吐量翻倍。

这仍然需要强大的工程师、AI优先实践、前沿模型访问以及代理可消化的代码库的罕见组合。但这种组合正在增长，成功也在增加。实现10倍增长的道路在于带有自我验证的代理群，这允许自主执行，从而倍增并行执行，并由民主化的访问支持，让任何人都可以通过日常订阅利用企业级推理。

氛围编程是火花。AI优先工程是缰绳。如果历史有任何借鉴意义，一旦这个系统扎根，今天的“我们吞吐量翻倍”将感觉像是一场热身表演。