从混乱氛围编程到AI优先工程的飞跃

65 阅读5分钟

氛围编程虽启发创造,但效率受限。AI优先工程通过规范驱动开发、自我验证、测试驱动开发、KISS原则等系统方法,结合基础设施,将混乱编程转化为生产力,实现吞吐量翻倍甚至十倍增长。

译自:From Chaotic Vibes to Real Velocity With AI-First Engineering

作者:Andrew Filev

2025年,氛围编程不再仅仅是一个网络迷因;它演变成了一场全面的运动。突然间,非开发人员在一夜之间就能快速开发应用,个体创业者沉迷于16小时的“再来一个提示”的狂热中,工程师们则以多巴胺冲击的速度分享着“脑洞大开”的时刻。

是的,氛围编程是混乱的。是的,它经常生成AI辅助的意大利面条式代码。但它也为数百万从未接触过编译器的人打开了软件创造的大门。它民主化了构建的乐趣,并激励了一代人去畅想。

挑战在于灵感不等于生产力。在某个时候,你需要一个系统。

氛围编程的瓶颈

研究通常将AI编程的生产力提升定在20%左右。这并非因为工具本身薄弱;而是因为大多数团队只是在旧工作流程上点缀AI。他们仍然以AI出现前的方式进行编码,只不过有了更花哨的自动补全功能。

另一方面是那些精通代理(agent)集群,系统地解决问题的人。例如,我的一位工程师在一个月内处理了35亿个token,经常并行运行四个代理,并让代理审查其他代理的工作。当我们采纳了一个有纪律的系统时,我们的吞吐量在几个月内翻了一番。

AI优先工程:系统

就像21世纪初的敏捷开发一样,AI优先工程是一个系统,而不是一系列技巧。其关键实践包括:

规范驱动开发(SDD): 将工作分解为三个步骤:从高层规范开始 → 技术规范(包含真实的接口,而非伪代码) → 逐步执行计划。让代理共同创建,但要保持人类的参与。例如,如果你想为你的应用程序添加Google日历集成,你将首先要求代理帮助你编写产品需求。然后你将审查这些需求并进行编辑(手动或通过后续提示)。接着,你将要求另一个代理阅读产品需求,深入分析你的代码库并创建技术规范。然后你将(自行或在另一个代理的帮助下)审查技术规范。然后,你将要求下一个代理根据规范创建一份逐步执行计划。

上述实践允许你频繁重置代理的上下文。代理运行的时间越长,上下文长度开始干扰其推理能力的可能性就越高。规范驱动开发是一种将正确上下文与正确提示相结合的自然方式。打个比方,可以将其视为人类专注工作与分心工作之间的区别。

下一个重要概念是自我验证:这使得编码代理比早期版本的GPT强大得多。当得到正确提示时,它们会尝试测试自己的工作并纠正在过程中发现的错误。日志记录和遥测帮助代理自行调试——这是一个巨大的进步。当我进入一个新的代码库时,在启动我的编码代理之前,我首先要求它们为未来的参考构建一些基本文档,然后要求代理审查并改进日志记录和遥测,以使调试更加容易。

如今,我很少要求代理直接编写代码。我提示它们先编写测试,这种实践被称为测试驱动开发(TDD)。这极大地提高了代理的自我验证能力。

最后但同样重要的是,保持简单(KISS)。我们的主代码库变得如此复杂,以至于我们的新员工都很难理解。在这种设置下,任何AI代理都无法成功。是时候刷新和简化架构了。更清晰的代码库不仅对人类有益;它们还能使代理更有效率。

这些实践共同创建了一个足够强大的系统,可以将氛围编程引导成真正的速度。

基础设施层

Claude CodeCodex这样的工具正在彻底改变开发者体验。但如果没有编排,它们可能会变得碎片化:重复的配置、孤立的代理、丢失的上下文。

这就是像Zencoder这样的平台的作用:一个在你现有AI订阅之上构建的UI和编排层。你无需在ChatGPT、Claude或Gemini之间做出选择,你可以将它们全部接入一个工作流程,合并限制,并行运行代理,并开箱即用地获得合规性、分析和团队协作。

超越炒作曲线

我们仍处于早期阶段。如今,最优秀的团队可以将吞吐量翻倍。

这仍然需要强大的工程师、AI优先实践、前沿模型访问以及代理可消化的代码库的罕见组合。但这种组合正在增长,成功也在增加。实现10倍增长的道路在于带有自我验证的代理群,这允许自主执行,从而倍增并行执行,并由民主化的访问支持,让任何人都可以通过日常订阅利用企业级推理。

氛围编程是火花。AI优先工程是缰绳。如果历史有任何借鉴意义,一旦这个系统扎根,今天的“我们吞吐量翻倍”将感觉像是一场热身表演。