OpenAI 原文:openai.com/zh-Hans-CN/…
OpenAI 开发者团队在 2025.12.12 发布了我标题中的这篇文章。日常开发中我已经离不开 AI Coding,所以我对顶级模型团队如何应用 AI Coding 也非常好奇。期望能从中学习到一些技巧帮助我更好的利用 AI 工具。但读完之后带给我最大冲击的不是文章中的技巧,而是 AI Coding(Vibe Coding 也许更合适)已经真的在投入千万级日活应用的生产了。
OpenAI 讲了什么故事
一句话:4个人,28 天,消耗 50亿 Token,完成了一个千万日活的应用。
4 个人
打破《人月神话》的魔咒。
通常情况下,开发一个千万级用户的生产级应用(Sora Android 版)需要几十人的团队数月的协作。根据软件工程名著《人月神话》中的“布鲁克斯定律”:向滞后的软件项目添加人力只会使其更滞后(因为沟通成本指数级上升)。
OpenAI 反其道而行之,保持了一个极其精简的 4人精英特种部队。他们没有通过增加“人”来提升产能,而是通过让每个人配备无限的 AI 算力来通过“扩增智能”解决问题。这 4 位工程师不再是单纯的代码编写者,而是转型为架构师、产品经理和代码审查员,指挥 AI 完成了 85% 的代码编写工作。
28 天
从原型到登顶应用商店的极限冲刺。
- 时间线:项目于 2025 年 10 月 8 日启动,11 月 5 日即完成发布。
- 结果:发布首日即登顶 Google Play 榜首,24 小时内用户生成了超过 100 万个视频。
- 质量:尽管速度惊人,但并未牺牲质量,应用保持了 99.9% 的无崩溃率。
团队利用 Codex 的并行处理能力,将原本需要串行开发的模块(如播放器、搜索、网络层)同时推进,极大地压缩了物理时间。
消耗 50亿 Token
用“算力”换“人力”和“时间”。
这 50 亿 Token 是 AI 在这 28 天内“思考”和“编码”的燃料。这不仅仅是生成最终代码的消耗,更包括了大量的阅读、理解、规划和试错。
- 模型:使用了 GPT-5.1-Codex 模型(具有更强的长上下文和推理能力)。
- 工作流:AI 不是一次性生成代码,而是反复阅读项目上下文,理解需求,生成计划,再编写代码。这种巨大的 Token 消耗代表了 AI 在幕后进行了海量的“思维链”推演,替代了人类工程师数千小时的脑力劳动。
有什么感想
1. 难以想象的效率提升
最近我在做项目的多租户适配,借助最新的编码模型(模型使用:Claude Sonnet&Opus 4.5 / GPT-5.1 Code X / Gemini 3 Pro)3 个核心类目的适配,5000+ 行代码,1 天时间完成,0 bug 运行,90% 的效率提升。
按照传统方案至少是一周的工作量。在 1 年前我还不敢想 AI 编写的代码质量已经如此之高。当时“将 AI 投入大段生产代码的编写是不可能的”还是程序员的共识,而现在几乎是日常
2. 效率提升并非线性在 AI 时代仍然适用
第一点我说 AI 带来了难以想象的效率提升,而要提升这么多(90%)效率其实有一个前提——单人或者极小团队(OpenAI 团队只用了 4人团队)。
“正如你无法通过不断增派工程师就指望项目工期线性缩短一样。每增加一双“手”,即使是虚拟的,也会增加协调工作的开销” 。
所以我认为未来更小、更灵活、能自闭环的团队会越来越多。
⚠️ 谨慎、谨慎再谨慎!!!:那些省下来的编码时间应该拿出大半用来思考架构设计,审阅 AI 生成的代码。效率提升并非线性,我们甚至要提防“线性”的提升。如果只是一味追求速度而不做设计,AI 制造“ 💩 山”的速度也将是人类的 10 倍。
在这种模式下,项目的瓶颈不再是编码速度,而是决策速度和 Code Review 的速度。
3. AI 时代的工程师角色转变
人人都要适应从开发者到架构师的转变,《重构》、《编程珠玑》、《设计模式》这些经典书籍没有变成废纸,反而是我们对抗 AI 平庸代码的最后防线。
我们要做的不再是编写代码,而是设计、审阅 AI 编写的代码符不符合“最佳实践”。我使用 AI Coding 时总是让模型“思考最佳实践再行动”,但是模型不一定能理解什么是“最佳实践”。
当 Coding 变得零成本, “鉴赏力(Taste)” 变得无比昂贵。我们需要一眼嗅出代码中“腐坏的味道”。
4. 想法与落地界线开始模糊
这个时代对懒人很友好,对有想法的懒人更友好。
以前我们有想法但是没有落地,最大的原因是 ROI 不高,投入时间长,收益低。
得益于 AI 带来的超高效率提升,我们需要推导出新的“ROI 公式”。以前评估要投入 1 个月的项目,现在也许在一个空闲的下午就能做出 MVP 版本,一周就能上线。
5. 跨平台框架的未来
过去为了提效 flutter、react native 等跨平台非常火热,一套代码随处运行。带来的是 100% 的效率提升。但同样带来的是更低用户体验。
在 AI Coding 的今天,基于 ios 构建一套 android 版本不再是问题,效率不再是瓶颈。我们也许可以抛弃“套壳”,拥抱 100% 的原生体验,借助 AI 我们能做到“既要又要”了。
学到了什么
最后也从 OpenAI 的分享中学到了一些实践技巧,主要是下面两点
规划:Plan before Code. 永远不要让 AI 上来就写代码。
- 实践:强制要求 AI 在编码前输出一份 PLAN.md 或输出实现思路。让 AI 先用自然语言复述它对需求的理解、计划修改的文件以及潜在的副作用。
- 价值:这一步是纠正“AI 幻觉”的最佳时机。我们在文本阶段修改逻辑,远比在代码阶段 Debug 要快得多。
示例(Few-Shot / Context):打造团队的 AGENTS.md
- 困境:模型不一定理解你口中的“最佳实践”是什么。
- 解法:建立一份项目级的 AGENTS.md(或类似 Prompt 库,大部分 IDE 都支持这种方式)。里面不只是写规则,写项目背景,放代码范例(或者指向示例的文件)。你希望代码写成什么样,就给它看什么样的样本。