我从 OpenAI《我们如何使用 Codex 在 28 天内构建 Android 版 Sora》看到了什么OpenAI

OpenAI 原文：openai.com/zh-Hans-CN/…

OpenAI 开发者团队在 2025.12.12 发布了我标题中的这篇文章。日常开发中我已经离不开 AI Coding，所以我对顶级模型团队如何应用 AI Coding 也非常好奇。期望能从中学习到一些技巧帮助我更好的利用 AI 工具。但读完之后带给我最大冲击的不是文章中的技巧，而是 AI Coding（Vibe Coding 也许更合适）已经真的在投入千万级日活应用的生产了。

OpenAI 讲了什么故事

一句话：4个人，28 天，消耗 50亿 Token，完成了一个千万日活的应用。

4 个人

打破《人月神话》的魔咒。

通常情况下，开发一个千万级用户的生产级应用（Sora Android 版）需要几十人的团队数月的协作。根据软件工程名著《人月神话》中的“布鲁克斯定律”：向滞后的软件项目添加人力只会使其更滞后（因为沟通成本指数级上升）。
OpenAI 反其道而行之，保持了一个极其精简的 4人精英特种部队。他们没有通过增加“人”来提升产能，而是通过让每个人配备无限的 AI 算力来通过“扩增智能”解决问题。这 4 位工程师不再是单纯的代码编写者，而是转型为架构师、产品经理和代码审查员，指挥 AI 完成了 85% 的代码编写工作。

28 天

从原型到登顶应用商店的极限冲刺。

时间线：项目于 2025 年 10 月 8 日启动，11 月 5 日即完成发布。
结果：发布首日即登顶 Google Play 榜首，24 小时内用户生成了超过 100 万个视频。
质量：尽管速度惊人，但并未牺牲质量，应用保持了 99.9% 的无崩溃率。

团队利用 Codex 的并行处理能力，将原本需要串行开发的模块（如播放器、搜索、网络层）同时推进，极大地压缩了物理时间。

消耗 50亿 Token

用“算力”换“人力”和“时间”。

这 50 亿 Token 是 AI 在这 28 天内“思考”和“编码”的燃料。这不仅仅是生成最终代码的消耗，更包括了大量的阅读、理解、规划和试错。

模型：使用了 GPT-5.1-Codex 模型（具有更强的长上下文和推理能力）。
工作流：AI 不是一次性生成代码，而是反复阅读项目上下文，理解需求，生成计划，再编写代码。这种巨大的 Token 消耗代表了 AI 在幕后进行了海量的“思维链”推演，替代了人类工程师数千小时的脑力劳动。

有什么感想

1. 难以想象的效率提升

最近我在做项目的多租户适配，借助最新的编码模型（模型使用：Claude Sonnet&Opus 4.5 / GPT-5.1 Code X / Gemini 3 Pro）3 个核心类目的适配，5000+ 行代码，1 天时间完成，0 bug 运行，90% 的效率提升。

按照传统方案至少是一周的工作量。在 1 年前我还不敢想 AI 编写的代码质量已经如此之高。当时“将 AI 投入大段生产代码的编写是不可能的”还是程序员的共识，而现在几乎是日常

2. 效率提升并非线性在 AI 时代仍然适用

第一点我说 AI 带来了难以想象的效率提升，而要提升这么多（90%）效率其实有一个前提——单人或者极小团队（OpenAI 团队只用了 4人团队）。

“正如你无法通过不断增派工程师就指望项目工期线性缩短一样。每增加一双“手”，即使是虚拟的，也会增加协调工作的开销” 。

所以我认为未来更小、更灵活、能自闭环的团队会越来越多。

⚠️ 谨慎、谨慎再谨慎！！！：那些省下来的编码时间应该拿出大半用来思考架构设计，审阅 AI 生成的代码。效率提升并非线性，我们甚至要提防“线性”的提升。如果只是一味追求速度而不做设计，AI 制造“ 💩 山”的速度也将是人类的 10 倍。

在这种模式下，项目的瓶颈不再是编码速度，而是决策速度和 Code Review 的速度。

3. AI 时代的工程师角色转变

人人都要适应从开发者到架构师的转变，《重构》、《编程珠玑》、《设计模式》这些经典书籍没有变成废纸，反而是我们对抗 AI 平庸代码的最后防线。

我们要做的不再是编写代码，而是设计、审阅 AI 编写的代码符不符合“最佳实践”。我使用 AI Coding 时总是让模型“思考最佳实践再行动”，但是模型不一定能理解什么是“最佳实践”。

当 Coding 变得零成本， “鉴赏力（Taste）” 变得无比昂贵。我们需要一眼嗅出代码中“腐坏的味道”。

4. 想法与落地界线开始模糊

这个时代对懒人很友好，对有想法的懒人更友好。

以前我们有想法但是没有落地，最大的原因是 ROI 不高，投入时间长，收益低。

得益于 AI 带来的超高效率提升，我们需要推导出新的“ROI 公式”。以前评估要投入 1 个月的项目，现在也许在一个空闲的下午就能做出 MVP 版本，一周就能上线。

5. 跨平台框架的未来

过去为了提效 flutter、react native 等跨平台非常火热，一套代码随处运行。带来的是 100% 的效率提升。但同样带来的是更低用户体验。

在 AI Coding 的今天，基于 ios 构建一套 android 版本不再是问题，效率不再是瓶颈。我们也许可以抛弃“套壳”，拥抱 100% 的原生体验，借助 AI 我们能做到“既要又要”了。

学到了什么

最后也从 OpenAI 的分享中学到了一些实践技巧，主要是下面两点

规划：Plan before Code. 永远不要让 AI 上来就写代码。

实践：强制要求 AI 在编码前输出一份 PLAN.md 或输出实现思路。让 AI 先用自然语言复述它对需求的理解、计划修改的文件以及潜在的副作用。
价值：这一步是纠正“AI 幻觉”的最佳时机。我们在文本阶段修改逻辑，远比在代码阶段 Debug 要快得多。

示例（Few-Shot / Context）：打造团队的 AGENTS.md

困境：模型不一定理解你口中的“最佳实践”是什么。
解法：建立一份项目级的 AGENTS.md（或类似 Prompt 库，大部分 IDE 都支持这种方式）。里面不只是写规则，写项目背景，放代码范例（或者指向示例的文件）。你希望代码写成什么样，就给它看什么样的样本。