Vibe Coding 一周年：从“写代码”到“交付结果”，AI 编程这一年Vibe Coding 一周年：从“写代码

Vibe Coding 一周年：从“写代码”到“交付结果”，AI 编程这一年

2025 年 2 月初，Andrej Karpathy 抛出 vibe coding 这个词：你不再执着于“每一行都由我亲手写、我完全掌控”，而是用自然语言描述目标，让模型生成与修改代码；你不断试错、不断迭代，更多靠“跑起来的感觉”和验收标准推进，而不是逐行推敲。它听起来像玩笑，但它指向了一个严肃变化：编程的重心正在从“写”转向“组织、验证与交付”。 1770451926474-Code_Writing_To_Result_Delivery____02____0001.png

这一年里，真正改变格局的并不是某个单点功能，而是三股力量叠加：

模型能力跃迁（更强推理、更长上下文、更稳定的工程输出）
代理式工作流agentic workflow（AI 不只“建议”，还能“动手干活”）
协议与规范标准化（MCP、Agent Skills 让“工具接入 + 组织流程”可复制）于是，“vibe”逐渐褪去口号意味，变成了可落地的工程范式：人给目标与约束，AI 负责推进任务链路，人把关风险与验收。

1）Copilot 时代：效率提升巨大，但开发的“主语”仍然是人

1770451962823-Code_Writing_To_Result_Delivery____04____0001.png GitHub Copilot 的意义不需要夸张：它把补全从“语法级”推到“函数级”，让很多重复劳动瞬间提速。可它没有立刻颠覆开发方式——原因很简单：它大多数时候仍是 IDE 的外挂。

你依旧需要自己完成那条最耗时的链路：

理解需求、定位改动点
跨文件重构、处理边界条件
跑测试、修失败、再验证
写文档、提 PR、过 review

Copilot 把“写得更快”做到了极致，但工程推进仍主要靠人来串联。

2）Cursor：AI 从“外挂”变成“编辑器的操作系统”

1770452167768-Code_Writing_To_Result_Delivery____05____0001.png 接下来真正“变味”的，是 AI-first 编辑器的崛起，而 Cursor 是代表作之一。

Cursor 之所以让许多人感觉“这才是未来”，并不只是 UI 更顺手，而是它把“上下文与行动”前置了：

AI 能围绕仓库理解做跨文件修改
输出可应用的 patch，而不是只给建议让你复制粘贴
你用“目标/约束/验收”驱动，而不是用“片段/语法”驱动

但关键点你说得非常准：**Cursor 好用的前提，是模型能力真的上来了。**当 Claude 3.5 这一代模型在复杂推理、长上下文一致性、跨文件修改质量上明显提升后，AI-first 编辑器才从“玩具”变成“主力”。

3）Windsurf、v0：从“写代码”转向“生成产品形态”，同时带来新风险

1770452201087-Code_Writing_To_Result_Delivery____06____0001.png Cursor 把“编辑器里更自然地用 AI”带火后，另一条线开始加速：直接从描述生成可运行产品形态。

**Windsurf（原 Codeium）**强调“代理式 IDE”：AI 不只写代码，还能多步执行，跟着项目状态主动推进。
Vercel v0把“描述 → UI → 可迭代代码”产品化，让前端原型落地速度爆炸。

但这条路也让一个现实更尖锐：**当生成速度极快，真正稀缺的就不再是“写”，而是“审计、验证与安全”。**同样的生成能力，可以用来快速搭页面，也可以被用来更快搭仿冒登录页、钓鱼站点。AI 编程进入规模化之后，安全与治理就不再是“可选项”。

4）真正的爆发点：Claude Code 把“会写”升级成“会干活”

1770452216454-Code_Writing_To_Result_Delivery____07____0001.png 如果说 Cursor/Windsurf 解决的是“在 IDE 里怎么更好用 AI”，那么 Claude Code 把战场推进到了工程执行层：让 AI 在终端里完成真实工程链路。

它的质变不在“写得更像人”，而在“像工程师一样做事”：

改动前做 checkpoint，失败可回滚
用 subagents 拆分子任务并行推进
用 hooks 把“改完自动跑测试/检查”内建
支持长任务更自主地跑完流程

这套机制把软件开发最重的那条链路（理解 → 修改 → 运行/测试 → 修复 → 再验证）交给代理执行，同时保留“可撤回与可审查”的控制点。

更稳妥的表述是：Claude Code 让“把工程任务外包给 AI，并在可控边界内验收结果”在大量常见场景中变得可用；它更像一个可雇佣的工程执行力，而不是“无需监督的全能程序员”。

5）CLI 大混战：从 IDE 之争走向“代理平台之争”

1770452245005-Code_Writing_To_Result_Delivery____08____0001.png 当 Claude Code 证明“终端里的代理”能成为主入口，其他家自然不会旁观。于是你看到的“CLI 大混战”就出现了：从 Codex CLI 开始，各家争先推出 CLI/Agent 工具，争的其实是两件事：

本地可控：读写仓库、跑命令、环境隔离、审批与审计
云端可扩展：长任务、并行子代理、更强算力、更大上下文

同时，平台开始把代理收编进协作体系（issue/PR/review/日志/权限），代理不再只是个人效率工具，而逐渐成为团队工程系统的一部分。

6）开源模型大战：国产开源把“全民可用的工程模型”往前推了一步

1770452283216-Code_Writing_To_Result_Delivery____09____0001.png “开源模型大战”的意义，不只在“便宜”，而在于它把 AI 编程推进到一个新范围：可以本地化、可定制、可组合、可治理。

以 GLM-4.5 /mimimax2.1/Kimi 2.5这类面向推理与编码的开源/开放权重模型为例，它推动了更多开发者与组织把 AI 编程落到真实生产环境：敏感代码库可以私有部署，企业流程可以做定制，工具链可以深度集成。

当“模型可获得性”大幅提升，就会自然引发一波“全民 coding”的浪潮：不是人人都去写复杂系统，而是人人都开始把“编程”当成一种可随手调用的生产力。

7）MCP 与 Agent Skills：让“AI 自主编程”从 Demo 走向工程

你提到的 MCP、Agent Skills 规范化，其实是这一年里最关键、也最容易被低估的基础设施变化。 1770452300910-Code_Writing_To_Result_Delivery____10____0001.png

MCP解决的是“模型如何接入上下文与工具”的标准化问题：不再每个 IDE/每个系统都做一套私有集成。
Agent Skills解决的是“组织经验如何被代理复用”的问题：把流程、规范、脚本、资源打包成技能，让 agent 像新员工 onboarding 一样快速具备领域能力。

它们共同带来的变化是：AI 不再只靠 prompt 临时发挥，而是开始具备“可移植的工作能力”，并能被纳入权限、审计与流程治理之中。于是“自主编程”才从演示走向可控落地。

8）最后的王牌：Opus 4.5/Codex 5.3 与“代理工作流闭环”

1770452317291-Code_Writing_To_Result_Delivery____11____0001.png 很多人喜欢把“终局”归功于某个旗舰模型（比如 Opus 4.5）。更准确的说法是：旗舰模型 + 代理工作流形成闭环后，才出现你说的那种“爆发感”。

更强模型让长链路任务更稳、更少返工
代理工作流让执行变得可审计、可回滚、可并行
协议与技能标准让工具接入与流程复用成为常态

于是我们看到：AI 编程从“写得像”走向“做得完”，从“单点生成”走向“端到端交付”。

9）2026 年的趋势：写代码不再稀缺，稀缺的是验证与责任

如果把 2026 年的趋势写成三句话：

“写”会越来越自动化 从需求描述到跨文件实现、从重构到迁移，AI 会承担更大比例的编码执行。
“测”会越来越自动化，但责任不会消失

测试生成、回归验证、静态检查、CI 修复会更多交给 AI；但安全、合规、正确性责任仍必须由人/组织承担。
真正的分水岭是“可控性”

谁能把代理纳入权限体系、审计体系、质量体系，谁就能把 AI 编程从“个人效率”升级为“组织生产力”。

结尾

Vibe coding 的“vibe”会退潮，但代理化开发不会。 一年前我们还在讨论“能不能不看代码凭感觉写”；一年后，问题变成了：任务怎么拆、约束怎么设、验证怎么做、风险怎么关进笼子——这才是 AI 编程进入主航道的标志。

Vibe Coding 一周年：从“写代码”到“交付结果”，AI 编程这一年