Vibe Coding 一周年:从“写代码”到“交付结果”,AI 编程这一年
2025 年 2 月初,Andrej Karpathy 抛出 vibe coding 这个词:你不再执着于“每一行都由我亲手写、我完全掌控”,而是用自然语言描述目标,让模型生成与修改代码;你不断试错、不断迭代,更多靠“跑起来的感觉”和验收标准推进,而不是逐行推敲。它听起来像玩笑,但它指向了一个严肃变化:编程的重心正在从“写”转向“组织、验证与交付”。
这一年里,真正改变格局的并不是某个单点功能,而是三股力量叠加:
- 模型能力跃迁(更强推理、更长上下文、更稳定的工程输出)
- 代理式工作流agentic workflow(AI 不只“建议”,还能“动手干活”)
- 协议与规范标准化(MCP、Agent Skills 让“工具接入 + 组织流程”可复制)
于是,“vibe”逐渐褪去口号意味,变成了可落地的工程范式:人给目标与约束,AI 负责推进任务链路,人把关风险与验收。
1)Copilot 时代:效率提升巨大,但开发的“主语”仍然是人
GitHub Copilot 的意义不需要夸张:它把补全从“语法级”推到“函数级”,让很多重复劳动瞬间提速。可它没有立刻颠覆开发方式——原因很简单:它大多数时候仍是 IDE 的外挂。
你依旧需要自己完成那条最耗时的链路:
- 理解需求、定位改动点
- 跨文件重构、处理边界条件
- 跑测试、修失败、再验证
- 写文档、提 PR、过 review
Copilot 把“写得更快”做到了极致,但工程推进仍主要靠人来串联。
2)Cursor:AI 从“外挂”变成“编辑器的操作系统”
接下来真正“变味”的,是 AI-first 编辑器的崛起,而 Cursor 是代表作之一。
Cursor 之所以让许多人感觉“这才是未来”,并不只是 UI 更顺手,而是它把“上下文与行动”前置了:
- AI 能围绕仓库理解做跨文件修改
- 输出可应用的 patch,而不是只给建议让你复制粘贴
- 你用“目标/约束/验收”驱动,而不是用“片段/语法”驱动
但关键点你说得非常准:**Cursor 好用的前提,是模型能力真的上来了。**当 Claude 3.5 这一代模型在复杂推理、长上下文一致性、跨文件修改质量上明显提升后,AI-first 编辑器才从“玩具”变成“主力”。
3)Windsurf、v0:从“写代码”转向“生成产品形态”,同时带来新风险
Cursor 把“编辑器里更自然地用 AI”带火后,另一条线开始加速:直接从描述生成可运行产品形态。
- **Windsurf(原 Codeium)**强调“代理式 IDE”:AI 不只写代码,还能多步执行,跟着项目状态主动推进。
- Vercel v0把“描述 → UI → 可迭代代码”产品化,让前端原型落地速度爆炸。
但这条路也让一个现实更尖锐:**当生成速度极快,真正稀缺的就不再是“写”,而是“审计、验证与安全”。**同样的生成能力,可以用来快速搭页面,也可以被用来更快搭仿冒登录页、钓鱼站点。AI 编程进入规模化之后,安全与治理就不再是“可选项”。
4)真正的爆发点:Claude Code 把“会写”升级成“会干活”
如果说 Cursor/Windsurf 解决的是“在 IDE 里怎么更好用 AI”,那么 Claude Code 把战场推进到了工程执行层:让 AI 在终端里完成真实工程链路。
它的质变不在“写得更像人”,而在“像工程师一样做事”:
- 改动前做 checkpoint,失败可回滚
- 用 subagents 拆分子任务并行推进
- 用 hooks 把“改完自动跑测试/检查”内建
- 支持长任务更自主地跑完流程
这套机制把软件开发最重的那条链路(理解 → 修改 → 运行/测试 → 修复 → 再验证)交给代理执行,同时保留“可撤回与可审查”的控制点。
更稳妥的表述是:Claude Code 让“把工程任务外包给 AI,并在可控边界内验收结果”在大量常见场景中变得可用;它更像一个可雇佣的工程执行力,而不是“无需监督的全能程序员”。
5)CLI 大混战:从 IDE 之争走向“代理平台之争”
当 Claude Code 证明“终端里的代理”能成为主入口,其他家自然不会旁观。于是你看到的“CLI 大混战”就出现了:从 Codex CLI 开始,各家争先推出 CLI/Agent 工具,争的其实是两件事:
- 本地可控:读写仓库、跑命令、环境隔离、审批与审计
- 云端可扩展:长任务、并行子代理、更强算力、更大上下文
同时,平台开始把代理收编进协作体系(issue/PR/review/日志/权限),代理不再只是个人效率工具,而逐渐成为团队工程系统的一部分。
6)开源模型大战:国产开源 把“全民可用的工程模型”往前推了一步
“开源模型大战”的意义,不只在“便宜”,而在于它把 AI 编程推进到一个新范围:可以本地化、可定制、可组合、可治理。
以 GLM-4.5 /mimimax2.1/Kimi 2.5这类面向推理与编码的开源/开放权重模型为例,它推动了更多开发者与组织把 AI 编程落到真实生产环境:敏感代码库可以私有部署,企业流程可以做定制,工具链可以深度集成。
当“模型可获得性”大幅提升,就会自然引发一波“全民 coding”的浪潮:不是人人都去写复杂系统,而是人人都开始把“编程”当成一种可随手调用的生产力。
7)MCP 与 Agent Skills:让“AI 自主编程”从 Demo 走向工程
你提到的 MCP、Agent Skills 规范化,其实是这一年里最关键、也最容易被低估的基础设施变化。
- MCP解决的是“模型如何接入上下文与工具”的标准化问题:不再每个 IDE/每个系统都做一套私有集成。
- Agent Skills解决的是“组织经验如何被代理复用”的问题:把流程、规范、脚本、资源打包成技能,让 agent 像新员工 onboarding 一样快速具备领域能力。
它们共同带来的变化是:AI 不再只靠 prompt 临时发挥,而是开始具备“可移植的工作能力”,并能被纳入权限、审计与流程治理之中。于是“自主编程”才从演示走向可控落地。
8)最后的王牌:Opus 4.5/Codex 5.3 与“代理工作流闭环”
很多人喜欢把“终局”归功于某个旗舰模型(比如 Opus 4.5)。更准确的说法是:旗舰模型 + 代理工作流形成闭环后,才出现你说的那种“爆发感”。
- 更强模型让长链路任务更稳、更少返工
- 代理工作流让执行变得可审计、可回滚、可并行
- 协议与技能标准让工具接入与流程复用成为常态
于是我们看到:AI 编程从“写得像”走向“做得完”,从“单点生成”走向“端到端交付”。
9)2026 年的趋势:写代码不再稀缺,稀缺的是验证与责任
如果把 2026 年的趋势写成三句话:
-
“写”会越来越自动化
从需求描述到跨文件实现、从重构到迁移,AI 会承担更大比例的编码执行。
-
“测”会越来越自动化,但责任不会消失
测试生成、回归验证、静态检查、CI 修复会更多交给 AI;但安全、合规、正确性责任仍必须由人/组织承担。
-
真正的分水岭是“可控性”
谁能把代理纳入权限体系、审计体系、质量体系,谁就能把 AI 编程从“个人效率”升级为“组织生产力”。
结尾
Vibe coding 的“vibe”会退潮,但代理化开发不会。 一年前我们还在讨论“能不能不看代码凭感觉写”;一年后,问题变成了:任务怎么拆、约束怎么设、验证怎么做、风险怎么关进笼子——这才是 AI 编程进入主航道的标志。