Vibe coding 探索之路

0 阅读6分钟

Vibe Coding 探索之路

Vibe Coding(氛围编程)是一种基于大语言模型(LLM)的全新编程范式。

核心在于:放弃传统编写代码,转而用自然语言向 AI 描述需求,由 AI 自动生成、修改和调试代码。

本文记录了我从使用 LLM 辅助开发,到完全依赖 AI 进行编码的演进历程。这段旅程分为四个阶段:

  1. 自动补全 —— AI 作为代码助手
  2. Prompt 工程 —— 学会与 AI 有效沟通
  3. SDD(规范驱动开发) —— 建立 AI 驱动的工作流
  4. Superpowers —— 追求极致效率

阶段一:自动补全

2024 年中,我初次接触 Cursor。那时的大模型远没有今天这般智能,但 Cursor 的创新在于将 AI 功能集成到 IDE 中——无需再将代码复制到 GPT 的对话框,然后再将结果粘回编辑器。

这个阶段使用最多的是 Cursor 的自动补全功能,它能稍微提高代码编写效率。偶尔会使用 Cursor 的对话功能生成一些通用函数。就这样使用了几个月。

Cursor 使用了一段时间后出现(too many free trial accounts used on this machine),无法继续"白嫖"。

后续有使用过 Copilot、Trae 和 CodeBuddy 等。


阶段二:Prompt 工程

2025 年初,公司提供了 Cursor Pro 账号。此时 AI 模型的能力已进步很多,可以尝试让 AI 编写一些功能函数,例如数据转换函数。

发现 AI 在这些简单函数上表现不错后,开始更多地使用 AI 来辅助编程。但 AI 的产出良莠不齐,需要通过 Prompt 设计 来"调教",才能得到可用的代码。

使用

这个阶段主要用 AI 做两类任务:

1. 代码优化

让 AI 对我编写的函数进行优化检查。AI 在语义明确性代码边界确认方面有较好的表现,大部分优化建议都可以采纳。

2. 功能拓展

项目做到一定阶段后,大部分需求是在原有基础上进行修改。由于项目积累了较多组件,很多新功能本可以复用现有组件——但部分组件在设计之初只考虑单一业务场景,没有过多考虑复用性。

使用 AI 来进行组件的抽离和复用。AI 的表现还不错,但在业务逻辑过于复杂时容易出错,仍需要较多的人工干预。

Cursor Rule

通过 Cursor Rule 来前置一些系统提示词,让 AI 以固定的风格、规范进行产出,并且介绍相关的项目架构、技术栈。

添加了 Cursor Rule 的限制后,AI 生成的代码质量有一定的提升。


阶段三:SDD(规范驱动开发)

随着日益强大的 Claude 3.5 模型出现,发现 AI 能够开发完整的功能。同时也有一批规范和流程以及开源工具被提出。

PromptX + OpenSpec 的开发

公司内部有大佬探索了 AI 开发的一些技巧:

  • 使用 PromptX 打造 AI 角色,不同的角色负责不同的任务
  • OpenSpec 让 AI 先生成 Proposal,然后根据对应 Proposal 去做代码的实现

探索一段时间后,结合这两个工具形成了最初阶段的 AI 开发工作流。

工作流

大概的流程是,通过 PromptX 创建多个角色负责不同的任务,并且通过扫描当前项目生成对应的知识库,不同的角色链接到不同的知识库中:

  1. 需求编写角色:分析 Prompt 了解需求,编写规范的需求文档
  2. 审核文档(人工)
  3. OpenSpec 助手:根据需求文档生成提案和分段任务
  4. 审核提案(人工)
  5. 代码编写助手:开始编写代码
  6. Code Review 助手:Review 代码
  7. 人工 Review 代码
  8. QA 助手:前端可以通过一些工具进行 Review(如 Cursor 自带的 Browser Tab),后端则通过单元测试
  9. 人工测试和提交代码

随着模型能力的增强,Opus 模型的出现,这个阶段已基本不在"古法编程"了(手敲代码)。


阶段四:Superpowers

上述工作流和模型能力的加强,极大提升了 AI 开发的体验。但 Token 的消耗成了一个巨大的问题。Opus 昂贵的 Token 价格成了全 AI 开发的一个重大阻碍。

成本问题

Opus 模型虽然强大,但高昂的 Token 费用让日常开发变得奢侈。一次完整的开发流程下来,费用相当可观。

开始使用 Coding Plan 等其他模型来控制成本:

  • 在 Cursor 使用自定义的 API key,每百万 Token 被收取 $0.25 的过路费

新工具探索

开始使用其他工具 Claude Code——CLI 工具,没有中间商赚差价。

Superpowers 的出现

Superpowers 这个 Skill 套件出现在我眼前。它提供了一套完整的方法论:

  • Brainstorming —— 在动手前先思考,避免盲目开发
  • Writing Plans —— 先写计划再执行,减少返工
  • Test-Driven Development —— 测试驱动开发,保证代码质量
  • Verification Before Completion —— 完成前验证,避免返工
  • Dispatching Parallel Agents —— 并行多智能体,提升效率

当前状态

目前的工作流:

  • 使用 Codex + gpt-4.5 作为主要工具
  • 结合 Superpowers 的方法论规范开发流程
  • 在关键节点回归 Cursor(Opus),在简单任务上使用性价比更高的模型

总结与展望

回顾这段 Vibe Coding 探索之旅,从最初的自动补全辅助,到如今的 Superpowers 工作流,AI 编程能力经历了质的飞跃。

核心转变:

  • 从"AI 辅助写代码"到"AI 主导开发流程"
  • 从"关注单次效率"到"关注整体工作流"

未来方向:

  • 优化 AI 角色分工与协作
  • 在代码质量与开发速度之间寻找最佳平衡点

Vibe Coding 不是终点,而是一个全新的起点。


当前局限

全部使用 AI 开发,目前依旧存在一些局限:

1. 回归破坏

AI 在迭代新功能时,容易破坏原有的功能。

这种情况下需要程序员向 AI 描述错误表现并让其修复 Bug——有时多轮迭代都无法修复,需要升级到更强的模型,或者由程序员自己提供 Debug 思路。

2. 测试可信度

在完成功能前,AI 会自己编写测试用例,只有通过测试才算编码完成。但问题是:AI 会"撒谎"

  • 没通过的测试,它会说通过了
  • 测试用例无法通过时,它会自动修改测试用例使其"能够通过",而不是修复代码

此外,后端的某些 Bug 仅通过单元测试无法覆盖,比如内存中的数据状态异常、并发问题等。

3. 偷工减料

在完成一个需求时,AI 会通过注释的方式"欺骗"——说明某个函数有 XX 和 YY 能力,实际上这个函数只有 XX 能力,没有 YY 能力。

这种"文档与实现不一致"的问题,需要人工 Code Review 才能发现。

4. ...