vibe coding 工具测试Vibe Coding 是近来在开发者社区流行起来的一个概念，它指的是一种借助 AI 辅

Vibe Coding 是近来在开发者社区流行起来的一个概念，它指的是一种借助 AI 辅助、更加轻松流畅的编程方式。不同于传统的“人写→机编译→人调试”的线性流程，Vibe Coding 更像是一种人与AI 协作的即兴创作:开发者通过自然语言描述意图，AI 即时生成和修改代码，甚至能够边写边运行、边调边看效果。这种方式让编程不再是纯粹的体力劳动，而更像是和 AI 一起“jam(即兴演奏)”，带有氛围感与创造性，因此被称为 Vibe Coding。

编程大模型

指的是那些专注于代码理解与生成能力极强、作为底层“智力基础”的模型。例如有像 DeepSeek-V3.1、Claude-4.1 这样的通用但编程能力非常强的基座模型;再比如 GPT-5-Codex 或 Qwen3 Code 这些，是在类似基础模型上，经过强化学习、细致调优与实战工程任务训练后的“专业编程大模型”，它们在代码重构、测试、复杂项目架构设计等方面性能更加优异。

编程 agent

则是指基于这些大模型之上的完整系统或智能体，它不仅仅负责“写代码”，还负责在真实开发场景中完成项目管理、功能测试、需求审核、产品原型调整、文件管理、命令行执行、甚至视觉识别/截图到前端生成页面这样的端到端工作流。例如 Claude Code、OpenAI 的 Codexagent(含 GPT-5-Codex 的新功能)、Gemini CLI、Qwen3 Coder 等，都属于编程 Agent 的范畴。

从图中可以看出，最强的工具还是openai的codex, Anthropic的claude code。两者比下来codex费用低些。

编程工具

指基于这些大模型，agent之上的编程IDE。它们超越了传统的代码补全工具，能够在真实开发环境中承担需求分析、项目搭建、代码审查、自动化测试乃至前端预览等全链路任务，为开发者提供从概念到交付的端到端生产力提升。例如：cursor，Trae，windsurf

案例测试

下面以生成 2048小游戏为例，测试下各工具的效果。因为“墙”的原因，选取了国内的几个工具，qwen, cursor,baidu comate.

第一轮：提示词：

用js创建2048的小游戏。

qwen

生成的游戏界面是不正常的，游戏也不能玩.

cursor

生成的游戏界面是正常的，游戏也能玩，但经常出现一些诡异的现象，例如：莫名奇妙的出现几张卡片，游戏玩的很诡异.

第二轮：修改提示词,把游戏的具体规则加上：

js生成2048小游戏有，规则如下：游戏场地：2048游戏在一个4x4的方格中进行，初始时会随机生成两个数字（通常是2或4）。
操作方式：玩家可以通过上下左右滑动来移动所有方块。每次滑动后，所有方块会向滑动的方向靠拢。相同数字的方块在碰撞时会合并成它们的和。例如，两个2会合并成一个4，两个4会合并成一个8，依此类推。 
生成新数字：每次滑动后，系统会在空白格子中随机生成一个新的数字（通常是2或4）。 
胜利条件：当玩家成功合并出一个2048的方块时，游戏胜利。 
失败条件：如果所有格子都被数字填满，并且没有相邻的格子可以合并，游戏结束。

qwen code

生成3个文件，生成的游戏界面是不居中，游戏也有bug.

cursor

生成4个文件，生成的游戏界面是正常的，游戏也能很顺畅，还额外生成server.js 文件，可以发布成http服务。

baidu comate

生成3个文件，生成的游戏界面是正常的，游戏也能很顺畅.

测试下来， cursor > baidu comate > qwen code. 让人意外的，baidu comate 效果比qwen code强。

ps :

trae是字节出的编程IDE, 但这段时间上去，总是提示排队，无法正常使用。
cursor 免费版有次数限制，可以删了用户，再重新注册，就又能正常使用。