vibe coding 工具测试

126 阅读4分钟

Vibe Coding 是近来在开发者社区流行起来的一个概念,它指的是一种借助 AI 辅助、更加轻松流畅的编程方式。不同于传统的“人写→机编译→人调试”的线性流程,Vibe Coding 更像是一种人与AI 协作的即兴创作:开发者通过自然语言描述意图,AI 即时生成和修改代码,甚至能够边写边运行、边调边看效果。这种方式让编程不再是纯粹的体力劳动,而更像是和 AI 一起“jam(即兴演奏)”,带有氛围感与创造性,因此被称为 Vibe Coding。

编程大模型

指的是那些专注于代码理解与生成能力极强、作为底层“智力基础”的模型。例如有像 DeepSeek-V3.1、Claude-4.1 这样的通用但编程能力非常强的基座模型;再比如 GPT-5-Codex 或 Qwen3 Code 这些,是在类似基础模型上,经过强化学习、细致调优与实战工程任务训练后的“专 业编程大模型”,它们在代码重构、测试、复杂项目架构设计等方面性能更加优异。

编程 agent

则是指基于这些大模型之上的完整系统或智能体,它不仅仅负责“写代码”,还负责在真 实开发场景中完成项目管理、功能测试、需求审核、产品原型调整、文件管理、命令行执行、甚至 视觉识别/截图到前端生成页面这样的端到端工作流。例如 Claude Code、OpenAI 的 Codexagent(含 GPT-5-Codex 的新功能)、Gemini CLI、Qwen3 Coder 等,都属于编程 Agent 的范畴。

image.png

从图中可以看出,最强的工具还是openai的codex, Anthropic的claude code。两者比下来codex费用低些。

编程工具

指基于这些大模型,agent之上的编程IDE。它们超越了传统的代码补全工具,能够在真实开发环境中承担需求分析、项目搭建、代码审查、自动化测试乃至前端预览等全链路任务,为开发者提供从概念到交付的端到端生产力提升。例如:cursor,Trae,windsurf

案例测试

下面以 生成 2048小游戏为例,测试下各工具的效果。因为“墙”的原因,选取了国内的几个工具,qwen, cursor,baidu comate.

第一轮:提示词:

用js创建2048的小游戏。

qwen

生成的游戏界面是不正常的,游戏也不能玩.

cursor

生成的游戏界面是正常的,游戏也能玩,但经常出现一些诡异的现象,例如:莫名奇妙的出现几张卡片,游戏玩的很诡异.

第二轮:修改提示词,把游戏的具体规则加上:

js生成2048小游戏有,规则如下:游戏场地:2048游戏在一个4x4的方格中进行,初始时会随机生成两个数字(通常是2或4)。
操作方式:玩家可以通过上下左右滑动来移动所有方块。每次滑动后,所有方块会向滑动的方向靠拢。相同数字的方块在碰撞时会合并成它们的和。例如,两个2会合并成一个4,两个4会合并成一个8,依此类推。 
生成新数字:每次滑动后,系统会在空白格子中随机生成一个新的数字(通常是2或4)。 
胜利条件:当玩家成功合并出一个2048的方块时,游戏胜利。 
失败条件:如果所有格子都被数字填满,并且没有相邻的格子可以合并,游戏结束。 

qwen code

生成3个文件,生成的游戏界面是不居中,游戏也有bug.

cursor

生成4个文件,生成的游戏界面是正常的,游戏也能很顺畅,还额外生成server.js 文件,可以发布成http服务。

baidu comate

生成3个文件,生成的游戏界面是正常的,游戏也能很顺畅.

测试下来, cursor > baidu comate > qwen code. 让人意外的,baidu comate 效果比qwen code强。

ps :

  • trae是字节出的编程IDE, 但这段时间上去,总是提示排队,无法正常使用。
  • cursor 免费版有次数限制,可以删了用户,再重新注册,就又能正常使用。