哪个AI大模型在代码编写上表现的最好?

1,324 阅读4分钟

现在这些大模型,哪个在代码编写上表现的最好呀?

最好的代码编写AI模型,我觉得应该是不固定的,目前而应该是DeepSeek、GPT、

Qwen、Claude、Gemini中的某一个

为什么这么说呢?

我们来看几个AI编程能力排行榜

其实这种AI编程能力排行榜还很多,这里只是选择了huggingface和aider网站上的排行榜。我们可以发现他们两者的结果并不一样,另外翻看这两个网站的历史排行榜也会发现前后也是不一样的,也就是说这个排行榜是在变的

比如,huggingface的BigCodeBench、aider的Aider LLM Leaderboards及清华大学的SuperBench。数据都不太一样,当然清华大学的是2024年11月的榜deepseek还是2.5的版本,但整体的数据还是相差不少。不过也能说明一个问题就是现阶段全球比较顶尖的AI模型中在编程能力方面比较优秀的就是DeepSeek、Claude、Gemini及Qwen这些了。

那么具体如何,我们可以用字节的 Trae来实操体验一下。

1 DeepSeek-V3-0324

2025年初最大的一个炸弹非deepseek莫属,deepseek-r1发布后风靡全球。而在3月24日deepseek又发布了deepseek-v3-0324版本,这个版本除了拥有deepseek-r1的部分深度思考能力又不需要深度思考的时间外,它还在前端的编码能力方面有增强。下面我们来具体试试:

deepseek是直接生成相应的代码

可能是deepseek没有先生成项目所以会缺少文件,然后运行后就会报错

选中异常信息后,可以点击“添加到对话” 直接在对话中提交就会生成解决办法

这里已经生成好了缺少的文件,直接再次运行,这就是生成的效果

2 Claude-3.7-sonnet

claude是由gpt离职员工出来后开发的,推出后一直和gpt是并肩的。到后来还有超出gpt的样子。现在claude的火热程度并不逊色于gpt。

第一步会先生成react的模板项目

然后,生成相应的组件代码同时在右下角会出现“全部接受”的按钮,点击后代码就会自动生成到当前的文件夹里,并且文件是按react模板的目录存放。

效果

点击预览,就会启动项目,并且trae内置了浏览器可以直接展示运行后的效果。代码完全没有报错,并且代码非常的工整。

3 GPT-4o

2022年11月GPT引发了AI变革,一场轰轰烈烈的AI革命就发生了。GPT的地位及在编程方面的能力也是非常突出的,当时GPT发布时通过手绘的草图然后发给AI,AI就能生成可以运行的网页。

来看看GPT也是通过模板先生成项目

这里要人式选择一些参数

然后一下步,这里也报缺少文件的错,然后还缺少了让我执行

npm install antd @ant-design/icons

命令的错

最后出来了,可能它误解了漂亮两个字的定义

4 Gemini

gemini是谷歌的AI产品早期叫Bard后来统一成Gemini。我们知道生成式AI大模型基本上都有谷歌Transformer的影子,谷歌在AI领域也是居功至伟。

gemini也是先创建react项目

然后报了一些错,最后的效果

代码风格上gemini和claude还是很不错的。

5 总结

总的来说从代码生成、到代码风格、再到代码可执行方面这几款都还不错。至少现在AI生成的代码基本上是可以直接执行或使用的,更关键的是它可以关联文件夹里的所有文件,即使代码存在问题它可以进一步的完善。AI已经成为程序员一个非常大的助力,如果非要从这些里面选择最好的一个个人感觉是Claude,如果国内使用不佳的话那就是DeepSeek,当然随着时间的变化后面是哪个又是个未知的结果。