现在这些大模型,哪个在代码编写上表现的最好呀?
最好的代码编写AI模型,我觉得应该是不固定的,目前而应该是DeepSeek、GPT、
Qwen、Claude、Gemini中的某一个。
为什么这么说呢?
我们来看几个AI编程能力排行榜,
其实这种AI编程能力排行榜还很多,这里只是选择了huggingface和aider网站上的排行榜。我们可以发现他们两者的结果并不一样,另外翻看这两个网站的历史排行榜也会发现前后也是不一样的,也就是说这个排行榜是在变的。
比如,huggingface的BigCodeBench、aider的Aider LLM Leaderboards及清华大学的SuperBench。数据都不太一样,当然清华大学的是2024年11月的榜deepseek还是2.5的版本,但整体的数据还是相差不少。不过也能说明一个问题就是现阶段全球比较顶尖的AI模型中在编程能力方面比较优秀的就是DeepSeek、Claude、Gemini及Qwen这些了。
那么具体如何,我们可以用字节的 Trae来实操体验一下。
1 DeepSeek-V3-0324
2025年初最大的一个炸弹非deepseek莫属,deepseek-r1发布后风靡全球。而在3月24日deepseek又发布了deepseek-v3-0324版本,这个版本除了拥有deepseek-r1的部分深度思考能力又不需要深度思考的时间外,它还在前端的编码能力方面有增强。下面我们来具体试试:
deepseek是直接生成相应的代码
可能是deepseek没有先生成项目所以会缺少文件,然后运行后就会报错
选中异常信息后,可以点击“添加到对话” 直接在对话中提交就会生成解决办法
这里已经生成好了缺少的文件,直接再次运行,这就是生成的效果
2 Claude-3.7-sonnet
claude是由gpt离职员工出来后开发的,推出后一直和gpt是并肩的。到后来还有超出gpt的样子。现在claude的火热程度并不逊色于gpt。
第一步会先生成react的模板项目
然后,生成相应的组件代码同时在右下角会出现“全部接受”的按钮,点击后代码就会自动生成到当前的文件夹里,并且文件是按react模板的目录存放。
效果
点击预览,就会启动项目,并且trae内置了浏览器可以直接展示运行后的效果。代码完全没有报错,并且代码非常的工整。
3 GPT-4o
2022年11月GPT引发了AI变革,一场轰轰烈烈的AI革命就发生了。GPT的地位及在编程方面的能力也是非常突出的,当时GPT发布时通过手绘的草图然后发给AI,AI就能生成可以运行的网页。
来看看GPT也是通过模板先生成项目
这里要人式选择一些参数
然后一下步,这里也报缺少文件的错,然后还缺少了让我执行
npm install antd @ant-design/icons
命令的错
最后出来了,可能它误解了漂亮两个字的定义
4 Gemini
gemini是谷歌的AI产品早期叫Bard后来统一成Gemini。我们知道生成式AI大模型基本上都有谷歌Transformer的影子,谷歌在AI领域也是居功至伟。
gemini也是先创建react项目
然后报了一些错,最后的效果
代码风格上gemini和claude还是很不错的。
5 总结
总的来说从代码生成、到代码风格、再到代码可执行方面这几款都还不错。至少现在AI生成的代码基本上是可以直接执行或使用的,更关键的是它可以关联文件夹里的所有文件,即使代码存在问题它可以进一步的完善。AI已经成为程序员一个非常大的助力,如果非要从这些里面选择最好的一个个人感觉是Claude,如果国内使用不佳的话那就是DeepSeek,当然随着时间的变化后面是哪个又是个未知的结果。