免费AI模型实测排名

2 阅读1分钟

免费AI模型实测排名

市面上能白嫖的AI模型少说几十个,但到底哪个能打?光看官方跑分没用,真写起代码来差别大了。

我花了一周时间,拿同一个任务挨个测了一遍,结果有几个还挺意外的。

测试方法

任务很简单:给一个现成的 Express 项目加 JWT 登录功能。包括注册、登录、token 签发、中间件鉴权、refresh token,一套完整流程。

为什么选这个?因为它不算太简单(不是写个 Hello World),也不算太复杂(不需要理解业务逻辑),能拉开差距但又不至于谁都写不出来。

每个模型跑 3 次取最好的结果,评三个维度:

  • 代码质量:能不能直接跑?有没有安全漏洞?代码结构清不清晰?
  • 响应速度:从发请求到拿到完整回复要多久
  • 免费额度:每天/每月能免费用多少

排名结果

排名模型代码质量响应速度免费额度综合评分
1Claude Sonnet 4.6★★★★★多个Provider提供9.5
2Gemini 2.5 Pro★★★★☆Google AI Studio免费9.0
3DeepSeek V3.2★★★★☆SiliconFlow免费8.8
4GPT-OSS 120B★★★★☆多平台免费8.5
5Qwen3.5★★★★☆阿里云免费8.3
6Llama 3.3 70B★★★☆☆Groq/Cerebras免费8.0
7Kimi K2.5★★★★☆Moonshot免费7.8
8GLM-5★★★☆☆智谱免费7.5
9MiniMax M2.5★★★☆☆MiniMax免费7.3
10Gemma 3 27B★★★☆☆多平台免费7.0

逐个点评

1. Claude Sonnet 4.6 — 综合第一没悬念。生成的 JWT 代码直接能跑,密码加盐用了 bcrypt,refresh token 存数据库而不是内存,错误处理也到位。唯一缺点是官方免费额度不多,得从多个渠道凑。

2. Gemini 2.5 Pro — Google 这代模型进步很大。代码质量接近 Sonnet,而且 Google AI Studio 免费额度够用。就是偶尔会多生成一些你没要的东西,比如我只要 JWT 登录,它顺手把 OAuth 也写了。

3. DeepSeek V3.2 — 性价比之王。代码风格很工整,注释写得比大部分模型都好。速度中等,SiliconFlow 上免费用。实测最大的问题是上下文长了之后偶尔会重复自己。

4. GPT-OSS 120B — 开源模型里的标杆。复杂任务表现稳定,多平台都能免费跑。速度不算快,但胜在稳定,很少出幺蛾子。

5. Qwen3.5 — 阿里的模型中文注释写得最好(废话),代码质量也不差。速度快,阿里云免费额度也大方。对中文开发者来说很友好。

6. Llama 3.3 70B — 在 Groq 上跑速度极快,几乎秒回。但代码质量跟前面几个比有差距,偶尔会漏掉边界处理。适合快速验证想法,不适合直接上生产。

7. Kimi K2.5 — Moonshot 的模型理解中文需求特别好。你用中文描述需求,它不会理解偏。代码质量中上,但速度一般,高峰期排队有点久。

8. GLM-5 — 智谱免费额度很大方,速度也快。代码能跑但不够精细,比如 JWT 过期时间写死在代码里而不是用环境变量。适合日常轻度使用。

9. MiniMax M2.5 — 速度快是优势,免费额度也还行。代码质量中规中矩,能用但需要自己改改细节。

10. Gemma 3 27B — Google 的开源模型,多平台免费部署。27B 参数量注定了天花板,复杂逻辑偶尔翻车,但简单任务够用,而且是真的免费无限量。

怎么一次性用上这些模型

测下来你会发现一个问题:这些免费模型散落在十几个不同平台,每个平台注册一遍、配一遍 API key,光配置就能搞半天。

我自己的做法是用 OpenRelay 做本地聚合。它是个开源工具,跑在本地,自动把 33 个 Provider 的免费配额统一成一个 OpenAI 兼容端点。你的 Cursor、Claude Code、Cline 这些工具直接连这一个端点就行,它自动帮你路由到有额度的 Provider。

Windows(PowerShell):

irm https://openrelay.app/install.ps1 | iex
openrelay start

macOS / Linux:

curl -fsSL https://openrelay.app/install.sh | sh
openrelay start

启动后会给你一个本地端点地址,填到你用的 AI 工具里就完事了。

我的日常搭配

说实话,测完这一圈,我日常固定用三个:

  • Sonnet 4.6 主力:写核心代码、复杂重构、Agent 模式全靠它
  • DeepSeek V3.2 备用:Sonnet 额度用完或者响应慢的时候切过去,质量差不太多
  • Gemini 2.5 Pro 写文档:生成 README、API 文档、注释这些,Gemini 特别擅长

这套组合基本覆盖了日常开发的所有场景,而且全程不花钱。


GitHub:github.com/romgX/openr…