免费AI模型实测排名
市面上能白嫖的AI模型少说几十个,但到底哪个能打?光看官方跑分没用,真写起代码来差别大了。
我花了一周时间,拿同一个任务挨个测了一遍,结果有几个还挺意外的。
测试方法
任务很简单:给一个现成的 Express 项目加 JWT 登录功能。包括注册、登录、token 签发、中间件鉴权、refresh token,一套完整流程。
为什么选这个?因为它不算太简单(不是写个 Hello World),也不算太复杂(不需要理解业务逻辑),能拉开差距但又不至于谁都写不出来。
每个模型跑 3 次取最好的结果,评三个维度:
- 代码质量:能不能直接跑?有没有安全漏洞?代码结构清不清晰?
- 响应速度:从发请求到拿到完整回复要多久
- 免费额度:每天/每月能免费用多少
排名结果
| 排名 | 模型 | 代码质量 | 响应速度 | 免费额度 | 综合评分 |
|---|---|---|---|---|---|
| 1 | Claude Sonnet 4.6 | ★★★★★ | 快 | 多个Provider提供 | 9.5 |
| 2 | Gemini 2.5 Pro | ★★★★☆ | 快 | Google AI Studio免费 | 9.0 |
| 3 | DeepSeek V3.2 | ★★★★☆ | 中 | SiliconFlow免费 | 8.8 |
| 4 | GPT-OSS 120B | ★★★★☆ | 中 | 多平台免费 | 8.5 |
| 5 | Qwen3.5 | ★★★★☆ | 快 | 阿里云免费 | 8.3 |
| 6 | Llama 3.3 70B | ★★★☆☆ | 快 | Groq/Cerebras免费 | 8.0 |
| 7 | Kimi K2.5 | ★★★★☆ | 中 | Moonshot免费 | 7.8 |
| 8 | GLM-5 | ★★★☆☆ | 快 | 智谱免费 | 7.5 |
| 9 | MiniMax M2.5 | ★★★☆☆ | 快 | MiniMax免费 | 7.3 |
| 10 | Gemma 3 27B | ★★★☆☆ | 快 | 多平台免费 | 7.0 |
逐个点评
1. Claude Sonnet 4.6 — 综合第一没悬念。生成的 JWT 代码直接能跑,密码加盐用了 bcrypt,refresh token 存数据库而不是内存,错误处理也到位。唯一缺点是官方免费额度不多,得从多个渠道凑。
2. Gemini 2.5 Pro — Google 这代模型进步很大。代码质量接近 Sonnet,而且 Google AI Studio 免费额度够用。就是偶尔会多生成一些你没要的东西,比如我只要 JWT 登录,它顺手把 OAuth 也写了。
3. DeepSeek V3.2 — 性价比之王。代码风格很工整,注释写得比大部分模型都好。速度中等,SiliconFlow 上免费用。实测最大的问题是上下文长了之后偶尔会重复自己。
4. GPT-OSS 120B — 开源模型里的标杆。复杂任务表现稳定,多平台都能免费跑。速度不算快,但胜在稳定,很少出幺蛾子。
5. Qwen3.5 — 阿里的模型中文注释写得最好(废话),代码质量也不差。速度快,阿里云免费额度也大方。对中文开发者来说很友好。
6. Llama 3.3 70B — 在 Groq 上跑速度极快,几乎秒回。但代码质量跟前面几个比有差距,偶尔会漏掉边界处理。适合快速验证想法,不适合直接上生产。
7. Kimi K2.5 — Moonshot 的模型理解中文需求特别好。你用中文描述需求,它不会理解偏。代码质量中上,但速度一般,高峰期排队有点久。
8. GLM-5 — 智谱免费额度很大方,速度也快。代码能跑但不够精细,比如 JWT 过期时间写死在代码里而不是用环境变量。适合日常轻度使用。
9. MiniMax M2.5 — 速度快是优势,免费额度也还行。代码质量中规中矩,能用但需要自己改改细节。
10. Gemma 3 27B — Google 的开源模型,多平台免费部署。27B 参数量注定了天花板,复杂逻辑偶尔翻车,但简单任务够用,而且是真的免费无限量。
怎么一次性用上这些模型
测下来你会发现一个问题:这些免费模型散落在十几个不同平台,每个平台注册一遍、配一遍 API key,光配置就能搞半天。
我自己的做法是用 OpenRelay 做本地聚合。它是个开源工具,跑在本地,自动把 33 个 Provider 的免费配额统一成一个 OpenAI 兼容端点。你的 Cursor、Claude Code、Cline 这些工具直接连这一个端点就行,它自动帮你路由到有额度的 Provider。
Windows(PowerShell):
irm https://openrelay.app/install.ps1 | iex
openrelay start
macOS / Linux:
curl -fsSL https://openrelay.app/install.sh | sh
openrelay start
启动后会给你一个本地端点地址,填到你用的 AI 工具里就完事了。
我的日常搭配
说实话,测完这一圈,我日常固定用三个:
- Sonnet 4.6 主力:写核心代码、复杂重构、Agent 模式全靠它
- DeepSeek V3.2 备用:Sonnet 额度用完或者响应慢的时候切过去,质量差不太多
- Gemini 2.5 Pro 写文档:生成 README、API 文档、注释这些,Gemini 特别擅长
这套组合基本覆盖了日常开发的所有场景,而且全程不花钱。
GitHub:github.com/romgX/openr…