- 最近国产AI圈有点热闹,短短一周内智谱GLM-5、MiniMax M2.5纷纷发布,DeepSeek V4灰度测试中,阿里的Qwen 3.5也快了。顺便说一下Kimi K2.5,之前也更新了,性价比不错。
| 模型 | 状态 | 特点 |
|---|---|---|
| GLM-5 | 已发布 | 744B参数,专注Agent和复杂任务 |
| MiniMax M2.5 | 已发布 | 编程能力强,接近Opus 4.6 |
| Kimi K2.5 | 已发布 | 性价比高,日常用 |
| DeepSeek V4 | 灰度测试 | 200B参数,100万上下文 |
| Qwen 3.5 | 即将发布 | 预计开源,本地部署 |
GLM-5:从写代码到AI工程师
智谱这次升级幅度不小,从GLM-4.7的355B参数直接干到744B,训练数据也从23T涨到28.5T tokens。
官方定位从“VibeCoding”转向“Agentic Engineering”,简单说就是以前帮你写写代码,现在能处理复杂的多步骤任务,更适合做Agent和系统工程。
网友评价:“评分超过Gemini 3 Pro,是目前开源模型里最高的”,但也提到“算力紧张,需要排队”。
MiniMax M2.5:国产编程王者
MiniMax这次主打编程能力,网友实测后反馈比较多:“和Claude Opus 4.6打得有来有回”、“国产最强编程模型”。
内测期间提供无限token,有人直接把Go写的微服务转成Rust,3亿token生成3万行代码,Rust大佬看完说“像模像样”。
Kimi K2.5:性价比不错
月之暗面之前更新的版本,主要特点是便宜。有人从Claude Sonnet 4.5切换过来,日花费从50美元降到4美元。
长文本处理能力也不错,网友实测改了近300个文件。不过也有人吐槽“感觉还是有点慢”。
DeepSeek V4:神秘的灰度测试
目前需要更新App到1.7.4版本才有机会体验,注意这次灰度的200B不是正式V4,是个中间版本。
主要卖点是100万上下文和知识截止到2025年5月。网友说“代码生成比V3.2好一些”,但也提到“前端能力还没到K2.5的等级”。
Qwen 3.5:还在憋大招
阿里的下一代模型,预计本周发布。前几代Qwen以开源友好著称,这次应该也会开源权重。
网友说:“如果今晚DeepSeek发车,Qwen 3.5今晚也会发,那就内战爆发了”。适合需要本地部署的用户。
怎么选?
- 写代码、做开发 → MiniMax M2.5
- 复杂项目、跑Agent → GLM-5
- 性价比、日常用 → Kimi K2.5
- 本地部署、开源需求 → 等Qwen 3.5
- 免费尝鲜 → DeepSeek App
这次更新确实比较密集,国产模型从之前的双月更变成月更,整体水平也上来了。大家根据自己需求选一个试试就行,不用想太复杂。