2.12国产大模型集体更新,一文看懂怎么选

176 阅读2分钟
  • 最近国产AI圈有点热闹,短短一周内智谱GLM-5、MiniMax M2.5纷纷发布,DeepSeek V4灰度测试中,阿里的Qwen 3.5也快了。顺便说一下Kimi K2.5,之前也更新了,性价比不错。
模型状态特点
GLM-5已发布744B参数,专注Agent和复杂任务
MiniMax M2.5已发布编程能力强,接近Opus 4.6
Kimi K2.5已发布性价比高,日常用
DeepSeek V4灰度测试200B参数,100万上下文
Qwen 3.5即将发布预计开源,本地部署

GLM-5:从写代码到AI工程师

智谱这次升级幅度不小,从GLM-4.7的355B参数直接干到744B,训练数据也从23T涨到28.5T tokens。

官方定位从“VibeCoding”转向“Agentic Engineering”,简单说就是以前帮你写写代码,现在能处理复杂的多步骤任务,更适合做Agent和系统工程。

网友评价:“评分超过Gemini 3 Pro,是目前开源模型里最高的”,但也提到“算力紧张,需要排队”。


MiniMax M2.5:国产编程王者

MiniMax这次主打编程能力,网友实测后反馈比较多:“和Claude Opus 4.6打得有来有回”、“国产最强编程模型”。

内测期间提供无限token,有人直接把Go写的微服务转成Rust,3亿token生成3万行代码,Rust大佬看完说“像模像样”。


Kimi K2.5:性价比不错

月之暗面之前更新的版本,主要特点是便宜。有人从Claude Sonnet 4.5切换过来,日花费从50美元降到4美元。

长文本处理能力也不错,网友实测改了近300个文件。不过也有人吐槽“感觉还是有点慢”。


DeepSeek V4:神秘的灰度测试

目前需要更新App到1.7.4版本才有机会体验,注意这次灰度的200B不是正式V4,是个中间版本。

主要卖点是100万上下文和知识截止到2025年5月。网友说“代码生成比V3.2好一些”,但也提到“前端能力还没到K2.5的等级”。


Qwen 3.5:还在憋大招

阿里的下一代模型,预计本周发布。前几代Qwen以开源友好著称,这次应该也会开源权重。

网友说:“如果今晚DeepSeek发车,Qwen 3.5今晚也会发,那就内战爆发了”。适合需要本地部署的用户。


怎么选?

  • 写代码、做开发 → MiniMax M2.5
  • 复杂项目、跑Agent → GLM-5
  • 性价比、日常用 → Kimi K2.5
  • 本地部署、开源需求 → 等Qwen 3.5
  • 免费尝鲜 → DeepSeek App

这次更新确实比较密集,国产模型从之前的双月更变成月更,整体水平也上来了。大家根据自己需求选一个试试就行,不用想太复杂。