2.12国产大模型集体更新，一文看懂怎么选最近国产AI圈有点热闹，短短一周内智谱GLM-5、MiniMax M2.5纷纷

最近国产AI圈有点热闹，短短一周内智谱GLM-5、MiniMax M2.5纷纷发布，DeepSeek V4灰度测试中，阿里的Qwen 3.5也快了。顺便说一下Kimi K2.5，之前也更新了，性价比不错。

GLM-5：从写代码到AI工程师

智谱这次升级幅度不小，从GLM-4.7的355B参数直接干到744B，训练数据也从23T涨到28.5T tokens。

官方定位从“VibeCoding”转向“Agentic Engineering”，简单说就是以前帮你写写代码，现在能处理复杂的多步骤任务，更适合做Agent和系统工程。

网友评价：“评分超过Gemini 3 Pro，是目前开源模型里最高的”，但也提到“算力紧张，需要排队”。

MiniMax M2.5：国产编程王者

MiniMax这次主打编程能力，网友实测后反馈比较多：“和Claude Opus 4.6打得有来有回”、“国产最强编程模型”。

内测期间提供无限token，有人直接把Go写的微服务转成Rust，3亿token生成3万行代码，Rust大佬看完说“像模像样”。

Kimi K2.5：性价比不错

月之暗面之前更新的版本，主要特点是便宜。有人从Claude Sonnet 4.5切换过来，日花费从50美元降到4美元。

长文本处理能力也不错，网友实测改了近300个文件。不过也有人吐槽“感觉还是有点慢”。

DeepSeek V4：神秘的灰度测试

目前需要更新App到1.7.4版本才有机会体验，注意这次灰度的200B不是正式V4，是个中间版本。

主要卖点是100万上下文和知识截止到2025年5月。网友说“代码生成比V3.2好一些”，但也提到“前端能力还没到K2.5的等级”。

Qwen 3.5：还在憋大招

阿里的下一代模型，预计本周发布。前几代Qwen以开源友好著称，这次应该也会开源权重。

网友说：“如果今晚DeepSeek发车，Qwen 3.5今晚也会发，那就内战爆发了”。适合需要本地部署的用户。

怎么选？

这次更新确实比较密集，国产模型从之前的双月更变成月更，整体水平也上来了。大家根据自己需求选一个试试就行，不用想太复杂。