你好,我是杰哥
刚刚,权威 AI 评测平台Artificial Analysis 发布了全球最新大模型三维排名:智能指数(Intelligence)、**输出速度(Output Tokens per Second)**和 价格(USD per 1M Tokens)。
这次排名亮点满满:
-
中美模型继续霸榜智能顶端,Gemini 3.1 Pro Preview 和 GPT-5.4(xhigh)并列57分第一!
-
中国模型表现亮眼:GLM-5 智能第5(50分),DeepSeek V3.2虽然智能中等,但价格+速度综合性价比极高,继续展现“中国力量”!
GLM-5 是由中国领先的 AI 公司智谱AI(Zhipu AI)于 2026年2月11日(春节前夕)正式发布的新一代开源旗舰大模型,也被视为国产大模型在2026年开年的重磅作品。它在全球权威评测平台 Artificial Analysis 的 Intelligence Index 中获得 50分,位居全球第 5、开源模型第一,成为中国模型首次突破这一分数线的重要里程碑。
- 速度王被 NVIDIA Nemotron 3 Super 夺走,价格最便宜的仍是开源/中国系模型。
下面我们一起具体来看。
一、智能指数(Intelligence)
核心能力排名,代表模型的综合推理、知识、创造力水平。
排行榜如下图(前10名):
- Gemini 3.1 Pro Preview(Google):57分(并列第1)
- GPT-5.4 (xhigh) (OpenAI):57分(并列第1)
- Claude Opus 4.6 (max) (Anthropic):53分
- Claude Sonnet 4.6 (max) (Anthropic):52分
- GLM-5(智谱AI):50分 (中国模型第1,全球第5!)
- Grok 4.20 Beta 0309(xAI):48分
- Gemini 3 Flash(Google):46分
- DeepSeek V3.2:42分
- Nemotron 3 Super(NVIDIA):36分
- gpt-oss-120B (high) :33分
杰哥点评:
Gemini 和 GPT-5.4 再次并驾齐驱,智能天花板被拉到新高度!中国 GLM-5 从上期榜单继续前进,稳居前 5,证明国产大模型在核心能力上已与国际顶级阵营并肩。DeepSeek V3.2 虽未进前 5,但作为开源/低成本代表,仍有不俗表现。Claude 双子星依然稳健,但已被中美模型拉开小差距。
二、输出速度(Speed)
每秒输出Token数,直接决定聊天、写作、代码生成的流畅度。
排行榜如下图(前10名):
- NVIDIA Nemotron 3 Super:455 tokens/s(第1!)
- gpt-oss-120B (high) :279 tokens/s(第2)
- Grok 4.20 Beta 0309 :216 tokens/s
- Gemini 3 Flash:166 tokens/s
- Gemini 3.1 Pro Preview :125 tokens/s
- GPT-5.4 (xhigh) :73 tokens/s
- GLM-5:67 tokens/s
- Claude Sonnet 4.6 (max) :55 tokens/s
- Claude Opus 4.6 (max) :48 tokens/s
- DeepSeek V3.2:28 tokens/s
杰哥点评:
速度王彻底易主!NVIDIA Nemotron 3 Super 以 455 tokens/s 碾压,成为“闪电侠”。Grok 4.20 和 Gemini Flash 也进入前 4,日常使用体验极佳。GPT-5.4 和 GLM-5 速度中等偏上,DeepSeek V3.2 速度偏慢,但胜在后面价格优势巨大——适合不追求极致速度的场景。
三、价格(Price)
每百万Token美元价格(输入+输出综合参考),直接影响大规模使用成本。
排行榜如下图(从低到高):
- gpt-oss-120B:0.3美元
- DeepSeek V3.2:0.3美元(并列最便宜!)
- Nemotron 3 Super:0.4美元
- Gemini 3 Flash:1.1美元
- GLM-5:1.6美元
- Grok 4.20 Beta 0309:3美元
- Gemini 3.1 Pro Preview:4.5美元
- GPT-5.4 (xhigh) :5.6美元
- Claude Sonnet 4.6 (max) :6美元
- Claude Opus 4.6 (max) :10美元
杰哥点评:
性价比之王诞生!DeepSeek V3.2 和 gpt-oss-120B 以 0.3美元/百万Token 并列最低,NVIDIA Nemotron 仅 0.4 美元——这三款几乎是“白菜价”。而顶级智能模型(Gemini/GPT-5.4/Claude Opus)价格明显更高,适合需要极致能力的场景。中国模型再次在成本控制上领先全球!
总结:怎么选才是最优解?
- 追求最强智能(写作、推理、复杂任务):Gemini 3.1 Pro Preview 或 GPT-5.4(57分天花板)
- 追求极致速度(实时聊天、代码生成):NVIDIA Nemotron 3 Super(455 tokens/s)
- 追求性价比(日常高频使用、创业/企业):DeepSeek V3.2 或 gpt-oss-120B(0.3美元+可用速度)
- 中国用户优选:GLM-5(智能前5+价格合理)、DeepSeek V3.2(最便宜)
AI时代,没有绝对最强,只有最适合。根据你的使用场景(智能/速度/预算)灵活选择,就能事半功倍!
你最看好哪款模型?是在用 Gemini、GPT 还是国产 DeepSeek/GLM?欢迎评论区告诉我~
关注公众号【AI信息风向】后,回复 666,即可获取更多 AI 行业报告。
AI 技术正以前所未有的速度发展,它将如何塑造我们的未来?让我们拭目以待。