近日,权威AI评测平台Artificial Analysis发布了最新一期全球大模型三维排名,从智能指数、输出速度和价格三个维度对主流模型进行了全面评估。
本次榜单亮点颇多:中美模型继续领跑智能榜首,Gemini 3.1 Pro Preview和GPT-5.4(xhigh)并列57分第一;中国模型表现亮眼,GLM-5以50分位列全球第五、开源模型第一;DeepSeek V3.2虽智能指数中等,但凭借极高的性价比再次证明了中国模型的竞争力。
智能指数:综合能力的较量
智能指数代表模型的综合推理、知识和创造力水平,是衡量AI"智商"的核心指标。
| 排名 | 模型 | 智能分数 |
|---|---|---|
| 1 | Gemini 3.1 Pro Preview(Google) | 57 |
| 1 | GPT-5.4(xhigh)(OpenAI) | 57 |
| 3 | Claude Opus 4.6(max)(Anthropic) | 53 |
| 4 | Claude Sonnet 4.6(max)(Anthropic) | 52 |
| 5 | GLM-5(智谱AI) | 50 |
| 6 | Grok 4.20 Beta 0309(xAI) | 48 |
| 7 | Gemini 3 Flash(Google) | 46 |
| 8 | DeepSeek V3.2 | 42 |
| 9 | Nemotron 3 Super(NVIDIA) | 36 |
| 10 | gpt-oss-120B(high) | 33 |
Gemini和GPT-5.4再次并驾齐驱,将智能天花板推向新高度。中国GLM-5稳居前五,证明国产大模型在核心能力上已与国际顶级阵营并肩。
输出速度:流畅体验的关键
每秒输出Token数直接决定聊天、写作、代码生成的流畅度,是用户体验的重要指标。
| 排名 | 模型 | 速度(tokens/s) |
|---|---|---|
| 1 | NVIDIA Nemotron 3 Super | 455 |
| 2 | gpt-oss-120B(high) | 279 |
| 3 | Grok 4.20 Beta 0309 | 216 |
| 4 | Gemini 3 Flash | 166 |
| 5 | Gemini 3.1 Pro Preview | 125 |
| 6 | GPT-5.4(xhigh) | 73 |
| 7 | GLM-5 | 67 |
| 8 | Claude Sonnet 4.6(max) | 55 |
| 9 | Claude Opus 4.6(max) | 48 |
| 10 | DeepSeek V3.2 | 28 |
NVIDIA Nemotron 3 Super以455 tokens/s的速度成为"闪电侠",Grok 4.20和Gemini Flash也进入前四,日常使用体验极佳。
价格:成本控制的比拼
每百万Token价格直接影响大规模使用成本,是企业选型的重要考量。
| 排名 | 模型 | 价格(美元/百万Token) |
|---|---|---|
| 1 | gpt-oss-120B | 0.3 |
| 1 | DeepSeek V3.2 | 0.3 |
| 3 | Nemotron 3 Super | 0.4 |
| 4 | Gemini 3 Flash | 1.1 |
| 5 | GLM-5 | 1.6 |
| 6 | Grok 4.20 Beta 0309 | 3.0 |
| 7 | Gemini 3.1 Pro Preview | 4.5 |
| 8 | GPT-5.4(xhigh) | 5.6 |
| 9 | Claude Sonnet 4.6(max) | 6.0 |
| 10 | Claude Opus 4.6(max) | 10.0 |
DeepSeek V3.2和gpt-oss-120B以0.3美元/百万Token并列最低,性价比优势明显。
OneAIPlus平台:多模型一站式对比体验
对于希望同时体验多款模型的用户,OneAIPlus平台提供了一个便捷的对比方案。以下是该平台与单一模型渠道的对比:
| 对比维度 | OneAIPlus平台 | 单一模型官方渠道 |
|---|---|---|
| 模型多样性 | 同时提供Gemini、GPT、Claude、DeepSeek、GLM等多种模型,按需切换 | 通常只能使用单一模型 |
| 使用便捷性 | 一站式集成,无需分别注册和管理多个账号 | 需要单独注册和配置 |
| 成本效益 | 提供灵活的用量选择,避免为不常用的模型付费 | 可能需要承担固定的订阅费用 |
| 对比测试 | 可在同一平台内快速切换模型进行横向对比 | 需要跨平台操作,流程繁琐 |
通过OneAIPlus,用户可以在同一平台对比测试各款模型的表现,根据实际需求选择最合适的方案。
选型建议
追求最强智能(写作、推理、复杂任务) :Gemini 3.1 Pro Preview或GPT-5.4(57分天花板)
追求极致速度(实时聊天、代码生成) :NVIDIA Nemotron 3 Super(455 tokens/s)
追求性价比(日常高频使用) :DeepSeek V3.2或gpt-oss-120B(0.3美元+可用速度)
中国用户优选:GLM-5(智能前五+价格合理)、DeepSeek V3.2(最便宜)
AI时代没有绝对最强,只有最适合。根据使用场景(智能/速度/预算)灵活选择,才能事半功倍。