全球大模型的价格和能力排行汇总

43 阅读3分钟

能力

排名模型名称综合得分核心优势短板
1Claude-Opus-4.861.4/100全球综合第一,代码质量最高,幻觉最少,复杂推理最强价格极贵,速度较慢
2GPT-5.562.9/100终端操作能力断层领先,DevOps 自动化最强价格极贵,中文能力一般
3Claude-Opus-4.760.5/100SWE-bench Verified 87.6%,工程代码修复能力最强价格极贵
4GPT-5.458.2/100原生计算机操控,多步任务执行稳定价格较贵
5Claude-Opus-4.657.8/100深度推理能力强,文档理解精准价格极贵
6Gemini-3.5-Flash56.7/100多模态能力全球第一,Agent 工具调用最强,速度最快纯文本推理略弱
7DeepSeek-V4-Pro52/100代码能力全球第一(LiveCodeBench 93.5%),数学推理极强,1M 上下文多模态能力缺失,英文写作一般
8Kimi-K2.654/100Agent 集群能力最强(300 个子 Agent 并行),长文本处理极佳代码能力略逊于 DeepSeek
9GLM-5.151/100数学推理全球第二(AIME 95.3%),中文能力强,开源可部署上下文仅 200K
10MiniMax-M349.8/100原生多模态 + 计算机操控,视觉代码生成最强纯文本推理略弱
11Claude-Sonnet-4.648.5/100均衡型模型,性价比高,企业级稳定能力无突出亮点
12DeepSeek-V4-Flash47/100轻量极速,能力接近 Claude Sonnet 4.5,价格极低复杂推理能力有限
13MiniMax-M2.746.2/100长程任务自主执行能力强(12 小时无人干预)已被 M3 替代
14GPT-5.3-Codex45.7/100代码能力强,生态完善已被 GPT-5.4 全面超越
15Hy3 preview(混元 3)44.5/100推理和代码能力均衡,企业实用型预览版,稳定性一般
16GLM-5v-Turbo43.8/100多模态 + Agent 优化,工具调用稳定纯文本推理略弱
17Claude-Haiku-4.542.1/100速度极快,适合简单分类和提取任务复杂任务能力差
18DeepSeek-V3.242/100上一代旗舰,能力仍不错,价格便宜已被 V4 全面超越
19Echo(豆包 Echo)35/100基础对话能力,中文体验好专业能力有限
20Auto自动自动智能选择最优模型成本不可控

价格

排名模型名称输入价格 (/1M)输出价格 (/1M)综合成本 (/1M)备注
1GPT-5.5(企业版)$5.00$30.00~252 元全球最贵,缓存命中输入仅 $0.50
2Claude-Opus-4.8(企业版)$5.00$25.00~216 元与 Opus 4.7/4.6 同价
3Claude-Opus-4.7(企业版)$5.00$25.00~216 元
4Claude-Opus-4.6(企业版)$5.00$25.00~216 元
5Claude-Sonnet-4.6(企业版)$3.00$15.00~129.6 元
6Gemini-3.5-Flash(企业版)$1.50$9.00~75.6 元多模态能力极强
7GPT-5.3-Codex(企业版)$2.00$8.00~72 元已被 GPT-5.4 替代
8GPT-5.4(企业版)$0.75$4.50~37.8 元缓存命中输入仅 $0.075
9GLM-5v-Turbo¥8.64¥28.8~37.44 元多模态 + Agent 优化
10GLM-5.1¥6.00¥24.0~30 元开源旗舰
11Kimi-K2.6¥4.9¥24.6~29.5 元缓存命中输入仅 ¥0.5
12Claude-Haiku-4.5(企业版)$1.00$1.25~16.2 元轻量快速
13MiniMax-M3¥3.0¥9.0~12 元多模态 + 计算机操控
14DeepSeek-V4-Pro¥3.0¥6.0~9 元性价比之王,缓存命中输入仅 ¥0.025
15MiniMax-M2.7¥2.0¥6.0~8 元长程任务优化
16DeepSeek-V3.2¥2.0¥3.0~5 元上一代旗舰
17Hy3 preview(混元 3)¥1.2¥4.0~5.2 元<16K 上下文,内部模型
18DeepSeek-V4-Flash¥1.0¥2.0~3 元轻量极速,缓存命中输入仅 ¥0.02
19Echo(豆包 Echo)免费免费0 元基础能力,日常对话
20Auto自动自动取决于调用模型智能路由