性能参数
| 模型名称 | 总参数 | 激活参数 | 上下文长度 | 发布时间 | 架构模式 |
|---|---|---|---|---|---|
| DeepSeek V4 pro | 1.6T(万亿) | 49B | 1M token | 2026-04-24 | MoE |
| DeepSeek V4 flash | 284B | 13B | 1M token | 2026-04-24 | 快速模式 |
| GLM-5.1 | 745B | 44B | 200K tokens | 2026-04-08 | MoE |
| MiniMax-2.7 | 2300亿 | 100亿 | 200K tokens | 2026-04-12 | MoE |
| Qwen3.6 plus | 未知 | 未知 | 100万 tokens | 2026-04-02 | 未知 |
| Qwen3.6 max preview | 未知 | 未知 | 100万 tokens | 2026-04-21 | 未知 |
| Kimi 2.6 | 1万亿 | 32B | 256K tokens | 2026-04-20 | MoE |
| mimo-v2-pro | 未知 | 未知 | 100万+ tokens | 2026-03-19 | MoE |
| hy3-preview | 295B | 21B | 256K tokens | 2026-04-23 | MoE 192专家top-8 |
| GPT-5.5 | 未知 | 未知 | 100万 tokens | 2026-04-23 | 未知 |
| Claude Opus 4.7 | 未知 | 未知 | 200K tokens | 2026-04-16 | 未知 |
| Gemini 3.1 pro | 未知 | 未知 | 100万 tokens | 2026-02-19 | 原生多模态 |
价格对比
| 模型名称 | 输入价格(百万token) | 输出价格(百万token) | 缓存命中价格 | 备注 |
|---|---|---|---|---|
| DeepSeek V4 pro | 12元 | 24元 | 1元(命中缓存) | 预计下半年价格下调 |
| DeepSeek V4 flash | 1元 | 2元 | 0.2元 | 预计下半年价格下调 |
| GLM-5.1 | ¥6 / $0.85 | ¥30 / $4.25 | 未公开 | 3美元/月订阅制 |
| MiniMax-2.7 | 未公开 | 未公开 | 未公开 | 高性价比定位 |
| Qwen3.6 plus | ¥2 | ¥12 | 有折扣 | 国内站定价 |
| Qwen3.6 max | ¥9-15 | ¥54-90 | 有折扣 | 阶梯定价 |
| Kimi 2.6 | $0.95 | $4.00 | $0.16 | 较K2.5上涨58%/33% |
| mimo-v2-pro | 未公开 | 未公开 | 未公开 | 比Opus 4.6便宜1/8 |
| hy3-preview | ¥1.2+ | 未公开 | 未公开 | 最低28元/月套餐 |
| GPT-5.5 | $5 | $30 | 未公开 | Token成本降至1/35 |
| GPT-5.5 Pro | $30 | $180 | 未公开 | Token成本降至1/35 |
| Claude Opus 4.7 | $5 | $25 | 未公开 | 与Opus 4.6持平 |
| Claude Opus 4.6 | $5 | $25 | 未公开 | 基准价格 |
| Gemini 3.1 pro | 未公开 | 未公开 | 未公开 | 加量不加价策略 |
关键指标:
-
上下文长度竞争:Qwen3.6系列、DeepSeek V4、Gemini 3.1 Pro均达到100万tokens,成为超长上下文标配。
-
MoE架构主流化:国产模型普遍采用MoE架构(GLM-5.1、MiniMax-2.7、Kimi 2.6、hy3-preview),在参数规模和推理效率间取得平衡。
-
价格战激烈:国产模型价格普遍低于国际竞品,Qwen3.6 plus输入仅¥2/百万tokens,hy3-preview最低¥1.2/百万tokens。
-
发布时间密集:4月份成为发布高峰期,DeepSeek V4、hy3-preview、GPT-5.5均在4月23-24日发布。
-
性能对标:多款国产模型(GLM-5.1、Kimi 2.6)在SWE-bench等基准测试中已接近或超越Claude Opus 4.6水平。