Token 狂飙五周霸榜,中国大模型凭 “用得起、用得广” 拿下全球 AI 主动权

0 阅读8分钟

如果说两年前 AI 领域的竞争焦点是 “谁的模型参数更大”,那么今天,答案已经变了 —— 竞争的核心已经从 “造得出” 转向了 “用得起、用得广”。而衡量这一切最直观的指标,就是 Token 调用量。

最新数据给出了一个足以引起全球 AI 产业关注的信号:中国大模型正以惊人的速度占据全球 API 调用市场的主导地位,而且这一趋势已经连续五周保持。

2.jpg

一、数字背后的产业真相

先来看核心数据。据全球知名 AI 模型 API 聚合平台 OpenRouter 最新统计,上周(3 月 30 日至 4 月 5 日),平台内全球 AI 大模型总调用量达到 27 万亿 Token,环比增长 18.9%。其中,平台内中国 AI 大模型的周调用量飙升至 12.96 万亿 Token,环比大涨 31.48%;而同期平台内美国 AI 大模型的周调用量仅为 3.03 万亿 Token,环比增幅仅有 0.76%。

差距不仅体现在总量上,更体现在排行榜的结构中。上周 OpenRouter 平台全球调用量排名前六的大模型全部来自中国:阿里 Qwen3.6 Plus (free) 以 4.6 万亿 Token 登顶榜首,小米 MiMo-V2-Pro 位居第二(3.08 万亿 Token),Qwen3.6 Plus Preview 位列第三(1.64 万亿 Token),阶跃星辰 Step 3.5 Flash、MiniMax M2.7 和 DeepSeek V3.2 分列第四至第六位。

这一格局绝非偶然。OpenRouter 平台内中国 AI 大模型的周调用量已经连续五周超越美国,而且差距还在拉大。背后的驱动力值得深入拆解。

二、从 “比参数” 到 “比调用”:AI 竞争的下半场

理解这一轮调用量暴涨,首先要明白 Token 意味着什么。简单来说,Token 是 AI 世界的 “最小计费单位”,相当于把 AI 的思考和生成能力像石油一样商品化,可计量、可交易。一段 1000 字的文章大约对应 1300 个 Token,而当企业调用大模型 API 时,每一次对话、每一次代码生成、每一次智能体任务,都在消耗 Token。

调用量的持续攀升,说明国产大模型正在从 “免费试用” 阶段迈入 “真实付费商用” 阶段。以智谱为例,2026 年一季度其 API 调用定价提升了 83%,即便如此,市场依然供不应求,调用量增长了 400%。这释放了一个清晰的信号:企业和开发者正在将国产大模型深度集成到实际业务中,形成了高频、不可逆的算力需求。

更重要的是,AI 应用正在经历一场根本性的范式跃迁 —— 从简单的对话式 Chatbot 向复杂的 AI Agent 演进。这带来的 Token 消耗变化是量级性的。数据显示,单个 AI Agent 的 Token 消耗约为传统对话模式的 4 倍,而多 Agent 协同系统更是高达 15 倍。这意味着,Token 消耗的增长不是线性的,而是指数级的。

可以这样理解:如果说 Chatbot 时代 Token 是 “按次计费” 的出租车,那么 AI Agent 时代 Token 就是 “持续跑动” 的出租车队 —— 一辆车一天可能跑十几个小时,消耗量级完全不可同日而语。中国大模型调用量连续五周在 OpenRouter 平台霸榜,本质上反映的是国内 AI Agent 生态正在率先形成规模化落地。

三、阿里 Qwen3.6-Plus 为何能单日 “封王”?

在这一轮超越中,阿里千问 3.6 系列扮演了核心引擎的角色。4 月 2 日,阿里发布了新一代编程大模型 Qwen3.6-Plus,主打 Agentic Coding(代理式编程)和智能体能力,当天上线 OpenRouter 后调用量快速攀升,发布次日调用量激增 711%,单日突破 1.4 万亿 Token,一举打破了 OpenRouter 平台的单日单模型调用量全球纪录,被该平台官方评价为 “新模型发布最强劲的表现”。此后该模型连续 4 天霸榜日榜,最终登顶周榜。

这款模型之所以能引发如此巨大的调用热潮,关键在于它切中了一个巨大的市场需求 —— 编程。Qwen3.6-Plus 在多项国际权威编程评测中表现惊艳,在 SWE-bench 等真实编程任务测试中,以不到 200 亿的参数规模,超越了 GLM-5、Kimi-K2.5 等参数量是其 2 至 3 倍的竞品。在国际知名大模型竞技场 Arena 的编程能力子榜中,Qwen3.6-Plus 排名中国第一,阿里也成为该子榜下编程能力全球排名第二的 AI 机构。

除了编程,Qwen3.6-Plus 还具备原生多模态能力,能够基于界面截图、设计稿或自然语言描述完成前端页面生成和代码修复,打通了从 “看懂界面” 到 “生成代码” 的完整链路。同时支持 100 万 Token 的超长上下文窗口,输入价格为 2 元 / 百万 Token(原价 4 元,当前 5 折优惠),输出价格为 12 元 / 百万 Token,OpenRouter 上的 Preview 版本同步提供免费试用,模型在性能与成本之间找到了一个极具竞争力的平衡点。

在 4 月 1 日至 2 日,阿里还密集发布了全模态模型 Qwen3.5-Omni、文生图模型 Wan2.7-Image 等多款新模型,在 AI 社区掀起了一股 “千问旋风”。密集的产品发布叠加高性价比的 API 定价,直接催化了调用量的爆发式增长。

四、Token 爆发的涟漪效应:从 AI 应用到国产算力

调用量持续走高,最直接的受益方是底层算力基础设施。每一次 Token 消耗,背后都对应着 GPU 芯片的运转。随着中国大模型在 OpenRouter 平台调用量突破日均万亿级别,国产 AI 芯片的替代进程正在从政策驱动加速转向市场驱动。

市场数据已经给出了反馈。4 月 7 日,国产 AI 芯片龙头寒武纪股价盘中大涨超 10%,带动芯原股份、沐曦股份、海光信息等产业链个股同步走强。寒武纪 2025 年年报显示,全年实现营业收入 65 亿元,同比大增 453.2%,归母净利润 20.6 亿元,上市以来首次实现年度盈利。

中信建投研报指出,2025 年中国 AI 加速卡市场总出货量约 400 万张,国产 AI 加速卡份额已超 40%。随着调用量持续攀升,国产算力厂商正在进入业绩释放的临界点。

从更宏观的视角来看,Token 调用量的持续增长意味着国产大模型的商业化落地速度已经赶超海外。中国大模型不再只是 “技术追赶者”,而是在应用层面开始占据全球市场的主导份额。Token 正在成为数字经济时代的 “新石油”,而中国正在这场能源战争中抢占主动权。

五、国产 AI 军备竞赛的下一个看点在哪儿?

五周霸榜只是开始,AI 产业的竞争逻辑正在发生深刻变化。

第一,竞争焦点从 “参数竞赛” 转向 “调用量竞赛”。参数再大、Benchmark 分数再高,如果没有人用、没有企业接入,就没有商业价值。调用量是检验大模型真实商业竞争力的硬指标。

第二,Token 定价壁垒正在形成。中泰证券指出,国产 AI 有望凭借能源与算力成本优势,构筑高性价比的 Token 定价壁垒,形成与美国大模型竞争的核心差异化优势。成本更低、效果接近甚至局部领先,正是国产大模型实现 “弯道超车” 的关键。

第三,AI Agent 和多模态应用将引爆下一轮 Token 消耗浪潮。当 AI 开始执行复杂的多步骤任务、当视觉智能体编程成为主流开发范式,Token 消耗量将迎来新一轮量级跃迁。谁率先在 Agent 生态中占据主导,谁就锁定了下一轮增长的红利。

消息称,千问 3.6 系列还将开源其他尺寸的模型,性能更强的旗舰模型 Qwen3.6-Max 也将于近期发布。当开源策略与高性能模型结合,国产大模型在开发者社区的渗透率有望进一步提升。

中国大模型五周在 OpenRouter 平台超越美国,不是一个需要过度渲染的 “叙事符号”,而是产业生态日渐成熟的真实映射。Token 的爆发式增长背后,是一个从应用到算力、从商业化到基础设施的完整闭环正在加速运转。这场 “新石油战争” 才刚刚拉开序幕,而中国 AI 产业已经站在了牌桌的中央位置。