日均140万亿Token,中国AI两年涨了1400倍——我慌了吗?
说实话,看到这个数的时候,我先是愣了一下,然后打开计算器算了算。
140万亿 ÷ 1000亿 = 1400。
两年。1400倍。没算错。
国家数据局局长在中国发展高层论坛上亲自说的数,不是自媒体瞎编的。
然后我就开始想一个问题:这些Token都是谁在"烧"?跟我这种普通开发者有啥关系?
先看这条曲线有多野
2024.01 ████ 1000亿
2025.06 ████████████████████████████████████████ 30万亿 (300x)
2025.12 ██████████████████████████████████████████████████████████████████████████████████ 100万亿 (1000x)
2026.03 ████████████████████████████████████████████████████████████████████████████████████████████████████████████ 140万亿 (1400x)
注意最后一段,从100万亿到140万亿,3个月,涨了40%。
这不是线性增长,这是Math.pow(x, n)里n还在变大的那种。
谁在烧Token?
C端大户:
- 豆包:月活2.26亿,日均Token消耗超50万亿(没打错,就是50万亿)
- DeepSeek:月活1.35亿
- 这俩加一起,基本就是国内AI应用的半壁江山了
B端才是真正的大头:
- 企业API日均调用:37万亿Token(2025下半年)
- 半年前才10.2万亿,涨了263%
- 96%的企业说还要加码投入
说白了,你公司的客服系统、风控系统、数据分析平台,大概率已经在调大模型API了。你写的业务代码里,可能已经套了好几层LLM调用。
中国凭啥反超美国?
2月份中国模型周调用量首次超过美国。全球Top 5里4个是中国的。
核心原因就一个字:省。
- 国产模型:~0.3美元/百万Token
- 海外模型:~5美元/百万Token
- 差距:16倍
怎么做到的?
- MoE架构:8个expert只激活2个,推理内存降60%
- 电费便宜:西部机房0.2-0.3元/度,海外1-1.5元
- 卷:国内大模型公司太多了,不卷价格卷什么
这跟当年互联网打价格战是一个套路。先把量做起来再说。
但是——API要涨价了
这才是我最关心的:
| 云服务商 | 涨幅 |
|---|---|
| 阿里云 | 5%-34% |
| 腾讯云 | 超4倍 |
| AWS | 约15% |
补贴时代可能快结束了。
作为开发者,几个实操建议:
1. 别啥请求都打最贵的模型
简单任务用轻量模型,复杂任务才上重型模型。省下来的都是真金白银。
2. 做语义缓存
相似的查询别每次都重新推理,加一层embedding相似度匹配,命中了直接返回缓存结果。
3. Prompt别写废话
你prompt里那些"你是一个专业的xxx,请认真地xxx",很多时候就是在烧Token。精简prompt,效果可能还更好。
4. 关注智能体的Token消耗
智能体市场今年预计增长70%+。一个Agent跑一次可能消耗普通QA的10-100倍Token。如果你在做Agent相关的开发,成本控制要从架构设计阶段就考虑进去。
所以我慌了吗?
说实话,不慌,但挺兴奋的。
140万亿日均Token意味着这个市场是真的起来了,不是PPT阶段了。JPMorgan说到2030年还要再涨370倍。
两年前我还在纠结"要不要学大模型开发",现在看,这个问题已经不存在了。存在的问题是:怎么在Token越来越贵的趋势下,把每个Token的价值榨干。
这个能力,可能是未来几年开发者最值钱的技能之一。
你们公司现在日均消耗多少Token?评论区聊聊?