从「抢火车票」到「算力焦虑」:阿里、腾讯、智谱集体抛弃 Coding Plan,AI 编程进入按量付费时代

12 阅读7分钟

从「抢火车票」到「算力焦虑」:阿里、腾讯、智谱集体抛弃 Coding Plan,AI 编程进入按量付费时代

从 12306 到 Coding Plan,十六年了,我们还在盯着屏幕刷新。

本文数据截至 2026 年 4 月,附各平台新旧套餐对比及开发者应对策略。


先说结论

三家云厂商,几乎同一时间,把「自助餐」换成了「按量付费」:

  • 阿里云百炼:Lite 停售,Pro 长期「已售罄」,新推 Token Plan 团队版 198/月起
  • 腾讯云:旧 Coding Plan 已清退,全面升级 Token Plan,Lite 39/月约 3500 万 Tokens
  • 智谱:2 月至今连续三次涨价,Lite 49 → 149,海外版月费接近翻倍

这不是巧合,是行业算力成本的一次集体调整。


阿里:7.9 块的蜜月期,三个月翻篇

2 月份阿里推 Coding Plan 时有多猛?

  • Lite 月费 40,新用户首月 7.9,次月续费 5 折(20 块)
  • 每月 18000 次请求
  • 可同时用千问、GLM、Kimi、MiniMax

开发者圈子里疯传:「一杯奶茶钱,AI 编程自由。」

三个月后,梦碎了。

4 月 13 日 18 点,Lite 套餐停止续费和升级,新用户只能买 Pro 版(200/月)。问题是 Pro 也抢不到——每天 9:30 补货,经常秒光。

阿里干脆推倒重来,上 Token Plan 团队版,198/月起,按 Credits 计费。个人开发者发现:原来 40 块包月随便用的服务,现在最低门槛抬到 198,还按量计费,心里没底。

更扎心的是:Coding Plan 虽然还在,但不再支持新模型了。有用户在社区吐槽:

百炼已经接入了 GLM-5.1 和 Kimi-K2.6,Coding Plan 看起来没支持的意思。上一代模型 + qwen,次数是挺多,但抢不到有啥用。

社区一片哀嚎:「阿里云 Coding Plan 废了,大家散了吧。」


腾讯:39 块买来的,重度用户一天耗光

腾讯比阿里还早动手。

3 月 26 日,腾讯把编码套餐全面升级为 Token Plan,旧 Coding Plan 清退。新套餐分四档:

套餐月费Tokens 额度OpenClaw 场景可用轮数
Lite39 元3500 万~70 轮
Standard99 元1 亿~200 轮
Pro299 元3.2 亿~640 轮
Max599 元6.5 亿~1300 轮

70 轮是个什么概念?

蓝点网实测数据:

  • 轻度用户:每日约 24M Tokens
  • 中度用户:每日约 60M Tokens
  • 重度用户:每日约 102M Tokens

也就是说,599 的 Max 套餐(650M),重度用户最多撑一星期。

以前包月自助餐,交一笔钱心里踏实;现在看着额度哗哗流,极易得「Token 焦虑症」。

腾讯不是个例。3 月中开始,各家云厂商在 OpenClaw 火起来后密集推低价编程套餐,用户发现 24 小时跑 Agent 时套餐还有余额,比直接买 API 划算,需求井喷。

3 月 17 日起各家调整:

  • 腾讯:每天 10 点限量抢,40 块 Lite 秒光
  • 阿里:停售 Lite 只留 Pro,每天 9:30 限量补货秒光
  • 百度千帆:同样售罄

智谱:连涨三次,海外版直追 Claude

智谱没彻底取消 Coding Plan,但做法一样狠。

调价时间事件涨幅
2 月 12 日发 GLM-5,取消首购优惠30%+
3 月 8 日发 GLM-5.1,再涨+10%
4 月海外版月费接近翻倍

国内版目前三档:Lite 49、Pro 149、Max 469,累计涨幅不小。海外版直逼 Claude——GLM-5.1 缓存命中 Token 单价 0.475 美元/百万,接近 Claude Opus 的 0.5 美元。

智谱官方解释:「用户量激增,热情超预期,高峰期并发报错。为保障体验,短期限售。」从 1 月 23 日起,每天 10 点释放新库存。抢到的欢天喜地,抢不到的明天再来。

跟春运限售窗口期一个逻辑——不是没票,是票不够分。

如果你也是每天 10 点蹲守的「抢码大军」,流程你一定熟:

  • 9:55 坐电脑前,确认账号在线、支付已绑定。从容。自信。志在必得。
  • 9:59:50 开始数秒。9:59:55,手放刷新键上。10:00:00——刷!
  • 页面转圈,转圈,转圈。三十秒后:「当前访问人数较多,请刷新重试。」
  • 开始疯狂 F5。一下,两下,三下。偶尔加载出来——「暂时售罄」。
  • 十八分钟后终于刷出来了,库存早没了。

十六年了。连措辞都没怎么换。


为什么三家同时动手?算一笔账就明白了

三件事放一起,核心矛盾只有一个:算力太贵,供给跟不上需求。

需求端:2026 年 3 月,国内日均 Token 调用量已破 140 万亿,比 2025 年底增长 40%。智谱 CEO 张鹏透露:一个 Agent 任务消耗的 Token,可能是简单问答的 10 倍甚至 100 倍

供给端更惨:

  • 英伟达 GPU 对华断供超一年
  • 台积电高端芯片产能扩建缓慢
  • 国产智算服务器年后报价普遍涨三成以上
  • 华为昇腾服务器第二轮调价,单台最高涨 48 万

供需失衡的结果就是涨价:

  • 阿里云 AI 算力和存储全线涨价,最高 34%
  • 腾讯云 5 月 9 日起 AI 算力产品上调 5%,混元大模型最高涨 463%
  • AWS 因算力不足把部分业务让给谷歌云

云厂商算账逻辑很简单:以前烧钱换用户,现在用户来了,该回血了。


各平台新旧套餐对比

平台套餐旧价格新价格变化
阿里云百炼Lite40/月停售
阿里云百炼Pro200/月新增
阿里云百炼Token Plan 团队版198/月起(Credits)新增
腾讯云Lite40/月39/月(3500万Tokens)换算
腾讯云Standard99/月(1亿Tokens)新增
腾讯云Pro299/月(3.2亿Tokens)新增
腾讯云Max599/月(6.5亿Tokens)新增
智谱Lite49/月49/月 → 149/月涨价 200%+
智谱Pro149/月149/月 → 469/月涨价 200%+
智谱Max399/月469/月 → —涨价

现在怎么办?开发者应对策略

1. 多平台组合,别死磕一家

百度千帆和 Kimi 价格相对稳,智谱 GLM 到 4 月底还有 1 倍抵扣窗口,可以搭配着来。

2. 年付能锁就锁

智谱国内版 Lite 年付 470(原价 588),有预算就提前锁住。腾讯 Token Plan 长期有效,不着急可以观望。

3. 评估本地推理的可行性

一台能跑 Qwen-Coder 或 DeepSeek-Coder 的机器,前期投入贵一次,之后不用看着额度哗哗流。长期来看,比按月烧 API 划算。

推荐开源模型(截至 2026 年 4 月):

  • Qwen-Coder 32B:中文代码能力强,推理成本低
  • DeepSeek-Coder 33B:性价比高,适合中小项目
  • CodeQwen 7B:轻量级场景够用,本地能跑

4. 优化使用习惯

  • 简单任务用小模型,复杂任务用大模型
  • 智谱 GLM-5.1 非高峰期(14:00-18:00 之外)只按 1 倍抵扣,同样的额度能干更多活

5. 先上车再补票

哪个档能抢到就先抢哪个,订阅期内升级不受限售限制。


一点感想

有个朋友跟我说,每天定闹钟抢 Coding Plan,感觉自己在「为 AI 打工」。

我觉得他说到点子上了。

与其每天盯着屏幕刷新,不如把这些时间用来想清楚:你的工作流里,哪些必须靠云端,哪些其实完全可以本地化。 算明白这笔账,比抢到一次额度有用得多。

从 12306 到 Coding Plan,十六年了,焦虑从来没变过。倒是该变的,是我们对它的态度。


作者:老王,一个每天用 AI 写代码的程序员。不吹不黑,用数据和实战告诉你 AI 到底能干什么。

公众号老王的 AI 编程


标签

AI编程 阿里云 腾讯云 Coding Plan Token Plan AI大模型 开发者工具