最近的 AI 浪潮有点有趣了,一边是各种宣发模型有多强,AI 工具有多好用,一边又因为算力不足,各种涨价或者变相涨价,比如钉钉 CEO 的最新发言里就说:「只要被我看到这个文档是人写的,我肯定批评」:
但是回到阿里云的 Qwen 模型订阅,先是 Lite 下架不给续费,然后是 Lite 订阅不能续费,接着是 200/月的 Pro 订阅抢购不到,然后又开始传出 Pro 订阅也要下架的消息:
然后这几天,阿里云推出了 Token Plan ,看起来接下来 Qwen 会开始全新的按量计费的时代?从用量上看,1398 的尊享的用量是对标 Qwen Code Plan Pro ,不过价格就不一样了,提价意味明显:
实际上这几天都有类似情况,比如 GitHub Copilot 就在 4 月 20 号修改了订阅政策:
- Copilot Pro:Opus 系列(包括 4.5、4.6、4.7)全部移除,用户无法再选择 Opus 模型,说没就没
- Copilot Pro+(约 39-40 美元/月):目前只保留 Opus 4.7
- 暂停新用户注册/付费:Student(学生计划)、Pro、Pro+ 的新订阅全部暂停
虽然现有用户不受影响,可以继续使用,但新用户暂时进不来(包括试用也多已暂停),GitHub 官方解释是为了提升服务可靠性和简化模型供应,但目前看来,实际核心原因是 agentic workflows 大幅增加了计算消耗,所以智能决定收紧高端模型的访问。
这其实也是现在的 AI 情况,推出了一款产品,在你付款的过程中,突然撤回了你已经花了钱购买的产品的服务,而且这貌似是也是合法的,比如在 Github 的协议里:
类似的情况在国内的协议也很常见,所以高峰期的时候,类似 GLM 等平台可以对你限速,也可以 429 ,感觉之前的订阅就像是健身房的月卡年卡,就像是一份对赌协议,但是没想到,随着 OpenClaw 和 AI 浪潮的加速,各家发现自己根本承接不了这么多 Token 消耗,而且怎么看就都血亏,所以都开始了相当大幅度的收敛。
如果你用的是平台 API ,其实也是类似,因为一般的 SaaS 标准三件套,他的服务和条款核心都会有:
-
服务可以修改
- 服务内容可以变更
- 功能可以调整
-
不保证持续可用
- 不承诺某个 feature 永久存在
- 第三方依赖可变
比如如果你用的是 Qwen 的 Code Plan ,那么实际上你使用的是“服务”,而权利来自授权,服务协议就是整体约束,所以用量不是你拥有,是平台控制,这就是为什么你订阅了,但是会出现用着用着,就变了的原因。
比如 Z.AI (智谱 GLM 海外版)coding plan 也调整协议限制非代码场景,说人话就是不给你在 OpenClaw 用了,非 Coding 场景使用会被严格限速,三次或三次以上违规就永久封禁。
突然想起之前 MiniMax 暗讽 Claude 禁止 Plan 用于 OpenClaw 的情况,现在 Minimax 也在 429/529 套餐了,它甚至可以在 error 里打广告
又比如 Claude Pro 虽然还是 $20/月,但实际可用性目前也大幅下降,在目前一些用户的使用场景里,Opus 4.7 一次就做对的比例比 4.6 更低,大概是 74.5%,而 4.6 是 83.8%,同时每次修改平均需要的重试次数几乎翻倍,所以虽然没涨价,但是他降智了,所以你的消耗自然也变大:
特别是最近 Opus 4.7 每次调用生成的内容也明显更多,大约是 800 tokens,相比之下 4.6 是 372 tokens,这也让成本明显更高:单次调用成本约 0.185 美元,4.6 是 0.112 美元。
类似的 Google 在需求爆炸下也是优先保稳定,免费/低成本通道大幅缩水,免费层/低阶配额大幅收紧,免费层配额削减50-80%(RPM/TPM/RPD大幅降低)。
类似 Windsurf 前段时间也涨价了:
- Pro 从 20 / 月
- Teams 计划从 40 / user / 月
而机遇现在的价格不断上涨,特别还有稳定性等因素限制,听说之前大家吐槽的 「Trae 优速通」还卖的还不错,999 一个月的权益居然还可以卖得不错,只能说大众的接受力度正在发生改变····
而事实也不只是订阅商家,算力产品和按量计费这段时间也在涨价:
- 阿里的 AI 算力产品今年价格上调了 5%-34% ,同时 DataWorks API 免费额度大幅缩减,转为按量付费。
- 百度智能云 AI算力产品涨 5%-30%
- 腾讯云上调混元大模型API价格,后续AI算力产品统又再一次上调
所以现在回过头来看,小米 MIMO 之前被人骂那么贵价格,貌似也反正成了性价比之一???只能说环境变化真快,但是事实 AI 也不能只看价格, API 的有效性和速度也是一个问题。
就比如有人做了不同平台目前 Code Plan 的速度测试,可以看到不同平台的差距还是挺明显的,虽然有时候光快也没用就是了:
可以看到,AI 企业对于 AI 订阅和服务的控制力度还是很到位的,而之前一直宣传的 AI 裁员和替换潮,都在考虑用 Token 替代部分人来开源节流,但是从过去看,看起来廉价是因为订阅制带来的错觉?
而随着价格不断上涨波动,稳定性受到考验之后,有些东西又开始被重新审视起来,毕竟一个员工的价格是稳定的,还能背锅,而 AI 目前的情况是,需要不断调整预期的涨薪,而且高峰期累了就需要「429 休息」,你甚至不能多骂几句,骂了也算 Token ·····
突入就想起来前段时间 OpenAI 奥特曼深情感谢老一辈程序员,感谢古法编程的开发者让 OpenAI 走到现在,结果评论区风转急下,大家说:
"不客气,很高兴知道我们的回报是被夺走工作"。
“对啊,谢谢你们把我们喂饱了 AI,现在我们该下岗了”
不过 AI 的浪潮终究还是会继续往前,虽然短期 Token 还是看涨,但是长期来看,Token 还是应该会下降?
个人感觉,短期整体趋势还是底层算力/基础设施集体涨价 ,配合使用限制收紧,那么高消耗场景(Agent/Coding)最终会被迫转向按量或更高阶付费,从结果来看,这已经是在发生的事情。
所以,你现在用的什么套餐?如今看来,我们也只是被大势裹挟而行的牛马。