前天,Anthropic 官网突然将 Claude Code 的使用权限从 Pro 会员撤下,这一石激起千层浪,引得大家群起大骂,虽然被骂得又改了回去,但还是说了正在对约 2% 的新 Pro 用户进行移除 Claude Code 的灰度测试。
人们从使用 AI 聊天问答,到使用 AI Agent 干活,把它真正变成生产力工具。从以前连开个 10 块钱的 QQ 会员都要犹豫,到今天愿意花 20 美元甚至更高的订阅费,求着厂商让自己用,就能看出人们对 AI 的依赖已经越来越深。很多人原本预期,token 费用会随着用户量增加而被摊薄,最后像流量费一样越来越便宜,但现实并没有朝这个方向发展,反而是厂商纷纷开始涨价。
从我作为用户的角度来看,基本上 AI 厂商还是走互联厂商那一套,在用补贴和低价完成圈地、拉完人头之后,开始收紧权益、重写规则,把前期换来的用户基础逐步兑现成收入和利润,这样才好向市场和股东继续他们的资本叙事。
用户量越多,Agent 越能干,厂商的成本反而越高
过去互联网的打法就是先用低价、免费额度和各种会员权益把用户拉进来,先把市场占住再说,是不是很熟悉,一样的套路,AI 厂商也是用的这套打法。
但问题在于,他们最早预估的使用场景,其实还是“聊几句、问几个问题、写几段文案”。在这种模式下,单个用户一次请求消耗的 token 和算力都比较有限,靠规模去摊薄成本这件事,至少表面上还是成立的。
可 OpenClaw 这样的 AI Agent 爆发之后,这个预期一下就被打穿了。用户不再只是提一个问题就走,而是开始把 AI 当成真正能持续干活的数字员工。一次 Agent 任务,往往不是一轮简单问答,而是一整套又长又重的推理过程,token 消耗更多,占用算力更久,GPU、缓存、网络和调度成本也都跟着往上走。也就是说,Agent 越能干,厂商为每个重度用户付出的真实成本就越高。
尤其现在各家最想抢的,本来就是最愿意付费、也最依赖 AI 的那批用户,而这批人恰恰也是最爱用高阶模型、长上下文和复杂工具链的人,原本靠补贴维持的平衡,被 AI Agent 的真实负载彻底打破了。
隐性涨价,先从权益缩水开始
Claude
Anthropic 被曝正在对约 2% 的新 Pro 用户测试不含 Claude Code,对OpenClaw 等AI Agent的使用要额外这说明高成本能力开始被拆出来单独收费。
GitHub Copilot
官方宣布暂停新的 Pro、Pro+、Student 注册,收紧个人版额度,并把 Opus 从 Pro 中移除,只把更强模型留给更高价层级。
Qwen
Qwen Code 先把免费 OAuth 日额度从 1000 砍到 100,再彻底取消;Coding Plan Lite 停止新购和续费;随后推出 Token Plan,把原来更像订阅的逻辑改成按 Credits 抵扣。
GLM
GLM-5 推出后,Coding Plan 取消首购优惠、价格上调,API 价格也随高阶模型一起抬升。
这些表面上看没有直接加价,实际体验却是你能用到的东西越来越少,想维持原来的体验就得花更多钱。
为什么这轮涨价来得这么密集
这轮涨价来得这么密集,不只是因为强化资本市场叙事和成本高了,更因为 AI 行业其实已经开始缩圈了,玩家们进入了淘汰赛。
最明显的信号之一,就是 Cursor,曾经的王者,要和马斯克谈收购,SpaceX 在 2026 年 4 月 21 日拿到了未来收购 Cursor 的选择权,算是两个 AI 落魄玩家的“强强联合”了。
不只是国外,国内的 AI 厂商也早已分化,千问,MiniMax 和 GLM 第一梯队,六小龙跑出了两家头部,剩下的就不细分了,都算做是第二梯队,毕竟在互联网时代,就说过赢家通吃,说白了,玩家正在变少,资源正在往头部集中,连一直低调地从不融资的 Deepseek 都要传出融资 50 亿,再不发力,可要掉队了。
token 费用未来是否会变得像流量费用一样变得便宜?
很多人都喜欢拿 token 和互联网时代的流量费作类比。逻辑也很简单:过去大家讲互联网+,今天大家讲 AI+;以前流量费随着技术进步越来越便宜,所以很多人自然会觉得,token 以后也会像流量一样一路降价,最后便宜到几乎可以忽略。
但我的观点恰恰没这么乐观,我觉得 token 的未来更可能是,贵的依然贵,便宜的依然便宜。
这句话什么意思?流量本质上是相对标准化的东西,不管你用 1GB 还是 10GB,你买的其实都是同一种资源,差别主要只在于用量多少。而 token 不是。token 的价格不仅取决于你用了多少,还取决于你在用什么模型、要什么能力、跑多长的上下文、做多复杂的任务。
同样是一百万 token,小模型和大模型的价格可以差很多,普通生成和高强度推理也完全不是一回事。一个只会做简单问答的轻量模型,未来当然会越来越便宜;但一个能写代码、调工具、跑长链路、多轮修正、还能稳定输出结果的高阶 Agent,背后消耗的从来就不只是 token 本身,还有训练成本、推理成本、部署成本和整套工程系统的成本。
也就是说,未来一定会有大量“白菜价 token”出现,尤其是那些低端、标准化、能力差异没那么大的调用场景,会越来越卷,价格也会越来越低。但另一边,真正先进、真正稳定、真正能替代人干复杂工作的那部分 token,不仅不会无限便宜,反而很可能长期保持溢价。
说得再直接一点,AI 不太会变成“所有 token 都像流量一样便宜”,更可能会变成京东和拼多多(叠个甲,并没有贬低拼多多,而是说面向消费群体不一样)。拥有基础能力的 token 会越来越便宜,甚至最后变成公共资源;但高端模型、高阶推理和 Agent 工作流,提供的是质量保证的服务,而且越是头部厂商,越不会轻易把最强能力卖成白菜价!
那有人就反驳说出个像 DeepSeek 一样的模型不就能卖成白菜价了吗?
然而 DeepSeek 至今还没有生图功能!还是拿京东和拼多多举例回答,只要费用远小于提高生产力的成本,人们会愿意付费给有质量保证的服务,盈利循环才能不断促进良性发展,形成护城河。