你大概也注意到一个挺拧巴的事。
一边,新闻天天说 AI 公司在疯狂烧钱、巨额亏损——做 ChatGPT 的 OpenAI,据估算一年要亏一百多亿美元;马斯克的 xAI 更夸张,传出来的数字是每赚一块钱、要倒贴大概二十六块。整个行业今年在 AI 基础设施上砸的钱,估算有六千多亿美元。
另一边,你自己用 AI 的体感却是:越来越便宜,甚至越来越多免费。国产的 DeepSeek 前阵子又永久降价,把同等能力的价格打到了对手的几十分之一。拉长看,达到同一个水平的 AI,每年价格大概降十倍。
更怪的还在后头:2026 年上半年,AI 这行其实还在同时涨价——内存(HBM)半年涨了五倍多、高端显卡抢不到货,好几家云厂商的 API 价格往上调,有的涨幅夸张到四倍多。
烧钱、涨价、白菜价。三件方向完全相反的事,在同一个行业、同一段时间里同时发生。
这到底怎么回事?钱到底是怎么算的?
我把这事从头捋了一遍,发现关键就一句话——
这压根不是一笔账,是三笔账,各走各的。
把这三笔账拆开,你就看懂了 2026 年 AI 行业几乎所有的拧巴。
第一笔账:训练,烧的是赌明天的钱
AI 公司烧的那些天文数字,绝大部分不是花在「伺候你这次提问」上,是花在训练下一代模型 + 抢算力上。
这是一场军备竞赛。谁的模型强一档,谁就可能赢家通吃,所以谁也不敢停——拼命买显卡、建数据中心、囤算力,赌的是一个还没到来的未来。
这笔钱有多吓人?据估算,光是几家最大的云巨头,今年在 AI 基础设施上的预算就有四千多亿美元。而且越往后越烧:有泄露出来的内部预测说,OpenAI 的年亏损会从今年的一百多亿,一路涨到几年后的四百多亿。
更要命的是,这笔账没法对冲。Anthropic 的 CEO 自己说过一句很实在的话(大意):买算力这件事,世上没有任何对冲手段——买多了,万一需求没跟上,能把公司拖垮;买少了,又会在竞争里掉队。
所以第一笔账的特点是:赌未来,越赌越烧。 它跟你这次用 AI 花了几分钱,几乎没关系。
第二笔账:硬件,涨价的是卖铲子的
第二笔账,解释了为什么 2026 还在「涨价」。
淘金热里最稳赚的,从来是卖铲子的。AI 这波,铲子就是显卡和内存。
需求太猛,供给跟不上——高端 GPU 长期抢不到,那个专门给 AI 用的高带宽内存(HBM),据报道半年价格涨了五倍多。卖铲子的(做芯片、做内存的)赚翻了,而买铲子的(云厂商、模型公司)成本被狠狠抬高。
于是你会看到,好几家云厂商把 AI 相关的服务往上调价,有的涨幅到了四倍多;国内也有大模型厂商一年之内连着涨了三次价。
注意,这一层的涨价,涨的是算力和硬件的价,不是终端模型调用的价。这两层,方向正好拧着。
第三笔账:推理,白菜价是真本事
现在到了最关键、也最反直觉的一笔——你天天感受到的「越来越便宜」,到底怎么来的。
先分清一个事:AI 的成本,九成以上其实不在训练,在推理——也就是你每发一次问、它每答一次,要花的那些实打实的算力开销。训练是一次性的,推理是每次调用都要花的,跑一辈子。
而推理这一层的单次成本,这两年是结构性地往下掉的。靠两样东西。
第一样,是工程。 这两年业界把「怎么让模型答得又快又省」卷出花了:
我尽量用人话说这几招:
- MoE(混合专家):模型很大,但每次回答只激活其中一小部分「专家」,不用整个大脑全开,省算力。
- 稀疏注意力:不让模型对每个字都死磕,只盯重要的,省下大量计算。
- 量化:把模型里的数字精度降一降(比如从高精度压到低精度),内存少一半、速度更快,质量几乎不掉。
- KV 缓存压缩:把对话里反复要用的中间结果压小,省显存——这块去年到今年进步特别大。
- 推测解码:用一个小快模型先「抢答」几个字,大模型一次性批量核对,省掉一个一个憋字的功夫。
这些招叠起来,单次推理成本能砍掉六到八成。国产的 DeepSeek 是个典型——据报道,它新一代模型在超长上下文下,算力开销只要上一代的两三成、缓存只要一成,靠的就是自研的一套注意力架构(顺带也用上了国产算力)。
第二样,是竞争。 开源模型这一年集体逼近了第一梯队——好几个开源模型家族,在发布后几个月内就摸到了接近顶级闭源模型的水平,价格却便宜十倍以上。这就给所有人的报价压了一个硬顶:你卖太贵,客户干脆自己跑个开源的。DeepSeek 带头把价格打到全球新低,小米这些也跟着压,价格战就这么烧起来了。
工程把成本压下来,竞争把利润挤出去。两头一夹,推理价格就成了白菜价。
但有两件事,你得想明白
讲到这,「三笔账」的拧巴就解开了:烧钱烧在训练、涨价涨在硬件、白菜价降在推理。三层各走各的,一点都不矛盾。
但白菜价这件事,还藏着两件反直觉的事,不说清楚你会被带偏。
第一:你享受的便宜,是「昨天的智能」在打折。
价格暴跌的,是「达到某个固定水平」的能力。去年的顶级模型,今年变成了便宜货——这部分确实每年降十倍。但「当前最强的那一档」,价格一直很坚挺。研究机构的数据也印证:固定能力的价格每年能降几十倍,可前沿模型几乎不降。
而且现在最强的那批「会思考」的推理模型,答一个问题前要先在心里「想」一大通,这些思考也是要烧 token 的。所以哪怕单价在降,你真用最强的模型干活,账单不一定少。
便宜的永远是昨天的前沿,今天的前沿永远贵。 这是这门生意的铁律。
第二:越便宜,大家反而花得越多。
这就是经济学里有名的「杰文斯悖论」——东西越便宜,用得越凶,总开销不降反升。
AI 这儿体现得淋漓尽致。单 token 是便宜了,但现在的 agent 干个活,动不动调用模型几十上百次;长上下文、反复自我检查,都是成倍地吃 token。结果就是:据报道,Uber 四个月就烧光了全年的 AI 预算——因为内部用 Claude Code 写代码的人,从三成飙到八成多,每个工程师一个月的 API 账单冲到几百上千美元。
所以「白菜价」没让任何人真省到钱,它只是把整个盘子做得更大了。这也正是模型公司那个怪现象的根源——客户越多,亏得越狠:每多一个用户、每多一次调用,它都得垫上实打实的算力成本。
那这对你意味着什么
把三笔账和这两件事摞一块,落到实处:
如果你是用 AI 的人:别一上来就用最贵最强的。分清档位——要顶尖推理的活,用前沿模型;大量重复、简单的活,用便宜档(连谷歌的 CEO 都在劝大客户多用便宜的 Flash 档,说能省下十亿美元级的钱)。还有,别按「每 token 多少钱」算账,要按「干成一件事总共花多少」算——前者在降,后者可能在涨。
如果你关心这行往哪走:盯两个东西。一是谁烧得起——同样在亏,有的公司选择不自己建数据中心、而是租算力,把烧钱比例压得低;有的背着一大堆免费用户,烧钱比例下不来。资本轻的,活下去的概率更大。二是价格的地板在哪——只要开源模型能逼近前沿,价格的底就是「你自己跑一个开源等价模型要花多少」,而这个底每年还在往下掉三到五成。换句话说,靠卖「通用模型调用」赚大钱,会越来越难。
还有一个容易被忽略的红利:推理白菜价的意义,其实不在帮你省钱,是解锁了以前做不起的东西。以前一个任务调模型上百次、喂几十万字上下文、让它反复自检——这些想都不敢想,因为烧不起。现在做得起了。机会就在这些「过去太贵、现在突然可行」的应用里。
最后
所以别再纠结「AI 到底是在烧钱还是白菜价」了——它同时是。
烧的是赌明天的钱,涨的是中间卖铲子的价,降的是卖给你今天的价。三笔账,各走各的方向。
看懂这三笔账,2026 年 AI 行业那些看着拧巴的事,全都顺了:为什么巨亏还要拼命降价(推理账上不降价就抢不到客户),为什么降价了还是活不下去(训练账上烧得更凶),以及——为什么这场淘金热里,最稳赚的可能不是挖金子的(做模型的),而是卖铲子的(做芯片和算力的)。
便宜的是昨天,烧钱的是明天。你我享受着昨天打折的智能,而这些公司,在赌一个还没到来的明天。