AI 公司巨亏，你却用得越来越便宜你大概也注意到一个挺拧巴的事。一边，新闻天天说 AI 公司在疯狂烧钱、巨额亏损——做

你大概也注意到一个挺拧巴的事。

一边，新闻天天说 AI 公司在疯狂烧钱、巨额亏损——做 ChatGPT 的 OpenAI，据估算一年要亏一百多亿美元；马斯克的 xAI 更夸张，传出来的数字是每赚一块钱、要倒贴大概二十六块。整个行业今年在 AI 基础设施上砸的钱，估算有六千多亿美元。

另一边，你自己用 AI 的体感却是：越来越便宜，甚至越来越多免费。国产的 DeepSeek 前阵子又永久降价，把同等能力的价格打到了对手的几十分之一。拉长看，达到同一个水平的 AI，每年价格大概降十倍。

更怪的还在后头：2026 年上半年，AI 这行其实还在同时涨价——内存（HBM）半年涨了五倍多、高端显卡抢不到货，好几家云厂商的 API 价格往上调，有的涨幅夸张到四倍多。

烧钱、涨价、白菜价。三件方向完全相反的事，在同一个行业、同一段时间里同时发生。

这到底怎么回事？钱到底是怎么算的？

我把这事从头捋了一遍，发现关键就一句话——

这压根不是一笔账，是三笔账，各走各的。

把这三笔账拆开，你就看懂了 2026 年 AI 行业几乎所有的拧巴。

第一笔账：训练，烧的是赌明天的钱

AI 公司烧的那些天文数字，绝大部分不是花在「伺候你这次提问」上，是花在训练下一代模型 + 抢算力上。

这是一场军备竞赛。谁的模型强一档，谁就可能赢家通吃，所以谁也不敢停——拼命买显卡、建数据中心、囤算力，赌的是一个还没到来的未来。

这笔钱有多吓人？据估算，光是几家最大的云巨头，今年在 AI 基础设施上的预算就有四千多亿美元。而且越往后越烧：有泄露出来的内部预测说，OpenAI 的年亏损会从今年的一百多亿，一路涨到几年后的四百多亿。

更要命的是，这笔账没法对冲。Anthropic 的 CEO 自己说过一句很实在的话（大意）：买算力这件事，世上没有任何对冲手段——买多了，万一需求没跟上，能把公司拖垮；买少了，又会在竞争里掉队。

所以第一笔账的特点是：赌未来，越赌越烧。 它跟你这次用 AI 花了几分钱，几乎没关系。

第二笔账：硬件，涨价的是卖铲子的

第二笔账，解释了为什么 2026 还在「涨价」。

淘金热里最稳赚的，从来是卖铲子的。AI 这波，铲子就是显卡和内存。

需求太猛，供给跟不上——高端 GPU 长期抢不到，那个专门给 AI 用的高带宽内存（HBM），据报道半年价格涨了五倍多。卖铲子的（做芯片、做内存的）赚翻了，而买铲子的（云厂商、模型公司）成本被狠狠抬高。

于是你会看到，好几家云厂商把 AI 相关的服务往上调价，有的涨幅到了四倍多；国内也有大模型厂商一年之内连着涨了三次价。

注意，这一层的涨价，涨的是算力和硬件的价，不是终端模型调用的价。这两层，方向正好拧着。

第三笔账：推理，白菜价是真本事

现在到了最关键、也最反直觉的一笔——你天天感受到的「越来越便宜」，到底怎么来的。

先分清一个事：AI 的成本，九成以上其实不在训练，在推理——也就是你每发一次问、它每答一次，要花的那些实打实的算力开销。训练是一次性的，推理是每次调用都要花的，跑一辈子。

而推理这一层的单次成本，这两年是结构性地往下掉的。靠两样东西。

第一样，是工程。 这两年业界把「怎么让模型答得又快又省」卷出花了：

我尽量用人话说这几招：

MoE（混合专家）：模型很大，但每次回答只激活其中一小部分「专家」，不用整个大脑全开，省算力。
稀疏注意力：不让模型对每个字都死磕，只盯重要的，省下大量计算。
量化：把模型里的数字精度降一降（比如从高精度压到低精度），内存少一半、速度更快，质量几乎不掉。
KV 缓存压缩：把对话里反复要用的中间结果压小，省显存——这块去年到今年进步特别大。
推测解码：用一个小快模型先「抢答」几个字，大模型一次性批量核对，省掉一个一个憋字的功夫。

这些招叠起来，单次推理成本能砍掉六到八成。国产的 DeepSeek 是个典型——据报道，它新一代模型在超长上下文下，算力开销只要上一代的两三成、缓存只要一成，靠的就是自研的一套注意力架构（顺带也用上了国产算力）。

第二样，是竞争。 开源模型这一年集体逼近了第一梯队——好几个开源模型家族，在发布后几个月内就摸到了接近顶级闭源模型的水平，价格却便宜十倍以上。这就给所有人的报价压了一个硬顶：你卖太贵，客户干脆自己跑个开源的。DeepSeek 带头把价格打到全球新低，小米这些也跟着压，价格战就这么烧起来了。

工程把成本压下来，竞争把利润挤出去。两头一夹，推理价格就成了白菜价。

但有两件事，你得想明白

讲到这，「三笔账」的拧巴就解开了：烧钱烧在训练、涨价涨在硬件、白菜价降在推理。三层各走各的，一点都不矛盾。

但白菜价这件事，还藏着两件反直觉的事，不说清楚你会被带偏。

第一：你享受的便宜，是「昨天的智能」在打折。

价格暴跌的，是「达到某个固定水平」的能力。去年的顶级模型，今年变成了便宜货——这部分确实每年降十倍。但「当前最强的那一档」，价格一直很坚挺。研究机构的数据也印证：固定能力的价格每年能降几十倍，可前沿模型几乎不降。

而且现在最强的那批「会思考」的推理模型，答一个问题前要先在心里「想」一大通，这些思考也是要烧 token 的。所以哪怕单价在降，你真用最强的模型干活，账单不一定少。

便宜的永远是昨天的前沿，今天的前沿永远贵。 这是这门生意的铁律。

第二：越便宜，大家反而花得越多。

这就是经济学里有名的「杰文斯悖论」——东西越便宜，用得越凶，总开销不降反升。

AI 这儿体现得淋漓尽致。单 token 是便宜了，但现在的 agent 干个活，动不动调用模型几十上百次；长上下文、反复自我检查，都是成倍地吃 token。结果就是：据报道，Uber 四个月就烧光了全年的 AI 预算——因为内部用 Claude Code 写代码的人，从三成飙到八成多，每个工程师一个月的 API 账单冲到几百上千美元。

所以「白菜价」没让任何人真省到钱，它只是把整个盘子做得更大了。这也正是模型公司那个怪现象的根源——客户越多，亏得越狠：每多一个用户、每多一次调用，它都得垫上实打实的算力成本。

那这对你意味着什么

把三笔账和这两件事摞一块，落到实处：

如果你是用 AI 的人：别一上来就用最贵最强的。分清档位——要顶尖推理的活，用前沿模型；大量重复、简单的活，用便宜档（连谷歌的 CEO 都在劝大客户多用便宜的 Flash 档，说能省下十亿美元级的钱）。还有，别按「每 token 多少钱」算账，要按「干成一件事总共花多少」算——前者在降，后者可能在涨。

如果你关心这行往哪走：盯两个东西。一是谁烧得起——同样在亏，有的公司选择不自己建数据中心、而是租算力，把烧钱比例压得低；有的背着一大堆免费用户，烧钱比例下不来。资本轻的，活下去的概率更大。二是价格的地板在哪——只要开源模型能逼近前沿，价格的底就是「你自己跑一个开源等价模型要花多少」，而这个底每年还在往下掉三到五成。换句话说，靠卖「通用模型调用」赚大钱，会越来越难。

还有一个容易被忽略的红利：推理白菜价的意义，其实不在帮你省钱，是解锁了以前做不起的东西。以前一个任务调模型上百次、喂几十万字上下文、让它反复自检——这些想都不敢想，因为烧不起。现在做得起了。机会就在这些「过去太贵、现在突然可行」的应用里。

最后

所以别再纠结「AI 到底是在烧钱还是白菜价」了——它同时是。

烧的是赌明天的钱，涨的是中间卖铲子的价，降的是卖给你今天的价。三笔账，各走各的方向。

看懂这三笔账，2026 年 AI 行业那些看着拧巴的事，全都顺了：为什么巨亏还要拼命降价（推理账上不降价就抢不到客户），为什么降价了还是活不下去（训练账上烧得更凶），以及——为什么这场淘金热里，最稳赚的可能不是挖金子的（做模型的），而是卖铲子的（做芯片和算力的）。

便宜的是昨天，烧钱的是明天。你我享受着昨天打折的智能，而这些公司，在赌一个还没到来的明天。