大多数人在省 token，高手在把它当学费花大多数人用 AI 的方式是：挑便宜的模型，省着用，能不花就不花。高手的方式完

我认识两个人，都在用 AI，都付了订阅费。

一个人的习惯是：能用免费额度就不升级，要用 API 就挑最便宜的模型，每次跑任务之前先想想「这个值不值花这点钱」。

另一个人的习惯是：直接上最贵的模型，一个 SOP 跑十几遍，哪里不对调一下再跑，账单每个月都不少。

一个月之后，第一个人的工作方式和一个月前差不多。第二个人已经闭环了三套工作流，每天能处理的事情是以前的好几倍。

我一开始觉得第二个人有点「不计成本」。

后来我意识到：他只是在花学费。而第一个人，在省的是同一笔钱。

大多数人在省，高手在花——为什么？

我观察过很多人用 AI 的方式，有一个现象挺有意思：越是刚开始用的人，越在意 token 的成本。

每次跑任务之前先掂量一下。能用 3.5 就不用 4。看到账单涨了会有点心疼。

这个心态很正常。但它有一个隐藏的问题：你把 token 当「消费」在算，高手把它当「投资」在花。

token 买的是什么？不是一个输出结果，是「你不知道这样行不行」这个问题的答案。

你跑一遍，得到一个答案。跑十遍，你知道哪个角度出来的结果更好、哪个 prompt 写法更稳、哪个环节容易出问题。这些判断力，是你花 token 换来的。

省 token，省的是这个过程。

不跑，SOP 就建不起来。SOP 建不起来，你的工作方式就和一个月前一样。一个月前和一年前一样。

而那个一直在跑的人，已经走出去很远了。

这不是我一个人的判断

黄仁勋在 GTC 2025 的演讲里说过，AI 推理算力的成本会持续下降，终将像电一样廉价。他的意思不是「等它便宜了再用」，而是「现在就该把它当基础设施用起来」。

那些在 2000 年代初觉得「宽带太贵，能省就省」的人，今天回头看会怎么想？

我也看到过 Manus 采访说过类似的话，大意是：真正会用 agent 的人，从来不纠结 token 消耗，他们纠结的是任务有没有跑对、结果有没有达到预期。消耗本身不是问题，消耗了但没学到东西才是问题。

这两个判断指向同一件事：现在省 token 的成本，比你以为的高得多。

那些你觉得「好贵」的顶级模型，本质上是在帮你买两样东西：更好的输出质量，和更快的迭代速度。降级省下的那几十块钱，换来的是更慢的学习曲线和更差的 SOP 质量。

这笔账，其实不难算。

那到底怎么花才值

几个具体的操作建议，不说废话。

第一，现在去看一眼你的账单。

打开 Claude 或 ChatGPT 的用量页面，看看你上个月消耗了多少。如果你觉得自己用得挺深，但账单金额让你意外地低——那可能说明你用得还不够。

找一个你认为真正在深度使用 AI 的人，问问他的月均消耗。差距通常会让你有点惊讶。

第二，不要降级省钱。

用顶级模型。Claude Opus、GPT-4o，就是这些。便宜模型能处理简单任务，但你要建立 SOP、要跑复杂的 agent 任务、要验证一个工作流到底行不行——用便宜模型，结果质量差，你还以为是自己的 prompt 问题，绕了一大圈。

降级省的是 20-50 块，损失的是你的判断速度和 SOP 质量。

第三，一个 SOP 多跑几遍。

跑一遍是验证，跑十遍是掌握。每次跑完，调一个参数，换一个 prompt 写法，看看结果有什么不同。这个过程消耗 token，也是你真正学到东西的过程。

第四，新工具出来就重跑。

每次有新模型、新工具，拿出你现有的 SOP 重跑一遍，看看有哪些环节可以优化、哪些步骤可以省掉。这不是浪费，是在用最低成本更新你的系统。

顺便说一句：那些一直在等免费额度的人，等的不是省钱的机会，是在等别人把差距拉得更大。

复利的真正来源

上一篇我说过，今天建起来的工作流优势会形成复利。

复利的来源是什么？是你愿意持续投入去跑、去试、去迭代。

token 是这个过程的燃料。省燃料，复利就跑不起来。

你的 token 账单，不只是一张消费记录。它是你在这件事上到底有多认真的证明。

看看你的账单，再想想你觉得自己用 AI 用得「还不错」的感觉——这两件事对得上吗？

最后

问你一个直接的问题：

你现在每个月在 AI 工具上花多少钱？觉得值吗？

欢迎在评论区告诉我。不管是「花了很多，值」还是「一直在省，看完这篇有点慌」——都想听。

更多深度内容与完整文章，欢迎关注我的微信公众号：SamLai 效率研习社

主要分享：

AI 编程与开发效率

技术趋势与工程思考

实用工具与工作流