我认识两个人,都在用 AI,都付了订阅费。
一个人的习惯是:能用免费额度就不升级,要用 API 就挑最便宜的模型,每次跑任务之前先想想「这个值不值花这点钱」。
另一个人的习惯是:直接上最贵的模型,一个 SOP 跑十几遍,哪里不对调一下再跑,账单每个月都不少。
一个月之后,第一个人的工作方式和一个月前差不多。第二个人已经闭环了三套工作流,每天能处理的事情是以前的好几倍。
我一开始觉得第二个人有点「不计成本」。
后来我意识到:他只是在花学费。而第一个人,在省的是同一笔钱。
大多数人在省,高手在花——为什么?
我观察过很多人用 AI 的方式,有一个现象挺有意思:越是刚开始用的人,越在意 token 的成本。
每次跑任务之前先掂量一下。能用 3.5 就不用 4。看到账单涨了会有点心疼。
这个心态很正常。但它有一个隐藏的问题:你把 token 当「消费」在算,高手把它当「投资」在花。
token 买的是什么?不是一个输出结果,是「你不知道这样行不行」这个问题的答案。
你跑一遍,得到一个答案。跑十遍,你知道哪个角度出来的结果更好、哪个 prompt 写法更稳、哪个环节容易出问题。这些判断力,是你花 token 换来的。
省 token,省的是这个过程。
不跑,SOP 就建不起来。SOP 建不起来,你的工作方式就和一个月前一样。一个月前和一年前一样。
而那个一直在跑的人,已经走出去很远了。
这不是我一个人的判断
黄仁勋在 GTC 2025 的演讲里说过,AI 推理算力的成本会持续下降,终将像电一样廉价。他的意思不是「等它便宜了再用」,而是「现在就该把它当基础设施用起来」。
那些在 2000 年代初觉得「宽带太贵,能省就省」的人,今天回头看会怎么想?
我也看到过 Manus 采访说过类似的话,大意是:真正会用 agent 的人,从来不纠结 token 消耗,他们纠结的是任务有没有跑对、结果有没有达到预期。消耗本身不是问题,消耗了但没学到东西才是问题。
这两个判断指向同一件事:现在省 token 的成本,比你以为的高得多。
那些你觉得「好贵」的顶级模型,本质上是在帮你买两样东西:更好的输出质量,和更快的迭代速度。降级省下的那几十块钱,换来的是更慢的学习曲线和更差的 SOP 质量。
这笔账,其实不难算。
那到底怎么花才值
几个具体的操作建议,不说废话。
第一,现在去看一眼你的账单。
打开 Claude 或 ChatGPT 的用量页面,看看你上个月消耗了多少。如果你觉得自己用得挺深,但账单金额让你意外地低——那可能说明你用得还不够。
找一个你认为真正在深度使用 AI 的人,问问他的月均消耗。差距通常会让你有点惊讶。
第二,不要降级省钱。
用顶级模型。Claude Opus、GPT-4o,就是这些。便宜模型能处理简单任务,但你要建立 SOP、要跑复杂的 agent 任务、要验证一个工作流到底行不行——用便宜模型,结果质量差,你还以为是自己的 prompt 问题,绕了一大圈。
降级省的是 20-50 块,损失的是你的判断速度和 SOP 质量。
第三,一个 SOP 多跑几遍。
跑一遍是验证,跑十遍是掌握。每次跑完,调一个参数,换一个 prompt 写法,看看结果有什么不同。这个过程消耗 token,也是你真正学到东西的过程。
第四,新工具出来就重跑。
每次有新模型、新工具,拿出你现有的 SOP 重跑一遍,看看有哪些环节可以优化、哪些步骤可以省掉。这不是浪费,是在用最低成本更新你的系统。
顺便说一句:那些一直在等免费额度的人,等的不是省钱的机会,是在等别人把差距拉得更大。
复利的真正来源
上一篇我说过,今天建起来的工作流优势会形成复利。
复利的来源是什么?是你愿意持续投入去跑、去试、去迭代。
token 是这个过程的燃料。省燃料,复利就跑不起来。
你的 token 账单,不只是一张消费记录。它是你在这件事上到底有多认真的证明。
看看你的账单,再想想你觉得自己用 AI 用得「还不错」的感觉——这两件事对得上吗?
最后
问你一个直接的问题:
你现在每个月在 AI 工具上花多少钱?觉得值吗?
欢迎在评论区告诉我。不管是「花了很多,值」还是「一直在省,看完这篇有点慌」——都想听。
更多深度内容与完整文章,欢迎关注我的微信公众号:SamLai 效率研习社
主要分享:
AI 编程与开发效率
技术趋势与工程思考
实用工具与工作流