黄仁勋要发Token当工资!硅谷兴起刷量大赛,一人一周烧掉33个维基百科

0 阅读4分钟

OpenAI 最烧 Token 的人有多狠?

一位匿名员工,上周处理了 2100 亿 Tokens,是全公司之最,足够把整个维基百科填满 33 遍。

他不是在做什么惊天大项目,就只是公司内部排行榜第一名而已。

与此同时,在隔壁 Anthropic 一位 Claude Code 用户单月账单超过 15 万美元,折合人民币过百万元。

这便是硅谷新风尚 Tokenmaxxing,直译过来就是 “Token 刷量大赛”。

具体来说:

  • AI 公司内部开始出现排行榜,追踪每个员工的 token 消耗量;

  • 招聘时,” 你能给我多少 token 预算 “正在成为工程师最关心的问题之一;

  • Meta 和 Shopify 甚至把 AI 使用量写进了绩效考核标准。

Token 这个 AI 处理的最小文本单位,正在从技术术语变成硅谷的新型货币。

从月付 200 到年烧 10 万

风投机构 Theory Ventures 创始人 Tomasz Tunguz 亲身经历了 Token 账单的指数级膨胀。

六个月前,他每月在 Claude 上花 200 美元。然后加了三个 agent 订阅 Codex、Gemini 和 Claude Code,月费涨到 600 美元。

接着他开始用 AI 把待办清单自动变成完成清单,每天处理 31 项任务,日均推理账单飙到 92 美元。再加上每月 400 美元的智能体浏览器。

半年之内,他的 AI 推理支出从年化 7200 美元涨到 4.3 万美元,再到超过 10 万美元。

但在一年前,一个人想用掉这么多 token 几乎不可能。

假设一个学生写篇论文,来回修改几轮,大概消耗 1 万个 token,约等于 7500 个英文单词。

要烧掉几十亿个 Token,得在电脑前不停下指令好几十小时。

Coding Agent 改变了一切。

Claude Code、Codex 这类工具可以在无人监督的状态下连续工作数小时,审查和编辑大型代码库,从一条指令生成完整程序。每个 agent 还能派生出子 agent 处理不同子任务,每一步都在生成成千上万个 Token。

龙虾 OpenClaw 更是 24/7 不停工作。

Token 消耗的爆炸直接推高了 AI 公司的收入。

Anthropic 今年在两个月内将收入预期翻了一倍多,Claude Code 年化收入达到 25 亿美元。

OpenAI 的 Codex 周活跃用户超过 200 万,年初以来增长两倍,Token 使用量增长五倍。

Google 去年透露,其 AI 模型每月处理超过 1.3 万万亿(quadrillion)个 Token。

不过,这场增长背后有个关键推手:补贴。

OpenAI 和 Anthropic 都在 200 美元 / 月的订阅计划里提供了价值约 1000 美元的 Token 额度。

和当年打车、外卖用发优惠券抢市场的逻辑一模一样。

Token 成为第四种薪酬

英伟达 GTC 2026 上,黄仁勋把这股暗流推到了台面上,抛出了一个让所有人竖起耳朵的提议:

工程师年薪几十万美元,我会在基础薪资之上再给他们相当于一半年薪的 token,让他们能力放大 10 倍。当然我愿意这么做。

黄仁勋成了第一个公开谈论 “公司 Token 预算” 的重量级 CEO。

在他的框架里,Token 正在变成继工资、奖金、期权之后的第四种薪酬。

根据薪酬追踪网站 Levels.fyi 的数据,硅谷 75 分位软件工程师的年薪是 37.5 万美元(约 262 万人民币)。如果再加 10 万美元的 token 预算,总包就是 47.5 万美元,其中 21% 是 token。

OpenAI Codex 工程负责人 Thibault Sottiaux 最近在 X 上写道,AI 算力正变得越来越稀缺、越来越值钱:

候选人面试时越来越多问我:我能有多少专属推理算力。

内卷还是生产力?

在 OpenAI 内部,员工已经可以在排行榜上看到同事消耗了多少 token。

公司 token 预算正在成为一种员工福利,就像医疗保险或免费午餐。

另一面,Shopify 和 Meta 已经把 AI 使用纳入了绩效考核,奖励重度使用的员工,批评不用的。

风险投资人 Nikunj Kothari 这样描述弥漫硅谷的新情绪 Token 焦虑。

晚饭时的开场白过去是 “你在做什么?” 现在变成了 “你跑了几个 agent?”

但质疑声音也在出现。一位匿名 OpenAI 员工评价同事们的 token 竞赛:这看起来不可持续。

排行榜不衡量产出质量。那些刷到数十亿 token 的人,到底在产出有用的东西,还是只是在空转、看起来很忙?

当一家公司为每个员工支付的 Token 费用接近甚至超过这个人的工资时,财务部门对 “人头” 的算法就会发生变化:

如果算力在干活,到底需要多少人来协调它?

参考链接:
[1]tomtunguz.com/inference-a…
[2]www.nytimes.com/2026/03/20/…
[3]www.wsj.com/tech/ai/cla…

欢迎在评论区留下你的想法!

—  —