推倒 SaaS 的围墙,筑起万亿美金的“Token 工厂”:黄仁勋 GTC 2026 演讲全纪实

6 阅读5分钟

北京时间 2026 年 3 月 17 日凌晨两点半,SAP 中心万头攒动。黄仁勋穿着那件标志性的黑色皮衣再次登场。这一次,他带来的不是芯片,而是一份关于“旧世界软件终结”的判决书。

一、 回顾 CUDA 20 年:不可撼动的“算力护城河”

演讲伊始,黄仁勋并没有急于展示 1.6nm 的新玩具,而是回溯了 CUDA 诞生的 20 年。他指出,英伟达最硬的壁垒不是芯片制程,而是遍布全球的安装基数

【笔者观点】 黄仁勋大谈“飞轮效应”,本质上是在向华尔街展示一种“生态霸权”。20 年的积累让英伟达具备了跨代兼容的能力,这意味着即便竞争对手拿出了跑分略高的芯片,只要它跑不动 CUDA 里的数十万个开源项目,就永远无法触碰英伟达的核心利益。这不仅是技术领先,更是对开发者时间的“暴力垄断”。

二、 软件结构的暴力重构:cuDF 与 cuVS 降临

老黄掏出了他认为本场最重要的图表:数据处理体系的变革。未来,AI 智能体将直接访问结构化数据库,数据处理基础设施必须获得数量级的性能提升。

【笔者观点】 通过 cuDF 加速结构化数据,通过 cuVS 锚定非结构化数据语义,英伟达正在把算力的触角从简单的“矩阵运算”伸向企业 IT 的命根子——数据库。这意味着,未来企业不再需要庞大的中间件,只要有英伟达的算力栈,数据就能直接转化为 Token。

三、 SaaS 已死,AaaS 当立:智能体时代的暴力演进

黄仁勋宣称,从 ChatGPT 的“生成”到 o1 的“推理”,再到 Claude Code 开启的“代理(Agentic)”时代,计算需求增长了 100 万倍。

【笔者观点】 这是全场最犀利的论断:所有 SaaS 公司都将消失,演变为 AaaS(智能体即服务)。老黄在暗示,那些靠卖 UI、卖固定工作流的软件公司将失去生存空间。在 Agent 面前,任何手动点击的界面都是低效的。英伟达不仅要垄断底层算力,还要定义未来软件的形态。

四、 Token 成本全球最低:英伟达的“铸币权”

英伟达推出了全新的 NVFP4 计算体系。老黄给出的核心逻辑极其霸道:衡量 AI 工厂效率的唯一指标是“每瓦特 Token 数”。

【笔者观点】 “不可触碰的 Token 成本”是老黄祭出的终极杀招。他实际上是在告诉云厂商:用英伟达之外的架构,即便芯片白送,由于能效比和软件栈的劣势,你生产 Token 的综合成本依然是亏本的。在 AI 时代,Token 就是货币,而英伟达掌控着印刷机的效率。

五、 Vera Rubin 时代:全栈垂直整合的怪兽

Vera Rubin 超级 AI 平台正式亮相,这是一个由 40 个机架、1.2 千万亿个晶体管组成的庞然大物。

【笔者观点】 Vera CPU 采用 LPDDR5 内存,Spectrum-X 引入 CPO(光电共封装),Kyber 机架消灭了铜缆限制。这标志着英伟达已经不再是一家半导体公司,而是一家“巨型计算机公司”。这种垂直整合能力,让任何单一环节的竞争对手都感到窒息。

六、 Feynman 架构前瞻:1.6nm 与定制化存储

黄仁勋提前剧透了 Feynman GPU 架构,确认搭载全新的 Rosa CPU 和定制化 HBM 技术。

【笔者观点】 跳过通用规格,直接采用定制增强版存储底座。Feynman 架构的意义在于:英伟达正在物理层面将计算与存储彻底耦合。这是一场对冯·诺依曼架构的终极挑战,也是通往 2027 年 1 万亿美元营收的“入场券”。

七、 NVIDIA DSX:AI 工厂的操作系统

英伟达推出了面向 AI 工厂的基础设施平台 DSX,旨在实现数据中心的虚拟调试与数字孪生。

【笔者观点】 当数据中心复杂到需要“数字孪生”才能维护时,英伟达就顺势成为了数据中心的“物业总管”。DSX 的出现,意味着以后不仅买英伟达的卡,连盖机房、省电费都要依赖英伟达的软件。

八、 NemoClaw 降临:智能体时代的 Linux 时刻

针对最近爆火的 OpenClaw 项目,英伟达正式推出 NemoClaw 参考架构,并引入 OpenShell 安全组件。

【笔者观点】 这是一个极具杀伤力的信号。老黄通过支持开源,实际上是在定义 Agent 的“操作系统”。他逼问所有软件公司:“你的 OpenClaw 战略是什么?” 本质上是强迫大家把业务逻辑迁移到英伟达定义的 Agent 协议上。

九、 开放模型生态:Nemotron Coalition

英伟达宣布成立 Nemotron Coalition 联盟,与 Cursor、Perplexity 等公司深度捆绑。

【笔者观点】 “纵向整合、横向开放”,这是英伟达的太极打法。它在模型层不搞封闭,而是支持大家去微调、去生产 Token。因为无论你们用什么模型,最后都得跑在英伟达的物理架构上。

十、 物理 AI 与机器人时代:ChatGPT 时刻降临

演讲最后,黄仁勋展示了 Project GR00T 基础模型以及与比亚迪、现代等车企的 Robotaxi 合作。

【笔者观点】 从云端的数字智能体,到地面的自动驾驶,再到 T-Mobile 的机器人 AI 基站,英伟达正在把物理世界全部“Token 化”。

总结:三位一体的暴力革命

【笔者总结】 2026 年的 GTC,是英伟达从“算力霸主”向“文明总包商”跨越的分水岭。黄仁勋用一整套全栈方案告诉世界:AI 训练的初级阶段已经结束,现在是暴力推理、暴力重构软件、暴力征服物理世界的“万亿大航海时代”。


👇 欢迎关注我的公众号

在 AI 爆发的深水区,我们一起探索真正能穿越周期的技术价值。 微信搜索 【睿见新世界】 或扫描下方二维码,获取每周硬核技术推文:

微信图片_20260301232734_225_35.jpg

欢迎关注【睿见新世界