英伟达GTC 2026:推理拐点已至,Agent时代全面展开

0 阅读10分钟

英伟达GTC 2026:推理拐点已至,Agent时代全面展开

核心观点

英伟达GTC 2026传递的核心信号:AI从训练时代正式进入推理时代,OpenClaw智能体框架成为新操作系统,2027年AI基础设施需求至少1万亿美元


一、万亿美元市场预期的底气

黄仁勋在GTC 2026上给出了一个令市场震惊的数字:到2027年,AI基础设施需求将至少达到1万亿美元,而且他强调"实际需求将远超这个数字"。

对比:去年GTC预测2026年需求为5000亿美元,一年内预期翻倍

这个预测背后的逻辑是什么?

Token工厂经济学

黄仁勋提出了一个全新的商业框架:数据中心不再是存储文件的仓库,而是生产Token的工厂

他展示了Token经济的分层定价模型:

  • 免费层:高吞吐、低速度,用于获客
  • 中级层:约每百万Token 3-6美元
  • 高级层:约每百万Token 45美元
  • 超高速层:约每百万Token 150美元

"AI越'聪明',价格越高,但吞吐量反而越低,因此架构优化至关重要。"

性能与收益的量化提升

英伟达给出的数据极具说服力:

  • Grace Blackwell相比Hopper:每瓦性能提升35-50倍,同一数据中心收入增加5倍
  • Vera Rubin:在最有价值的推理层级再提升10倍,收入再翻5倍
  • 整合Groq LPU后:超高速Token生成再提升35倍

在1吉瓦的AI工厂中,两年内Token生成速率从200万/秒提升到7亿/秒,提升350倍

来源:黄仁勋GTC 2026演讲全文,华尔街见闻


二、硬件产品:从GPU到全栈异构平台

本次GTC最大的变化在于:英伟达不再只是一家GPU公司,而是一个覆盖训练、预填充、解码、推理、智能体编排的全栈式异构AI基础设施平台。

七款芯片+五套机架系统

7款全新芯片全面投产

  1. Rubin GPU:下一代计算核心
  2. Vera CPU:专为Agent设计的CPU(256颗液冷处理器)
  3. NVLink 6交换机:互连升级
  4. ConnectX-9 SuperNIC:网络加速
  5. BlueField-4 DPU:数据中心处理器
  6. Spectrum-6以太网交换机:全球首款CPO交换机
  7. Groq 3 LPU:超低延迟推理处理器

5套机架系统

  • Vera Rubin NVL72:GPU计算,100%液冷
  • Vera CPU机架:Agent编排
  • Groq 3 LPX:超低延迟解码
  • BlueField-4 STX:上下文内存存储
  • Spectrum-6 SPX:以太网主干网络

CPO成为标配,光学时代来临

2026年开始,CPO成为绝对标配

黄仁勋明确表示:Vera Rubin已经在微软Azure上线运行,机架里的铜缆已经完全看不见。更关键的是,2028年的Feynman架构将同时支持铜缆和CPO进行水平扩展。

这意味着:

  • Scale-up(训练):NVLink 8将在2028年走向CPO
  • Scale-out(推理):Spectrum-6 SPX已量产,CPO成为必选项

市场波动解读:演讲中提到"同时用铜和CPO来实现Scale-up",一度引发光学方向恐慌,但这实际上是老黄的谨慎表述——Scale-up不可能100%替代铜,但核心价值量将由CPO获得。

LPU略超预期

Groq 3 LPX机架的加入略超预期:

  • 单机架集成256个LPU处理器
  • 配备128GB片上SRAM
  • 带宽达每秒640TB

黄仁勋给出的部署建议:"可能在数据中心总容量25%左右部署Groq,其余全部采用Vera Rubin"

LPU解决的是实时AI推理场景的最核心痛点:

尤其在实时语音交互这类应用里,用户要的不是等模型想半天再回答,而是像人与人对话一样,几乎立刻就能得到反馈。

CPU价值重估:一匹被忽视的黑马

这是本次GTC最大的意外之一。

黄仁勋首次将Vera CPU作为一款专用机架级产品推出,并直言:

"我们从未想过会单独销售CPU。但我们现在CPU的销量非常可观。这无疑将是一个价值数十亿美元的产业..."

关键洞察:AI智能体在CPU上调用工具、运行SQL、编译代码和验证结果。如果CPU速度慢,GPU就只能闲置。

Vera CPU采用LPDDR5内存,是"全球唯一一款采用LPDDR5的数据中心CPU",专为极高单线程性能和能效设计。

这展现了英伟达的全栈野心:从GPU入手,控制整个AI基础设施的每个关键环节,现在已经到了CPU机架的程度。


三、软件生态:OpenClaw就是新操作系统

如果说硬件是"看得见的手",那软件生态就是英伟达"看不见的手",而且这只手正在快速构建护城河。

NemoClaw:企业级Agent基础设施

黄仁勋将OpenClaw称为"人类历史上最受欢迎的开源项目",称其"仅用几周时间就超越了Linux在过去30年取得的成就"。

更关键的是他的定义:

"OpenClaw本质上就是Agent计算机的'操作系统'。"

英伟达推出了NemoClaw(企业级参考设计),集成:

  • Nemotron模型:英伟达自研的前沿模型
  • OpenShield安全层:策略引擎、网络护栏、隐私路由
  • NeMo Cloud:与所有SaaS企业的策略引擎对接

商业模式的质变

每一家SaaS公司都将转变为AaaS(Agentic as a Service,智能体即服务)公司——不只是提供工具,而是提供专精特定领域的AI智能体。

黄仁勋甚至给出了具体的招聘场景:

"未来,公司里的每一位工程师都将拥有年度Token预算。他们年薪可能是几十万美元,我会额外给他们相当于薪资一半的Token配额,让他们的产出放大10倍。"

英伟达的全面Agent化

黄仁勋透露:

"英伟达100%都在使用Claude Code、Codex和Cursor的组合。如今,没有哪个软件工程师不使用一个或多个AI代理。"

这正是英伟达构建软件栈背后的需求驱动力。

Nemotron联盟成员:BlackForest Labs、Cursor、LangChain、Mistral、Perplexity、Reflection等,一个又一个企业软件公司加入,将NemoClaw参考设计整合到自身产品中。


四、四大超预期与两大低于预期

超预期之一:市场需求快速暴增

从去年的5000亿美元到今年的至少1万亿美元,需求预期的快速翻倍超出了市场预期,也超出了华尔街的预期。

这意味着英伟达可以从整个AI基础设施的每一个环节赚钱——不只GPU,还有CPU、DPU、交换机、LPU、软件栈、云服务...

超预期之二:CPU的复兴

Vera CPU作为专用机架级产品推出,价值得到重估。这是一个价值数十亿美元的产业,而且此前市场完全没有预期。

超预期之三:LPU的量产和部署预期

Groq 3 LPX由三星代工,Q3开始出货,25%的用量预期略超市场预期。加入LPU的异构计算系统成为Token经济学的核心硬件。

超预期之四:OpenClaw生态的成熟度

对于NemoClaw的成熟度以及开放生态,市场此前毫无预期。英伟达已经将其定位为"智能体计算机的操作系统",这将是未来价值分配的关键节点。

低于预期之一:硬件本身

因为剧透太多,硬件方面没有太多超预期的地方。真正的亮点并非GPU本身,而是围绕它的架构。只有英伟达能够同时交付如此多的专用、协同设计的组件。

低于预期之二:存储架构

市场期待的"新存储架构"以及CXL提及的不多,或者说存储架构在这次演讲中的提及一般。


五、投资逻辑:从"铲子"到"工厂"

英伟达的战略定位已经清晰

从一家"芯片公司"向一个"AI基础设施和工厂公司"蜕变。

这个定位意味着:

  1. 通用性:英伀达能运行几乎所有领域的AI模型,这种通用性使得客户投入的1万亿美元能够被充分利用并保持长久的生命周期

  2. 系统级优势:不只卖GPU,而是卖从芯片到机架到软件到云的全栈解决方案

  3. 成本领先:黄仁勋直言"英伟达系统已经证明了自己是全球成本最低的基础设施"

A股相关产业链

光通信/CPO

  • 核心逻辑:2026年开始CPO成为标配,2028年Feynman架构Scale-up将呈现CPO和铜的混合架构
  • 关键数据:光学扩展已经成为必选项,Scale-up也不可能100%替代铜,但核心价值量都由CPO获得

液冷/电源

  • 核心逻辑:Vera Rubin已100%液冷,安装时间从2天缩短到2小时,采用45°C热水冷却
  • 关键逻辑:AI数据中心功率密度激增,传统风冷无法满足,液冷渗透率快速提升

PCB/服务器

  • 核心逻辑:AI服务器PCB单机价值量是普通服务器的2-3倍
  • 稀缺性:高多层板、高速PCB技术壁垒较高

六、未来展望:物理AI与太空算力

黄仁勋还"剧透"了下一代计算架构Feynman,它将首次实现铜线与CPO的共同水平扩展。

更引人遐想的是,英伟达正在研发部署在太空的数据中心计算机**"Vera Rubin Space-1"**,彻底打开了AI算力向地球之外延伸的想象空间。

物理AI方面,本次GTC共有110款机器人亮相,几乎囊括了全球所有机器人研发企业。自动驾驶的"ChatGPT时刻"已经到来,比亚迪、现代、日产、吉利等新合作伙伴加入RoboTaxi Ready平台,合计年产量1800万辆。


七、总结与判断

本次GTC的核心主题

"推理拐点已到来,Agent时代已展开"

四大关键结论

  1. 全栈进化:英伟达正在向一个涵盖训练、预填充、解码、推理、智能体编排的全栈式异构AI基础设施平台进化,其迭代能力正在快速拓宽护城河

  2. 光学时代:2026年下半年开始,CPO加速渗透。未来的集群性能深度依赖互连的能力,CPO和光纤技术成为主要价值方向

  3. 异构计算:GPU+LPU+CPO互连将是未来异构推理平台的核心架构,相比于一些自研项目性能更佳、效率更高、盈利能力更强

  4. Agent操作系统:OpenClaw/NemoClaw正在成为智能体时代的"操作系统",这将是未来价值分配的关键节点