英伟达GTC 2026:推理拐点已至,Agent时代全面展开

核心观点
英伟达GTC 2026传递的核心信号:AI从训练时代正式进入推理时代,OpenClaw智能体框架成为新操作系统,2027年AI基础设施需求至少1万亿美元
一、万亿美元市场预期的底气
黄仁勋在GTC 2026上给出了一个令市场震惊的数字:到2027年,AI基础设施需求将至少达到1万亿美元,而且他强调"实际需求将远超这个数字"。
对比:去年GTC预测2026年需求为5000亿美元,一年内预期翻倍
这个预测背后的逻辑是什么?
Token工厂经济学
黄仁勋提出了一个全新的商业框架:数据中心不再是存储文件的仓库,而是生产Token的工厂。
他展示了Token经济的分层定价模型:
- 免费层:高吞吐、低速度,用于获客
- 中级层:约每百万Token 3-6美元
- 高级层:约每百万Token 45美元
- 超高速层:约每百万Token 150美元
"AI越'聪明',价格越高,但吞吐量反而越低,因此架构优化至关重要。"
性能与收益的量化提升
英伟达给出的数据极具说服力:
- Grace Blackwell相比Hopper:每瓦性能提升35-50倍,同一数据中心收入增加5倍
- Vera Rubin:在最有价值的推理层级再提升10倍,收入再翻5倍
- 整合Groq LPU后:超高速Token生成再提升35倍
在1吉瓦的AI工厂中,两年内Token生成速率从200万/秒提升到7亿/秒,提升350倍
来源:黄仁勋GTC 2026演讲全文,华尔街见闻
二、硬件产品:从GPU到全栈异构平台
本次GTC最大的变化在于:英伟达不再只是一家GPU公司,而是一个覆盖训练、预填充、解码、推理、智能体编排的全栈式异构AI基础设施平台。
七款芯片+五套机架系统
7款全新芯片全面投产:
- Rubin GPU:下一代计算核心
- Vera CPU:专为Agent设计的CPU(256颗液冷处理器)
- NVLink 6交换机:互连升级
- ConnectX-9 SuperNIC:网络加速
- BlueField-4 DPU:数据中心处理器
- Spectrum-6以太网交换机:全球首款CPO交换机
- Groq 3 LPU:超低延迟推理处理器
5套机架系统:
- Vera Rubin NVL72:GPU计算,100%液冷
- Vera CPU机架:Agent编排
- Groq 3 LPX:超低延迟解码
- BlueField-4 STX:上下文内存存储
- Spectrum-6 SPX:以太网主干网络
CPO成为标配,光学时代来临
2026年开始,CPO成为绝对标配
黄仁勋明确表示:Vera Rubin已经在微软Azure上线运行,机架里的铜缆已经完全看不见。更关键的是,2028年的Feynman架构将同时支持铜缆和CPO进行水平扩展。
这意味着:
- Scale-up(训练):NVLink 8将在2028年走向CPO
- Scale-out(推理):Spectrum-6 SPX已量产,CPO成为必选项
市场波动解读:演讲中提到"同时用铜和CPO来实现Scale-up",一度引发光学方向恐慌,但这实际上是老黄的谨慎表述——Scale-up不可能100%替代铜,但核心价值量将由CPO获得。
LPU略超预期
Groq 3 LPX机架的加入略超预期:
- 单机架集成256个LPU处理器
- 配备128GB片上SRAM
- 带宽达每秒640TB
黄仁勋给出的部署建议:"可能在数据中心总容量25%左右部署Groq,其余全部采用Vera Rubin"
LPU解决的是实时AI推理场景的最核心痛点:快
尤其在实时语音交互这类应用里,用户要的不是等模型想半天再回答,而是像人与人对话一样,几乎立刻就能得到反馈。
CPU价值重估:一匹被忽视的黑马
这是本次GTC最大的意外之一。
黄仁勋首次将Vera CPU作为一款专用机架级产品推出,并直言:
"我们从未想过会单独销售CPU。但我们现在CPU的销量非常可观。这无疑将是一个价值数十亿美元的产业..."
关键洞察:AI智能体在CPU上调用工具、运行SQL、编译代码和验证结果。如果CPU速度慢,GPU就只能闲置。
Vera CPU采用LPDDR5内存,是"全球唯一一款采用LPDDR5的数据中心CPU",专为极高单线程性能和能效设计。
这展现了英伟达的全栈野心:从GPU入手,控制整个AI基础设施的每个关键环节,现在已经到了CPU机架的程度。
三、软件生态:OpenClaw就是新操作系统
如果说硬件是"看得见的手",那软件生态就是英伟达"看不见的手",而且这只手正在快速构建护城河。
NemoClaw:企业级Agent基础设施
黄仁勋将OpenClaw称为"人类历史上最受欢迎的开源项目",称其"仅用几周时间就超越了Linux在过去30年取得的成就"。
更关键的是他的定义:
"OpenClaw本质上就是Agent计算机的'操作系统'。"
英伟达推出了NemoClaw(企业级参考设计),集成:
- Nemotron模型:英伟达自研的前沿模型
- OpenShield安全层:策略引擎、网络护栏、隐私路由
- NeMo Cloud:与所有SaaS企业的策略引擎对接
商业模式的质变:
每一家SaaS公司都将转变为AaaS(Agentic as a Service,智能体即服务)公司——不只是提供工具,而是提供专精特定领域的AI智能体。
黄仁勋甚至给出了具体的招聘场景:
"未来,公司里的每一位工程师都将拥有年度Token预算。他们年薪可能是几十万美元,我会额外给他们相当于薪资一半的Token配额,让他们的产出放大10倍。"
英伟达的全面Agent化
黄仁勋透露:
"英伟达100%都在使用Claude Code、Codex和Cursor的组合。如今,没有哪个软件工程师不使用一个或多个AI代理。"
这正是英伟达构建软件栈背后的需求驱动力。
Nemotron联盟成员:BlackForest Labs、Cursor、LangChain、Mistral、Perplexity、Reflection等,一个又一个企业软件公司加入,将NemoClaw参考设计整合到自身产品中。
四、四大超预期与两大低于预期
超预期之一:市场需求快速暴增
从去年的5000亿美元到今年的至少1万亿美元,需求预期的快速翻倍超出了市场预期,也超出了华尔街的预期。
这意味着英伟达可以从整个AI基础设施的每一个环节赚钱——不只GPU,还有CPU、DPU、交换机、LPU、软件栈、云服务...
超预期之二:CPU的复兴
Vera CPU作为专用机架级产品推出,价值得到重估。这是一个价值数十亿美元的产业,而且此前市场完全没有预期。
超预期之三:LPU的量产和部署预期
Groq 3 LPX由三星代工,Q3开始出货,25%的用量预期略超市场预期。加入LPU的异构计算系统成为Token经济学的核心硬件。
超预期之四:OpenClaw生态的成熟度
对于NemoClaw的成熟度以及开放生态,市场此前毫无预期。英伟达已经将其定位为"智能体计算机的操作系统",这将是未来价值分配的关键节点。
低于预期之一:硬件本身
因为剧透太多,硬件方面没有太多超预期的地方。真正的亮点并非GPU本身,而是围绕它的架构。只有英伟达能够同时交付如此多的专用、协同设计的组件。
低于预期之二:存储架构
市场期待的"新存储架构"以及CXL提及的不多,或者说存储架构在这次演讲中的提及一般。
五、投资逻辑:从"铲子"到"工厂"
英伟达的战略定位已经清晰
从一家"芯片公司"向一个"AI基础设施和工厂公司"蜕变。
这个定位意味着:
-
通用性:英伀达能运行几乎所有领域的AI模型,这种通用性使得客户投入的1万亿美元能够被充分利用并保持长久的生命周期
-
系统级优势:不只卖GPU,而是卖从芯片到机架到软件到云的全栈解决方案
-
成本领先:黄仁勋直言"英伟达系统已经证明了自己是全球成本最低的基础设施"
A股相关产业链
光通信/CPO:
- 核心逻辑:2026年开始CPO成为标配,2028年Feynman架构Scale-up将呈现CPO和铜的混合架构
- 关键数据:光学扩展已经成为必选项,Scale-up也不可能100%替代铜,但核心价值量都由CPO获得
液冷/电源:
- 核心逻辑:Vera Rubin已100%液冷,安装时间从2天缩短到2小时,采用45°C热水冷却
- 关键逻辑:AI数据中心功率密度激增,传统风冷无法满足,液冷渗透率快速提升
PCB/服务器:
- 核心逻辑:AI服务器PCB单机价值量是普通服务器的2-3倍
- 稀缺性:高多层板、高速PCB技术壁垒较高
六、未来展望:物理AI与太空算力
黄仁勋还"剧透"了下一代计算架构Feynman,它将首次实现铜线与CPO的共同水平扩展。
更引人遐想的是,英伟达正在研发部署在太空的数据中心计算机**"Vera Rubin Space-1"**,彻底打开了AI算力向地球之外延伸的想象空间。
物理AI方面,本次GTC共有110款机器人亮相,几乎囊括了全球所有机器人研发企业。自动驾驶的"ChatGPT时刻"已经到来,比亚迪、现代、日产、吉利等新合作伙伴加入RoboTaxi Ready平台,合计年产量1800万辆。
七、总结与判断
本次GTC的核心主题
"推理拐点已到来,Agent时代已展开"
四大关键结论
-
全栈进化:英伟达正在向一个涵盖训练、预填充、解码、推理、智能体编排的全栈式异构AI基础设施平台进化,其迭代能力正在快速拓宽护城河
-
光学时代:2026年下半年开始,CPO加速渗透。未来的集群性能深度依赖互连的能力,CPO和光纤技术成为主要价值方向
-
异构计算:GPU+LPU+CPO互连将是未来异构推理平台的核心架构,相比于一些自研项目性能更佳、效率更高、盈利能力更强
-
Agent操作系统:OpenClaw/NemoClaw正在成为智能体时代的"操作系统",这将是未来价值分配的关键节点