皮衣老黄燃爆GTC 2025!最强AI芯片GB300登场,推理性能暴增1.5倍,下一代Rubin性能逆天

44 阅读4分钟

在2025年GTC大会的“AI超级碗”舞台上,黄仁勋身披经典皮衣,正式发布英伟达新一代AI芯片GB300,宣告AI算力进入全新纪元!

一、GB300:算力怪兽登场,水冷技术掀起“二次革命”

  • 性能飞跃:GB300基于Blackwell Ultra架构,单卡FP4算力达15PFLOPS,推理性能较前代H100提升36倍,成本降低32倍。与GB200相比,其推理性能直接提升1.5倍,显存容量升级至288GB HBM3e,专为内存密集型AI模型设计。
  • 散热革命:为应对1400W的高功耗,GB300抛弃传统风冷,采用全液冷散热方案,密集水冷管线推动双鸿、奇鋐等供应商订单激增。
  • 交付时间:GB300将于2025年下半年出货,配套的GB300 NVL72机架系统可支持72颗GPU+36颗Grace CPU,处理DeepSeek-R1模型时响应时间从1.5分钟缩短至10秒。

二、Vera Rubin:2026年登场,性能碾压GB300的3.3倍!

老黄更“剧透”了下一代AI超级芯片Vera Rubin(预计2026年发货),命名延续“CPU+GPU”组合:

  • Vera CPU:内存容量是Grace的4.2倍,带宽提升2.4倍;
  • Rubin GPU:搭载288GB HBM4显存,整体性能达到GB300的3.3倍。更令人咋舌的是,2027年的Rubin Ultra性能将飙至GB300的14倍!老黄直言:“大规模推理是一种极限计算”,而Rubin系列正是为此而生。

三、个人AI革命:两款桌面超算,让开发者“人手一台AI工厂”

英伟达首次将数据中心级算力搬上桌面,推出两款划时代产品:

  • DGX Spark(售价3000美元) : 体积仅Mac Mini大小,搭载GB10芯片,支持每秒1000万亿次AI运算;采用NVLink-C2C互连技术,带宽是PCIe 5.0的5倍,可本地部署2000亿参数大模型。
  • DGX Station: 搭载旗舰GB300芯片,提供784GB统一内存和800Gb/s超高速网络,性能对标数据中心。

华硕、戴尔等厂商将于今夏开售,老黄放话:“这才是PC该有的样子!”

四、软件生态:开源Dynamo与Llama Nemotron,推理效率飙升30倍

  • Dynamo推理库:被老黄称为“AI工厂操作系统”,可动态分配1000个GPU资源,在Blackwell上优化DeepSeek-R1模型时,吞吐量提升30倍。
  • Llama Nemotron模型:49B参数规模,在Agentic任务中准确率碾压Llama 3.3和DeepSeek R1。

五、跨界突破:自动驾驶、量子计算与机器人

  • 自动驾驶:与通用汽车合作推出全栈安全系统Halos,覆盖700万行代码审核,号称“全球首家逐行评估代码安全”。
  • 量子计算:大会首次设立“量子日”,黄仁勋将与D-Wave、IonQ探讨技术落地。年初一句“量子计算需20年实用化”曾引发概念股暴跌,此次能否扭转风向?
  • 具身智能:开源人形机器人模型Isaac GR00T N1,结合视觉语言理解与物理引擎Newton,现场机器人“Blue”更上演“叛逆”互动。

六、网络革命:Spectrum-X以太网,性能提升1.6倍

英伟达推出全球首个AI专用以太网平台Spectrum-X,由Spectrum-4交换机和BlueField-3 SuperNIC组成,AI云电力效率显著提升,端口速度达1.6Tb/s,支持百万GPU协同。

结语:AI算力的“摩尔定律”由英伟达书写

从GB300到Vera Rubin,从桌面超算到量子计算,英伟达正以“一年一迭代”的速度重新定义算力边界。老黄的野心不止于硬件:通过开源生态、跨界合作,英伟达正在构建一个从芯片到应用的全栈AI帝国。正如他所言:“AI已重塑计算堆栈的每一层”,而这场变革,才刚刚开始。

欢迎留言、一键三连!BuluAI算力平台新上线通义推理模型QwQ-32B,也可一键部署deepseek!!再也不用为算力发愁嘞,点击官网了解吧!