当全世界都在为 OpenClaw 和 Manus 这样的“赛博打工人”惊呼或恐惧时,真正的顶级掠食者已经悄然入局。
3 月 12 日,英伟达正式发布并开源了 120B(1200 亿)参数的 MoE 模型 Nemotron 3 Super。随之曝光的,还有一份令人胆寒的财务文件:英伟达已备好 260 亿美元(约合 1789 亿人民币)巨资,将在未来五年内全盘倾注于构建开源 AI 模型。卖铲子的人,开始亲自下场挖金矿了。
一、 暴力碾压 GPT:不搞闲聊,专为“赛博打工人”注入灵魂
Nemotron 3 Super 并不是一个用来写诗或讲笑话的聊天模型,它的各项指标都透着一股浓烈的“工业控制”味道。
它原生支持 100 万 token 的上下文窗口。在针对 OpenClaw 这类智能体控制能力的 PinchBench 测试中,它以 85.6% 的高分强势空降同类开源模型榜首。

同时,它的运转效率也实现了大幅度跨越。在 8k 输入与 64k 输出的特定运行设置下,它的推理吞吐量达到了对标竞品 GPT-OSS-120B 的 2.2 倍。

在实操基准测试中,它搭配 OpenHands 框架在软件工程基准 SWE-Bench 中跑出了 60.47% 的准确率(碾压 GPT-OSS 的 41.9%)。而在包含航空、零售和电信三大领域的 TauBench V2 复杂业务场景测试中,它同样交出了 61.15% 的高分成绩。

为了提升 Agent 面对复杂任务的稳定性,英伟达不仅给它灌入了 1.5 万个核心合成任务的终端操作轨迹,还在强化学习阶段引入了 PivotRL 技术,强行遏制 AI 在长程任务中的“推理漂移”。
【笔者观点】 这是一个极具杀伤力的信号:英伟达敏锐地察觉到,大模型的战争已经从“比谁嘴皮子溜(Chat)”升级到了“比谁干活稳(Agent)”。之前的文章我们提到,AI Agent 的核心是 Skills 和工具调用,而 Nemotron 3 Super 简直就是为解析复杂 JSON、操作终端命令量身定制的“最强数字大脑”。当其他大模型还在比拼虚无缥缈的“常识推理”时,英伟达已经开始给数字员工发放“高级电工证”了。谁掌握了最底层的 Agent 执行模型,谁就掌握了未来所有自动化软件的命脉。
二、 披着开源外衣的“特洛伊木马”:用软件锁死硬件生态
这款模型在技术架构上极其激进:为了在处理百万级上下文时兼顾效率与精度,采用了混合 Mamba-Transformer 架构,在具备线性时间复杂度的 Mamba-2 层中插入了 Transformer 全局注意力层。

而在模型规模的扩展上,为了解决传统混合专家架构的瓶颈,引入了 Latent MoE 技术,在潜空间降维来直接调用四倍数量的专家网络,实现更精细的分工。

此外,模型还原生应用了多 token 并行预测技术,通过共享权重设计,单次传递即可预测多个未来 token,极大提升了响应速度。

但最核心的杀招隐藏在硬件底层:Nemotron 3 Super 是在 25 万亿个 token 上,原生采用 NVFP4 格式进行预训练的。这意味着它从出生起,其基因就完全是为了适配英伟达最新的 Blackwell 架构(如 B200 芯片)而优化的。最终的结果是,它在 B200 芯片上跑出了比前代 H100 快整整四倍的推理速度。
【笔者观点】 这才是科技圈最反常识的降维打击!开源精神的初衷是“硬件不可知论(Write once, run anywhere)”,但英伟达的开源,是送给全行业一个极其精密、极其好用,但“只有插在自家主板上才能发挥全力的特洛伊木马”。表面上,老黄大方地送出了顶级的开源模型;实际上,这种原生绑定 NVFP4 的做法,直接把 AMD 和谷歌 TPU 等竞争对手的算力架构踢出了局。你以为你白嫖了一个 120B 的最强模型?错,你是被英伟达用这个模型逼着去买他家更贵的新一代显卡。
三、 260 亿美元的“极限拉练”:拿全世界开发者当免费 QA
在未来五年投入 260 亿美元搞开源模型,这笔钱甚至超过了许多国家级 AI 项目的总预算。英伟达在此次开源中毫无保留:全参数权重、训练配方、评估日志、部署手册全盘托出。
但官方通稿中泄露了这笔巨资的真实用途:英伟达将通过在超级数据中心里跑这些自家优化的开源模型,对计算、存储和网络性能进行全方位的压力测试。压榨出的宝贵数据,将被直接拿来反哺未来的硬件架构路线图,实现“由软件实操定义硬件进化”。
【笔者观点】 如果你觉得 260 亿是用来做慈善的,那就太天真了。这其实是一场让人脊背发凉的“终极阳谋”。英伟达为什么要自己做模型?因为现有的 AI 公司(哪怕是 OpenAI)在压榨算力极限方面,根本跟不上英伟达迭代硬件的野心。老黄不想等别人来测试他的芯片了,他要自己造出地表最吃算力的怪物,然后免费发给全世界的开发者去跑。全人类的开发者,都在拿着这套开源方案,不知不觉地充当英伟达下一代硬件的免费测试员(QA)。在 AI 时代,得生态者得天下,而英伟达正在用 260 亿美元,彻底买断未来十年的算力定义权。
👇 欢迎关注我的公众号
在 AI 爆发的深水区,我们一起探索真正能穿越周期的技术价值。 微信搜索 【睿见新世界】 或扫描下方二维码,获取每周硬核技术推文:

欢迎关注【睿见新世界】