英伟达公司发布了其迄今为止能力最强的AI模型Nemotron Super 3。该模型旨在大规模运行复杂的智能体AI系统,它将先进的推理能力与快速处理速度相结合,以高效执行需要极高准确性的任务。
Nemotron Super 3是一个基于混合专家架构的1200亿参数开放模型。英伟达表示,它结合了三大创新,实现了比上一代Nemotron Super模型高达五倍的吞吐量和两倍的准确性。
据英伟达介绍,Nemotron Super 3旨在解决智能体AI系统面临的两大主要限制。第一个限制是内容爆炸。多智能体工作流通常比标准聊天交互多生成高达15倍的token,因为用户每次与智能体交互时,模型都需要重新发送上下文,包括工具输出和中间推理。
第二个限制被称为**“思考税”**。复杂的智能体在完成任务的每一步都需要进行推理,这使得使用更大的模型变得不切实际,因为参数越多,处理成本就越高。此外,大模型也比小模型慢。
为了解决这些问题,Nemotron 3 Super拥有100万个token的上下文窗口,使其能够在内存中保留完整的工作流状态,并防止“目标漂移”。此外,在其1200亿参数中,推理期间只有120亿是激活的。推理是指运行训练好的模型以在新数据上生成预测或得出结论的过程。
英伟达表示,Nemotron Super 3在其Blackwell GPU上以NVFP4精度运行,这使其内存需求降低,推理速度相比上一代Hopper平台提升高达四倍。
Nemotron 3 Super可从build.nvidia.com、OpenRouter和Hugging Face下载。此外,AI搜索引擎某机构(原文:Perplexity Inc.)正在其搜索引擎及其“计算机”AI智能体系统中提供该模型。CodeRabbit、Factory和Greptile等生成式AI编码应用程序也正在将该模型添加到其产品阵容中,而生命科学组织Edison Scientific和Lila Sciences将使用它来为数据科学、深度文献研究和分子理解领域的智能体提供动力。
包括某机构(原文:Amdocs group Co.)、某机构(原文:Palantir Technologies Inc.)、某机构(原文:Cadence Design Systems Inc.)和某机构(原文:Dassault Systèmes SA)在内的公司也正在使用Nemotron Super 3来自动化电信、网络安全、半导体设计和制造领域的工作流。最后,某机构(原文:Dell Technologies Inc.)和某机构(原文:Hewlett Packard Enterprise Co.)也将通过其各自的智能体中心提供对该模型的访问。
Nemotron 3 Super的发布正值英伟达年度GTC大会前夕,该大会将于下周3月16日开幕,届时该公司预计将公布有关其下一代GPU平台的更多信息。FINISHED