英伟达发布开源AI天气预报模型,包括中期预报和短时预报,采用Transformer架构,可在单个GPU上运行,大幅降低超算需求,并推出数据同化工具,使企业级高分辨率天气预报更普及。
译自:Nvidia makes AI weather forecasting more accessible, no supercomputer needed
作者:Frederic Lardinois
除了极少数例外情况,大规模天气预报一直是拥有大型超级计算机的政府机构的领域。但这种情况正在改变。
英伟达今天发布了两款开源天气预报模型:Earth-2 中期预报和 Earth-2 短时预报。此外,它还推出了一款工具,将显著加快这些模型起始条件的生成速度。
英伟达气候模拟总监Mike Pritchard告诉《The New Stack》:“天气方面的风险再高不过了。”
“气候变化导致极端天气恶化,正在影响我们所有人以及现代生活的几乎每个方面。天气预报影响着我们所有人。它可以推动农业、能源、航空和应急响应的改进,但预报的科学正在发生变化。”Pritchard说。
Pritchard认为,人工智能引发了“天气预报领域的科学革命”,但研究人员一直在努力将这项工作从实验室推向实际解决方案。“我们需要降低准入门槛,让开发者能够在开放环境中构建工具。”
这并非英伟达首次涉足天气预报业务。作为其构建地球数字孪生项目Earth-2的一部分,它此前发布了两款其他模型。第一款是Earth-2 CoreDiff,一个能够将大陆尺度预测下采样到高分辨率局部预测的模型,速度比传统方法快500倍。第二款是Earth-2 FourCastNet3,一款高效的全球预报模型,可在单个英伟达H100 GPU上运行。
准确的预报不仅仅是为了决定是否带伞。这些模型是航空公司、保险公司、能源供应商和农业的关键基础设施。
英伟达的新天气模型
此前的两款模型——以及大多数其他现有基于AI的预报模型——都使用专业模型架构,并且不采用现在已成为现代大型语言模型(LLM)默认方法的Transformer架构。对于新的中期预报和短时预报模型,英伟达正是采用了这种Transformer架构。毕竟,Transformer架构得到了几乎所有其他AI公司的性能和工程工具的支持。
Pritchard说:“从哲学上、科学上讲,这是一种回归简单。我们正在摆脱手工定制的利基AI架构,转向未来简单、可扩展的Transformer架构。”
中期预报模型,顾名思义,旨在提供未来长达15天的高精度预报。

英伟达Earth-2 中期预报模型运行中。(图片来源:英伟达)
英伟达尚未向《The New Stack》提供详细的基准测试数据,但Pritchard认为,中期预报模型在“超过70个气象变量”方面,包括温度、气压和湿度,都优于目前该领域的领导者DeepMind的GenCast。
短时预报模型可能更有趣:它能生成公里分辨率的国家级预报——对于任何现代模型来说,这都是一个非常高的分辨率。欧洲或北美的大多数天气预报模型分辨率为两公里或更高,而美国国家海洋和大气管理局(NOAA)的GFS模型,免费可用且通常是免费天气应用的默认模型,其分辨率为13公里(尽管NOAA最近也已开始实施AI预报)。
以色列气象局计划今后使用短时预报模型,每天生成多达八次的高分辨率预报。该机构已经在使用英伟达较旧的CoreDiff模型。同样,天气公司(weather.com背后的公司)计划将短时预报用于局部恶劣天气应用。
无需超级计算机
中期预报模型有多个变体,参数范围从24亿到33亿不等,其训练是在32个80GB A100/H100 GPU上完成的。但要运行该模型,您只需26GB的GPU内存,单个A100 GPU即可运行覆盖6或12小时的单时间步预测。根据模型不同,GenCast模型仅需140秒,另外两个中期预报变体(分别命名为Atlas-SI和Atlas EDM)需要94秒和88秒,而Atlas-CRPS模型(具有额外的噪声条件,参数量稍大,为33亿)则在四秒内完成。
对于短时预报模型,每个6公里分辨率的模型仅需5GB GPU内存,可在单个H100 GPU上以最高精度在33秒内运行。“我们预计推理速度将通过蒸馏和/或降低精度等技术大大加快,”英伟达发言人告诉我们。
数据同化:问题的另一半
对于天气预报,模型开始生成预报的起始数据至关重要。这些数据可以是卫星图像、雷达数据、来自气象气球、飞机和浮标的传感器数据。所有这些数据都需要标准化和转换,以便模型能够对其进行处理。
气候科学家称此过程为“同化”。为了加速这个耗时数小时的过程,英伟达还推出了全球数据同化模型,该模型可在几秒钟内生成这些全球天气的初始快照。
Pritchard表示:“尽管AI社区和研究社区在过去五年中大量关注预测模型,但这种数据同化任务,这种状态估计任务,很大程度上仍未通过AI解决,然而它却消耗了传统天气[预报]总超级计算负荷的约50%。”
同化模型实际上相当小,参数量为3.3亿。使用一个H100 GPU,它可以在不到一秒的时间内运行完整的推理流程,同时使用的GPU内存不到20GB。
尽管如此,这些高效模型能否让业余爱好者很快开始创建自己的预测,仍然不太可能——但并非不可能。毕竟,仅仅获取和管理起始数据就是一个重大的数据问题。但对于拥有正确用例和资源的企业来说,这可能为创建本地预报打开大门,而无需访问超级计算集群。