AI加速化学与材料发现的原子模拟技术详解

7 阅读6分钟

借助AI驱动的模拟技术加速化学与材料发现

几乎所有工业产品都依赖于化学与材料科学的进步。然而,新材料的发现过程通常成本高昂、耗时漫长,且常受制于试错方法的局限。传统上,使用经典力场的分子动力学等计算方法难以准确预测化学性质和稳定性。

某中心的ALCHEMI(人工智能化学与材料创新实验室)为化学与材料科学的研究人员与开发者提供了基于该中心加速计算平台优化的NIM微服务和工具包。本文介绍两款全新的原子模拟NIM微服务:该中心批量构象搜索NIM与该中心批量分子动力学NIM。

使用某中心ALCHEMI进行加速的构象搜索与分子动力学

分子具有多种三维形状,即构象异构体,每种构象都具有不同的性质和稳定性。识别低能量构象对于准确预测化学和材料性质至关重要。

ALCHEMI批量构象搜索NIM能高效识别和排序分子的低能量构象异构体。传统的量子化学方法进行构象优化计算成本高昂。批量构象搜索NIM使用AIMNet2作为机器学习原子间势能,以加速能量优化,相比量子化学方法,减少了生成低能量构象所需的时间。这对于高通量构象搜索活动非常有益,使研究人员能够以接近量子化学的精度快速评估分子在热力学上可及的构象。

批量构象搜索NIM的工作分为三个步骤:

  1. 使用RDKit或nvMolKit库从SMILES格式生成多个初始构象。可以指定生成的最大构象数量,或根据分子的可旋转键数量进行估算。
  2. 随后使用AIMNet2异步地将这些构象优化至其局部能量最小值。优化将持续进行,直到任一原子上的最大受力低于0.005 eV/Å的阈值。
  3. 最后一步是整理构象集合:根据原子间距离验证键的连通性,丢弃高于用户指定阈值的高能量构象,并根据原子间距离的相对差异对构象进行去重。

图1显示了随着分子复杂性(可旋转键数量)增加,构象生成数量也必须相应增加,以确保充分采样低能量构象。例如,对于一个具有12个可旋转键的分子,可能需要生成多达1000个构象,才能确保所有构象的能量都在最低能量结构的≤3 kcal/mol范围内。这突显了对高效构象搜索方法的需求。使用批量构象搜索NIM,在某中心H100 GPU上,每个构象的平均优化时间(Fmax = 0.005 eV/Å)为10-100毫秒。

在许多工作流程中,构象搜索会与分子动力学模拟结合使用。用于高通量模拟的批量分子动力学NIM通过支持MACE-MPA-0、TensorNet和AIMNet2等机器学习原子间势能来满足这一需求。其应用场景包括对许多原子系统进行高通量分子动力学模拟,以及需要高通量异步模拟的智能体AI工作流程。

批量分子动力学NIM的关键特性包括:

  • 动态批处理:通过动态批处理原子系统,优化GPU利用率,实现多个模拟的并发处理,以最大化吞吐量。
  • 基于GPU的积分器:使用朗之万恒温器和蒙特卡洛恒压器进行温度和压力控制,在恒定原子数、体积和温度,或恒定原子数、压力与温度条件下执行模拟。
  • 机器学习原子间势能支持:支持MACE-MPA-0、TensorNet-MatPES-r2SCAN-v2025.1、TensorNet-MatPES-PBE-v2025.1、AIMNet2、AIMNet2-NSE和AIMNet2-CPCM。

图2展示了性能增益(每原子每步时间)随批处理规模增加而提升,体现了动态批处理的优势。使用新一代某中心GPU(如某中心B200)可获得更好的性能和更大的批处理规模。例如,使用TensorNet,在单台某中心HGX B200 GPU上可实现每原子每步1.4微秒的性能,并模拟超过35万个原子。该基准测试使用了从OMat24数据集中随机抽样的结构批次进行。

加速OLED分子与浸没式冷却液的发现

某中心的客户正在利用ALCHEMI的新功能取得突破性成果。

某机构正在使用ALCHEMI批量构象搜索和批量分子动力学NIM微服务加速OLED分子发现。他们预测热加工稳定性的速度比传统的密度泛函理论快高达10000倍,同时达到了近乎相当的精度。该机构的研究人员能够探索更大的解决方案空间,增加了找到性能最佳OLED分子的可能性。

从候选分子池开始,研究人员使用批量构象搜索NIM来识别和排序低能量构象。针对每个构象,构建一个模拟单元,并运行分子动力学模拟以评估热加工稳定性。批量处理和机器学习原子间势能技术使得能够以前所未有的速度和精度评估数千种可能性。ALCHEMI通过批量构象搜索NIM和批量分子动力学NIM同时执行大量模拟,而不是单独模拟每个分子,从而加速了通量和创新。

另一家合作机构某中心,通过结合使用批量构象搜索NIM、批量分子动力学NIM和批量密度泛函理论微服务的多阶段工作流程,发现了超过1000种有前景的环保且不含PFAS的浸没式冷却液。浸没式冷却液需要低介电常数以保持信号完整性,以及高闪点以降低可燃性。从1000万分子开始,他们使用批量构象搜索NIM计算了100万分子的偶极矩。他们使用知识引导的图Transformer预训练模型来预测剩余900万分子的偶极矩,仅保留具有低偶极矩的分子。

接着,批量密度泛函理论微服务计算并筛选出具有低极化率的分子。随后,使用批量分子动力学NIM计算体积介电常数,并识别出具有低介电常数的候选分子。最后,使用知识引导的图Transformer预训练模型进行闪点预测。该工作流程使得该中心在短短三周内就识别出超过1000种同时具有低介电常数和高闪点的有前景的浸没式冷却液。

了解更多

如果你参加了超算大会,可以前往某中心展位聆听该中心的演讲并查看某中心ALCHEMI演示。 阅读相关材料与未来交通加速的相关文章,并观看ALCHEMI视频。

致谢

感谢来自某机构的George Fitzgerald、Sean Ryno、Gbolade Kayode和Darice Liu,来自某中心的Hideki Ono、Hiroyuki Tsujimoto、Kentaro Yomogita、Yoichiro Kawami和Masanao Goto,以及来自某中心的Saee Paliwal和Srimukh Veccham所做的贡献。FINISHED