机器学习探索共价键碳的亚稳态相图,未来可用于发现或设计亚稳态材料

360 阅读11分钟

编辑 | 萝卜皮

传统的相图生成涉及实验以提供一组热力学可接近相及其边界的初始估计,然后使用现象学模型在可用实验数据点之间进行插值并外推到实验不可接近的区域。

这种方法与高通量第一性原理计算和数据挖掘技术相结合,导致了详尽的热力学数据库(例如与 CALPHAD 方法兼容),尽管重点关注在不同热力学平衡下观察到的减少的相集。

相比之下,材料在其合成、操作或加工过程中可能无法达到其热力学平衡状态,而是保持在局部(亚稳态)自由能最小值中,这可能表现出理想的特性。

阿贡国家实验室纳米材料中心的研究人员介绍了一种自动化工作流程,它将第一性原理物理和原子模拟与机器学习 (ML) 和高性能计算相结合,以允许快速探索亚稳态相,从而为远离平衡的材料构建「亚稳态」相图。

使用碳作为原型系统,研究人员演示了自动亚稳态相图构建,以绘制数百个亚稳态,范围从接近平衡到远离平衡(400 meV/原子)。将自由能计算结合到基于神经网络的状态方程学习中,从而可以有效地构建亚稳态相图。该团队使用亚稳态相图并确定亚稳态材料的相对稳定性和可合成性域。并通过实验,证实了他们的亚稳态预测。

该研究以「Machine learning the metastable phase diagram of covalently bonded carbon」为题,于 2022 年 6 月 6 日发布在《Nature Communications》。

材料合成传统上依赖「热力学相图」来提供稳定相的信息,这些信息是温度、压力和化学成分等各种强度状态特性的函数。用于生成相图的常规方法涉及提供相边界的初始估计的实验,然后使用现象学模型来内插可用的实验数据点并外推到实验无法访问的区域。

这种方法与原子模拟和最近的数据挖掘技术相结合,已经为不同材料建立了完善的详尽热力学数据库——尽管仅限于在热力学平衡附近观察到的相。

然而,在合成和加工之后,或在操作过程中,材料可能会陷入能量景观的局部最小值,即处于亚稳态。固体碳是表现出这种行为的典型系统,在室温和大气压下具有许多已知的亚稳态同素异形体。重要的是,这些同素异形体具有广泛的特性,从金属、半导体、拓扑绝缘体到宽带隙绝缘体。

类似地,多组分材料的亚稳态结构存在巨大而丰富的相空间,其中一些相具有潜在的理想特性,推动了超越近平衡材料的需求。因此,非常需要详尽的「亚稳态相图」,绘制热力学平衡中无母相的状态方程。

图示:构建亚稳态相图的自动化 AI 工作流程。(来源:论文)

预测、识别和绘制亚稳态材料的自由能是一项非常重要的数据密集型任务。

第一个挑战是采用有效的结构优化算法,能够识别配置空间中能量景观的全局(基态)和局部(亚稳态)最小值。

另一个挑战是在需要相位信息的范围内,将这些亚稳态相中的每一个的自由能表面(即状态方程)映射为密集热力学状态变量(P、T 和 X)的函数。对于大量亚稳态配置,这一步骤在计算上很快变得难以计算,并且在实践中,需要一个替代模型来近似更昂贵的基于第一原理的方法(例如从头算分子动力学)的自由能计算。

在计算所有相的状态方程后,最后的挑战是分类和识别相边界和亚稳态平衡域,即相图中亚稳态结构与低能结构动态解耦的区域。

在这里,阿贡国家实验室纳米材料中心的研究团队报告了一个自动化框架,通过将进化算法与第一性原理计算、机器学习 (ML) 和高性能计算相结合来解决上述挑战,以允许探索亚稳态材料并构建它们的相图。

他们的框架允许从已发表的文献/数据库中管理亚稳态结构,同时能够自动发现、识别和探索材料的亚稳态,并通过深度神经网络「学习」它们的状态方程。研究人员将他们的框架应用于碳的情况,碳是一个众所周知的具有大量亚稳同素异形体的系统,并绘制了其在大范围温度(0–3000 K)、压力(0–100 GPa)和过剩自由能(高于热力学平衡高达400 meV/原子)下的亚稳相图。

研究人员表明,在石墨的高压高温(HPHT)处理中可以通过实验观察到热力学平衡的近相。他们还确定了一种新的立方硅藻土亚稳态构型,它解释了先前报道的 n 型金刚石的衍射图案,证明了该方法在指导材料合成超越平衡方面的潜力。

相对稳定的领域

通常,材料科学家发现只考虑选择的几个感兴趣的阶段并检查它们的相对形成概率是有用的。例如,可以只考虑相变中涉及的两个相并研究它们的相对稳定性,以估计相变线。在给定压力和温度下观察一个相的概率取决于它相对于竞争相的相对稳定性。

实验上,在中等压力和高温下观察到辉绿岩,而高压条件主要产生六角形金刚石。通过适当调整实验条件,这些关于相对稳定性的信息可以帮助驱动合成过程产生所需的亚稳相,而不是相的混合物。

图示:从亚稳态相图中提取的信息。(来源:论文)

亚稳相之间的转化障碍

该团队的亚稳态相图与任何其他相图一样,包含有关相的热力学的信息,并且仅包含有关动力学的部分信息。在实践中,克服相变动力学障碍所需的实际激发大于ΔG。一旦在感兴趣的a(T,P)上确定了竞争亚稳相列表,通过使用 Stevanović 团队提出的算法将晶体结构相互匹配,并计算变换路径上图像的能量,可以估计任何相位对的近似能量势垒。

研究人员构建了一个离散的热力学图表示(上图 c),其中节点代表各个相,边缘的长度与转换障碍成正比。基于该图,研究人员发现石墨到 Z-碳相与立方金刚石到 Z-碳相的转变势垒较低,这表明石墨是实现 Z-碳亚稳相的优选起始材料。另一方面,立方金刚石是形成 bct-C 的相对更好的起始材料。

值得指出的是,碳的亚稳态配置具有有趣的电子特性,从金属到半导体再到绝缘 - 如果能够了解这些相的热力学景观以及从一种亚稳态转变为另一种亚稳态的障碍,就可以利用这些特性。例如,石墨是导电的,而 Z-碳是绝缘的。同样,金刚石是绝缘的,而 bct-C 碳估计是导电的。

因此,建立这样一个与其转化途径相关的亚稳相网络,可以作为在合成所需亚稳相期间确定起始材料的基于动力学的指导。

可合成领域

在给定的 T 和 P 下观察相的可能性取决于晶体结构是否由于熔化或动态不稳定性而被保留或变形。换句话说,可合成性从根本上受到动态稳定性的限制。

研究人员通过在 MD 模拟期间检查原子的均方偏差 (MSD) 来确定亚稳相的动态稳定性,在感兴趣的温度和压力范围内进行,使用碳的长程键序势 (LCBOP)。LCBOP 电位再现了碳的平衡相图并捕获了相的状态方程。

在这里,研究人员将可综合性域定义为(T,P)空间中相位动态稳定的区域。上图显示了 S32、S54 和 S125 的可合成域。虽然相 S32 和 S54 的可合成性受压力限制,但 S125 受温度限制。

应该注意的是,保持在可合成范围内是成功合成的必要条件,但不是充分条件,因为可能存在其他限制合成的因素。过去已经提出了类似的可合成性上限,但基于非晶相的能量学。

当亚稳相被驱动到动态不稳定区域时,它可能会转变为能量景观中的相邻亚稳相或经历熔化形成非晶相。状态变量 (T,P) 的这种理论界限(其中相可能是稳定的)对于合成感兴趣的亚稳态相具有指导意义。

使用机器学习加速构建亚稳态相图

亚稳态相图的生成依赖于大量竞争相的昂贵的自由能计算。受深度神经网络在与原子能量和力相关的 DFT 数据集上取得良好性能的成功启发,该团队在这项工作中使用了类似的 ML 策略。

使用基于 ML 的代理模型,可以加速该过程,并且可以构建预测 G(T,P) 的代理模型。下图展示了仅给定 SOAP 描述符形式的结构信息,经过训练以预测 G(T,P) 的 DNN 模型的性能。图中的奇偶校验图展示了 DNN 模型在训练集和测试集上实现的预测精度(平均绝对误差,MAE)。值得注意的是,n-diamond (S291)、S455 和 6B (S389) 数据是测试集的一部分,这些情况下良好的 DNN 性能说明了它能够捕获碳的自由能表面。

此外,研究人员展示了他们的 DNN 模型能够准确地预测测试集中的相位状态方程,仅给出它们的结构信息。测试集中所有阶段的总体 MAE 为 37.1 meV/原子,并且发现其性能明显优于另一个基线 DNN 模型,假设其与 P 和 T 二次相关,该模型适合自由能表面的系数。在许多情况下,在相对较高的压力下观察到自由能预测的高误差。

然而,DNN 模型在测试集上令人鼓舞的表现表明了这种方法的总体前景。虽然 DNN 的性能似乎令人满意,但未来应该做更严格的工作,以找到更合适的 ML 方法和进一步提高模型性能的输入结构指纹。一旦训练了这样的替代模型,任何新相的自由能景观可以仅使用结构信息更快地预测几个数量级,从而加快构建亚稳态相图的过程。

图示:DNN模型预测不同碳相吉布斯自由能的性能。(来源:论文)

总之,该团队通过提供自由能标度来引入亚稳态的替代表示,该自由能标度有助于识别亚稳态相位置及其非平衡程度。这种表示对于设计实验和加速发现亚稳态的信息要多得多,亚稳态通常表现出奇异的特性。

该自动化工作流程允许通过结合几种协同计算方法来构建「亚稳态相图」,包括基于遗传算法的结构搜索、深度学习加速的高通量自由能计算和用于分类相界的多类支持向量机。研究人员通过使用具有代表性的单组分碳系统证明了该计算方法的有效性,该系统的平衡和亚稳态在过去已经得到了很好的研究。

该团队成功地预测了平衡相图,并使用亚稳态相图解释了金刚石砧座中石墨在高压高温处理过程中的几个实验观察结果。他们提出了一种立方硅藻土结构,作为解释 n 金刚石衍射图案的候选相。此外,还证明了有关亚稳态相的相对稳定性及其可合成性的信息,可以从亚稳态相图中解析出来。

研究人员表示,在代理 ML 模型的帮助下,相图构建可以加速几个数量级,该模型可以在仅给定结构信息的情况下可靠地预测状态方程。说明该框架为计算机辅助发现和设计可合成的亚稳态材料奠定了基础。

论文链接:www.nature.com/articles/s4…