这可能是最全的材料导电性数据库,一个好用的在线分类工具

119 阅读3分钟

编译/文龙

初中物理告诉我们,金属大多数是电和热的优良导体。从广义上讲,所有的材料都可以归类为金属或绝缘体,取决于电子通过材料的能力。然而,有一种金属-绝缘体转变 (metal–insulator transition, MIT) 化合物,它可以既表现出金属特性又表现出绝缘体特性,具体取决于物理条件。

对于这一新材料,来自美国西北大学和麻省理工学院的联合团队结合专业领域知识和自然语言处理(NLP)搜索建立了一个材料数据库,并对这个数据集训练了监督学习,开发出在线分类器。该工具免费且易用,可以加速科学家发现金属-绝缘体转变材料,以及确定可以描述此类材料的新特征。

研究结果于 7 月 6 日以「Database, Features, and Machine Learning Model to Identify Thermally Driven Metal–Insulator Transition Compounds」为题发表在期刊《Chemistry of Materials》上。

使电子设备更快、更节能以及设计新的计算机的关键之一是发现具有可调电子特性的新材料。金属-绝缘体转变材料会根据所施加的外部条件(温度、压力、掺杂)发生从金属态到绝缘态的电子相变。预测材料是否容易经历 MIT 是一件重要却十分有挑战的事情,其原因之一是电子相变可能来自各种不同的机制。

金属-绝缘体转变材料电子相变的三种机制。(来源:论文)

因此,该团队结合了专业领域知识和 NLP 技术,检索了大约 70000 篇专业论文,建立了一个由实验证实的温度驱动的 MIT 化合物数据库,并使用原子、电子和结构描述符以及 MIT 特定的特征来表征完整的数据集。

构建用于训练分类器的材料数据库的工作流。(来源:论文)

有了数据集,研究人员为金属与非金属(M)、绝缘体与非绝缘体(I)以及 MIT 与非 MIT(T)三个分类任务训练了六种不同的监督学习模型,确定了以前被低估的新特征,并编写了一个由三个二元分类器组成的在线工具。

来自简化特征集的 MIT 化合物 (T) 分类器的 SHAP 特征重要性(来源:论文)

这个新的工具公开访问且易用。用户无需安装任何软件,只需在 tinyurl.com/mit-classif… 网站上上传晶体结构文件,就可以获得该晶体被识别为金属、绝缘体或 MIT 化合物的三个概率。具体演示如图。值得注意的是,三种可能的电导率分类可能不会相互排斥,因此没有进行单一的三元分类。

0 表示是这类材料,1 表示不是这类材料,默认阀值是 0.5,这意味着着仅当预测概率大于 0.5 时才会进行正分类。(来源:论文)

作者认为他们的工具帮助了材料科学家加速 MIT 这类材料的理解和发现。「这个免费工具允许任何人快速获得关于他们正在研究的材料是金属、绝缘体还是金属-绝缘体过渡化合物的概率估计。科学家不需要了解机器学习就可以使用它,就像不需要深入了解搜索算法来浏览互联网一样。」

科学家们使用机器学习工具确定了表征金属绝缘体转变材料的重要特征。(来源:西北大学和麻省理工学院)

此外,他们还认为可以将类似的方法进行推广,以帮助更多的科研工作者。「这项工作可以被其他科学家使用并应用于其他材料类别,以加速其他类别量子材料的发现和理解。」

论文链接:doi.org/10.1021/acs…

项目地址:tinyurl.com/mit-classif…

参考内容:www.eurekalert.org/news-releas…