这种技术在晶体完整时效果最好,但在许多情况下,科学家只有粉末状的材料,其中包含晶体的随机碎片。这使得拼凑整体结构变得更加困难。
麻省理工学院的化学家们现在提出了一种新的生成式人工智能模型,可以更轻松地确定这些粉末晶体的结构。该预测模型可以帮助研究人员表征用于电池、磁铁和许多其他应用的材料。
“对于任何材料来说,结构都是你需要知道的第一件事。它对超导性很重要,对磁铁很重要,对了解你创造的光伏电池也很重要。对于你能想到的任何以材料为中心的应用来说,结构都很重要,”麻省理工学院弗雷德里克·乔治·凯斯化学教授丹娜·弗里德曼说。
弗里德曼和斯坦福大学计算机科学教授JureLeskovec是这项研究的资深作者,该研究发表在《美国化学会志》上。麻省理工学院研究生EricRiesel和耶鲁大学本科生TsachMackey是该论文的主要作者。
独特的图案
晶体材料包括金属和大多数其他无机固体材料,由许多相同、重复的单元组成的晶格构成。这些单元可以被认为是具有独特形状和大小的“盒子”,原子在其中精确排列。
当X射线照射到这些晶格上时,它们会以不同的角度和强度衍射原子,从而揭示有关原子位置及其之间键的信息。自20世纪初以来,这项技术一直用于分析材料,包括具有晶体结构的生物分子,例如DNA和一些蛋白质。
对于仅以粉末晶体形式存在的材料,解决这些结构变得更加困难,因为碎片不具有原始晶体的完整3D结构。
“精确的晶格仍然存在,因为我们所说的粉末实际上是微晶体的集合。因此,你的晶格与大晶体相同,但它们的方向完全随机,”弗里德曼说。
对于数千种此类材料,X射线衍射图存在但尚未解决。为了破解这些材料的结构,弗里德曼和她的同事利用来自“材料项目”数据库的数据训练了一个机器学习模型,该数据库包含超过150,000种材料。
首先,他们将数以万计的材料输入现有的模型中,该模型可以模拟X射线衍射图。然后,他们使用这些图来训练他们的AI模型(他们称之为Crystalyze),以根据X射线图预测结构。
该模型将预测结构的过程分解为几个子任务。首先,它确定晶格“盒子”的大小和形状,以及哪些原子将进入其中。然后,它预测盒子内原子的排列。对于每个衍射图案,该模型都会生成几种可能的结构,可以通过将这些结构输入到确定给定结构的衍射图案的模型中来测试这些结构。
“我们的模型是生成式人工智能,这意味着它可以生成以前从未见过的东西,这使我们能够产生几种不同的猜测,”里塞尔说。“我们可以进行一百次猜测,然后我们可以预测我们猜测的粉末图案应该是什么样子。然后,如果输入看起来与输出完全一样,那么我们就知道我们做对了。”
解决未知结构
研究人员在材料项目中的数千个模拟衍射图案上测试了该模型。他们还在RRUFF数据库中的100多个实验衍射图案上测试了该模型,该数据库包含近14,000种天然结晶矿物的粉末X射线衍射数据,这些数据均未包含在训练数据中。
根据这些数据,该模型的准确率约为67%。然后,他们开始在之前未解决的衍射图案上测试该模型。这些数据来自粉末衍射文件,其中包含超过400,000种已解决和未解决材料的衍射数据。
研究人员利用他们的模型,提出了100多种以前未解决的模式的结构。他们还利用他们的模型发现了弗里德曼实验室通过迫使在大气压下不发生反应的元素在高压下形成化合物而创建的三种材料的结构。这种方法可用于生成具有完全不同晶体结构和物理特性的新材料,即使它们的化学成分相同。
石墨和钻石都是由纯碳制成的,它们就是这类材料的例子。弗里德曼开发的材料含有铋和另一种元素,可用于设计新型永磁体材料。
弗里德曼说:“我们从现有数据中发现了很多新材料,最重要的是,我们实验室解决了构成这些元素组合的第一个新二元相的三种未知结构。”
麻省理工学院的研究团队在crystalyze.org上发布了该模型的网络界面,他们表示,能够确定粉末状晶体材料的结构可以帮助几乎所有与材料相关的领域的研究人员。