首次实现「自驱动」,材料发现效率提升6倍,贝叶斯优化+CALPHAD计算的新方法
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
将ScienceAI设为星标
第一时间掌握
新鲜的AIforScience资讯
视频:AMASE的一次完整运行,耗时8小时22分钟,包括在11个温度点进行的66次XRD测量。(来源:论文)
编辑|萝卜皮
无需任何人工干预即可进行的实验和理论的实时、自主、迭代交互?
理论预测和实验验证的迭代循环是现代科学方法的基石。
然而,在实践中,实验-理论循环中所谓的「闭环」通常是临时性的,而且往往本身就很困难,因为计算或现象的规模或时间限制会使其难以实现。
在此,马里兰大学的研究人员提出了自主材料搜索引擎(AMASE),它通过实验和计算预测的自主驱动连续循环交互来探索材料。
他们已经将这种形式化方法应用于温度-成分相图的快速绘制。薄膜相边界的实验测定与使用CALPHAD实时更新相图预测的过程相互交织。
AMASE仅通过一次自引导实验,便能够精确地测定Sn-Bi薄膜体系的共晶相图,且实验数量仅占相空间的一小部分,从而将实验次数减少了六倍。
研究背景
主动学习驱动的自主实验利用贝叶斯优化(BO)动态引导实验序列,通过迭代更新模型来加速科学发现。自动化实验平台结合主动学习算法,实现了由机器人科学家自主决策的研究系统,尤其在材料发现领域成效显著,如量子点合成和太阳能电池优化。
自主系统大幅减少实验迭代次数,高效绘制相图并识别相边界,推动了功能材料研发,但是理论计算与实际实验之间仍然存在天然的鸿沟。
为了缩小这一差距,人们努力将计算模型纳入自主工作流程,包括将单独准备的或现有的计算数据与实验进行比较,以指导下一次迭代。
在BO框架中,将物理模型纳入概率模型,例如高斯过程(GP),通常是在核函数、均值函数、输入和输出以及采集函数的层面上实现的。
作为自主闭环迭代部分,对物理先验或理论的动态修改在范围上仍然很大程度上受到限制。令人兴奋但又充满挑战的是涉及材料合成的实时自主循环,由于动力学原因存在时间限制,因此实时发生的化学反应具有实验紧迫性。
AMASE
在最新的研究中,马里兰大学的研究人员提出了自主材料搜索引擎——AMASE。该系统由贝叶斯主动学习驱动,实验观察与计算建模交替进行实时交互,并在运行过程中不间断地相互通知和修正。
具体而言,该团队已将该系统应用于自行绘制薄膜共晶相图的任务。AMASE系统通过主动学习执行成分选择、X射线衍射(XRD)测量及其分析、样品热处理、穿插GP分类以确定相边界和热力学计算等线程循环任务。
通过不断更新的吉布斯自由能实时计算,结合贝叶斯自主实验,研究人员只需对整个成分-温度相空间的一小部分进行采样,就能得到完整的薄膜相图。
图示:用于绘制Sn-Bi相图的AMASE工作流程概述。(来源:论文)
在实验室环境中,构建Sn-Bi薄膜相图的一次实时运行仅需8个多小时即可完成,与详尽且耗时的网格映射(在同一范围内)相比,总实验次数减少了六倍,这对于在空气中含有这种常见但易挥发的化学元素的材料来说是不可取的。
研究人员在论文里表示:「Sn-Bi薄膜系统是AMASE工作流程的一个典型测试案例。虽然体相Sn-Bi相图已为人熟知,但薄膜相图与体相图存在偏差。此外,Sn-Bi薄膜系统的熔点相对较低,这使得相变无需额外硬件即可轻松实现。Sn-Bi薄膜系统容易氧化,这彰显了加速AMASE实验的必要性。」
一些拓展
在未来的工作中,将AMASE工作流程推广到相图未知的系统需要一种先进的相识别方法,并进一步完善CALPHAD的实现。
虽然许多先前的研究表明检测未知/新相是可能的,但从薄膜XRD数据中全面表征晶体结构通常并非易事。基于机器学习的相识别系统可以与AMASE系统一起使用,以主动监测相分布。这样的系统有可能取代目前的YOLO峰值检测+跟踪工作流程。
此外,材料项目和AFLOWlib等第一性原理计算数据库的预测结果可以链接或预加载到AMASE系统中,从而预测潜在的新相。一旦识别出新相,就可以构建其吉布斯能量函数并将其纳入优化过程。
大胆的设想
研究人员设想,可以通过使用大型语言模型(LLM)的上下文学习来实现此功能。为了实现高精度CALPHAD优化,可以建立一个模型上下文协议服务器,使LLM能够直接与CALPHAD软件交互。
图示:AMASE工作流程示意图,说明了实时实验和CALPHAD模型之间的迭代交互。(来源:论文)
在硬件方面,虽然实验上具有挑战性,但可以将环境控制的高温衍射仪与扫描台相结合,用于研究含有高熔点(高于1000°C)元素的材料系统。组合式批量样品库将有助于研究这些高温系统。
已有报道称,有几种用于类似目的(例如材料优化)的自主工作流程,其中一些工作流程包含内部循环。目前为止,AMASE工作流程是唯一一个将计算和实验任务与实际运行中演示的操作相结合的工作流程。
这里多循环工作流程的一个关键特点是,主循环中更新的CALPHAD计算(每40分钟执行一次)也用于指导内部相边界搜索循环。
为了进一步证明计算物理模型(CALPHAD)与相边界实验测定之间交互作用的优势,研究人员开发了一个单独的工作流程,其中相边界的追踪和选择完全由基线GP方法执行。他们提取了关键的统计指标,以比较该方法与AMASE的性能。
图示:AMASE和GP工作流程在两个统计参数方面的性能比较。(来源:论文)
每种方法均使用AMASE实时运行中最终导出的相图进行20次模拟。其中,GP方法经过明确编程,用于搜索溶解线和液相线。方法的基准测试基于用于导航相图的总点数以及每个温度下的测量点数。结果显示,AMASE方法的总测量点数明显低于GP方法。研究人员将这一差异归因于CALPHAD能够正确地外推相图特征。
与AMASE方法相比,GP方法表现出更大的方差,这体现在其总测量点分布更宽,以及单位温度测量点分布的尾部较大(上图B和C)。
上图B中观察到的bin0的高频率是由于AMASE能够「跳过」许多温度点,这得益于CALPHAD的基本外推性质,而这在GP方法中是不可能的。
结语
总而言之,科学家展示了一种材料探索方法,其中实验任务和计算任务以定时循环的方式自主交织,并不断相互影响。
利用提出的AMASE工作流程快速构建了薄膜Bi-Sn二元体系的相图,并通过后续实验验证了预测的共晶温度。这使得研究人员能够探索多维参数空间的区域,而这些区域超出了典型研究的物理条件所能达到的范围。
AMASE运算令人兴奋的自然扩展包括:整合其他类型的计算工作,例如密度泛函理论和凸包的快速自主映射,以及在材料科学以外的研究领域中将线程式实验-理论循环耦合起来。
这项研究还表明,人们可以仅基于实验室中相对便宜的现有工具来创建完整的自主材料探索系统,从而向公众展示自主科学的实用性和影响力。
论文链接:https ://www. science.org/doi/10. 1126/sciadv. adu7426
人工智能×[生物神经科学数学物理化学材料]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。