Nat. Mach. Intell. 封面 | 深度原理开发最佳传输模型生成化学反应过渡态


Nat. Mach. Intell. 封面 | 深度原理开发最佳传输模型生成化学反应过渡态

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

将ScienceAI设为星标
第一时间掌握
新鲜的AIforScience资讯
编辑|ScienceAI
在化学的微观世界里,过渡态(TS)就像化学反应中的「能量高峰」——当分子们为了发生奇妙的化学变化而剧烈碰撞时,必须跨越这个转瞬即逝的能量顶峰。然而,这个关键的中间状态就像闪电一样难以捕捉:实验仪器的「快门速度」跟不上它的变化节奏,而传统的量子化学计算方法又如同用慢镜头拍摄烟花,即使是最强大的超级计算机,解析一个过渡态的结构也可能需要连续工作数小时甚至数天。这种困境让科学家们在探索复杂反应网络指导化工生产、设计性能更优的催化剂时举步维艰。
图1:二维势能面上的反应物(R),过渡态(TS),产物(P),以及最小能量路径(minimalenergypathway)
近日,深度原理DeepPrinciple联合佐治亚理工大学,康奈尔大学等机构联合提出了一种革新性的过渡态检索方法——React-OT,采用最优传输(OptimalTransport,OT)的方法,从反应物和产物的结构插值开始,推导出高度精确的过渡态结构,相关成果已作为封面文章发表在《NatureMachineIntelligence》上,同时MITNews也对文章的第一兼通讯作者,深度原理DeepPrinciple的创始人兼CTO段辰儒博士进行了专访报道。
本文将带你深入了解React-OT的核心原理、与传统方法的对比,以及它如何突破计算化学的瓶颈,大幅提升TS搜索的效率与精度,为反应机理研究和催化剂设计提供全新工具。
一、方法创新
🔍从OA-ReactDiff到React-OT

OA-ReactDiff仅依赖反应物和产物的3D几何形状即可生成过渡态结构,比传统量化方法预测过渡态速度提升1000倍。但是由于扩散模型采样过程中的随机性,OA-ReactDiff生成的过渡态也是随机的,往往需要多次采样才能获得理想的过渡态结构。
作为OA-ReactDiff的迭代升级版本,React-OT在OA-ReactDiff的基础上,针对给定的反应物和生成物(双端搜索)进行了改进,基于最优传输理论,通过流匹配方法,从反应物和产物直接推导TS结构,单次采样即可生成确定性的TS结构。
💡最优传输(OT)
最优传输是一种数学理论和计算方法,用于描述两个概率分布之间的距离或者对应关系。它的核心概念是如何以最佳方式将一组资源(如质量、能量等)从一个位置传输到另一个位置。类比初中学习的线性规划问题:三个城市(A,B,C)分别有1、0.5、1.5吨煤,另外有两个城市(D,E)分别需要2、1吨煤,由于不同城市之间的运输成本不同,城市需求也不同,需要制定策略给出最优运输路线,这些「最优路线」在化学反应中就代表了最合理化学反应路径以其对应的过渡态结构。
🌟技术亮点速览
1.初始过渡态结构:OA-ReactDiff从高斯噪音中随机采样,所以生成的过渡态也存在随机性。React-OT则是从反应物和产物的线性插值出发,并且通过平移旋转等操作确保初始结构的等变性和唯一性,获得相对合理的初始猜测,将采样路径推向更接近最优传输的方向。
2.采样过程:OA-ReactDiff采用扩散模型,过渡态生成是一个随机采样过程。而React-OT将采样过程模拟为常微分方程,而不是扩散模型中的随机微分方程,将反应物、产物和过渡态的联合分布视为动态传输问题,通过流匹配(flowmatching)方法,直接从反应物和产物推导TS结构,不再需要多次随机采样。
3.更大数据集的预训练:使用RGD1-xTB数据集对React-OT进行预训练,然后再在Transition1x数据集上进行模型的微调,RGD1-xTB包含95万个基于GFN2-xTB计算的化学反应,对比训练OA-ReactDiff使用的Transition1x数据集(1万个反应),RGD1-xTB的数据量大幅增加,可为React-OT提供更广泛的化学环境和结构信息。
图2:扩散模型和最佳传输模型生成TS结构的工作概述(左)OA-ReactDiff的随机推理过程。(右)React-OT的确定性推理过程
二、结果一览
📈挤爆牙膏的性能提升
在使用Transition1x训练React-OT之前,先在RGD1-xTB数据集上对React-OT进行了预训练,预训练后,React-OT在TS预测精度上实现了显著提升:生成结构的RMSD中位数和势垒高度误差降低25%以上,相比未预训练模型精度提升显著。除了精度的提升之外,搜索过渡态所需运行时间也显著减少。OA-ReactDiff在单张GPU上需6秒完成过渡态搜索,而React-OT的采样过程消除了随机性,只要0.4秒就可以得到正确的TS结构。对比OA-ReactDiff,React-OT能适应更复杂的化学反应类型,对未见过反应的预测能力也要更好。
图3:React-OT和OA-ReactDiff模型在生成过渡态的精度和速度方面的性能对比a.React-OT得到满足特定RMSD要求的TS结构的可能性高于两种扩散模型。b.OA-ReactDiff和React-OT生成过渡态的质量。c.两种模型预测效果的对比。d.运行速度的比较。
🌐在反应网络中的应用
在经过RGD1-xTB预训练后,React-OT显著提升了对未见反应类型的适应性和预测能力,即使在12个非氢原子的复杂反应体系中,仍能准确生成TS结构,具备应对多步有机反应的能力。为了探索React-OT在反应网络探索中的实际应用,这篇文章选择γ-酮过氧化氢(KHP)作为研究对象。KHP是一个备受关注的反应体系,近年来被广泛用于基准测试。
图4:KHP的反应网络其中红色/黑色的数字分别为DFT计算/React-OT生成的过渡态上计算得到的活化能
可以看到,React-OT生成的反应网络与文献记载的KHP反应节点完全一致,表明其能够准确捕捉所有关键反应,且两者的平均绝对能量差仅为3.84kcal/mol。这一案例研究展示了React-OT在加速反应网络探索中的应用潜力。
三、应用展望
段辰儒表示,「人类眨眼的平均时间是0.4秒。在这个时间内React-OT就可以精准的找到一个化学反应的过渡态,这在之前是不可想象的。极致的加速会产生行为模式的质变,React-OT将改变我们对化学反应的理解和探索新材料的方式。」
💻应用场景前瞻
•催化剂设计:快速筛选高活性反应路径,加速清洁能源催化剂开发。
•药物合成:精准预测有机反应能垒,优化合成路线,降低实验成本。
•材料探索:构建超大型反应网络,发现新型功能材料(如MOFs、钙钛矿)。
未来已来
React-OT标志着化学反应TS搜索进入高效、精准的新纪元,有望成为计算化学领域的重要工具。欢迎关注深度原理DeepPrinciple团队,探索更多前沿研究!
进一步了解React-OT:
https ://bohrium.dp.tech/notebooks/47742251216
模型试用:
https ://bohrium.dp.tech/apps/bohriumweb/job?type=app
http ://reactot-dev.deepprinciple.com
人工智能×[生物神经科学数学物理化学材料]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录