Nat. Mach. Intell. 封面 | 深度原理开发最佳传输模型生成化学反应过渡态

发布日期: 2025-04-24

仅用于站内搜索，没有排版格式，具体信息请跳转上方微信公众号内链接

将ScienceAI设为星标
第一时间掌握
新鲜的AIforScience资讯
编辑|ScienceAI
在化学的微观世界里，过渡态（TS）就像化学反应中的「能量高峰」——当分子们为了发生奇妙的化学变化而剧烈碰撞时，必须跨越这个转瞬即逝的能量顶峰。然而，这个关键的中间状态就像闪电一样难以捕捉：实验仪器的「快门速度」跟不上它的变化节奏，而传统的量子化学计算方法又如同用慢镜头拍摄烟花，即使是最强大的超级计算机，解析一个过渡态的结构也可能需要连续工作数小时甚至数天。这种困境让科学家们在探索复杂反应网络指导化工生产、设计性能更优的催化剂时举步维艰。
图1：二维势能面上的反应物（R），过渡态（TS），产物（P），以及最小能量路径（minimalenergypathway）
近日，深度原理DeepPrinciple联合佐治亚理工大学，康奈尔大学等机构联合提出了一种革新性的过渡态检索方法——React-OT，采用最优传输（OptimalTransport,OT）的方法，从反应物和产物的结构插值开始，推导出高度精确的过渡态结构，相关成果已作为封面文章发表在《NatureMachineIntelligence》上，同时MITNews也对文章的第一兼通讯作者，深度原理DeepPrinciple的创始人兼CTO段辰儒博士进行了专访报道。
本文将带你深入了解React-OT的核心原理、与传统方法的对比，以及它如何突破计算化学的瓶颈，大幅提升TS搜索的效率与精度，为反应机理研究和催化剂设计提供全新工具。
一、方法创新
🔍从OA-ReactDiff到React-OT

OA-ReactDiff仅依赖反应物和产物的3D几何形状即可生成过渡态结构，比传统量化方法预测过渡态速度提升1000倍。但是由于扩散模型采样过程中的随机性，OA-ReactDiff生成的过渡态也是随机的，往往需要多次采样才能获得理想的过渡态结构。
作为OA-ReactDiff的迭代升级版本，React-OT在OA-ReactDiff的基础上，针对给定的反应物和生成物（双端搜索）进行了改进，基于最优传输理论，通过流匹配方法，从反应物和产物直接推导TS结构，单次采样即可生成确定性的TS结构。
💡最优传输（OT）
最优传输是一种数学理论和计算方法，用于描述两个概率分布之间的距离或者对应关系。它的核心概念是如何以最佳方式将一组资源（如质量、能量等）从一个位置传输到另一个位置。类比初中学习的线性规划问题：三个城市（A,B,C）分别有1、0.5、1.5吨煤，另外有两个城市（D,E）分别需要2、1吨煤，由于不同城市之间的运输成本不同，城市需求也不同，需要制定策略给出最优运输路线，这些「最优路线」在化学反应中就代表了最合理化学反应路径以其对应的过渡态结构。
🌟技术亮点速览
1.初始过渡态结构：OA-ReactDiff从高斯噪音中随机采样，所以生成的过渡态也存在随机性。React-OT则是从反应物和产物的线性插值出发，并且通过平移旋转等操作确保初始结构的等变性和唯一性，获得相对合理的初始猜测，将采样路径推向更接近最优传输的方向。
2.采样过程：OA-ReactDiff采用扩散模型，过渡态生成是一个随机采样过程。而React-OT将采样过程模拟为常微分方程，而不是扩散模型中的随机微分方程，将反应物、产物和过渡态的联合分布视为动态传输问题，通过流匹配（flowmatching）方法，直接从反应物和产物推导TS结构，不再需要多次随机采样。
3.更大数据集的预训练：使用RGD1-xTB数据集对React-OT进行预训练，然后再在Transition1x数据集上进行模型的微调，RGD1-xTB包含95万个基于GFN2-xTB计算的化学反应，对比训练OA-ReactDiff使用的Transition1x数据集（1万个反应），RGD1-xTB的数据量大幅增加，可为React-OT提供更广泛的化学环境和结构信息。
图2：扩散模型和最佳传输模型生成TS结构的工作概述（左）OA-ReactDiff的随机推理过程。（右）React-OT的确定性推理过程
二、结果一览
📈挤爆牙膏的性能提升
在使用Transition1x训练React-OT之前，先在RGD1-xTB数据集上对React-OT进行了预训练，预训练后，React-OT在TS预测精度上实现了显著提升：生成结构的RMSD中位数和势垒高度误差降低25%以上，相比未预训练模型精度提升显著。除了精度的提升之外，搜索过渡态所需运行时间也显著减少。OA-ReactDiff在单张GPU上需6秒完成过渡态搜索，而React-OT的采样过程消除了随机性，只要0.4秒就可以得到正确的TS结构。对比OA-ReactDiff，React-OT能适应更复杂的化学反应类型，对未见过反应的预测能力也要更好。
图3：React-OT和OA-ReactDiff模型在生成过渡态的精度和速度方面的性能对比a.React-OT得到满足特定RMSD要求的TS结构的可能性高于两种扩散模型。b.OA-ReactDiff和React-OT生成过渡态的质量。c.两种模型预测效果的对比。d.运行速度的比较。
🌐在反应网络中的应用
在经过RGD1-xTB预训练后，React-OT显著提升了对未见反应类型的适应性和预测能力，即使在12个非氢原子的复杂反应体系中，仍能准确生成TS结构，具备应对多步有机反应的能力。为了探索React-OT在反应网络探索中的实际应用，这篇文章选择γ-酮过氧化氢（KHP）作为研究对象。KHP是一个备受关注的反应体系，近年来被广泛用于基准测试。
图4：KHP的反应网络其中红色/黑色的数字分别为DFT计算/React-OT生成的过渡态上计算得到的活化能
可以看到，React-OT生成的反应网络与文献记载的KHP反应节点完全一致，表明其能够准确捕捉所有关键反应，且两者的平均绝对能量差仅为3.84kcal/mol。这一案例研究展示了React-OT在加速反应网络探索中的应用潜力。
三、应用展望
段辰儒表示，「人类眨眼的平均时间是0.4秒。在这个时间内React-OT就可以精准的找到一个化学反应的过渡态，这在之前是不可想象的。极致的加速会产生行为模式的质变，React-OT将改变我们对化学反应的理解和探索新材料的方式。」
💻应用场景前瞻
•催化剂设计：快速筛选高活性反应路径，加速清洁能源催化剂开发。
•药物合成：精准预测有机反应能垒，优化合成路线，降低实验成本。
•材料探索：构建超大型反应网络，发现新型功能材料（如MOFs、钙钛矿）。
未来已来
React-OT标志着化学反应TS搜索进入高效、精准的新纪元，有望成为计算化学领域的重要工具。欢迎关注深度原理DeepPrinciple团队，探索更多前沿研究！
进一步了解React-OT：
https ://bohrium.dp.tech/notebooks/47742251216
模型试用：
https ://bohrium.dp.tech/apps/bohriumweb/job?type=app
http ://reactot-dev.deepprinciple.com
人工智能×[生物神经科学数学物理化学材料]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星，并点击右下角点赞和在看。
点击阅读原文，加入专业从业者社区，以获得更多交流合作机会及服务。