AutoMat:让「看见原子」成为「理解材料」的科学直通车


AutoMat:让「看见原子」成为「理解材料」的科学直通车

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

将ScienceAI设为星标
第一时间掌握
新鲜的AIforScience资讯
作者|AutoMat团队
投稿单位|清华大学
编辑丨ScienceAI
在材料科学的微观世界里,电子显微镜已能把原子「拍」得一清二楚;然而「看见」并不等于「理解」。要把这些亚埃级图像转成计算可用的晶体结构,研究者仍需逐像素判读、手工搭建模型、比对参考模板。这个流程动辄耗费数小时到数天,且极易被噪声与元素重叠误导。这一解析瓶颈使得高分辨成像与理论模拟之间始终存在一道「真空带」。
最新工作AutoMat则试图用AI来填平这条鸿沟。AutoMat团队构建了一个「电镜智能代理」:它接收原始STEM图像,先用模式自适应去噪网络澄清信号,再通过物理约束检索模板、对称感知重建原子坐标,最终输出标准 CIF并借助机器学习势能模型给出形成能等关键物性。整个链条仅需数分钟,就能完成过去依赖人工的「显微成像→结构重建→性质预测」。
为了量化成效,作者们搭建了二维材料基准STEM2Mat-Bench(超450 种材料)——单层结构可最大限度减少多重散射与投影歧义,便于评测算法极限。
结果显示,AutoMat在结构误差与能量预测上均大幅优于现有多模态大模型及专用工具AtomAI;在最难的低剂量三元素场景下仍能稳定输出可用结构。由此,实验观测首次与计算模拟形成高通量闭环,为「AI-驱动的材料发现」打开了真正的高速通道。
STEM2Mat-Bench:构造专为显微→模拟打造的基准
超过450种高置信二维材料|覆盖67种元素
统一三元组:图像–结构–DFT能量
难度梯度↗(Tier 1 → 3):从单元素高剂量到三元素低剂量
让模型在「图像→结构→性质」全链路上一站式考核。
借助STEM2Mat-Bench,AutoMat首次展示了在全难度段稳定重建与精准预测的能力,也为后续算法提供了统一、公正的比拼赛道。
AutoMat四步闭环——桥接显微镜与计算模拟的智能 Agent
性能评估:AutoMat压倒性超越现有技术
为评估 AutoMat,团队设置三条基准线:
一是多模态视觉‑语言模型(GPT‑4. 1 mini、Qwen 2. 5‑VL‑32B、LLama 4V‑17B、ChemVLM‑8B),输入固定提示与 STEM 图像直接推断材料性质,用于衡量「图像→性质」推理水平;
二是AtomAI,仅通过分割网络定位原子中心并结合分辨率拟合晶格,专门考察结构重建精度;
三是「LabelCIF + MatterSim MLIP」,即将真实CIF喂入机器学习势能模型,给出形成能误差的理论最优上限。
AutoMat在形成能预测上的平均绝对误差(MAE)为332±12meV/atom(分层级为344、320和333meV),虽仍高于理论最佳值(48meV),但远低于视觉-语言模型普遍数eV级别的误差,且后者误差随任务难度显著增加,验证了基准设计的合理性。进一步提升结构重建精度后,AutoMat有望逼近理论误差范围,充分满足下游性质预测需求。
对于结构重建,AutoMat实现了大约0. 11A的平均投影RMSDxy,比AtomAI(43-44A)低两个数量级,大多数偏差可通过最终松弛校正。
成分正确性方面,AutoMat在各层级上平均达到83%(具体为88. 9%、85. 9%、73. 1%),而AtomAI仅在简单的Tier1情况下达到不到2. 7%。
结构成功率方面,考虑空间和成分一致性,AutoMat总体达到83. 2%(各层级为85. 0%、84. 0%、73. 1%),而AtomAI几乎不能产生有效结构。
总结来说,AutoMat不仅优于所有现有基线,而且在具有挑战性的Tier3场景中保持高性能,这些场景涉及多元素组成和低成像剂量,展示了其在整个基准范围内的稳健性和泛化能力。
挑战和未来路线
瓶颈 ①|模板检索失灵(39. 3 %)
检索未命中正确晶体,导致原子排布与元素完全错位,形成能误差最高飙至 3130meV / atom(典型案例:U-F-O结构被错配为P-系模板)。
瓶颈 ②|下游重建崩溃(60. 7 %)
模板虽正确,但2D投影重叠或C/O等近似元素对比度过低,触发原子混淆、结构松弛失真,CIF直接输出失败。
下一步优化
不确定性检索+多候选融合:先扩宽匹配范围,再用置信度筛选,提高模板命中率。
3D-aware&多模态融合:补足z轴深度信息,强化复杂体系的结构保真度与性质预测准确性。
迈向“智能实验室”愿景
1. 实验-模拟-AI全闭环
AutoMat负责表征 → 结构 → 物性的实时推断;
机器人合成平台自动制备候选材料;
在线表征(XRD、EELS、原位光谱)即时回流数据;
LLM/贝叶斯优化代理决策下一轮实验,实现「自驱迭代」。
2. 扩展能力版图
3D体相&缺陷/界面:深度学习重建算法+断层电镜(ET)数据,解决真实晶体块材与界面问题
多模态数据融汇:将谱学、成像、热分析等多源信息拼成「材料全息图」,提高预测精度;
高通量并行:结合固定床/微反应器阵列,日级别筛选上百组合物,实现催化与能源材料的快速迭代。
3. 数据标准&开放平台
建立统一「图像-结构-性质」数据协议,兼容AutoMat与机器人实验记录;
开放API与Benchmark,促成跨实验室协同与模型可重复验证。
未来图景:显微镜不再只是观测工具,而是闭环反馈设计方案和材料的重要一环;AutoMat则成为连接表征、合成与计算的「中央神经」,驱动材料研发像自动驾驶一样自我学习、持续优化。
代码:https ://github. com/yyt-2378/AutoMat
数据集:https ://huggingface. co/datasets/yaotianvector/STEM2Mat
论文:https ://arxiv. org/abs/2505. 12650
人工智能×[生物神经科学数学物理化学材料]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录