融合图神经网络与无监督语言模型,对RNA-蛋白质相互作用精准预测


融合图神经网络与无监督语言模型,对RNA-蛋白质相互作用精准预测

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

将ScienceAI设为星标
第一时间掌握
新鲜的AIforScience资讯
编辑丨&
在遇到未知的蛋白质与RNA时,通常不易准确的计算测定RNA-蛋白质相互作用。RNA的有限数量及其灵活性限制了深度学习模型用于RNA-蛋白质相互作用预测的有效性。
华中师范大学物理研究所对此有全新的研究成果。研究者与美国华盛顿大学和达特茅斯学院进行合作,推出了一种名为ZHMolGraph的模型,它集成了图神经网络和无监督大型语言模型来预测RNA-蛋白质相互作用。
他们在两个基准数据集上验证了ZHMolGraph的预测,并超越了当前的最佳方法。对于完全未知的RNA和蛋白质的数据集,ZHMolGraph显示,在实现79.8%的高AUROC和82.0%的AUPRC方面有所提高。
这些增强功能使ZHMolGraph成为全基因组RNA-蛋白质预测的可靠选择。ZHMolGraph在建模和设计RNA-蛋白质复合物方面具有广泛的潜力。

RPI网络
RNA-蛋白质复合物对于许多细胞过程至关重要,包括基因转录和转录后基因调控。由于RNA突变迅速,及时确定RNA-蛋白质复合物的结构可能并不容易。因此,迫切需要利用现有的RNA-蛋白质相互作用网络和测序数据快速识别RNA的蛋白质结合对象。
最先进的RNA-蛋白质相互作用(RPI)预测方法主要依赖于传统的机器学习和深度学习技术。深度学习模型用于从RPI网络中的节点度数学习模式。在测序规模数据上的LLM的帮助下,ZHMolGraph克服了有限结合数据带来的限制,增强了其对未知和蛋白质对的泛化性。模型的改进在帮助预测RNA-蛋白质结构方面表现出潜力。
图示:构建RPI网络的工作流程。(图源:论文)
搭建模型的工作旨在改进RNA-ProteinRPI预测。他们首先使用使用结构化、高通量和文献挖掘验证数据构建了三个不同的网络,以了解RPI的特征。其次采用了名为ZHMolGraph的深度学习管道,它可以利用无监督LLM节点特征的网络采样学习策略来优化对RNA和蛋白质结合特性的探索。
ZHMolGraph框架与RPI网络的特点
图示:ZHMolGraph框架概述。(图源:论文)
在分析了结构网络的拓扑结构后,他们发现与结构网络中的所有节点、蛋白质和RNA相关的相互作用呈肥尾分布。在高通量和文献挖掘验证网络中也有类似的发现。
研究表明,RPI网络具有无标度拓扑。它突出显示了网络内节点的连接首选项的差异。高通量和文献挖掘验证的网络也表现出反相关和幂律衰减模式。在所有三种类型的网络中,高度节点的公共邻居数量通常不会比低度节点多得多。
在分析了各种来源的网络特性后,研究者们观察到RPI网络表现出无标度特性和高模块化。这些发现表明了复杂RPI网络中的秩序感和一致性,并为其复杂的拓扑结构提供了新的视角。RPI复杂网络系统显示定义明确的连接关系,允许大型语言模型映射短语之间的关联并推断复杂体之间的交互。
图示:ZHMolGraph在基准测试数据集上的整体性能。(图源:论文)
RPI网络节点到达新节点的能力与它们各自的程度直接相关。这一结果表明RNA和蛋白质节点在RPI的进化中是首选的。
除此之外,LLM和GNN的嵌入可以相互补充,弥补每种方法在基准测试中各自的局限性。在跨物种建模中,ZHMolGraph有效地最大限度地减少了对特定RNA和蛋白质家族的潜在结构偏差。
功能繁多使用灵活的模型
ZHMolGraph,通过结合无监督LLM语言模型和图神经网络来提高准确性和泛化性。在与其他深度学习方法进行对比之后,全新的模型展示出了它明显的性能提升。
现如今可以利用ZHMolGraph来帮助预测RNA-蛋白质复合物结构。ZHMolGraph可以识别界面中RNA和蛋白质结合在一起的序列。
尽管ZHMolGraph有助于识别RPI与序列信息的相互作用,但结合现象主要取决于分子的三级结构。通过结合驱动RNA-蛋白质结合的高阶分子特性,这一进展将进一步提高ZHMolGraph的预测准确性,从而可以更详细地分析RNA-蛋白质残基和核苷酸之间的物理相互作用接触。
与其他最先进的方法相比,ZHMolGraph表现出高准确性和泛化性,即使对于未知节点数据集也是如此。ZHMolGraph是一种可靠的工具,可用于在全基因组范围内确定RNA-蛋白质相互作用,并准确预测近天然RNA-蛋白质结构。
原文链接:https ://www.nature.com/articles/s42003-025-07694-9
代码链接:https ://github.com/Zhaolab-GitHub/ZHMolGraph
人工智能×[生物神经科学数学物理化学材料]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录