首个全场景原子级蛋白质大模型,百奥几何发布GeoFlow V2,统一生命分子的结构预测与从头生成
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
将ScienceAI设为星标
第一时间掌握
新鲜的AIforScience资讯
编辑|ScienceAI
从AlphaFold开启蛋白结构预测革命,到RFDiffusion成为蛋白质从头设计的高峰,科学家们一直在探索生命分子设计与工业应用场景的适配方式。
2025年4月16日,百奥几何发布了全球首个全场景原子级蛋白质大模型——GeoFlowV2。该模型展示了两个核心能力,一是首次以原子级精度统一蛋白质结构预测,二是可以对生物分子进行从头设计。
蛋白设计的全能引擎:GeoFlowV2的四重突破
首个蛋白质通用原子级大模型结构预测与从头设计一体化架构
相较现在业界主流模型「只能预测或只能生成」的单向性,GeoFlowV2首次实现了蛋白质结构预测与从头设计一体化:既可以对已有蛋白进行精准结构预测,也可以从零构建全新蛋白结构和序列。并在性能指标、预测准确性及设计合理性上实现了全面进化。
图示:GeoFlowV2模型流程示意
面向复杂体系的智能结构预测
GeoFlowV2具备强大的蛋白质复合物结构预测与建模能力,能够在各种约束条件下精准预测对接结构,广泛适用于抗原-抗体、蛋白-蛋白及蛋白-小分子等交互体系。
GeoFlowV2在低同源抗原抗体数据集上的Top-1预测成功率(即置信度最高的模型和真实模型DockQ>0.23的比例,下图左)达到45%,显著领先Chai-1(33%)、Protenix(31%)、AFM2.3(25%)等现有业界认可度最高的模型。在蛋白-小分子结构预测任务(下图右)中,GeoFlowV2也有一流的表现。
图示:GeoFlowV2在抗原-抗体复合物和蛋白-小分子复合物结构预测上均取得领先性能
在提供一个或多个表位氨基酸(即抗原上和抗体结合的氨基酸)的条件下,GeoFlowV2的结构预测成功率可进一步提高至50%至75%,体现了模型对原子水平相互作用的精准建模,也为基于表位的抗体从头设计奠定了坚实基础。
图示:指定表位条件下抗原-抗体复合物结构预测性能测评
在抗体结构预测任务中,经过蒸馏的小模型GeoFlowV2-ab在精度更高的情况下,预测速度达到AFM2.3的百倍以上,预测时间压缩至秒级别,助力实现百万量级的抗体结构快速推理。
图示:GeoFlowV2-ab在抗体结构预测上取得领先精度
图示:GeoFlowV2-ab在抗体预测运行时间上相比AFM2.3展现出150至250倍的速度优势
更听话、更高效的通用蛋白设计范式
在以抗体设计为代表的蛋白质设计任务中,GeoFlowV2展现出领先行业的设计结构合理性与结合成功率,实现了生成质量与命中效率的双重突破。GeoFlowV2生成结构的表位遵从性、CDR结合率、虚拟筛选通过率均显著优于SOTA模型RFAntibody(由RFDiffusion在抗体数据集上微调而来)。
这意味着,在同样设计数量的前提下,GeoFlowV2能生成更多具有功能的候选分子,大幅提升蛋白设计项目的成功率。
图示:基于GeoFlowV2的抗体设计与验证工作流
在七个靶点组成的抗体设计测试集上,指定表位氨基酸生成1000个抗体,在抗体框架区统一为Herceptin框架的条件下,GeoFlowV2在5个抗原上成功复现了参考分子的结合模式(minimumFRRMSD<5Å);而RFAntibody在全部七个靶点上均未能精准复现参考分子的结合模式,仅在两个靶点上获得了<10Å的抗体结构。
适配多源输入与多样性任务
GeoFlowV2具备全栈式的多模态蛋白质设计能力,可在不同类型的任务中实现与输入目标的高度灵活匹配。
不论是基于蛋白序列或结构的优化设计,还是以小分子、核酸为输入进行结合蛋白的从头构建(denovodesign)或基序拓展(scaffolding),亦或是直接生成高稳定性的多肽序列,GeoFlowV2都能稳定输出结构合理、功能明确的候选设计,显示出其在药物研发、分子工程与合成生物学中的广谱适配能力。
实际应用场景:开启生命分子设计的自由之门
以往的蛋白质发现和设计,或依赖自然界进化出的复杂体系(如动物免疫发现抗体),或依赖高通量实验进行规模化试错(如饱和突变已有分子),或依赖领域专家经验进行理性设计。
GeoFlowV2以可靠、通用的模型能力,将蛋白质设计推向可定义、可优化、可规模化量产的智能时代,正为研发效率与创新边界带去实质性重构。
在多类型的真实项目中,GeoFlow系列模型已经大显身手,逐步成为释放蛋白质“设计自由”的关键基础设施。
抗原设计
在与某头部药企的合作中,GeoFlowV2成功实现对某多次跨膜蛋白的可溶化改造。团队利用GeoFlowV2对跨膜疏水区域进行全新设计,成功构建出能够在水溶液中稳定存在的同时保持胞外区结构和功能特性的跨膜蛋白序列。GeoFlowV2设计的序列中90%可实现稳定可溶表达,其中多条序列与原始蛋白的胞外区结合特异性相同,但跨膜区仅有22%的序列相似性,展现出强大的设计创新性与工程适应性。
抗体从头设计
在针对HER2(ECD2/ECD4表位)及多个内部/合作靶点的抗体从头设计任务中,GeoFlowV2生成的抗体在高通量建库筛选后得到了多个低纳摩尔亲和力、满足结合表位要求、可开发性良好的全抗/纳米抗体分子,部分分子已完成动物体内功能验证。
相较传统的动物免疫及库筛选方法,GeoFlow开辟了一条全新的抗体发现路径,让科学家可以不再依赖自然生命体免疫系统的力量进行抗体发现,而是通过生成式AI对于靶点表位的精准建模生成结合抗体,有望为难成药靶点、特殊表位及种属交叉抗体的发现带来革命性变化。
功能蛋白设计
在一项功能蛋白的替代设计任务中,GeoFlowV2通过对目标结合区域(loop区)进行可专利的重新设计,一轮生成的100个候选分子中,有80%能够正常表达且具备良好的热稳定性,其中50%的样本对目标肽段的亲和力甚至优于专利分子,最高达到数十pM水平。
相较原专利分子需经历5轮文库构建与实验迭代,GeoFlowV2显著缩短了研发周期,展现了其在知识产权规避、蛋白性能优化与开发效率提升三方面的强大能力。
工业酶优化
在一个关键医药中间体合成工艺优化中,GeoFlowV2被用于转氨酶的高性能定向改造,以解决关键手性前体胺的催化难题。通过对酶-底物关系的深度建模与变体设计,结合高通量实验平台,仅用55天,百奥几何便完成了酶性能的全面优化——催化活性提升52.3倍,左手性选择性从0%跃升至99.7%,所有关键指标均满足小试工艺要求。
新酶挖掘
某非天然氨基酸具有重大商业价值,但传统合成方法转化率无法满足工业化要求。
百奥几何使用GeoFlow,通过新酶挖掘和两轮酶进化,研发出一款能够催化全新反应、具有商业化成本优势的酶,创新设计了一步酶法体外生物合成路线。该路线原料价格低廉、转化率高,具备更佳成本优势。
这一项目的成功,体现了GeoFlow从新酶挖掘到酶优化的强大优势——GeoFlow不仅成功挖掘到这款能够催化全新反应的酶(能够催化此类反应的酶此前未见任何文献报道),还在两轮酶进化中,将酶的催化活性提高了65倍。得益于GeoFlow的出色能力和百奥几何自建的高通量湿实验能力,这一切仅在2个月内完成。
从工具到范式:构建下一代蛋白质设计的底层能力
GeoFlowV2的意义不止于模型精度与生成能力的提升,而在于它为整个行业提供了一种新的解法——结构预测与从头设计首次在统一架构中协同演进,融合为贯通基础研究到应用开发的系统架构,让蛋白质成为可以被理解、被创造、被验证的智能构件。
设计自由、预测精度、优化效率——GeoFlowV2的使命不是解决一个局部问题,而是在蛋白质设计这整个系统工程中重构规则、释放产能。
GeoFlowV2已经面向全球生物医药、合成生物、蛋白工程等相关领域的科研机构、行业专家、创新团队开放限时免费试用。
使用链接:https ://prot.design
技术报告:https ://prot.design/report
深度合作或定制需求可联系:bd@biogeom.com
人工智能×[生物神经科学数学物理化学材料]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。