通用生物医学Agent,可由「任务」自主生成「工作流」,斯坦福、基因泰克等开发Biomni
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
将ScienceAI设为星标
第一时间掌握
新鲜的AIforScience资讯
编辑|萝卜皮
生物医学研究是我们进行人类健康研究、疾病治疗、药物研发以及促进临床护理进步的基石。
然而,随着复杂的湿实验、庞杂的数据集、众多分析工具以及海量文献的增长,生物医学研究日益受到重复性和碎片化工作流程的制约。这些工作流程使研究发现的速度严重变慢,且限制了创新的发生。
因此,我们亟需一种全新的方法来扩展专业科学知识。
小编觉得它可能很靠谱!为什么这样说呢?大家简单看下它的工作逻辑就明白了。
为了系统地绘制生物医学行动空间,Biomni首先使用一个行动发现智能体来创建第一个统一的智能体环境——从25个生物医学领域的数万篇出版物中挖掘必要的工具、数据库和协议。
在此基础上,Biomni具有通用智能体架构,将大型语言模型(LLM)推理与检索增强规划和基于代码的执行相结合,使其能够动态地组合和执行复杂的生物医学工作流程——完全不依赖预定义的模板或严苛死板的任务流。
系统基准测试表明,Biomni在异构生物医学任务(包括因果基因优先级排序、药物再利用、罕见疾病诊断、微生物组分析和分子克隆)中实现了强大的泛化,无需任何特定于任务的快速调整。
Biomni拥有在真实案例中解读复杂多模态生物医学数据集并自主生成可实验测试方案的能力。它的出现使我们可以畅想,未来虚拟AI生物学家与人类科学家并肩作战,将显著提升研究效率、临床洞察力和医疗保健水平。
该研究以「Biomni:AGeneral-PurposeBiomedicalAIAgent」为题,于2025年5月30日发布在BioRxiv预印平台。
论文链接:https ://www. biorxiv.org/content/10. 1101/2025. 05.30. 656746v1.full
Biomni架构
Biomni由两个主要组件组成:Biomni-E1(一个具有统一动作空间的基础生物医学环境)和Biomni-A1(旨在有效利用该环境的智能体)。
图示:Biomni中统一的生物医学行动空间和智能体环境概述。(来源:论文)
整理一个统一的生物医学行动空间极具挑战性,因为它本身就非常复杂且内容庞大。研究人员采用人工智能驱动的方法系统地解决了这个问题。
具体来说,他们利用bioRxiv定义的25种学科类别,并在每个类别中选取100篇最新文章。行动发现LLM智能体按顺序处理每篇论文,提取复制或生成所述研究所需的基本任务、工具、数据库和软件。这套全面的资源构成了执行大量生物学研究任务所需的基本行动。
关于Biomni-E1
随后创建了Biomni-E1,这是一个供生物医学AI智能体执行各种操作的环境。已确定的工具均由人类专家进行严格验证,并附有相应的测试用例。这些工具因其重要性而被特意挑选出来,涵盖复杂的代码、特定领域的专业知识或专门的AI模型。
鉴于生物软件本身所需的灵活性,其本身无法简化为静态函数,研究人员构建了一个预装了105种常用生物软件包的执行环境,支持Python、R和Bash脚本。
为了方便数据库集成,他们将资源分为两类。
第一组由可通过WebAPI访问的海量关系数据库(例如PDB、OpenTarget、ClinVar)组成。他们没有创建多个单独的检索工具,而是为每个数据库实现了一个统一的函数。每个函数接受自然语言查询,并在内部使用LLM解析数据库模式并动态生成可执行查询。
第二组是将不具备Web界面的数据库下载到数据湖中,并在本地预处理为结构化的PandasDataFrame,以便与智能体无缝集成。
该团队提出的Biomni-E1是首个生物医学AI智能体环境,含150个专用生物医学工具、105个软件和59个数据库。
关于Biomni-A1
为了构建一个能够处理各种生物医学任务的通用智能体,研究人员需要一个专门的智能体架构——避免为每个任务编写硬编码的工作流程。这促成了Biomni-A1的开发,它融合了多项对整个生物医学研究领域至关重要的核心技术。
首先,研究人员引入了一种基于LLM的工具选择机制,旨在应对生物医学工具的复杂性和专业性,并根据用户目标动态检索定制的资源子集。
其次,考虑到生物医学任务通常需要丰富的程序逻辑,Biomni-A1使用代码作为通用操作接口,使其能够编写和执行涉及循环、并行化和条件逻辑的复杂工作流。至关重要的是,这种方法还使智能体能够交错调用不符合预定义函数签名的软件、工具、数据库和原始数据操作,从而支持异构资源的灵活和动态集成。
第三,该智能体采用自适应规划策略:它基于生物医学知识制定初始计划,并在执行过程中不断迭代完善,从而实现响应迅速、情境感知的行为。
这些技术共同使Biomni-A1能够泛化到前所未有的任务和领域,动态地组合智能动作,并与软件、数据和工具进行交互,从而体现出通用生物医学智能。
基准测试
图示:Biomni在各种现实生物医学任务中的零样本泛化。(来源:论文)
基准测试表明,Biomni在现有的生物医学问答基准测试中表现出色,并在八个开发过程中从未遇到过的具有挑战性的现实场景中表现出强大的泛化性能。
研究人员通过三个具有影响力的案例研究来强调Biomni的实践能力:
分析458个可穿戴传感器数据文件从而产生新的见解;
对大量原始数据集(例如单细胞RNA-seq和ATAC-seq数据)快速进行全面的生物信息学分析,以产生新的见解和假设;
自主设计实验室协议从而协助湿实验室研究人员完成任务。
图示:Biomni设计湿实验室实验方案。(来源:论文)
意义深远
Biomni在遗传学、基因组学、微生物学、免疫学、药理学和临床医学等复杂任务中的零样本性能,展现了其在提升科研效率、加速发现和拓展高级生物医学分析应用方面的潜力。
它通过将复杂且劳动密集型的工作流程(通常需要专业知识和编程技能)自动化,使研究人员能够将精力转向创造性假设的生成、实验创新和跨学科合作。
图示:Biomni自主执行复杂的多模式生物医学分析并生成假设。(来源:论文)
这一转变具有重要意义,比如:
在生物制药的靶点和药物研发领域,Biomni可以自主确定靶点优先级、设计干扰筛选或重新利用药物,从而为更快速、更具成本效益的研究提供途径。
在临床应用领域,其在基因优先级排序和罕见病诊断方面的能力,有助于提供更精准、个性化的洞察,并简化诊断流程。
对于消费者健康而言,Biomni将可穿戴数据与多组学分析相结合,实现实时、个性化的健康监测和干预。
局限性
同时,研究人员也分析了Biomni的局限性。Biomni的统一环境覆盖了大量生物医学工具和数据库,但评估任务仅涉及该领域一小部分,且许多关键领域仍未探索。
虽然其在数据库查询、序列分析等任务上接近人类水平,但在需要深度临床判断或创新实验推理的任务中仍存在局限,尚未达到全领域专家级性能。
展望未来
尽管如此,这些局限性为未来的发展开辟了新的方向。利用强化学习训练生物医学推理智能体,可以使其在规划和执行方面不断自我提升。
整合多模态数据(文本、图像和结构化输入)可以进一步深化推理能力。让Biomni能够自主发现和整合新的工具和数据库,并整合更多历史方法(曾经出现过的具有很高实用性的方法),将确保其适应性和长期相关性。
展望未来,Biomni及其后续产品有望成为人工智能驱动的生物医学生态系统的基础设施,与人类专家无缝协作,解锁关于健康和疾病的全新见解。
这种混合型合作关系或将彻底重塑生物医学研究——自动化假设生成,扩展发现流程,并使医学创新以前所未有的速度和规模推进。像Biomni这样的通用药物不仅可以加速突破,还能重新定义科学探究的未来。
Biomni已经上线,供大家免费使用,快去体验一下吧👇。
Biomni:https ://biomni. stanford.edu
人工智能×[生物神经科学数学物理化学材料]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。