仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
将ScienceAI设为星标
第一时间掌握
新鲜的AIforScience资讯
编辑丨%
4月的一个星期天早上,病理学家托马斯·蒙廷(ThomasMontine)召开了他一生中最超现实的会议之一。在一个名为VirtualLab的系统的在线测试界面中,Montine构建了一个由六个人工智能(AI)角色组成的团队,所有角色都由商业大型语言模型提供支持。
他赋予了这些模型全新的身份:一对神经科学家,一位是神经药理学家,另一位是药物化学家。然后,他要求这个虚拟实验室小组研究阿尔茨海默病的可能治疗方法,并讨论知识差距、进展障碍和要测试的假设。
在加利福尼亚州斯坦福大学研究认知障碍的Montine正在测试AI辅助科学新兴趋势的一个例子:使用聊天机器人专家团队来开发一个科学想法,就像实验室团队可能会做的那样。
探索这一概念的最杰出团队包括科技巨头谷歌的研究人员,当然,去年11月,一支斯坦福大学团队宣布了其VirtualLab系统——Montine正在玩的一个版本。
相关链接:https ://www. nature.com/articles/d41586-024-01684-3
去年10月,上海人工智能实验室的一个小组也提出了一种类似的虚拟科学家系统,称为VirSci。
这些虚拟科学家的工作范围涵盖了肝纤维药物开发、癌症小鼠模型优化、阿尔茨海默病探索等场景。在许多这样的系统中,涉及的大型语言模型(LLM)不仅仅是相互交流想法。它们还搜索互联网、执行代码并与其他软件工具交互,使它们成为「代理AI」的一部分。
「代理AI」指的是LLM自主承担任务,即使在此过程中通常仍会有人工的干预。为了探索与虚拟团队合作的感觉,《Nature》杂志邀请了几位科学家试用斯坦福大学的一个版本,并与一些使用过GoogleAI联合科学家的人进行了交谈。
多重人格
所有共事科学家系统都会为代理分配角色或个性,并让它们互动,但具体细节有所不同。
斯坦福大学的计算机科学家KyleSwanson及其团队开发的虚拟实验室配备了两个默认角色:一位首席研究员和一位评论员(提供有益反馈的代理)。用户或AI首席可以添加评议员数量,前者还可以选择代理「发言」的轮数。
与斯坦福系统不同,谷歌工具不允许用户为代理分配科学专长。相反,代理具有预定义的具体功能:创意生成;反思或批判;想法的演变;确定想法的接近度以减少重复;排名;以及元评审。
就像所有LLM一样,这些代理所驱动的模型有时会胡言乱语,编造出错误的文本。但芝加哥大学的RickStevens表示,多代理对话中通常会有批评者或评判者来剔除不合理内容。此外,倘若胡言乱语对跳出常规思考有帮助,那它就是有益的。
与AI团队共事是什么体验?
斯坦福大学医学研究员GaryPeltz经常在工作中使用AI,他想利用它来寻找治疗肝纤维化的药物。
由于AI系统仍在开发中,他将查询发送给了谷歌的一名中间人。他的提示如下:「开发关于肝纤维化过程中肌成纤维细胞生成所需的基因和表观遗传学变化的假设,并指出我们应该测试哪些新药物作为肝纤维化的治疗方法。」并附上了几段背景资料。
图示:GaryPeltz所收到的AI报告。
AI虚拟科学家提出了三种药物,Peltz又补充了两种(这些药物均已获批用于治疗其他疾病)。
谷歌赞助了Peltz的实验室对这五种药物进行测试。AI提出的三种建议中有两种显示出促进肝脏再生和抑制纤维化的潜力,而Peltz选择的两种药物则没有达到预期效果。
然而,其他肝脏研究人员表示,AI对药物的建议既不特别创新也不深刻。
纽约市伊坎医学院的肝脏疾病研究员ShuangWang表示,「我个人认为它们很普通,没有什么真知灼见」。
僵硬的对话
斯坦福大学虚拟实验室的代码可以在开发者平台GitHub上获取,但该团队为没有计算机科学背景的测试者开发了一个简单的个性化网页界面。Swanson表示,这个界面与完整系统有些许不同,但使用体验大致相同。
《Nature》邀请的研究人员并没有进行建议的实验,也没有让他们的AI团队编写代码来尝试虚拟实验室。但他们仍觉得AI很有帮助。
Montine举例说,他的AI团队出色地综合了当前的知识(其他LLM系统也能很好地完成这项任务),并流畅地回答了他的申请资助问题。
另一位测试员是来自巴塞罗那的FranciscoBarriga,他自认为受过生物化学训练,出于兴趣成为一名小鼠模型构建者和基因工程师,完全没有编程技能。在这项实验中,他怀疑自己被当成了非技术背景的对照组。
在这种情况下,Barriga请AI设计小鼠模型实验,AI提出了他原本就会的方案。但Barriga觉得有哪里不对:这些AI缺少了一些直觉上的跳跃,就像下午三点你捧着一杯咖啡在走廊上碰到一个科学家时那些灵光乍现的想法。
也许只是需要转换一下思路
《Nature》又找来了一位第三位测试员CatherineBrownstein,她是一位遗传学家,有更多使用AI工具的经验。她认为LLMs的用户通常需要是专家,这样才能即时发现错误。
但是当Brownstein使用虚拟实验室来批判她正在撰写的论文时,AI突然询问她患者研究的下一步该往何处发展。Brownstein对此感到惊讶与感激:她原本没想到这一点,但她本应想到。
这样的心态转变,在曾经也许只是需要工作之余与朋友聊聊,或者是在暖阳下盯着盆栽发个呆,现在却成为了AI的提示。她对此表示:「这真是一个谦卑的时刻」。
谷歌宣布其AI合作科学家时提到,该系统帮助研究人员提出了「新颖的预测」。正如对Peltz经历的反应所显示的,一些科学家质疑这些预测究竟有多新颖。
类似的问题也出现在伦敦帝国理工学院的JoséPenadés团队测试谷歌系统时。他们让AI合科学家提出关于细菌进化的详细问题,并要求其提出假设。
AI给出的假设与现有观点完全相悖,但通过实验,Penadés的团队却证明该方法可行。
去往未来的道路
目前,旨在帮助科学家撰写实验室报告的多智能体LLM系统还没有以更易于使用的形式出现在大众的视野中。但Stevens预计,许多技术娴熟的研究人员或者大型科技公司将会构建针对不同需求的系统。
与这些多智能体系统互动就像与任何LLM聊天一样。但一些测试人员表示,多智能体系统似乎思考得更深入,这可能与某个特定的LLM的训练方式有关,也可能多智能体系统本身就更加智能。
然而,Nature邀请的所有研究人员,以及这些系统的设计师,都表示他们并不认为AI能够或应该取代人类:目标不是取代实验室工作人员,而是提供帮助。
他们都认为,将LLM引入创意生成和实验设计是不可避免的,就像将互联网搜索引入科学一样。
人工智能×[生物神经科学数学物理化学材料]
「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。
欢迎关注标星,并点击右下角点赞和在看。
点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。