中国科学院院士鄂维南:AI赋能研发 推动“大科研时代”到来


中国科学院院士鄂维南:AI赋能研发 推动“大科研时代”到来

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

来源:中国信息界
从DeepSeek爆火、宇树机器人全网刷屏,再到妙趣横生、“含AI量”极高的2025中关村论坛年会,中国AI正以前所未有的速度改变着千行百业。聚焦“人工智能”,本期对话中国科学院院士、北京大学国际机器学习研究中心主任、北京科学智能研究院学术委员会主任鄂维南,他在2025中关村论坛年会平行论坛——AIForScience青年论坛中分享了以下主旨演讲《AIForScience:赋能研发全面转型升级推动“大科研时代”的到来》
演讲实录
鄂维南
大家下午好!
AIForScience论坛,我坚定不移地认为,它是我们国家人工智能布局里面的一匹黑马,将来也会产生巨大的影响。
我为什么讲这样一句话?AIForScience出现之前,我个人的科研实际上是走了30多年的弯路。我在科大是学纯数学的,为了让我自己的工作真的有用,我考研突然转做了应用数学,当时所有老师都不知道我干什么。我从应用数学开始,有限元,然后到读博士做流体力学,博士后做固体力学、材料科学,后来又转到计算物理、凝聚态物理,尤其是软凝聚态物理,接着1999年到普林斯顿,转到做分子动力学,后来自己又转到第一性原理、电子结构。应该说,理科和工科里面所有基础理论模型——物理、化学、材料、机械科学、机械工程、土木工程等,我都做了一些科研工作。
我举个例子,总书记2021年的院士大会上提到了一点,就是千万核上面做第一性原理计算,一部分是科大的工作,一部分是电子结构的计算,而这个工作背后的算法就是我和几个同事做的。
我做了这么多不同的专业、不同的方向,这不是我主观意愿,而是我没有找到好的选题,没有觉得既有创新的空间,又真正能够有用的(学科选题)。所以,这个是我当时的困惑,尤其是当我认识到,我的工作成果也被其他科学家们使用,我发现他们(在使用这些研究成果时)做的这些工作与真正落地,能够解决实际问题上差距很远。
所以,2011年我写了一本书,叫《多尺度计算方法》,然后就开始决定真正转行做大数据。我是最早推动多尺度方法的,1999年就开始推动多尺度方法,2002年我在普林斯顿高等研究院,就是大家看《奥本·海默》那个电影里面经常出现的地方,我组织了一个科学计算多尺度方法的研讨会,这是我知道的(当时)国际上唯一的一次,各个不同领域,物理、化学、生命科学、机械工程、化工等各个不同的领域做科学计算的顶级专家聚在一起开的一个小型会议,但是我个人感觉看不到这些东西真正能够落地,真正能够解决实际问题。2004年我在国内推大数据及大数据算法。2010年在复旦建了一个数据科学专业,很可能是全世界第一个数据科学专业,可惜只建了一年。
2012年,我感觉到大数据已经快火起来了,于是在北大组织了一个研讨会。中国大数据为什么困难?就是缺人。但是,我们的优势在哪里?就是我们市场比较大。所以,我组织了一个研讨会,就是把做科研的、数据科学信息产业的人拉在一起。2014年全面转行建了北大的大数据科学中心,这也是国内的第一个数据科学研究生专业。2015年创建了北京大数据研究院,2016年建了数据科学的本科专业。
这个过程当中一个非常重要的发现,就是我以前碰到的科学计算的核心困难,为什么那些路都走不下去?探索了那么多不同的领域都走不下去的原因在哪里?就是因为所谓的“维数灾难”,因为变量的个数,输入、输出的函数关系,当你的自变量的个数增加的时候它的复杂度是指数增加的,而恰恰深度学习提供了解决“维数灾难”的有效方法。
什么叫作“维数灾难”?我举个例子,“组合爆炸”跟“维数灾难”可以说是难兄难弟。左边是国际象棋,右边是围棋,国际象棋是8×8,围棋是19×19。国际象棋1997年的时候专家系统DeepBlue就已经解决了,当时就打败了人类最好的专家。但是,同样的方法解决不了围棋问题,围棋得等到20年之后,深度学习出现之后,AlphaGo才能解决围棋问题,这两者之间的差距就是“维数灾难”的问题,或者组合爆炸的问题。所以说,只有深度学习才能解决大的体系,复杂系统的问题。
2017年7月我就开始布局这件事情,2017年圣诞节,我开了我历史上唯一的一次组会,把所有的学生召集在一起,我告诉他们,未来几年深度学习方法全面改变科学研究,而且这个机会只有100年前量子力学产生的时候所提供的机会可以相比,而且那个时候我就坚定不移地认为这个事情必须靠年轻人解决,因为我们年龄大的人思维不容易转弯。所以,我当时说你们每个人都有这样的机会,而且我有一个学生,说是圣诞节来了,要出去玩,我就给他讲了一个故事,一个非常著名的物理学家就是因为出去玩,然后把诺贝尔奖给丢掉了,我说你千万不能在这个时候出去玩。所以,从2017—2020年实际上对我来说是一个非常困难的事情,因为我必须从培养人开始。
在基础的算法方面,我们从最底层的薛定谔方程、量子力学的基础方程,到上面的连续介质力学,在每一个层次都发展了人工智能方法赋能的新的算法,应该说几乎每一个层次都是我们最早做的这些工作,后面像Google,很多其他的都开始Folldow。2018年我跟汤涛院士一起在北大组织了国际上第一次AIForScience研讨会,我的两个学生青年合作者张林峰和王函他们牵头推动成立了国际上第一个AIForScience的开源社区DeepModeling。
2018年我还推动张林峰和孙伟杰成立了这样一个公司——深势科技。成立这个公司从我的角度来说是两个原因:第一,我们一定要抱着落地的决心,第二,企业也是另外一个获取资源做事情的平台。这几年下来,深势科技已经成为AIForScience领域全世界力量最强的团队之一。2018年还布局了另外一件事情,就是做国际上的第一个大数据库——AI数据库,2021年这个产品出来,就是MyScale,这个是国际上第一个AI数据库,这个数据库也是成为我们现在的基础设施。
我们也在北京市的支持下,推动成立了北京科学智能研究院,这是国际上第一个以AIForScience为主要目标的研究院,现在已经聚集了一批年轻人,我坚定不移地认为他们将来会成为国际上科学的主力。
从2017年开始,我就已经确定了一个战略布局,就是我们怎样推动AIForScience,这个战略布局我把它叫作“农村包围城市”。
什么意思呢?城市指的就是那些亮点项目,像蛋白结构、AlphaFold这样的亮点项目,这样的亮点项目我们不是没想到,这些机会我们是看到的。但是,我们没有能力去跟美国在这些项目上拼。所以,这些项目我们不能去花太多精力。
所谓“农村”什么意思?“农村”就是基础设施,AIForScience最重要的就是推动整个科研范式的改变,要把这件事情真正做到落地,我们就必须建这些基础设施,包括比方说数据库,文献的工具、理论的方法、实验的工具,这个是我今天要跟大家讲的。这个基础设施,从2018年开始,深势科技和北京科学智能研究院一起打造了这样一个所谓的“玻尔空间站”,我们把它定义成AIForScience领域的HuggingFace,它给大家提供的就是高水平的文献阅读、计算和实验平台。
我举一个简单的例子,这是一个大模型,叫DPI系列,我们已经出台了DPI1、DPI2,它把分子和原子层面从小分子到催化剂、高熵合金、功能材料、能源材料,各个层面的计算数据、实验数据都整合在一起,在各个不同的场景,它们的效果都是最好的。在这个基础上,王函和马琰铭(现任浙大校长),他们发现了一批高压环境下富氢,就是氢的成分很多的这样一个超导材料。这些超导材料实际上我们现在就可以去实验室尝试,它们的结构都是非常新的,跟过去很不一样的超导结构。那么,这种工具就使得我们做这样的事情成本非常低。
两年前中关村论坛上我们发布了ScienceNavigator,这是一个智能化的文献平台,它集中了所有的科学文献,就是现有的你们可以拿到的科学资源,文献、专利等,再用AI数据库,它可以提供智能化的文献的利用。我们以前都是通过人来看,效率很低,这样一个智能化的表征系统,使得你可以用自然语言告诉它该干什么,它马上自己就找到缺陷在哪里,感兴趣的地方在哪里,拍一张照片,然后给你解读。有机合成应该是自动化、智能化里面最困难的事情,现在有了这样的平台以后,我们希望不但是能够把现有的有机合成的路径做得更加高效、更加准确,甚至于可以发现一些新的合成路径。
如何完成“最后一公里”?现在“玻尔空间站”已经有非常好的基础,但是并不是仍然有非常大的空间。第一个就是从计算的角度,刚才我说了,人工智能的方法让我们把科学计算的方法的效率提高了很多倍,提高了很多数量级,但是离实际场景还差一两个数量级,“最后一公里”怎么完成?从算法角度我们已经做到极致了,剩下的两个数量级怎么解决?
我们提出的方案就是从专用芯片来解决,在分子动力学这个场景已经实现了专用芯片,这样的样机,这样的专用芯片,现在我们只能在FPGA,因为没有足够的资金资源使它流片,如果能够流片,它就可以给我们提供刚才说的这两三个数量级的增加,我们就可以在实际场景下面做材料和蛋白的模拟、计算。文献,ScienceNavigator已经是非常好的基础平台,但是要把它做成好的产品,要解决背后的IP问题、知识产权问题,仍然需要很大的资源的支持。所以,最近我们在跟深圳的国科信,跟中国科协,我们也希望北京市能够积极参与,帮助我们在今年的时间里面就能完成“最后一公里”。还有实验,我们在跟苏州实验室、嘉庚实验室等,我们来赋能这些新的机构,甚至于传统的这些实验室,给它们智能化的转型。
这些事情做了以后,刚才我提的这些不是十年的一个项目,而是两三年的项目。这两三年以后,我们会实现什么?ThenWhat?这里面就有一个反思。我个人在2018、2019年就开始注意到大模型,GPT1,GPT2,GPT3,甚至我们用了大模型。但是我压根就没有预测到ChatGPT会到来,不光是我个人,很多做人工智能的都没有看到ChatGPT会到来。
应该说,从我个人的角度来说,我这一生的研究生涯,几个主要的事情:多尺度的方法、AIForScience、大数据,我都先看到了,但在我的脑子里面,压根就没有一个全量资源这样的概念。ChatGPT告诉我们,我们现在到了一个可以设法用好全量资源的时代,大语言模型的全量资源就是全量的语料和全量的算力,但是AIForScience的全量资源是全量的数据,全量的理论,全量的人才。理论和人才我就不多说了,从数据的角度,我们眼下做的事情是把文献和已有数据用好。更重要的是通过实验,通过计算,可以得到很多增量资源,这个是更大的空间所在,这也是为什么我们花这么大的精力来做计算的方法,来做自动化的实验,智能化的实验方法,它要构造一个一体化的平台,在这个一体化的平台上,就一个数据库,一个图书馆,整合了所有的教育资源,还有一个超算中心整合了所有的计算平台,还有一个实验室整合了所有的实验功能。
现在我们科研做交流是通过文献,通过开会来解决的。有了这个新的一体化平台以后,文献的办法、开会交流的办法就已经远远不够了,我们必须有新的交流平台,这样的交流平台使得我们所有的科研人员就成为一个科研团队,这个我们现在已经看到了,正在发生。它可以帮助我们打破学科之间的界限,打破理论和实验之间的界限,打破科研和产业之间的界限。这就意味着我们不但要更高的探索效率,更重要的是我们有更大的探索空间。
谢谢大家!
注:本文来源于2025中关村论坛年会嘉宾现场演讲速记,文中内容仅代表专家个人观点
阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”
https ://wx. zsxq.com/group/454854145828
未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https ://wx. zsxq.com/group/454854145828进入。
截止到3月31日”未来知识库”精选的百部前沿科技趋势报告
(加入未来知识库,全部资料免费阅读和下载)
牛津未来研究院《将人工智能安全视为全球公共产品的影响、挑战与研究重点》
麦肯锡:超级智能机构:赋能人们释放人工智能的全部潜力
AAAI2025关于人工智能研究未来研究报告
斯坦福:2025斯坦福新兴技术评论:十项关键技术及其政策影响分析报告(191页)
壳牌:2025能源安全远景报告:能源与人工智能(57页)
盖洛普&牛津幸福研究中心:2025年世界幸福报告(260页)
Schwab:2025未来共生:以集体社会创新破解重大社会挑战研究报告(36页)
IMD:2024年全球数字竞争力排名报告:跨越数字鸿沟人才培养与数字法治是关键(214页)
DS系列专题:DeepSeek技术溯源及前沿探索,50页ppt
联合国人居署:2024全球城市负责任人工智能评估报告:利用AI构建以人为本的智慧城市(86页)
TechUK:2025全球复杂多变背景下的英国科技产业:战略韧性与增长路径研究报告(52页)
NAVEXGlobal:2024年十大风险与合规趋势报告(42页)
《具身物理交互在机器人-机器人及机器人-人协作中的应用》122页
2025-2035年人形机器人发展趋势报告53页
EvaluatePharma:2024年全球生物制药行业展望报告:增长驱动力分析(29页)
【AAAI2025教程】基础模型与具身智能体的交汇,350页ppt
Tracxn:2025全球飞行汽车行业市场研究报告(45页)
谷歌:2024人工智能短跑选手(AISprinters):捕捉新兴市场AI经济机遇报告(39页)
【斯坦福博士论文】构建类人化具身智能体:从人类行为中学习
《基于传感器的机器学习车辆分类》最新170页
美国安全与新兴技术中心:2025CSET对美国人工智能行动计划的建议(18页)
罗兰贝格:2024人形机器人的崛起:从科幻到现实:如何参与潜在变革研究报告(11页)
兰德公司:2025从研究到现实:NHS的研究和创新是实现十年计划的关键报告(209页)
康桥汇世(CambridgeAssociates):2025年全球经济展望报告(44页)
国际能源署:2025迈向核能新时代
麦肯锡:人工智能现状,组织如何重塑自身以获取价值
威立(Wiley):2025全球科研人员人工智能研究报告(38页)
牛津经济研究院:2025TikTok对美国就业的量化影响研究报告:470万岗位(14页)
国际能源署(IEA):能效2024研究报告(127页)
Workday:2025发挥人类潜能:人工智能(AI)技能革命研究报告(20页)
CertiK:Hack3D:2024年Web3. 0安全报告(28页)
世界经济论坛:工业制造中的前沿技术:人工智能代理的崛起》报告
迈向推理时代:大型语言模型的长链推理研究综述
波士顿咨询:2025亚太地区生成式AI的崛起研究报告:从技术追赶者到全球领导者的跨越(15页)
安联(Allianz):2025新势力崛起:全球芯片战争与半导体产业格局重构研究报告(33页)
IMT:2025具身智能(EmbodiedAI)概念、核心要素及未来进展:趋势与挑战研究报告(25页)
IEEE:2025具身智能(EmbodiedAI)综述:从模拟器到研究任务的调查分析报告(15页)
CCAV:2025当AI接管方向盘:自动驾驶场景下的人机交互认知重构、变革及对策研究报告(124页)
《强化学习自我博弈方法在兵棋推演分析与开发中的应用》最新132页
《面向科学发现的智能体人工智能:进展、挑战与未来方向综述》
全国机器人标准化技术委员会:人形机器人标准化白皮书(2024版)(96页)
美国国家科学委员会(NSB):2024年研究与发展-美国趋势及国际比较(51页)
艾昆纬(IQVIA):2025骨科手术机器人技术的崛起白皮书:创新及未来方向(17页)
NPL&Beauhurst:2025英国量子产业洞察报告:私人和公共投资的作用(25页)
IEAPVPS:2024光伏系统经济与技术关键绩效指标(KPI)使用最佳实践指南(65页)
AGI智能时代:2025让DeepSeek更有趣更有深度的思考研究分析报告(24页)
2025军事领域人工智能应用场景、国内外军事人工智能发展现状及未来趋势分析报告(37页)
华为:2025鸿蒙生态应用开发白皮书(133页
《超级智能战略研究报告》
中美技术差距分析报告2025
欧洲量子产业联盟(QuIC):2024年全球量子技术专利态势分析白皮书(34页)
美国能源部:2021超级高铁技术(Hyperloop)对电网和交通能源的影响研究报告(60页)
罗马大学:2025超级高铁(Hyperloop):第五种新型交通方式-技术研发进展、优势及局限性研究报告(72页)
兰德公司:2025灾难性网络风险保险研究报告:市场趋势与政策选择(93页)
GTI:2024先进感知技术白皮书(36页)
AAAI:2025人工智能研究的未来报告:17大关键议题(88页)
安联Allianz2025新势力崛起全球芯片战争与半导体产业格局重构研究报告
威达信:2025全球洪水风险研究报告:现状、趋势及应对措施(22页)
兰德公司:迈向人工智能治理研究报告:2024EqualAI峰会洞察及建议(19页)
哈佛商业评论:2025人工智能时代下的现代软件开发实践报告(12页)
德安华:全球航空航天、国防及政府服务研究报告:2024年回顾及2025年展望(27页)
奥雅纳:2024塑造超级高铁(Hyperloop)的未来:监管如何推动发展与创新研究报告(28页)
HSOAC:2025美国新兴技术与风险评估报告:太空领域和关键基础设施(24页)
Dealroom:2025欧洲经济与科技创新发展态势、挑战及策略研究报告(76页)
《无人机辅助的天空地一体化网络:学习算法技术综述》
谷歌云(GoogleCloud):2025年AI商业趋势白皮书(49页)
《新兴技术与风险分析:太空领域与关键基础设施》最新报告
150页!《DeepSeek大模型生态报告》
军事人工智能行业研究报告:技术奇点驱动应用加速智能化重塑现代战争形态-250309(40页)
真格基金:2024美国独角兽观察报告(56页)
璞跃(PlugandPlay):2025未来商业研究报告:六大趋势分析(67页)
国际电工委员会(IEC):2025智能水电技术与市场展望报告(90页)
RWS:2025智驭AI冲击波:人机协作的未来研究报告(39页)
国际电工委员会(IEC):2025智能水电技术与市场展望报告(90页)
RWS:2025智驭AI冲击波:人机协作的未来研究报告(39页)
未来今日研究所2025年科技趋势报告第18版1000页
模拟真实世界:多模态生成模型的统一综述
中国信息协会低空经济分会:低空经济发展报告(2024-2025)(117页)
浙江大学:2025语言解码双生花:人类经验与AI算法的镜像之旅(42页)
人形机器人行业:由“外”到“内”智能革命-250306(51页)
大成:2025年全球人工智能趋势报告:关键法律问题(28页)
北京大学:2025年DeepSeek原理和落地应用报告(57页)
欧盟委员会人工智能与未来工作研究报告
加州大学伯克利分校:面向科学发现的多模态基础模型:在化学、材料和生物学中的应用
电子行业:从柔性传感到人形机器人触觉革命-250226(35页)
RT轨道交通:2024年中国城市轨道交通市场数据报告(188页)
FastMoss:2024年度TikTok生态发展白皮书(122页)
CheckPoint:2025年网络安全报告-主要威胁、新兴趋势和CISO建议(57页)
【AAAI2025教程】评估大型语言模型:挑战与方法,199页ppt
《21世纪美国的主导地位:核聚变》最新报告
沃尔特基金会(VoltaFoundation):2024年全球电池行业年度报告(518页)
斯坦福:2025斯坦福新兴技术评论:十项关键技术及其政策影响分析报告(191页)
国际科学理事会:2025为人工智能做好国家研究生态系统的准备-2025年战略与进展报告(英文版)(118页)
光子盒:2025全球量子计算产业发展展望报告(184页)
奥纬论坛:2025塑造未来的城市研究报告:全球1500个城市的商业吸引力指数排名(124页)
FutureMatters:2024新兴技术与经济韧性:日本未来发展路径前瞻报告(17页)
《人类与人工智能协作的科学与艺术》284页博士论文
《论多智能体决策的复杂性:从博弈学习到部分监控》115页
《2025年技术展望》56页slides
大语言模型在多智能体自动驾驶系统中的应用:近期进展综述
【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用
皮尤研究中心:2024美国民众对气候变化及应对政策的态度调研报告:气候政策对美国经济影响的多元观点审视(28页)
空间计算行业深度:发展趋势、关键技术、行业应用及相关公司深度梳理-250224(33页)
Gartner:2025网络安全中的AI:明确战略方向研究报告(16页)
北京大学:2025年DeepSeek系列报告-提示词工程和落地场景(86页)
北京大学:2025年DeepSeek系列报告-DeepSeek与AIGC应用(99页)
CIC工信安全:2024全球人工智能立法的主要模式、各国实践及发展趋势研究报告(42页)
中科闻歌:2025年人工智能技术发展与应用探索报告(61页)
AGI智能时代:2025年Grok-3大模型:技术突破与未来展望报告(28页)
上下滑动查看更多


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录