爆火的AI4Research,被哈工大车万翔团队讲明白了


爆火的AI4Research,被哈工大车万翔团队讲明白了

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

来源:学术头条
整理:小羊
“跨学科AI是学术界一个非常令人兴奋的领域,尤其是在科学发现方面。”
在AI教母、斯坦福大学教授李飞飞看来,由大语言模型(LLM)等主导的AI范式能够与众多学科交叉,帮助人类发现、解决一些真正根本性的问题。
那么,AI在科学研究中的潜力究竟如何?特别是在推动跨学科科学研究方面,其衍生出的AI4Research领域的进展又如何?
哈尔滨工业大学计算学部长聘教授、博士生导师车万翔团队及其合作者针对AI4Research展开的一项系统性调查,为我们提供了一个统一的视角,帮助我们更好地理解AI在科研中的应用与未来发展。
论文链接:https ://arxiv. org/abs/2507. 01903
主要贡献如下:
系统性分类:提出了一种系统性分类方法,用于划分AI4Research中的五大主流任务;
新兴领域:识别关键研究空白并强调未来发展方向,重点关注自动化实验的严谨性和可扩展性,以及社会影响;
丰富应用与资源:整理了大量资源,包括跨学科应用案例、数据集和工具。
研究团队希望,这一综述能够为科研社区提供快速获取这些资源的途径,并激发AI4Research领域的创新。
AI4Research指的是将人工智能方法应用于跨学科研究,旨在改进、加速并部分自动化研究过程。
AI4Research与AI4Science有着本质上的区别。
具体而言,AI4Science主要聚焦于科学发现和数据分析,它旨在利用AI技术加速具体科学领域的发现过程,如材料发现、药物设计、基因组分析等,其主要目标是将AI嵌入研究工作流程中,帮助专家实现重大的科学突破。
相比之下,AI4Research采用更广泛的视角,涵盖了学术研究的整体流程和基础设施。它关注学术论文、研究方法和科研生产力等更宽泛的问题,强调AI在提升研究方法及支持学术环境方面的作用,适用于资深研究人员与新兴科学家。
这两个框架的核心区别在于其关注重点不同:AI4Science针对特定科学问题和实验协议,而AI4Research则关注更广泛的研究方法和学术基础设施。
随着LLM具备更强的推理和生成能力,一种统一的科研AI工作流正在出现,可以同时解决专门的科学挑战和一般的学术流程。AI4Science的工具常被集成到AI4Research系统中,作为LLM科学探索的可调用组件。
研究团队提出了一个涵盖科学理解、学术调研、科学发现、学术写作和学术评审五个领域的全面分类法,对应科研过程的不同阶段。
AI用于科学理解(AI4SC):指利用AI提取、解释和综合单篇科学文献信息的能力。旨在帮助人类和自动系统更高效地理解科研论文,加速知识获取。
AI用于学术调研(AI4AS):旨在让AI整合并结构化多个现有文献,提供某研究领域的全面综述。有助于识别科学领域中的趋势、空白及关键贡献。
AI用于科学发现(AI4SD):侧重于借助AI生成并验证新的科学假设或创意,以及执行相关实验或模拟。该模块提高了探索未知领域和加速创新的能力。
AI用于学术写作(AI4AW):协助研究人员生成、修改和格式化科学论文。其通过提升学术写作的质量和效率,确保论文结构清晰且符合出版标准。
AI用于学术评审(AI4PR):利用AI自动化和加强学术论文的同行评审过程。该模块旨在生成结构化、客观且有建设性的审稿意见,以提高评审质量和效率。
1. AI用于科学理解
AI用于科学理解是推动AI4Research的关键环节,它涉及从科学文献中提取、理解并综合信息的能力。这一能力可以加速人类对科学知识的掌握,提高自动分析的效率,从而让后续科研流程更有效。AI辅助的科学理解划分为两大类别,即对论文文本内容的理解和表格与图表型科学理解。
文本科学理解指AI理解、解释并批判性评价科学文本(如学术论文)的能力。其涉及识别论文中的关键概念、掌握复杂术语、综合信息形成对科学原理和发现的整体认识。现有技术有半自动科学理解和全自动科学理解,半自动科学理解需要人工提供起始问题或交互,由AI生成针对该问题的论文理解结果,属于人机协同方式。全自动科学理解中AI可自主阅读大量文献并生成理解结果,无需人工提问或干预,属于完全自动方式。
表格理解指让LLM具备从科研论文的表格中提取、解释和推理数据的能力。目前思路有数据增强、推理范式增强。图表理解则指AI能够直接处理和解释科研论文中的图像化图表(如折线图、柱状图、示意图等),并据此回答问题或生成摘要。
2. AI用于学术调研
学术调研指对特定研究领域文献的综述和调研,在科研工作中具有重要地位。AI在学术调查中的应用旨在帮助研究者高效检索相关文献并自动生成综述报告,从而减轻工作量、提高综述的全面性和客观性。
相关工作检索需要人工智能主动识别与其不断发展的科学目标相一致的基础性和新颖的研究论文。现有研究将AI用于文献检索的方法大致分为三个范式;语义引导的检索、基于图的检索和LLM增强的检索。
在检索到相关文献后,下一步是自动生成结构化、连贯的综述报告。利用AI,我们可以首先完成研究路线图映射,然后生成章节级相关工作,最后生成完整的文档级调查。
3. AI用于科学发现
AI用于科学发现指利用AI基于现有知识生成新的假设,理论或想法。旨在利用人工智能来辅助甚至自动完成这一过程的各个阶段,包括创意生成、假设评估、理论分析和实验执行等,从而加速突破性发现的产生。这种方法不仅可以指导新的研究方向还可以解决复杂的科学挑战。
科学发现模块包含五个主要类别:创意挖掘、新颖性与重要性评估、理论分析、
实验执行和全自动发现。这五个环节几乎覆盖了一个完整科学研究项目的生命周期:从产生假设想法、评估想法的价值、分析理论基础、设计并实施实验,到最终将整个过程整合为自动化系统。
4. AI用于学术写作
AI用于学术写作涉及使用AI技术来帮助研究人员或从头开始起草,编辑和格式化科学手稿。AI正逐步成为科研写作的有力助手。
半自动学术写作指人机协同完成论文写作,AI提供辅助而人类研究者掌控内容。具体而言,在撰写准备阶段,AI可以提供诸多便利。而全自动学术写作指AI几乎不需人工参与,即可自动生成完整的学术论文草稿。这通常建立在科研流程前面环节已由AI完成的基础上——例如经过AI实验系统产出了结果数据和图表,然后由写作模型来撰写论文各个部分。从引言、方法到结果与讨论,AI模型根据既有资料填充内容并形成连贯的论文文本。在实验性的演示中,研究者让AI读取实验记录、分析数据图表,并自动生成相应的结果描述和讨论,从而自动撰写技术报告。
5. AI用于学术评审
同行评审在提高学术论文质量方面十分重要。但它经常受到延迟,时间要求和不断增长的学术工作量的阻碍。为了应对这些挑战并提高论文质量,研究人员正在探索将AI融入评审过程。
在正式同行评议开始前,期刊和会议经常要对稿件进行初步筛选并选择合适的评审人。AI已经在这一阶段得到应用。一方面,随着学术期刊投稿量的增加,编辑部在案头审查阶段面临着更繁重的工作量。为了解决这个问题,主要出版商引入了人工智能驱动的工具,例如自动关键字提取,主题匹配和初步评分,以提高效率,缩短周转时间,并减少人工筛选。另一方面,评审人匹配是确保评审质量的另一重要环节AI系统可以通过机器学习模型在海量专家数据库中匹配合适的候选人。
审稿中阶段,涉及通过自动化或人工评审协助生成或支持评审报告。评审员必须分配一个数字评分并提供书面评估。评审过程通常包括两个主要阶段:同行评审和元评审。
论文通过同行评审并发表后,还有一些评审后的AI应用来评估论文影响、扩大论文传播。旨在评估其未来学术影响并扩大其传播范围。它包括影响力分析(通过论文内容预测引用轨迹和研究意义)和推广增强(自动生成海报、通俗摘要、视频和其他宣传材料以扩大论文影响力)。
在自然科学领域,AI的应用已成为推动科学发现和开发新研究方法的重要工具。
例如,在物理学研究中,AI如今在开发新研究方法和驱动科学发现上不可或缺。它的应用范围从自动规律发现到物理世界模拟和神经操作符学习,旨在提高模拟精度,加速计算,并从有限的数据中揭示隐藏的模式。生命科学和医学研究中的AI使用算法和计算模型来分析和预测跨尺度,从分子结构到临床诊断,加速药物发现,优化实验工作流程,提高诊断准确性,推进精准医疗。在化学和材料科学中,AI驱动的化学和材料自动化将机器学习,机器人和仪器集成到一个闭环系统中,用于设计,合成和表征,加速决策和实验。
在应用科学与工程领域,AI的应用也取得了显著进展。机器人控制领域的AI在机器人和控制领域应用广泛,包括深度学习、强化学习、大模型用于感知、决策和控制,以提高机器人在新环境下的适应性、鲁棒性和自主性。在软件工程,应用AI技术自动化软件开发任务,可以提高代码质量和开发人员的生产力。包括代码生成错误检测,代码审查和软件测试。
在社会科学领域,如社会学、心理学,AI也被用于自动化社会科学实验的设计、执行和分析,涵盖从假设生成到数据采集等任务,尽量减少人为干预。心理学研究的AI研究方法侧重于心理学实验的设计,实施和验证,来确保有效性和可重复性。
随着AI在科研中的广泛应用,未来的研究方向集中于多个关键领域,以推动人工智能在科研中的进一步发展。
跨学科AI模型成为未来研究的重点,特别是基础模型(FoundationModels)和图模型(GraphModels)两大方向。这些模型能够整合来自不同学科的数据,实现跨学科知识流动,推动科学研究的进一步发展。然而,异构数据的融合和知识整合仍面临巨大挑战。策略转移、领域对抗训练和语义对齐等技术可缩小部分差距,但高度异构环境下负面转移现象仍难以消除。
与此同时,随着AI在科研中的应用日益增多,伦理、安全、公平性和偏见问题已经浮现。目前提出了三大缓解策略:公平感知训练、无训练去偏和建立伦理框架。这些策略旨在消除AI应用中的偏见和不公平性,但仍面临性能与公平之间的权衡以及AI剽窃的问题,尤其是大规模文本生成可能导致的“智能剽窃”现象。
跨学科合作的增加,团队成员的背景差异也可能导致信息流不畅和决策协调困难。AI可以帮助自动提取跨文档和跨领域的信息,从而缩小协作者之间的信息差距。同时,实时协作平台中的人工智能驱动仲裁器可根据项目进展和成员专长动态调整任务分配,从而提升效率并提高创新成果的质量。主要研究方向可大致分为两类:协同智能体与合作智能系统,以及联邦学习和分布式建模。这些技术可以提高跨机构协作效率,但也面临交互复杂性和数据隐私问题的挑战。
确保AI系统的透明性和可解释性至关重要。未来的研究需要加强模型的可解释性,使研究者能够追溯AI得出结论的过程,尤其是在高风险科学应用中。当前的挑战包括缺乏统一的可解释性框架以及在高性能黑盒模型和透明性之间的权衡。
此外,实时AI系统能自动调整实验协议以应对不可预见的变量或变化条件,同时进行即时数据分析,从而大幅提升研究效率和创新潜力。智能体实时AI和自主实验室协同控制的研究旨在通过自动化实验过程来加速科学发现。异构设备和AI系统的集成以及低延迟决策的需求仍然是当前面临的很大挑战。
在多模态集成方面,有效多模态整合已成为人工智能驱动发现的关键。早期研究表明,同时嵌入文本和图表可显著提升深度分析和基于文献的发现能力,但这种方法在将高度专业化的图表与文本描述对齐时常会遇到困难。多模态融合面临的数据稀缺和标注瓶颈,以及跨模态不确定性量化的问题。
随着全球科研日益国际化,多语言集成的重要性也不断上升。若人工智能工具仅偏好英语或其他高资源语言,研究共享将受阻,加剧“信息孤岛”和“知识鸿沟”。目前有科学术语对齐、平衡多语言性两种策略,挑战包括如何在多语言模型中平衡性能和容量,以及如何在跨语言学术中保持一致。
阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”
https ://wx. zsxq.com/group/454854145828
未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https ://wx. zsxq.com/group/454854145828进入。
截止到3月31日”未来知识库”精选的百部前沿科技趋势报告
(加入未来知识库,全部资料免费阅读和下载)
牛津未来研究院《将人工智能安全视为全球公共产品的影响、挑战与研究重点》
麦肯锡:超级智能机构:赋能人们释放人工智能的全部潜力
AAAI2025关于人工智能研究未来研究报告
斯坦福:2025斯坦福新兴技术评论:十项关键技术及其政策影响分析报告(191页)
壳牌:2025能源安全远景报告:能源与人工智能(57页)
盖洛普&牛津幸福研究中心:2025年世界幸福报告(260页)
Schwab:2025未来共生:以集体社会创新破解重大社会挑战研究报告(36页)
IMD:2024年全球数字竞争力排名报告:跨越数字鸿沟人才培养与数字法治是关键(214页)
DS系列专题:DeepSeek技术溯源及前沿探索,50页ppt
联合国人居署:2024全球城市负责任人工智能评估报告:利用AI构建以人为本的智慧城市(86页)
TechUK:2025全球复杂多变背景下的英国科技产业:战略韧性与增长路径研究报告(52页)
NAVEXGlobal:2024年十大风险与合规趋势报告(42页)
《具身物理交互在机器人-机器人及机器人-人协作中的应用》122页
2025-2035年人形机器人发展趋势报告53页
EvaluatePharma:2024年全球生物制药行业展望报告:增长驱动力分析(29页)
【AAAI2025教程】基础模型与具身智能体的交汇,350页ppt
Tracxn:2025全球飞行汽车行业市场研究报告(45页)
谷歌:2024人工智能短跑选手(AISprinters):捕捉新兴市场AI经济机遇报告(39页)
【斯坦福博士论文】构建类人化具身智能体:从人类行为中学习
《基于传感器的机器学习车辆分类》最新170页
美国安全与新兴技术中心:2025CSET对美国人工智能行动计划的建议(18页)
罗兰贝格:2024人形机器人的崛起:从科幻到现实:如何参与潜在变革研究报告(11页)
兰德公司:2025从研究到现实:NHS的研究和创新是实现十年计划的关键报告(209页)
康桥汇世(CambridgeAssociates):2025年全球经济展望报告(44页)
国际能源署:2025迈向核能新时代
麦肯锡:人工智能现状,组织如何重塑自身以获取价值
威立(Wiley):2025全球科研人员人工智能研究报告(38页)
牛津经济研究院:2025TikTok对美国就业的量化影响研究报告:470万岗位(14页)
国际能源署(IEA):能效2024研究报告(127页)
Workday:2025发挥人类潜能:人工智能(AI)技能革命研究报告(20页)
CertiK:Hack3D:2024年Web3. 0安全报告(28页)
世界经济论坛:工业制造中的前沿技术:人工智能代理的崛起》报告
迈向推理时代:大型语言模型的长链推理研究综述
波士顿咨询:2025亚太地区生成式AI的崛起研究报告:从技术追赶者到全球领导者的跨越(15页)
安联(Allianz):2025新势力崛起:全球芯片战争与半导体产业格局重构研究报告(33页)
IMT:2025具身智能(EmbodiedAI)概念、核心要素及未来进展:趋势与挑战研究报告(25页)
IEEE:2025具身智能(EmbodiedAI)综述:从模拟器到研究任务的调查分析报告(15页)
CCAV:2025当AI接管方向盘:自动驾驶场景下的人机交互认知重构、变革及对策研究报告(124页)
《强化学习自我博弈方法在兵棋推演分析与开发中的应用》最新132页
《面向科学发现的智能体人工智能:进展、挑战与未来方向综述》
全国机器人标准化技术委员会:人形机器人标准化白皮书(2024版)(96页)
美国国家科学委员会(NSB):2024年研究与发展-美国趋势及国际比较(51页)
艾昆纬(IQVIA):2025骨科手术机器人技术的崛起白皮书:创新及未来方向(17页)
NPL&Beauhurst:2025英国量子产业洞察报告:私人和公共投资的作用(25页)
IEAPVPS:2024光伏系统经济与技术关键绩效指标(KPI)使用最佳实践指南(65页)
AGI智能时代:2025让DeepSeek更有趣更有深度的思考研究分析报告(24页)
2025军事领域人工智能应用场景、国内外军事人工智能发展现状及未来趋势分析报告(37页)
华为:2025鸿蒙生态应用开发白皮书(133页
《超级智能战略研究报告》
中美技术差距分析报告2025
欧洲量子产业联盟(QuIC):2024年全球量子技术专利态势分析白皮书(34页)
美国能源部:2021超级高铁技术(Hyperloop)对电网和交通能源的影响研究报告(60页)
罗马大学:2025超级高铁(Hyperloop):第五种新型交通方式-技术研发进展、优势及局限性研究报告(72页)
兰德公司:2025灾难性网络风险保险研究报告:市场趋势与政策选择(93页)
GTI:2024先进感知技术白皮书(36页)
AAAI:2025人工智能研究的未来报告:17大关键议题(88页)
安联Allianz2025新势力崛起全球芯片战争与半导体产业格局重构研究报告
威达信:2025全球洪水风险研究报告:现状、趋势及应对措施(22页)
兰德公司:迈向人工智能治理研究报告:2024EqualAI峰会洞察及建议(19页)
哈佛商业评论:2025人工智能时代下的现代软件开发实践报告(12页)
德安华:全球航空航天、国防及政府服务研究报告:2024年回顾及2025年展望(27页)
奥雅纳:2024塑造超级高铁(Hyperloop)的未来:监管如何推动发展与创新研究报告(28页)
HSOAC:2025美国新兴技术与风险评估报告:太空领域和关键基础设施(24页)
Dealroom:2025欧洲经济与科技创新发展态势、挑战及策略研究报告(76页)
《无人机辅助的天空地一体化网络:学习算法技术综述》
谷歌云(GoogleCloud):2025年AI商业趋势白皮书(49页)
《新兴技术与风险分析:太空领域与关键基础设施》最新报告
150页!《DeepSeek大模型生态报告》
军事人工智能行业研究报告:技术奇点驱动应用加速智能化重塑现代战争形态-250309(40页)
真格基金:2024美国独角兽观察报告(56页)
璞跃(PlugandPlay):2025未来商业研究报告:六大趋势分析(67页)
国际电工委员会(IEC):2025智能水电技术与市场展望报告(90页)
RWS:2025智驭AI冲击波:人机协作的未来研究报告(39页)
国际电工委员会(IEC):2025智能水电技术与市场展望报告(90页)
RWS:2025智驭AI冲击波:人机协作的未来研究报告(39页)
未来今日研究所2025年科技趋势报告第18版1000页
模拟真实世界:多模态生成模型的统一综述
中国信息协会低空经济分会:低空经济发展报告(2024-2025)(117页)
浙江大学:2025语言解码双生花:人类经验与AI算法的镜像之旅(42页)
人形机器人行业:由“外”到“内”智能革命-250306(51页)
大成:2025年全球人工智能趋势报告:关键法律问题(28页)
北京大学:2025年DeepSeek原理和落地应用报告(57页)
欧盟委员会人工智能与未来工作研究报告
加州大学伯克利分校:面向科学发现的多模态基础模型:在化学、材料和生物学中的应用
电子行业:从柔性传感到人形机器人触觉革命-250226(35页)
RT轨道交通:2024年中国城市轨道交通市场数据报告(188页)
FastMoss:2024年度TikTok生态发展白皮书(122页)
CheckPoint:2025年网络安全报告-主要威胁、新兴趋势和CISO建议(57页)
【AAAI2025教程】评估大型语言模型:挑战与方法,199页ppt
《21世纪美国的主导地位:核聚变》最新报告
沃尔特基金会(VoltaFoundation):2024年全球电池行业年度报告(518页)
斯坦福:2025斯坦福新兴技术评论:十项关键技术及其政策影响分析报告(191页)
国际科学理事会:2025为人工智能做好国家研究生态系统的准备-2025年战略与进展报告(英文版)(118页)
光子盒:2025全球量子计算产业发展展望报告(184页)
奥纬论坛:2025塑造未来的城市研究报告:全球1500个城市的商业吸引力指数排名(124页)
FutureMatters:2024新兴技术与经济韧性:日本未来发展路径前瞻报告(17页)
《人类与人工智能协作的科学与艺术》284页博士论文
《论多智能体决策的复杂性:从博弈学习到部分监控》115页
《2025年技术展望》56页slides
大语言模型在多智能体自动驾驶系统中的应用:近期进展综述
【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用
皮尤研究中心:2024美国民众对气候变化及应对政策的态度调研报告:气候政策对美国经济影响的多元观点审视(28页)
空间计算行业深度:发展趋势、关键技术、行业应用及相关公司深度梳理-250224(33页)
Gartner:2025网络安全中的AI:明确战略方向研究报告(16页)
北京大学:2025年DeepSeek系列报告-提示词工程和落地场景(86页)
北京大学:2025年DeepSeek系列报告-DeepSeek与AIGC应用(99页)
CIC工信安全:2024全球人工智能立法的主要模式、各国实践及发展趋势研究报告(42页)
中科闻歌:2025年人工智能技术发展与应用探索报告(61页)
AGI智能时代:2025年Grok-3大模型:技术突破与未来展望报告(28页)
上下滑动查看更多


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录