仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
来源:新智元
近日,Nature头版独家文章,揭秘了不同科学领域最具影响力的论文。
然而,令人意外的是,那些广为人知的科学发现:从mRNA疫苗和CRISPR基因编辑技术,到希格斯玻色子的发现和引力波的首次测量,并没有出现在这些入选的论文中。
他们得出结论,被引最高的论文,正是描述科学方法、软件工具或系统性综述的「幕后英雄」。
那么,都有哪些论文上榜了呢?
引用:科学影响力的衡量标准
引用是学术界衡量论文影响力的重要指标,作者通过引用来致敬前人的工作。
Nature的分析基于五个学术数据库(涵盖了21世纪数千万篇论文),通过取中位数排名,筛选出本世纪最受引用的25篇论文。
结果显示,人工智能、提升研究质量提升、癌症统计、研究软件相关的论文占据了榜单前列。
唯一例外是一篇2004年关于石墨烯实验的开创性论文,这项工作为作者赢得了2010年的诺贝尔物理学奖。
AI崛起,ResNet登顶
人工智能论文,在本世纪引用榜单中独领风骚。
位居榜首的是,微软团队2016年发表的一篇论文——DeepResidualLearningforImageRecognition。
这恰恰是所有人熟知的「深度残差学习」神经网络——ResNets的开山之作,由AI大牛孙剑带队何恺明等人完成。
论文地址:https ://arxiv.org/abs/1512.03385
ResNets解决了信号在多层网络中传播时衰减的问题,让研究人员能够训练约150层神经网络。
这大约是当时常规神经网络层数的5倍。
该论文首次作为预印本发布于2015年末,微软团队凭借其在图像识别竞赛中夺冠。
ResNets的突破为AI飞速发展铺平了道路,催生了AlphaGo、AlphaFold、ChatGPT等模型诞生。
现就职于麻省理工学院的何恺明表示,「在ResNets之前,深度学习并不那么『深』」。
据统计,这篇论文的引用量在10万-25.4万次之间。在五个数据库中有两个将其列为第一,两个列为第二,一个列为第三,综合中位数排名第一。
GoogleScholar这篇论文被引数已超25万
此外,2017年谷歌发表的Attentionisallyouneed排位列七,论文中提出了著名的Transformer架构,成为ChatGPT等大模型的核心。
论文地址:https ://arxiv.org/pdf/1706.03762
AI论文的高引用量,主要是因为其广泛的应用领域和快速的研究进展。
同样,AI教父GeoffHinton指出,「AI论文天然具有引用优势」。
2012年,Hinton带领学生Ilya、AlexKrizhevsky发表的AlexNet论文排名第八。
这篇巨作展示了神经网络在图像识别竞赛中的压倒性优势,掀起了后来的深度学习革命。
此外,开源也助推了AI论文的引用。
比如排名第六的RandomForests论文介绍了一种开源、易用的机器学习算法,广泛应用于多个领域。
论文地址:https ://link.springer.com/article/10.1023/A:1010933404324
需要说明的是,许多AI论文以预印本形式发布,增加了引用统计的复杂性。
OpenAlex数据库尝试合并预印本与最终出版物的引用,而GoogleScholar则努力将同一作品的所有版本归类并汇总引用。
研究软件:科学家的「工具箱」
除了AI领域,研究软件相关论文在本世纪引用榜单中表现亮眼。
排名第二的论文由ThomasSchmittgen等人于2000年发表,介绍了一种用于定量PCR(聚合酶链式反应)数据分析的方法。
这篇论文应审稿人要求而生,因其提供了计算基因活性变化的简单公式,被引量超过16.2万次,跻身历史前十。
论文地址:https ://www.sciencedirect.com/science/article/abs/pii/S1046202301912629
排名第五的论文,是由英国化学家GeorgeSheldrick撰写,介绍SHELX程序套件,用于分析X射线散射模式以揭示分子结构。
这篇2008年的综述论文建议使用SHELX时引用,引用量在7万至9万次之间。
论文地址:https ://journals.iucr.org/a/issues/2008/01/00/sc5010/index.html
其他软件论文,如排名第十五的scikit-learn(Python机器学习库)和排名第十八的DESeq2(RNA测序分析),因其开源和易用性,成为科学家不可或缺的工具。
统计软件:数据分析的利器
统计软件相关论文,也在榜单中名列前茅。
例如,排名第15的scikit-learn论文和排名第22的lme4论文分别为Python和R语言用户提供了强大的数据分析工具。
排名第23的G*Power软件论文则帮助生物学家计算实验所需的样本量,以确保统计显著性。
值得注意的是,R编程语言本身未出现在榜单中,尽管OpenAlex记录其引用量超过30万次。
这是因为R的开发者建议用户引用其网站而非学术论文,导致数据库记录不一致。
这也提醒研究者:若开发了有影响力的程序,发表一篇相关论文至关重要。
癌症与健康:数据驱动的洞见
癌症研究领域的三篇论文在榜单中占据重要位置。
排名第九和第十的是世界卫生组织GLOBOCAN项目于2018年和2020年发布的全球癌症统计报告,为研究者和政策制定者提供了关键数据。
排名第十九的综述论文总结了癌症的「标志性特征」,激励了无数学生投身癌症研究。
提升研究质量
这篇为学生设计的指南意外成为本世纪第三高引用论文,彻底改变了两位作者的职业轨迹。
排名第11的PRISMA声明(2009年)为系统综述和荟萃分析提供了27项报告规范,引用量在5.3万至13.8万次之间。
2020年更新的PRISMA(排名第23)同样上榜。排名第17的论文(2003年)讨论了行为研究中的方法偏差,帮助研究者提高研究严谨性。
参考资料:
https ://www.nature.com/articles/d41586-025-01125-9
推荐阅读
MIT新晋副教授何恺明《计算机视觉进展》课程,附Slides与资料下载
西电IEEEFellow团队出品!最新《Transformer视觉表征学习全面综述》
如何做好科研?这份《科研阅读、写作与报告》PPT,手把手教你做科研
奖金675万!3位科学家,斩获“中国诺贝尔奖”!
最新2022「深度学习视觉注意力」研究概述,包括50种注意力机制和方法!
【重磅】斯坦福李飞飞《注意力与Transformer》总结,84页ppt开放下载!
2021李宏毅老师最新40节机器学习课程!附课件+视频资料
欢迎大家加入DLer-大模型技术交流群!
👆长按识别,邀请您进群!