超25万次引用,谁是21世纪最火论文?


超25万次引用,谁是21世纪最火论文?

仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接

最近,《自然》杂志发布专题报告,回顾了科学文献数据库中被引用最多的科研论文。根据WebofScience、Dimensions和Scopus等多个数据库提供的数据,他们发现人工智能、提升研究质量的科研软件和方法、癌症统计数据等主题的论文占据21世纪热门论文榜单[1]。而1951年发表于《生物化学杂志》的一篇描述蛋白质测定方法的论文[2],继续稳坐迄今为止被引次数最多论文榜首。
早在2014年,《自然》杂志就已统计过史上被引次数最多的100篇论文[3],他们发现最知名的一些研究并未入选,例如发现高温超导体和DNA双螺旋结构解析等获得诺奖的研究。相反,上榜论文多是生物医学和统计学领域中实用性极强的技术方法,例如Lowry蛋白质测定法、Sanger测序法和PCR等。此外,像BLAST和Clustal这样的生物信息学工具、用于绘制进化树的邻接法、以及Kaplan–Meier和Cox模型等统计方法也位列其中。榜单还显示,计算机的发展推动了这些方法的普及,而工具类软件、数据库和统计模型往往能获得远超基础科学突破的引用量。
而在当前《自然》杂志更新的榜单中,排名有一半已经发生了变化,21世纪已有16篇论文跻身历史前50名。值得一提的是,微软研究人员在2015年人工智能会议上提交的一篇论文《用于图像识别的深度残差学习》[4],迅速攀升至历史百大榜单第5名(WoS、Dimensions和Scopus数据库排名中位数分析)。
进一步的分析发现,这篇论文已经成为21世纪以来被引用次数最多的论文。该论文的作者提出了深度残差学习(ResNet)架构,突破性地解决了深层神经网络训练中的信号衰减问题,使网络层数达到前所未有的深度,并在2015年赢得图像识别竞赛。ResNet不仅成为深度学习发展的重要里程碑,也为后续的AI突破——如AlphaGo、AlphaFold和ChatGPT等技术的出现奠定了基础。
不过,不同数据库对这篇论文的引用统计存在差异。谷歌学术将其列为第二高被引论文,引用次数达25.4万,而WebofScience则将其排在第三,引用略超10万。尽管排名不一,在五个主流数据库中,它的中位排名居首。然而,引用次数本身存在诸多不公平因素,例如发表时间较早、所处领域热门等都会带来积累优势。尽管《自然》曾尝试通过计量学方法调整这些影响,但由于入选文章本就引用极高,整体榜单变化不大,仅有部分疫情相关新论文有所上升。
除此之外,人工智能、研究软件与方法、癌症与健康相关研究也进入21世纪被引次数最高论文榜单[5]。AI领域凭借跨学科适用性和迅猛发展势头,多篇关键论文高居榜单,包括2012年开启深度学习热潮的AlexNet、推动大语言模型发展的Transformer架构“Attentionisallyouneed”,以及广泛应用于图像处理的U-Net网络等。开源特性和预印本文化也促进了这些论文的广泛传播。
研究软件方面,定量PCR、RNA测序分析工具DESeq2、结晶分析程序SHELX等被广泛引用。健康类论文中,GLOBOCAN癌症统计报告、癌症标志综述以及DSM-5精神障碍分类指南影响深远。此外,主题分析方法、PRISMA系统综述报告指南、I²统计量等研究质量提升工具也跻身前列,scikit-learn、lme4、G*Power等统计与编程软件的引用量也极高。
总的来看,许多论文因其快速发展趋势在引用上展现出天然优势,还有一些论文更是借助工具性、方法指南或综述性获得超高引用。然而,一个值得深思的问题也浮上水面:为什么原创性的基础研究逐渐淹没在高被引论文中?显而易见的是,引用次数已经不再能够完全评估科研质量及其影响力,或许我们是时候引入新的评价体系了。
21世纪十大高被引论文
01
Deepresiduallearningforimagerecognition
用于图像识别的深度残差学习
He,K.,Zhang,X.,Ren,S.,&Sun,J.
发表日期:2016
引用次数:103,756–254,074
这篇论文提出了残差学习框架(ResNet),成功解决了深层神经网络训练困难的问题。通过引入“残差连接”,网络可以更高效地学习相对于输入的变化,使得深度高达152层的模型依然易于优化,并显著提升了图像识别准确率。这一突破奠定了深度学习在计算机视觉领域的关键基础。
02
Analysisofrelativegeneexpressiondatausingreal-timequantitativePCRandthe2-ΔΔCTMethod
使用实时定量PCR及2-ΔΔCT方法分析相对基因表达数据
Livak,K.J.,&Schmittgen,T.D.
发表日期:2001
引用次数:149,953–185,480
实时定量PCR数据常用的两种分析方法是绝对定量和相对定量,其中2-ΔΔCT方法是一种简便实用的相对定量工具。这篇论文介绍了该方法的原理、假设与应用,并补充了两种有助于分析的衍生变体。
03
Usingthematicanalysisinpsychology
在心理学中使用主题分析法
Braun,V.,&Clarke,V.
发表日期:2006
引用次数:100,327–230,391
这篇论文系统阐述了主题分析在心理学中的应用,强调其作为一种灵活且易于上手的定性研究方法的重要性。文章呼吁研究者更多关注和规范使用主题分析,认为它在心理学及其他领域的定性研究中具有广泛价值。
04
DiagnosticandStatisticalManualofMentalDisorders,
DSM-5
《精神障碍诊断与统计手册》第五版(DSM-5)
AmericanPsychiatricAssociation
发表日期:2013
引用次数:98,312–367,800
《精神障碍诊断与统计手册》第五版(DSM-5)是当前全球最广泛使用的精神疾病诊断标准之一。它是对第四版(DSM-IV)及其修订版的全面更新,旨在反映过去十余年中精神病学、心理学、神经科学等领域的最新研究成果。
05
AshorthistoryofSHELX
SHELX简史
Sheldrick,G.M.
发表日期:2007
引用次数:76,523–99,470
这篇论文总结了SHELX晶体结构解析软件的发展历程,回顾了其从1976年版本到现代的演进。SHELX系列尽管起源于旧式计算环境,但凭借稳定性、实用性和不断改进,至今仍被广泛应用。
06
Randomforests
随机森林
Breiman,L.
发表日期:2001
引用次数:31,809–146,508
这篇论文介绍了随机森林算法的原理与优势。随机森林通过构建多个相互独立、基于随机特征选择的决策树组成分类器,其泛化误差会随着树数量的增加而趋于稳定。该方法在误差率上优于Adaboost,具有更强的抗噪性,并能利用内部估计评估模型性能与变量重要性,广泛适用于分类与回归任务。
07
Attentionisallyouneed
注意力机制即一切
Vaswani,A.,Shazeer,N.,Parmar,N.,Uszkoreit,J.,Jones,L.,Gomez,A.N.,…&Polosukhin,I.
发表日期:2017
引用次数:56,201–150,832
这篇论文提出了一种全新的神经网络架构——Transformer,完全基于注意力机制,摒弃了以往依赖循环(RNN)或卷积(CNN)结构的复杂模型。Transformer结构简单、并行性强,训练效率显著提高。这一成果标志着注意力机制在序列建模中的巨大潜力。
08
ImageNetclassificationwithdeepconvolutionalneuralnetworks
使用深度卷积神经网络进行ImageNet图像分类
Krizhevsky,A.,Sutskever,I.,&Hinton,G.E.
发表日期:2012/2017
引用次数:46,860–137,997
这篇论文介绍了深度卷积神经架构AlexNet网络在ImageNet图像分类任务中的应用。为了提高训练效率,作者采用了非饱和激活函数和GPU加速的卷积操作,并通过“dropout”技术有效减少过拟合。在ILSVRC2012竞赛中,该模型变体以15.3%的Top-5错误率夺得第一名。这项工作开创了深度学习在图像识别领域的新时代。
09

全球癌症统计2020:GLOBOCAN对185个国家36种癌症发病率和死亡率的估算
Sung,H.,Ferlay,J.,Siegel,R.L.,Laversanne,M.,Soerjomataram,I.,Jemal,A.,&Bray,F.
发表日期:2020
引用次数:75,634–99,390
这篇文章基于国际癌症研究机构(IARC)发布的“GLOBOCAN2020”数据,更新了全球癌症负担的最新情况。2020年,全球预计新增癌症病例达1930万例,死亡病例近1000万例。女性乳腺癌首次超过肺癌,成为全球最常见癌症,其次为肺癌、结直肠癌、前列腺癌和胃癌;而肺癌仍是癌症死亡的首要原因。预计到2040年,全球癌症新发病例将增至2,840万例,较2020年增长47%。
10

全球癌症统计2018:GLOBOCAN对185个国家36种癌症发病率与死亡率的估算
Bray,F.,Ferlay,J.,Soerjomataram,I.,Siegel,R.L.,Torre,L.A.,&Jemal,A.
发表日期:2018
引用次数:66,844–93,433
这篇文章基于“GLOBOCAN2018”数据,评估了全球癌症负担,并重点分析了全球20个地区的地理差异。2018年全球预计将有1810万新发癌症病例和960万癌症死亡,肺癌在发病率和死亡率中均居首位,但不同国家和地区最常见及致死率最高的癌症类型差异显著,受经济发展水平和生活方式影响明显。
其他高被引论文
11
PreferredReportingItemsforSystematicReviewsandMeta-Analyses:ThePRISMAStatement
系统综述与荟萃分析的首选报告项目:PRISMA声明
12
U-Net:ConvolutionalNetworksforBiomedicalImageSegmentation
U-Net:用于生物医学图像分割的卷积神经网络
13
ElectricFieldEffectinAtomicallyThinCarbonFilms
原子级薄碳膜中的电场效应
14
FittingLinearMixed-EffectsModelsUsinglme4
使用lme4拟合线性混合效应模型
15
Scikit-learn:MachinelearninginPython
Scikit-learn:Python中的机器学习工具
16
Deeplearning
深度学习
17
CommonMethodBiasesinBehavioralResearch:ACriticalReviewoftheLiteratureandRecommendedRemedies
行为研究中的常见方法偏差:文献批判性回顾与推荐补救措施
18
ModeratedestimationoffoldchangeanddispersionforRNA-seqdatawithDESeq2
使用DESeq2对RNA测序数据的倍数变化和离散度进行调和估计
19
HallmarksofCancer:TheNextGeneration
癌症的标志:下一代
20
Measuringinconsistencyinmeta-analyses
荟萃分析中不一致性的测量
21
NIHImagetoImageJ:25yearsofimageanalysis
从NIHImage到ImageJ:25年的图像分析之路
22
Fiji:anopen-sourceplatformforbiological-imageanalysis
Fiji:用于生物图像分析的开源平台
23
ThePRISMA2020statement:anupdatedguidelineforreportingsystematicreviews
PRISMA2020声明:系统综述报告最新指南
24
ImageNet:ALarge-ScaleHierarchicalImageDatabase
ImageNet:一个大规模分层图像数据库
25
GPower3:Aflexiblestatisticalpoweranalysisprogramforthesocial,behavioral,andbiomedicalsciences
G
Power3:面向社会科学、行为科学与生物医学科学的灵活统计功效分析程序
参考文献
[1]https ://www.nature.com/articles/d41586-025-01124-w
[2]https ://www.jbc.org/article/S0021-9258(19)52451-6/pdf
[3]https ://www.nature.com/news/the-top-100-papers-1.16224
[4]https ://arxiv.org/abs/1512.03385
[5]https ://www.nature.com/articles/d41586-025-01125-9
编译&整理:神经现实
封面:GPT4o


文章作者: ZejunCao
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 ZejunCao !
  目录