12.24
知识分子
The Intellectual
图源:pixabay
撰文 | 张天祁
● ● ●
01
影响因子涨了吗
影响因子(Impact Factor, IF)宛如一种无形却无处不在的“学术货币”,无声无息地衡量期刊的声望、研究者的成就乃至整个科研机构的地位。然而随着时间的推移,这种货币似乎在经历一场漫长的贬值,通货膨胀让影响因子分数变得越来越不值钱。
影响因子的计算方式并不复杂。每年科睿唯安(Clarivate)会发布最新的期刊引证报告(Journal Citation Reports, JCR),根据JCR的介绍,影响因子是这样计算的:计算某期刊前两年发表的所有文章在当年被引用的总次数,然后除以这两年该期刊发表的论文总数。
值得注意的是,分子中的引用次数其实是包括了期刊上所有的文本,包括社论、评论、新闻之类,但在计算分母时,却不包含这些所谓没有“实质性”研究内容的文章。这一点留下了灰色地带,给了有心人操作影响因子的空间,这也为影响因子招致了很多批评[1]。
虽然从短期看,影响因子的变化不是那么明显。但把镜头拉远,就能看出到底发生了多大的变化。在1975年,影响因子得分最高的期刊是《实验医学杂志》,其影响因子为11.9。到2024年,得分最高的《临床医师癌症杂志》(CA-A Cancer Journal for Clinicians)影响因子高达521.6。在不到50年的时间里,影响因子最高的期刊评分上涨了超过50倍。
在上个十年,期刊影响因子整体的涨势迅速。国内一项针对SCI期刊影响因子的统计发现,近年来SCI期刊的影响因子在不断升高。这项研究收集了2011-2020年1337种期刊的数据,在影响因子大于5的期刊中,2020年的影响因子平均值是2011年的2.62倍。就这段时间来看,影响因子的通胀非常明显[2]。
不过,这里的一个干扰因素是新冠疫情。由于对疫情信息的关注,当时医学类特别是传染病类的期刊受关注的程度迅速增长,所有这类期刊都发表了大量与 COVID-19 相关的研究,这成了它们引用提升的主力。从整体来看,2020年和2021年期刊影响因子整体也出现了大幅增长,尤其是2020年的影响因子,相比过去几年几乎是指数增长。
对于7,689种连续多年出现在JCR报告中的期刊的一项调查发现,这部分期刊的平均影响因子在2019年为3.0,在2021年达到峰值4.3,然后在2022年下降至4.0。从2016 年到 2019 年,这些期刊影响因子的复合年增长率为 5.1%,但2020年的增长率飙升至 23.2% 的峰值[3]。
2010到2021年之间的期刊影响因子变化,绿色部分是影响因子增长或不变的期刊比例,紫色部分是减少的比例。来源:Journal Citation Reports 2022
经历了2020和2021年的迅猛攀升,2022和2023年期刊的平均影响因子有所下降。特别是传染病领域的影响因子急转直下,降幅竟高达30%。乍一看,这似乎是期刊影响因子普遍下滑的信号。然而,这不过是疫情这一特殊事件引发的短暂回调。从整体来看,影响因子一直在稳步增长。
欧洲一项研究利用了1999-2022年Scopus 数据库中的各项数据,对各种规模期刊的影响因子变化进行了统计。发现无论期刊规模如何,各出版商旗下期刊的影响因子都出现了普遍增加。1999年的时候绝大多数的出版商旗下期刊影响因子平均不到2,甚至很多在1左右徘徊,到2022年表现好的一些已经超过4。
疫情的影响依然明显,但这项研究提到,论文篇均引用量在2018到2019年间已经出现。而2020年的爆发增长,也恰好和特刊论文的加速增长相吻合,这些新生的特刊往往通过自引拔高自己的影响因子。因此可以认为,2020年的引用量迅速增长不仅和疫情有关,也有特刊文章膨胀的原因[4]。即使考虑到疫情后的影响因子回调,近年来影响因子仍然增长得很快。
2016到2022年的论文篇均引用数变化
02
自然规律还是期刊炒作
影响因子膨胀的主要因素之一是随着时间的推移,论文中引用的参考文献数量会逐渐增加,这是期刊影响因子总体上持续稳定增长的基本盘。
回顾上世纪的一些重要科学成果可以发现,以现在的标准来看,当时无论是文章长度还是参考文献列表的长度都显得非常简短。只看长度,当年一些著名论文的页数,或许都没有现在论文的参考文献页数多。
早在00年代初,就有研究者注意到这个趋势。作者们的统计发现,从 1994 年到 2005 年,JCR 中列出的所有期刊的加权平均影响因子平均每年增长 2.6%。而在此期间,每篇文章参考文献部分引用论文的平均数量每年增加约 3.6%[5]。
作者们还提出了几个引用论文数量增加的原因。首先学科领域规模变大,可引用的文献数量本身就在增长。此外,互联网搜索引擎、在线引文数据库以及对文献电子化大大减少了作者查找和获取相关文章的时间成本。最后不太光彩的是,因为引用越来越重要,审稿人可能会要求作者添加大量引用到他们的工作中,而作者也可能为了迎合潜在的编辑和审稿人而预先在手稿中引用更多的文献。
随着每篇论文引用更多文献,总的引用次数也随之增多,以引用次数为分子、发表文章数量为分母的影响因子自然也会增长。
影响因子不仅是数量上普涨,质量上确实也“灌水”了。前文提到的欧洲团队的研究,参考了Scimago 期刊排名(SJR)来对比近年来影响因子的变化趋势,SJR同样是基于引文指标判断期刊影响力的工具,和影响因子的区别在于SJR重视引用的质量以及期刊间的引用网络,尤其限制了自引和不正当引用行为对期刊排名的影响,而高影响因子是可以通过期刊自引刷出来的。
作者们将期刊影响因子和SJR的比值定义为影响因子膨胀值,这个数据越高就说明自引和违规引用的比例越高。经过计算,2016 年至 2022 年间,影响因子膨胀现象在所有出版商中普遍出现,MDPI 和 Hindawi两家影响因子膨胀最快。
MDPI 的自引率高于任何其他出版商,除了期刊内部的自引之外,还有期刊大约29%的引用来自于其他MDPI期刊。Hindawi期刊自引率更接近于其他出版商旗下期刊,然而,尽管不频繁自引,Hindawi期刊却有来自MDPI期刊的引用(图S16的例子),以及依托Hindawi运作的论文工厂的引用,这也让人不禁怀疑两家出版商的联系。
这几年影响因子的暴涨和回落,以及越来越强的掺水倾向,也说明单纯依赖影响因子来评判期刊或文章的质量并不可靠。影响因子普涨不代表期刊质量提高,回调也不意味着期刊的质量下降。
信息公司Wolters Kluwer编辑策略和出版政策总监表示,评价期刊水平与其看期刊的影响因子,不如看影响因子的百分位数,也就是一种期刊在领域内超过多少百分比的其他期刊。影响因子每年都会波动,但期刊影响因子的百分数还是相对稳定的[6]。
以期刊影响因子去评论个别的论文的水平问题就更大了。2020年2 月,教育部、科技部印发的《关于规范高等学校SCI论文相关指标使用 树立正确评价导向的若干意见》明确提出,论文是成果产出的主要表达形式,坚决摒弃“以刊评文”,评价重点应是论文的创新水平和科学价值,不要把SCI论文相关指标作为直接判断依据[7]。
就连影响因子的提出者尤金·加菲尔德,也不赞成用影响因子去评论具体的研究论文。他在中科院的一次演讲表示,尽管一篇文章发表在很好的期刊上,比如《自然》、《科学》,它可能永远没被人引用过,这些期刊上很多一般的文章也只被引用过几次,而只有少数文章引用是特别多的。
“引用期刊影响因子来评估每个人的科研表现和科研能力,包括他个人的评估、奖金也好、资助也好都是不合理的[8]”。加菲尔德说。
参考文献:(上下滑动可浏览)