将一只哈基米送上“学术热搜”总共需要几步？

知社学术圈

2024-10-17 11:29知社学术圈官方账号

海归学者发起的公益学术平台

分享信息，整合资源

交流学术，偶尔风月

在学术界，论文工厂因其批量生产毫无价值的虚假论文而臭名昭著。其实，论文工厂开展的业务范围比我们想象中的要大得多。比如，通过付费服务帮助撰稿人提高论文引用率。最近，美国西北大学博士生Reese Richardson和她的“打假小组”成员一起揭露了论文工厂惯用的手法。她们采取的方式很特别：把一只萌萌的猫咪送上了“学术热搜”。

事情源于Reese Richardson的朋友——剑桥大学工程和流体动力学研究员、学术打假爱好者Nick Wise收到了一份来自论文工厂的广告。该广告声称能够帮助买家提高某著名学术平台“A”（为防止模仿行为，本文中平台名称皆隐去）个人资料中论文引用次数和 h 指数。（注：本文的图均源自Reese Richardson的博客，链接见参考文献。）

该广告展示了多个成功案例，包括客户个人资料“升级”前后对比的图片。比如某客户通过向这家公司支付服务费用，该客户的 h 指数翻了一番，引文数量翻了两番。

不仅如此，广告显示，这些客户分别购买了 50 到 500 次引用不等。显示的18个客户中，大部分人仍然活跃在某平台上。其中可识别的客户都隶属于印度大学，此外还有分别来自阿曼和美国的两名客户无法识别。尽管,广告中还提到了某著名科技医学界索引“B”，但小组成员最终没能找到直接证据，证明该论文工厂能够提高其引用率。

那么，问题来了：论文工厂究竟是如何操纵引文数量的呢？

首先，强行插入参考文献。对于一些客户来说，大量的引用来自于同一可疑期刊的数十篇论文。这些论文可能是由论文工厂以客户身份所炮制的。在这类论文里，比如正文中编号最高的参考文献是参考文献 40，而参考文献列表则扩展到参考文献 53。参考文献 48 到 53都是服务客户而后期塞进去的。

除了插入虚假论文，一些已故知名科学家论文也被无辜“搭便车”。数十篇由毕达哥拉斯、伽利略、柯尔莫哥洛夫等知名人士撰写的论文，通过人工智能软件“D”被生成为除了摘要和标题之外都是“胡言乱语”的文章。这些论文没有在任何期刊或预印本服务器上发表，只以 PDF 文件的形式上传到某些学术社交网站“C”。即便随后这些文章就立刻被删除掉。然而，学术平台“A”已经通过“时间差”将这些文章编入了索引。这种野蛮粗暴的方式，甚至连期刊都不需要。

所以，论文工厂提高引用率的方法不外这样几个步骤：

与客户签订合同。
使用人工智能软件“D”自动生成几篇毫无意义的论文。
在这些无意义的论文中随机插入对客户论文的引用。
等待学术平台“A”将无意义的论文及其引文编入索引。
客户庆祝学术影响力“升级”
7删除上传学术社交网站“C”的无意义论文，抹去痕迹。

通过这种方式，任何人都可以付些费用给自己编写一部“学术影响力”的剧本来镀金。气愤之余，Reese Richardson决定揭露论文工厂的手法，来督促相关学术平台和网站尽快正视系统“漏洞”，亡羊补牢。

这时，她想到了自家的哈基米——一只名为 Larry的猫咪。她决定把Larry通过论文工厂打造称一名“高被引”的著名学者。

Larry个人资料中使用的头像照片，抱着它的是Reese Richardson的父亲

为了更令人信服，她将Larry在论文里的名字命名为“Larry Richardson”，这个名字听起来就像一名穿着格子呢外套的知识分子。然后，小组成员使用人工智能软件“D”生成了 12 篇论文，把“Larry Richardson ”列为唯一作者。接着，他们生成了另外 12 篇不是由 Larry 撰写的论文，并编辑了每篇论文的 LaTeX 文档，使每篇论文都引用了 Larry 的 12 篇论文。如此一来，12 篇论文每篇被引用 12 次，最终获得了144 次引用，h 指数为 12。

接下来，小组成员在学术社交网站“C”上为 Larry创建了个人资料，将论文上传到其个人资料下。值得注意的是，学术社交网站“C”的个人资料任何人都可以创建，通过电子邮件甚至无需验证。对作者身份的验证与审核形同虚设，这是该平台成为论文工厂帮凶的重要漏洞之一。

最后，就是等待学术平台“A”将这些论文抓取并编入索引了——学术平台“A”以将几乎任何内容作为学术论文编入索引而闻名。两周之后，Larry顺利成为学术平台“A”上有史以来被引用次数最多的猫：被引用了 132 次， h 指数是 11。

然而，Larry的“荣耀”仅仅持续了一周时间，学术平台“A”就把它的论文全部删除了，仅仅留下那几个数字诉说着曾经的“辉煌”。更令人遗憾的是，该平台仅仅对这只猫咪采取了“打假”措施，其他虚假论文仍然逍遥法外。

截至 2024 年 7 月 24 日Larry的个人资料

目前，学术平台“A”对此没有做出回应。

学术社交网站“C”相关负责人则表示，并不知道引文工厂在获得索引后删除了内容来掩盖踪迹。感谢科学家反映这一特殊情况，来对系统流程进行调整。

小组成员表示，此举并不是要让猫成为“高被引”的科学家，而是要证明引用指数是可以被人为操纵的。尽管相关学术平台漏洞百出，但目前的评价体系仍然以此指标来考核科学家的业绩与影响力，这是不严谨、不公平的。他们希望以此呼吁学界，以更为公平的方式来评价科学家的工作，至少能把评价体系的“篱笆”扎紧一些！这些虚假的头衔，哈基米Larry根本不在乎，真正的科学家也一样！

参考文献：

查看原图 10K