发表 SCI 被炮轰撤稿!广州医生用 AI 画出离谱插图,辩称经费有限、没钱润色
这不是罕见病例,而是一幅由 AI 绘制的无意义插图。更离谱的是,这幅插图竟然出自一篇已发表的医学 SCI 论文。7 月 12 日,一篇来自 5 位广东医生的临床研究论文被 Medicine 撤稿,理由是「对数据的完整性和不准确的插图表示担忧」[2]。今年 4 月,这篇题为 Assessment of the efficacy of alkaline water in conjunction with conventional medication for the treatment of chronic gouty arthritis: A randomized controlled study 的论文正式发表,文中提到碱性水可有效缓解疼痛、减少关节肿胀、增强日常活动能力,并改善慢性痛风性关节炎治疗中的关节活动。然而,这篇论文在数据和插图的科学性和准确性上均存在问题。7 月初,研究员 Pfiffne 在社交媒体上表达了他对这篇论文中一张插图的质疑,称该插图是「由 AI 生成的垃圾图片」,因为该插图存在较多的解剖学错误。同时,他评价该图片中的注释文字为「胡言乱语」[3]。随后,又有另一名网友发现,这篇论文的引言部分「100% 是 AI 生成的」[4]。很快,这篇论文引起了更多的人的注意,包括期刊科学诚信顾问 Elisabeth Bik 在内的评论者纷纷发表意见。其中,Bik 指出,插图中的小腿和手臂在骨骼数量上完全错误,并且存在很多没有意义的标签,例如「chlsinkestead atlvs no ctivktty greuedis」和「Aliainine jerve sreiter」[5]。她还指出,该论文的数据存在很多问题。例如,在该论文的表 2 中,高浓度组的上限范围的最后几位数字均为 0.84,中等浓度组则为 30 或 80,低浓度组则均为 0.88 [5]。随着事件的发酵,这篇论文最终在质疑发生后的一周内被撤回。该研究的通讯作者在接受撤稿观察网站(Retraction Watch)的采访时表示,英语不是该研究团队的母语,且翻译费用极其昂贵,因此该团队「利用 AI 对文本进行翻译和改进,并使用 ChatGPT 来生成插图和表格」。对于由此引起的任何争议,作者表示:「我们深表歉意。」[4]今年 2 月,西安 3 名医生在 Frontiers in Cell and Developmental Biology 发表了题为 Cellular functions of spermatogonial stem cells in relation to JAK/STAT signaling pathway 的论文,阐述了精原干细胞与 JAK/STAT 信号通路相关的功能 [6]。(点击链接查看丁香园往期文章:发表 3 天就被撤稿!西安医生用 AI 画的离谱插图,是怎么过审的?)论文的其中一张插图描述了从大鼠睾丸中分离、纯化和培养精原干细胞的过程,该插图被质疑由 AI 绘制完成,因为在图中,一只大鼠拥有松鼠的坐姿,且有 4 个睾丸和比身体还大的阴茎,图右下侧的培养皿中还有一把汤勺。另外,插图的标注中还存在大量的英文单词拼写错误,以及一些看起来像单词但实际上没有任何意义的字母组合。面对巨大的争议,该论文仅发表 3 天,就迅速被撤稿[6],期刊也单独公开致歉 [7]。然而,该事件中,论文作者用 AI 制作文章插图的行为,实际上却符合期刊的投稿要求。Frontiers 系列期刊在相关规定中,允许人工智能加入(包括但不限于任何引述、引用或参考文献),但必须对其进行披露,并且作者必须检查其内容的准确性 [8]。去年,美国田纳西大学健康科学中心的一名放射科医生使用 ChatGPT,4 个月写了 16 篇论文,其中 5 篇已发表。(点击链接查看丁香园往期文章:某院医生用 ChatGPT 在 4 个月内狂写 16 篇论文,其中 5 篇已发表)四大医学顶刊之一 NEJM 也在今年还专门推出了新杂志 NEJM AI,编辑团队在第一卷中发文鼓励研究者使用大语言模型投稿 [9]。让 AI 辅助科研与论文发表已经受到了众多支持,但接连发生的劣质 AI 论文顺利发表事件也让人开始担忧:如何保证 AI 创作的内容得到合理的审核?实际上,面对类似的事件,学者们并非认为要完全拒绝 AI,而是强调应该注意 AI 产物的「准确性」。「在大多数情况下,AI 可能缺乏对科学概念和背景的正确理解。」一位大数据科学家认为,「研究人员必须仔细审查和验证 AI 生成的文本,以确保其准确性和有效性。」[10]对于上述提到的两篇论文,它们引起广泛批评的主要原因,正是因为论文中使用的是 AI 生成的「错误」插图,论文作者并没有对插图进行有效的校对。正如网友评价的那样:「我很惊讶它通过了同行评审。」 [4]更有网友戏称:「不会审核过程也用了 AI 吧?」[3]一项研究对排名前 100 的学术期刊对作者使用 AI 的指导范围和内容进行了分析,结果发现,许多期刊的指导「严重不足」,这导致作者们「对该做和不该做的事产生困扰」,同时也对编辑和同行评审的审查过程造成了困难 [11]。有科学家提出建议:「需要制定更全面的指南来概述 AI 在研究中的可接受用途。同行评审也应更加严格,需要专门识别和审查 AI 生成的内容。」此外,他们还表示,「临床科学家、编辑委员会、AI 开发人员和研究人员之应加强合作,以了解这些工具的功能和局限性。」[12]而本次事件中, Medicine 杂志的发言人也表示,该杂志正在开展多项措施来改进编辑审查流程,通过与其他领先出版商开展合作,并考虑利用新技术,帮助塑造医学研究评审的未来 [4]。策划:肯德羊|监制:carollero|首发:丁香园丁香园社区论文写作投稿版版主 @WOrange 曾发文「用 ChatGPT 写了 16 篇论文,成功发了 5 篇!」,并在其中总结了不少用人工智能完成论文写作的经验技巧: