医学
Medicine
2025年12月16日,复旦大学附属中山医院谭黎杰/Roland Eils教授团队在Cell Press细胞出版社旗下期刊Cell Reports Medicine发表了一篇论文,题为“Multi-center benchmarking of large language models for clinical decision support in lung cancer screening”。该研究基于多中心真实世界低剂量螺旋CT(LDCT)报告,对包括国产开源模型DeepSeek-R1在内的多种大语言模型(LLMs)在肺癌筛查临床决策支持中的表现进行了系统性基准评测,为人工智能辅助肺癌早期筛查提供了重要科学依据。
随着公众健康意识的提升和低剂量螺旋CT(LDCT)筛查的普及,肺结节的检出率大幅增加。然而,海量的筛查报告给临床工作带来了巨大挑战。尤其在基层医疗机构,受限于医生的专业诊疗水平和相对有限的医疗资源,临床医生的诊断与决策压力更为突出。面对繁多复杂的病例,如何准确判断结节风险并给出符合指南的、规范化的管理建议(如随访间隔、进一步检查或手术),成为了亟待解决的临床难题。
近年来,大语言模型(LLMs)的兴起,以及在医学领域的广泛应用为破解这一困局提供了新思路。然而,现有的研究多基于教科书和数据库中的标准病例或单一中心数据,缺乏基于真实世界、多中心临床场景的严谨验证。针对这一现状,复旦大学附属中山医院谭黎杰教授团队联合Roland Eils教授团队,开展了一项联合多家不同层级医院(包括复旦大学附属中山医院、复旦大学附属中山医院厦门分院和六安市人民医院)的横断面多中心研究。研究纳入了148份真实世界的LDCT筛查报告,系统评估专有模型GPT-4、GPT-3.5、Claude 3 Opus、Claude 3 Sonnet以及GPT-4o和国产开源模型DeepSeek-R1在生成肺癌筛查管理建议方面的表现。
研究结果显示,不同模型在临床应用中各具所长:GPT-4在临床决策的准确性上表现最佳(中位评分4.5/5),展现了严谨的逻辑与决策能力;而Claude 3 Opus 则在回复的可读性上拔得头筹,其语言风格更易于被非专科医生理解。值得注意的是,模型在顶级三甲医院和基层医院的报告处理中表现基本一致,未发现显著的性能差异,证明了其在不同医疗环境下的稳定性与普适性。此外,探索性分析进一步证实,国产开源模型DeepSeek-R1、专有模型GPT-4o和GPT-4的总体表现相近,均显著优于GPT-3.5;但DeepSeek-R1和GPT-4在生成“满分回答”的比例上呈现出高于GPT-4和GPT-3.5的趋势。这意味着在数据隐私敏感和成本受限的医疗场景中,高性能开源模型将具有巨大的应用前景。
作者专访
Cell Press细胞出版社特别邀请论文作者团队进行了专访,为大家进一步详细解读。
作者介绍
谭黎杰
教授
谭黎杰,主任医师,博士生导师。复旦大学附属中山医院胸外科主任、食管癌中心主任。美国外科学会院士(FACS),中华医学会胸心血管外科分会食管疾病学组副组长、胸腔镜学组委员,中国抗癌协会食管癌专业委员会副主任委员,中国医师协会胸外科分会委员,中国医师协会内镜医师分会理事。作为负责人主持国家自然科学基金面上项目、上海市自然科学资金面上项目等,作为子课题负责人参与国家科技部“863”项目,十二五国家重点课题等。近年来以通讯作者(含共同)在Nature Medicine、Annals of Oncology、Molecular Cancer、Cell Reports Medicine、Science Translational Medicine等领域内高水平期刊发表多篇论文。获上海市科技进步二等奖(第一完成人)、上海市医学科技奖三等奖(第一完成人)等。
Roland Eils
教授
Roland Eils,德国柏林健康研究所(BIH)数字健康中心创始主任,德国柏林夏里特医学院(Charit–Universitätsmedizin Berlin)讲席教授,以及海德堡大学医学院名誉教授。2025年4月,他被任命为上海复旦大学智能医学研究院执行院长,并加入复旦大学附属中山医院。此外,他还担任柏林自由大学兼职教授,并曾任哈佛医学院客座教授。在此之前,他是海德堡大学系统生物学中心(BioQuant)的创始主任及执行主任,以及海德堡德国癌症研究中心(DKFZ)“理论生物信息学”部门负责人。Eils教授被公认为数字健康领域的先驱。他在癌症基因组学、系统生物学和数字健康领域做出了开创性的贡献。自2017年起,Roland Eils一直担任“人类细胞图谱(Human Cell Atlas)”计划组委会成员;自2016年起,他担任HiGHmed联盟的协调员,该联盟汇集了13家德国大学医学中心,旨在推进常规临床数据的共享。Roland Eils也是德国国家科学院(Leopoldina)当选院士。Roland Eils在将不同学科的新颖理念引入生命科学方面拥有丰富的经验。他是欧洲乃至全球癌症及生命科学领域计算组学的领军人物。他在医学和生命科学领域的顶尖期刊上,以第一和通讯作者(含共同)身份发表了多篇重要论文,发表期刊包括Cell、Nature、Nature Medicine、Nature Biotechnology、Nature Cell Biology、Nature Genetics、Lancet Digital Health、PNAS、Journal of Cell Biology和Molecular Systems Biology。其中许多论文被高频引用,他早期的一些论文更被视为分子细胞生物学和癌症领域的奠基之作。截至目前,Eils教授在同行评审期刊上已发表超过800篇论文(其中过去十年内发表350篇)。这些论文总引用次数超91,000次,H-index高达126(数据来源:Google Scholar,2025年12月)。基于此成就,科睿唯安(Clarivate)于2022年将其列为跨学科领域的“高被引科学家”。
相关论文信息
相关论文刊载于Cell Press细胞出版社旗下期刊Cell Reports Medicine上,点击“阅读原文”或扫描下方二维码查看论文
▌论文标题:
Multi-center benchmarking of large language models for clinical decision support in lung cancer screening
▌论文网址:
https://www.sciencedirect.com/science/article/pii/S2666379125005385
▌DOI:
https://doi.org/10.1016/j.xcrm.2025.102465
Cell Reports Medicine现已加入Cell Press MJS多刊审稿!Cell Press Multi-Journal Submission(点击查看)的前身Cell Press Community Review模式于2021年推出。对于通过Cell Press Multi-Journal Submission“多刊审稿”模式投稿的作者,我们将提供稿件被多本期刊同时考虑的机会。超过80%通过Cell Press Multi-Journal Submission“多刊审稿”模式投稿的文章获得了至少一个或多个期刊的评审。
CellPress细胞出版社