医学
Medicine
2025年11月26日,中山大学中山眼科中心林浩添教授团队在Cell Press细胞出版社期刊Cell Reports Medicine发表了一篇论文,题为“The effectiveness of large language models in medical AI research for physicians: A randomized controlled trial”。该研究通过严谨的随机对照试验证实,大语言模型可以有效帮助医生完成医学人工智能研究项目,克服知识与技术障碍,同时也可能带来依赖风险等问题。
一直以来,多学科的融合与应用在推动学科发展和创新中发挥着关键作用,是推动科学前沿突破的重要驱动力。医学人工智能(AI)作为多学科融合的典范,在提升诊疗水平与医疗效率方面展现出巨大潜力。临床医生宝贵的一线临床经验和深厚的专业洞察力对于医学人工智能的发展不可或缺,然而,技术门槛却构成了他们深入参与的重大障碍。这一矛盾在资源有限的年轻医生或基层医疗机构中尤为突出。尽管此前已有一些旨在降低编程门槛的工具,但要独立完成一个完整的、从设计到执行的医学AI研究项目,对非工程背景的临床医生而言依然充满挑战。目前,尚缺乏一种能够灵活应用于整个医学AI研究流程、有效降低综合技术难度的策略与方法。
近年来,大语言模型的出现,为破解这一困境带来了新的希望。其强大的通用知识问答与代码生成能力,是否真能成为临床医生开展AI研究的“助手”?其效果究竟如何?又会带来哪些潜在风险?这些问题亟需严谨的科学证据予以回答。
近日,中山大学中山眼科中心林浩添教授团队开展了一项优效性、开放标签的随机对照试验,评估LLMs能否作为一种有效工具协助医生开展医学AI研究。研究入组了64例无AI研究和编程经验的参与者,随机分为使用LLMs的干预组(n=32)与使用传统搜索工具的对照组(n=32),参与者被要求在两周内完成一项医学AI研究项目。结果显示,干预组的项目总完成率高达87.5%,远超对照组的25.0%(差值62.5%,p=9.42e-7)。更值得注意的是,干预组在无需专家小组任何协助的情况下独立完成项目的比例达到68.7%,而对照组仅为3.1%(差值65.6%,p=5.70e-8)。此外,干预组在项目方案质量与项目完成速度方面均表现更优(p<0.01)。
更重要的是,在为期两周的“洗脱期”后停止使用大语言模型,仍有41.2%原干预组的成功参与者能够独立完成一个新的研究项目,这表明他们不仅仅是机械复制LLMs的答案,而是在LLMs帮助下掌握了医学AI研究的基本原理和开展流程,并能够将习得的知识和技能应用于新的AI研究项目。然而,仍有超40%的成功参与者在撤除LLMs后未能完成新项目,表明参与者对LLMs可能有依赖倾向。进一步问卷调查显示,42.6% 的参与者担心使用LLMs可能导致“只是机械复制而缺乏理解”,40.4%的参与者忧虑其可能“助长惰性思维”,提示对LLMs依赖的潜在风险。该研究证实了大语言模型在赋能临床医生进行医学AI研究方面的巨大潜力,同时也提示其长期风险需进一步评估。
此外,研究人员进一步分析指出,未能完成项目的参与者与LLMs的对话记录中出现了“AI幻觉”及使用“无效提示词”的问题,因此研究人员采用类德尔菲法总结出一套“CPGI”提示词指南帮助医生使用LLMs开展医学AI研究时能够制定有效的提示词。
作者专访
Cell Press细胞出版社特别邀请论文作者团队进行了专访,为大家进一步详细解读。
作者介绍
林浩添
教授
林浩添,论文通讯作者。中山大学中山眼科中心主任、医院院长,世界卫生组织眼健康与视觉合作中心主任,眼病防治全国重点实验室主任,国家眼科质控中心(筹)主任,二级教授、一级主任医师、研究员,眼科学和生物医学工程双学科博士研究生导师,国家高层次人才,国家卫生健康突出贡献中青年专家,中华全国青年联合会常务委员会委员,中国青年科技工作者协会副会长。主持国家自然科学基金重大研究计划重点支持项目、重大疾病智慧诊疗项目等。以第一作者及通信作者发表SCI收录文章200余篇,涵盖Nature、Nature Medicine、Science、The Lancet、BMJ等国际顶级期刊,主编专著6部,参与编写专著6部。获2024年广东省科学技术进步奖一等奖、2021年吴文俊人工智能科学技术奖一等奖、首届钟南山青年科技创新奖等。
陈文贲
副研究员
陈文贲,论文通讯作者。中山大学中山眼科中心副研究员、硕士研究生导师,眼科医师,眼病防治全国重点实验室主任助理,“广东省特支计划”青年拔尖人才,获2024年广东省科技进步一等奖(主要完成人)。兼任广东省医学会精准医学应用学会大数据和人工智能分会副主委,BME Frontiers(BMEF)青年编委。主要从事眼科大数据挖掘及医学人工智能诊疗技术研发与转化应用,近年来以第一或通讯作者(含共同)在Nature Medicine、Nature Communications、Advanced Science、Cell Reports Medicine、Ophthalmology、International Journal of Surgery等领域内高水平期刊发表多篇论文,申请或授权国家发明专利8项,作为负责人主持国家自然科学基金青年科学基金项目、中国博士后科学基金面上项目、广东省自然科学基金面上项目等课题。
团队介绍
中山大学中山眼科中心、眼病防治全国重点实验室为本研究第一单位。尚元君博士、林远帆博士和李睿扬助理研究员为本文共同第一作者。林浩添教授、陈文贲副研究员为共同通讯作者。
中山大学中山眼科中心林浩添教授团队联合国内外高校、科研机构,利用交叉学科优势,创立了眼科人工智能诊疗和临床应用体系:解决数据治理与安全保护关键问题,为智能诊疗技术创新奠定基础;基于眼部动静态特征的算法创新,驱动眼与全身疾病智能筛诊技术突破;构建眼病新型智能“三级诊疗”模式,实现眼病诊疗多场景应用。授权国内外专利和软件著作权50余项,技术成果已在我国各级代表性医疗机构及“一带一路”沿线国家及地区广泛应用,惠及百万居民和患者,实现优质医疗资源扩容下沉,引领眼病防治能力关键智能化技术的革新与发展,提升眼病防治水平。
相关论文信息
相关论文刊载于Cell Press细胞出版社旗下期刊Cell Reports Medicine上,点击“阅读原文”或扫描下方二维码查看论文
▌论文标题:
The effectiveness of large language models in medical AI research for physicians: A randomized controlled trial
▌论文网址:
https://www.sciencedirect.com/science/article/pii/S2666379125005427
▌DOI:
https://doi.org/10.1016/j.xcrm.2025.102469
Cell Reports Medicine现已加入Cell Press MJS多刊审稿!Cell Press Multi-Journal Submission(点击查看)的前身Cell Press Community Review模式于2021年推出。对于通过Cell Press Multi-Journal Submission“多刊审稿”模式投稿的作者,我们将提供稿件被多本期刊同时考虑的机会。超过80%通过Cell Press Multi-Journal Submission“多刊审稿”模式投稿的文章获得了至少一个或多个期刊的评审。
CellPress细胞出版社