聚焦临床AI:RSNA 2024现场直击

器械之家

医疗器械媒体报道先锋

分享专业医疗器械知识


来源:医械一线


在医学领域,人工智能(AI)的应用正逐步深化,特别是在放射学这一专业领域内,其进展尤为显著。近日,北美放射学会(RSNA)第24届年会在芝加哥麦考密克展览中心举行,会议期间,多场聚焦AI在放射学应用的研讨会,为行业内外人士揭示了AI技术在该领域的最新进展与广阔前景。


图片


01

百花齐放


在周二上午题为“AI模型持续监测的最佳实践”的会议中,来自北卡罗来纳州的全国性放射科医生团体Radiology Partners的AI创新团队成员、实践经验丰富的神经放射学家Walter F. Wiggins博士指出,成功的关键在于每一步都采取措施来验证流程。Wiggins博士表示:“我们在部署前会严格执行五步临床验证流程,旨在积极减轻人与AI之间的偏见。为此,我们向放射科医生传授工具的工作原理,以及它们可能失效的情况。随后,在开发完成后,我们持续构建一个监测系统,以应对随时间推移可能出现的性能漂移问题。”


Wiggins博士强调,成功的核心在于从实施前到实施后持续进行测试和评估。他举了一个关于头部CT扫描的实例来说明。他与同事们已经部署了一种颅内出血检测工具,并利用ChatGPT-4来分析该AI工具在这类检测中与放射学家的发现之间的一致性程度。初步结果显示,他们取得了相当不错的“病例一致性”(即人类放射学家和算法得出相同结论的比例)为63.9%。然而,在进一步分析患者检查时的年龄后,他们发现一致性率因年龄差异而有所不同:80岁及以上人群的一致性率高达68.8%,50-79岁人群为63.3%,而18-49岁人群则仅为55.9%。Wiggins博士总结道,这一领域仍有许多工作亟待完成。


02

以患者为中心


“为何AI开发对患者至关重要”这一话题,在周二下午题为“利用大型语言模型(LLMs)改善放射学中的以患者为中心的护理机遇与挑战”的会议上,成为了讨论的焦点。弗吉尼亚大学放射学和医学影像学教授Arun Krishnaraj博士在会议伊始便指出:“遗憾的是,即便是在21世纪,放射学报告仍旧仿佛是用20世纪的打字机敲打出来的,充斥着专业术语和冗长的列表。”他引用了Eric Topol博士的著作《患者现在就要见你》,强调需要重新思考如何生成与患者护理紧密相关的信息。


Krishnaraj展示了一张来自弗吉尼亚大学健康系统的Epic MyChart记录幻灯片,并指出其上他骨折的手指被标记为“XR Finger PA Lateral LT”。他说道:“我们现在正在生成对患者开放的报告,但仍有提升空间。”尽管大多数放射学家都了解《21世纪治愈法案》(CURES Act)强调及时向患者发布信息,但Krishnaraj质疑:“对于放射学家而言,你们所撰写的报告是否真的对患者友好?恐怕未必。”


Krishnaraj进一步指出,他们进行了一项全国性调查,以评估放射学家对CURES法案影响的了解程度。他问道:“放射学家是否因此改变了做法?他们愿意改变吗?”调查结果显示,68%的受访者表示对CURES法案非常或有些熟悉,但44%的人对其条款持负面看法,32%的人持正面看法,即支持向患者发布报告。然而,69%的受访者表示,该法案并未改变他们生成报告的方式、长度或内容。他还提到,68%的人更担忧患者的愤怒,而非理解。同时,40%的放射学家注意到来自患者的沟通请求增加,31%的放射学家则注意到转诊医生要求修改报告的请求增多,包括纠正如将“厘米”误写为“米”等错误——这类错误医生能立即识别,但患者可能无法察觉。


尽管如此,Krishnaraj向听众展示了希望:“2000年,《连线》杂志举办了一场比赛,探讨如何使血液检查报告更加易读且美观。受此启发,我们改进了弗吉尼亚大学的肺癌筛查报告,使其更易于患者接受。”他展示了一份关于低剂量CT扫描的患者友好型报告,该报告内容简洁明了,语言通俗易懂,并配以丰富的图表。这种沟通方式“让我们的工作更加人性化,有助于患者理解”。Krishnaraj强调,关键在于“大型语言模型和定制GPT将能够大规模地为患者生成易于理解的信息”。


他举例说,放射学家可以迅速轻松地生成无对比颈椎MRI报告的患者友好版本,如:“在您的颈部某个位置,有一个骨刺和一个膨出的椎间盘正压迫着神经。”这是为患者量身定制的语言。Krishnaraj强调:“患者是关键的利益相关者,他们不愿等待。”而生成式AI,特别是与大型语言模型结合,将助力实现这一目标。


随后,哈佛大学医学院放射学副教授、麻省总医院布列根和妇女医院血管与介入放射学部精准介入与医学影像实验室主任Dania Daye博士指出,大型语言模型在医学中主要有三大应用领域:患者护理、研究和教育。


Daye也提到了大型语言模型广泛应用的局限性,包括幻觉、偏见再现、错误信息传播和缺乏责任追究。她表示:“大型语言模型确实前景广阔,但我们尚未达到那个水平。最大的担忧是幻觉问题。GPT能够熟练地产生幻觉,而我们的患者无法区分真伪。ChatGPT是在互联网上训练的,目前尚无法让GPT承担责任。”


尽管如此,Daye认为大型语言模型在临床操作中的应用范围非常广泛。她解释说:“通常,影像护理流程从诊所中的某人输入订单开始,经过决策、放射学要求、放射学家协议等步骤,然后患者准备成像,放射学家准备并发布报告,最后访问报告。大型语言模型可以在这个过程的每一个环节发挥作用。”


Daye还引用了《放射学》杂志上的一篇文章,题为“基于上下文的聊天机器人在遵循ACR适当性指南方面超越放射学家和通用ChatGPT”,该研究表明使用聊天机器人能显著节省时间和成本。她还提及了近期文献中的其他几项研究,包括一篇发表于2023年10月5日《JAMA Network Open》的文章,题为“急诊科胸部X线检查中生成式人工智能的解释”,该研究发现GPT生成的报告与急诊科的放射学家相当,且优于远程放射学家。


该文章指出,生成式人工智能(AI)方法能够根据用户指示生成文本和图像等数据,有可能通过提供近乎即时的医学影像解释来弥补急诊科环境中需要快速生成大量报告的需求,从而在不受疲劳或人员限制的情况下应对高病例量。与分类方法相比,生成式方法的一个重要优势是能够生成完整的放射学报告,从而提供更具信息量和相关性的输出,为急诊科的决策提供重要上下文。


最后,来自宾夕法尼亚大学的医学博士Tessa S. Cook就“大型语言模型的临床实施”发表了演讲。她表示:“作为一名心血管放射学家,我经常需要研究主动脉,每次打开病例时,我都要花费10分钟去寻找下单的医生以及他们的需求。在这方面,生成式AI能够提供极大的帮助。”


Cook认为,实际上有许多小任务可以实现自动化,包括归类偶发发现以及根据特定的临床内容自动处理研究。