终结 30 年争议!GOLD 与 GLI 联合发布关于 COPD 诊断阈值的最新声明

问AI · COPD诊断争议的根源是什么?
图片


慢性阻塞性肺疾病COPD)是全球发病率和死亡率最高的慢性疾病之一。肺功能检查通过测定第一秒用力呼气容积与用力肺活量的比值(FEV1/FVC),为 COPD 诊断提供客观的气流阻塞证据。然而,全球范围内肺功能检查的可及性有限、使用不足,导致大量患者被误诊或漏诊。


以胸腔内气道阻塞为特征的 COPD,可通过肺功能检查中发现呼气气流受限来识别。然而,对于应采用何种阈值来界定 COPD 疑似患者的气流受限,长期以来存在争议。近日,慢性阻塞性肺疾病全球倡议组织(GOLD)与全球肺功能倡议组织(GLI)联合发布了关于诊断 COPD 的肺功能检查结果解读标准的声明,旨在终结这一持续已久的争议。本文整理其核心要点,供各位参考学习。



争议是什么?



GOLD 自 2001 年发布首部指南以来,一直推荐采用支气管扩张剂后 FEV1/FVC < 0.7 的固定比值来定义慢性阻塞性肺疾病(COPD)相关的气流阻塞。该方法的优势在于操作简便、无需查阅参考值,且不受人群特征影响。然而其缺点在于未考虑与年龄相关的生理性肺功能下降,可能导致老年人过度诊断、年轻人漏诊。


GLI 则推荐使用特定正常值下限(LLN)定义气流阻塞,即 FEV1/FVC 比值低于健康人群的第 5 百分位数。其优势在于考虑了年龄、身高、性别等因素,更符合生理实际,并基于健康人群分布具有统计学基础。但 LLN 同样存在问题,它依赖于参考人群的的特征,假设参考人群是健康的,如果参考人群中包含未确诊或者亚临床疾病患者会导致 LLN 值偏移,此外,若脱离临床症状使用 LLN 可能将健康年轻人误诊为 COPD。


两种阈值本身并无对错之分,它们的差异源于根本目标不同:GOLD 推荐的固定比值旨在为日常临床实践提供实用的 COPD 确诊工具,而 GLI 推荐的 LLN 旨在反映人群间肺功能指标的生物学变异性。


图片



GOLD 与 GLI 的核心共识



GLI 与 GOLD 达成多项共识,核心观点如下:二者认为无需纠结于「异常」判断阈值的推荐差异,临床中仅少数人群会因二者方法不同得到不同分类结果,更应聚焦肺功能检查使用不足这一共性问题;明确 COPD 以气流阻塞为特征,肺功能检查测得的 FEV1/FVC 仍是评估该症状最适宜的客观生物标志物,但诊断 COPD 不能仅依赖此项检查,需结合患者症状与病史综合判断。 


二者均倡导大力推广肺功能检查,该检查简便、成本低,可应用于诊断、疾病管理、科研等多场景,能在基层医疗、社区、职业卫生、各级医院等不同场所开展,仅操作与应用方式存在差异。但目前该检查临床应用显著不足,多国研究显示,多数已确诊的 COPD 患者并未接受过此项检查,检查可及性欠缺、医师对结果解读信心不足、患者配合度低是主要障碍;教育培训项目可部分解决上述问题,人工智能则能在医师认知不足时助力提升检查质量,还可辅助结果判读,近期一项基层医疗随机对照试验证实,基于 AI 的决策支持能显著提高临床医师诊断 COPD 的准确性。 


同时,二者强调肺功能检查质量的重要性:检查质量不佳时,固定比值与 LLN 阈值的差异便无实际意义,而更新的技术标准和集成算法,可帮助操作者实时完成高质量检查。相关声明明确了检查结果与 COPD 诊断的关联:若 FEV1、FVC 及二者比值均正常,结果不受操作不当影响,可直接排除当前定义的 COPD;若上述指标正常但临床高度怀疑 COPD,支气管舒张后的肺量测定可能显示 FVC 容量反应,进而发现隐匿性气流阻塞;若患者存在显著相关病史和症状,仅靠临界值无法明确证实或排除 COPD。 


在结果解读上,双方一致认为,COPD 具有异质性,肺功能测定指标易受测量误差(最佳状态下肺功能仪重复测试结果变异度最高可达5%)和生物学变异影响,导致结果解读存在不确定性。因此临床实际应用中,采用固定比或 LLN 的差异较小;若二者结果矛盾,或 FEV1/FVC 比值处于 0.6~0.8 区间时,诊断存在不确定性,不建议仅凭单次测试下结论,需结合临床症状考虑重复测试,或通过 FEV1/慢肺活量(SVC)等其他指标进一步检查,以明确或排除 COPD 诊断。


此外,相关创新或推动肺功能测定替代方法问世,亦可整合振荡法、二氧化碳呼气分析、光体积描记法、影像学等补充检查;人工智能有助于整合各类检查,且在检测肺损伤(尤其小气道病变、限制与阻塞混合型病变)时敏感度更高,但此类创新目前尚未普及,也难以改善诊断检查的可及性。


本声明还专门澄清了支气管扩张剂测试中两个常被混淆的概念:


支气管扩张剂反应是指使用支气管扩张剂后 FEV1 或 FVC 的数值变化幅度,无论其数值最终是否恢复正常;

支气管扩张剂可逆性是指使用支气管扩张剂后,原本「异常」的 FEV1/FVC 比值恢复到正常范围(要么高于 0.7 的 FEV1/FVC 固定比值,要么高于 FEV1/FVC 的 LLN)。


需要注意,许多 COPD 患者对支气管扩张剂有反应(FEV1 和/或 FVC 会发生变化),但 FEV1/FVC 比值仍低于诊断阈值,这不属于支气管扩张剂可逆性。



两种阈值该怎么用?



在诊断 COPD 时,对于有症状且有危险因素暴露史的患者,推荐使用固定比值确认 COPD 诊断。研究显示,那些被固定比值识别为阻塞,但在 LLN 标准下属于「正常」的个体,实际上表现出更多的呼吸道症状、更差的运动耐量、更低的气体转移能力以及更高的急性加重和死亡风险,这表明固定比值能够在 LLN 发现明显阻塞之前,识别出具有临床意义的早期疾病。


在更广泛的人群识别中,包括有劳力性呼吸困难的年轻患者,声明指出 LLN 可用于识别气流阻塞,提示其在筛查和早期识别方面具有价值。


当面对诊断不确定性的情况时,特别是在 FEV1/FVC 比值处于 0.6~0.8 之间,声明强调不应仅凭单次测试做出明确诊断,应结合临床症状综合判断,考虑重复肺功能检查,必要时行进一步检查如影像学、气体转移功能等。



阈值以外的问题



在气流阻塞严重程度分级方面,目前存在 GOLD 基于 FEV1 占预计值百分比的方法和 ATS/ERS 基于 Z 评分(经年龄、身高和性别标准化)的方法。研究表明,尽管 Z 评分似乎与患者症状(如呼吸困难)和住院风险的关联性更强,但两者在预测死亡风险方面,均不如 FEV1 的绝对值。声明指出,这两种方法都是人为设定的阈值,具有主观性,未必完全反映患者预后,气流阻塞的严重程度分级应基于患者报告结局(实际功能状态)或临床结局(如生存率)来确定。


关于种族中立参考值,过去使用的基于种族的参考值存在问题,可能会导致某些人群的疾病严重程度被低估,使肺健康差异正常化。GLI 于 2022 年发布的种族中立全球参考方程(GLI-Global equations)基于加权平均的种族和民族类别,消除了种族因素的影响,GOLD 已确认这是目前最合适的参考标准,并呼吁常规使用。但声明也承认了现有方程仍存在局限性,未纳入许多国家和地区的参与者,全球有效性有待验证,亟需纳入胸围尺寸等人体测量学变异的新策略。


结  语

GOLD 与 GLI 联合声明的核心要义为:摒弃诊断阈值的争议,携手推动肺功能检查的可及性提升与质量优化。未来工作的核心重点在于,减少肺功能检查的临床应用障碍,提升其在全球范围内的可及性与利用率,同时强化基层医疗相关的专业培训和能力建设。


声明还呼吁,需协调各国及地区相关医学学会(包括 ATS、ERS)的诊疗建议,以此消除临床实践中的认知混淆。


GOLD 与 GLI 就此达成一致共识:LLN 可用于在更广泛人群中筛查识别气流阻塞,适用于存在劳力性呼吸困难的年轻患者等群体;而在具备合理临床背景的前提下(即患者出现相关症状,且有提示 COPD 的病史及危险因素暴露史),则推荐采用固定比值,来识别 COPD 相关气流阻塞并确诊 COPD。


表 1. GOLD 与 GLI 之间的核心共识要点

图片


✩ 本文仅供医疗卫生等专业人士参考


策划:超超