Nature Medicine | 跨越21种癌症,SCORPIO模型如何引领个体化免疫治疗新时代?

引言

近年来,癌症治疗领域的重大突破之一是免疫检查点抑制剂(Immune Checkpoint Inhibitors, ICIs)的广泛应用。这类药物通过调动患者的免疫系统攻击肿瘤,成功为部分晚期癌症患者带来了显著的长期疗效。然而,这种革命性的治疗并非对所有患者都有效,大多数患者在接受治疗后未能获得持久的临床获益,同时还需承受高昂的治疗费用和潜在的不良反应。因此,如何在治疗前准确预测患者是否会从ICIs中获益,成为精准医学中的一大挑战。
目前,肿瘤突变负荷(Tumor Mutational Burden, TMB)和程序性死亡配体1(PD-L1)表达是美国食品药品监督管理局(FDA)批准的预测ICIs疗效的两大生物标志物。然而,这些标志物的预测准确性有限,并且因样本需求、检测成本和缺乏标准化检测方法等问题,在实际临床中难以普及。因此,急需开发一种简便、经济且广泛适用的预测工具,以填补现有技术的空白。
在这一背景下,1月6日Nature Medicine的研究报道“Prediction of checkpoint inhibitor immunotherapy efficacy for cancer using routine blood tests and clinical data”,开发了一种名为SCORPIO的机器学习模型,它结合常规血液检测(如全血细胞计数和综合代谢谱)和患者的临床特征,无需复杂的基因组或免疫学检测即可预测ICIs的疗效。SCORPIO模型基于来自21种癌症类型的9745名患者的临床数据进行训练和验证,涵盖了多种真实世界和临床试验数据集。研究结果显示,SCORPIO在预测患者总体生存期(Overall Survival, OS)和临床获益(Clinical Benefit)方面,均显著优于TMB和PD-L1表达等传统方法。此外,该模型在多个癌症类型和不同医疗环境中展现出强大的可靠性和适应性,为实现个体化治疗提供了重要支撑。

图片

免疫治疗的“黄金时代”:希望与挑战并存
免疫检查点抑制剂(Immune Checkpoint Inhibitors, ICIs)的问世,为癌症治疗带来了前所未有的突破。这类药物通过解除免疫系统的“刹车”,重新激活T细胞攻击肿瘤,使部分晚期癌症患者获得了长期生存的机会。然而,免疫治疗的光芒背后也存在阴影:大多数患者未能从ICIs中受益,仅约15-20%的患者能够展现持久的临床反应。这一现象不仅让患者及家属承受了巨大的经济和心理负担,也为精准医学带来了新的挑战。
ICIs的作用靶点主要是两大免疫检查点分子:程序性死亡1(Programmed Death 1, PD-1)及其配体PD-L1,以及细胞毒性T淋巴细胞相关抗原4(CTLA-4)。这些分子在肿瘤微环境中被过度表达,从而抑制免疫系统对癌细胞的攻击。通过靶向阻断这些分子,ICIs能够恢复免疫系统的抗肿瘤活性。然而,尽管这种治疗策略原理明确,但在具体应用中却难以预测其效果。也就是说,医生在治疗前往往无法准确判断哪些患者能够获益,哪些患者会徒劳无功。
当前用于预测ICIs疗效的主要生物标志物是肿瘤突变负荷(Tumor Mutational Burden, TMB)和PD-L1表达。然而,这两种标志物的实际应用受到多重限制。首先,TMB需要进行复杂的基因组测序,而这一过程不仅耗时长、成本高,还对样本质量有较高要求。此外,PD-L1表达的检测标准尚未统一,不同抗体克隆和评分系统之间的差异也导致结果的可比性较差。研究数据显示,TMB和PD-L1表达在不同癌症类型中的预测准确性存在显著波动,在某些情况下,AUC仅略高于随机概率,显示出其在实际临床中的局限性。
因此,尽管ICIs开创了癌症治疗的“黄金时代”,精准预测疗效的需求却亟待满足。这不仅关系到患者的生存和生活质量,也对医疗资源的高效利用提出了更高要求。

预测疗效的“新武器”:SCORPIO模型的诞生
针对传统生物标志物(如肿瘤突变负荷和PD-L1表达)预测能力的局限性,研究人员提出了一个大胆的设想:是否可以通过分析常规血液检测结果,结合临床数据,开发一种高效的预测工具?这一设想最终催生了SCORPIO模型(Standard Clinical and labOratory featuRes for Prognostication of Immunotherapy Outcomes)的诞生。
SCORPIO模型的设计目标非常明确——为患者和医生提供一种基于常规医疗数据的预测工具,无需依赖复杂的基因组测序或免疫学检测,便可评估患者是否能够从ICIs治疗中获益。该模型的独特之处在于,它以全血细胞计数(Complete Blood Count, CBC)和综合代谢谱(Comprehensive Metabolic Profile, CMP)等常规血液检测为核心数据来源,同时整合患者的年龄、性别、体重指数(BMI)等临床特征。这些数据不仅易于获取,还具有普遍适用性,尤其适合资源有限的医疗环境。
在开发过程中,研究团队从超过9700名接受ICIs治疗的患者数据中提取了关键特征,并对模型进行了大规模训练和测试。SCORPIO通过机器学习算法的强大计算能力,从常规数据中识别出与患者生存和疗效高度相关的33个特征,包括白细胞和红细胞数量、血清蛋白水平、氯离子浓度等。这些特征反映了患者的免疫状态、营养水平和代谢功能,从而为免疫治疗效果的预测提供了科学依据。
研究结果显示,SCORPIO模型在多个独立的数据集中表现优异,不仅在真实世界数据中展现了强大的预测能力,还在全球多项三期临床试验中得到了验证。
图片

研究的设计与分析流程(Credit: Nature Medicine

数据队列的收集与分层(a)
研究的数据来源分为三大部分:真实世界队列(MSK-I):来自纪念斯隆-凯特琳癌症中心(MSKCC)的患者数据,用于模型的开发。这部分数据涵盖17种癌症类型,共1628名患者。
独立验证队列(MSK-II 和 MSHS):MSKCC的MSK-II队列和纽约西奈山健康系统(MSHS)队列的数据被用于模型的验证。其中,MSK-II包含2104名患者,MSHS包含1159名患者,这些数据代表了更广泛的患者群体。
全球10项三期临床试验数据:包括4447名患者的意向治疗分析(ITT),覆盖了6种癌症类型,用于进一步验证模型在不同地理和临床环境中的适用性。
特征选择分析(b)
特征收集:在MSK-I队列中,共收集了47个与患者总体生存(Overall Survival, OS)或临床获益(Clinical Benefit)可能相关的特征。
统计分析:通过Cox比例风险回归和Cochran-Mantel-Haenszel检验,测试每个特征与目标结果(OS或临床获益)之间的关联性。为控制潜在混杂因素,分析过程中调整了系统性治疗史(Systemic Therapy History)的影响。
结果筛选:最终筛选出的关键特征被用于后续的机器学习模型开发。
机器学习模型的开发与评估(c)
模型构建:分别开发了两个机器学习模型,一个用于预测总体生存,另一个用于预测临床获益。每个模型采用集成算法,通过“软投票”融合多个算法(如岭回归、支持向量机和随机森林)的结果。
模型表现对比:通过受试者工作特征曲线(ROC)和曲线下面积(AUC)对模型性能进行评价,以时间依赖性AUC衡量总体生存的预测能力。
模型选择:在测试集上表现最佳的模型被用于后续分析。

跨越21种癌症:SCORPIO模型如何实现广泛适用性
癌症的多样性和复杂性长期以来是精准治疗的重大挑战。不同类型的癌症在生物学特性和免疫反应上差异显著,而免疫检查点抑制剂(ICIs)在多种癌症中的疗效也存在极大波动。在这一背景下,SCORPIO模型展现出了令人瞩目的适应能力。它通过训练和验证涵盖21种癌症类型的数据,成为目前最广泛适用的疗效预测工具之一。
SCORPIO的开发基于来自9700余名接受ICIs治疗患者的临床数据,这些数据来源于多个真实世界队列和全球三期临床试验。模型的初始训练数据集包括17种癌症类型的1628名患者,其后在一组407名患者中进行了独立测试。这些癌症类型涵盖了非小细胞肺癌NSCLC)、黑色素瘤、肝胆系统癌症、膀胱癌、肾细胞癌(RCC)和小细胞肺癌(SCLC)等常见类型,以及一组包括食管癌、卵巢癌等罕见类型的“其他”类别。
值得一提的是,SCORPIO不仅能够预测单一癌症类型的疗效,还能够在“跨癌症”的背景下表现出色。在真实世界和临床试验数据集中,模型预测总体生存期(OS)的时间依赖性受试者工作特征曲线下面积(AUC(t))在多个癌症类型中均超过0.75,远高于传统生物标志物(如肿瘤突变负荷)的表现。此外,研究还发现,SCORPIO在多癌症数据中捕捉的关联特征,如白细胞比例、血清蛋白浓度和红细胞分布宽度等,能够普遍适用于不同癌症类型。
此外,模型对多重治疗线、多种病理状态和异质性强的患者群体展现出极强的预测能力。例如,对于接受联合治疗或既往治疗失败的患者,SCORPIO的预测准确性仍然保持较高水平。研究人员通过分癌种的特定模型进一步验证了SCORPIO的普适性,结果显示,尽管不同癌种存在微观特性差异,SCORPIO作为一个大范围泛癌模型,依然能够捕捉到跨癌症的关键预测信号。
SCORPIO的广泛适用性不仅为临床医生提供了应对多样化病例的强大工具,也为未来跨癌症治疗研究提供了数据驱动的新思路。

机器学习的力量:如何提升预测的精准度?
SCORPIO模型的成功,离不开机器学习的强大计算能力。通过先进的算法和严格的优化流程,该模型从海量常规医疗数据中提取关键信息,实现了对免疫检查点抑制剂(ICIs)疗效的精准预测。这一过程中,机器学习不仅是一种技术工具,更是一个不断学习和进化的智能系统。
模型的开发过程始于对患者数据的深入特征筛选。研究团队从初始数据集中提取了47项与患者生存和治疗效果可能相关的特征,包括白细胞计数(WBC)、血红蛋白(HGB)、血清白蛋白(ALB)以及患者的体重指数(BMI)等。随后,研究人员通过Cox比例风险回归和Cochran-Mantel-Haenszel检验等统计方法,对这些特征进行了关联分析,以识别出与总体生存期(OS)和临床获益(Clinical Benefit)显著相关的特征。最终,33个特征被选入用于预测生存的模型,而22个特征用于预测临床获益。
SCORPIO采用了集成学习(ensemble learning)方法,将多种机器学习算法(如岭回归、支持向量机和随机森林)结合起来,通过“软投票”生成最终预测。这种方法能够充分利用各算法的优势,提高模型的鲁棒性和预测能力。此外,研究团队在模型训练过程中应用了five-fold cross-validation,对每种算法的超参数进行优化,从而确保模型的泛化能力。
关键特征的选择是提升预测精准度的核心。例如,血清氯离子(CL)、血清白蛋白(ALB)和血红蛋白(HGB)被发现是对疗效预测贡献最大的指标。研究显示,这些特征不仅与患者的免疫功能和营养状态密切相关,还可能反映肿瘤微环境的复杂变化。通过量化这些特征对预测结果的影响,SCORPIO利用了Shapley Additive Explanations(SHAP)技术进一步揭示了每个特征对模型决策的贡献大小,从而增强了模型的可解释性。
SCORPIO模型的开发展示了机器学习在医学预测中的巨大潜力。它通过高效的数据处理和智能的特征分析,将复杂的临床数据转化为可靠的疗效预测工具。

超越传统方法:SCORPIO模型的表现如何?
SCORPIO模型在疗效预测上的优异表现,显著超越了传统生物标志物如肿瘤突变负荷(Tumor Mutational Burden, TMB)和程序性死亡配体1(PD-L1)表达。
在预测总体生存期(Overall Survival, OS)方面,SCORPIO展现了卓越的时间依赖性受试者工作特征曲线下面积(AUC(t))。研究数据显示,在内测数据集中,SCORPIO的AUC(t)在6个月、12个月、18个月、24个月和30个月的中位值达到0.763,相比之下,TMB的中位值仅为0.503。此外,在另一个独立验证数据集中,SCORPIO的中位AUC(t)为0.759,同样显著高于TMB的表现。
在临床获益(Clinical Benefit)预测中,SCORPIO同样表现出色。模型的AUC值在内测数据集中达到0.714,而TMB仅为0.546。即使在外部测试的全球三期临床试验数据中,SCORPIO仍然表现稳定,显著优于PD-L1免疫组化染色等传统方法。这种优势不仅体现在单一癌症类型上,还跨越多种癌症类型和患者亚群,充分验证了模型的广泛适用性。
SCORPIO的优势还体现在其数据来源的普适性。传统的TMB检测依赖于高质量的肿瘤样本和昂贵的基因组测序,而PD-L1表达分析则因抗体克隆和评分标准的不一致而导致结果不稳定。相比之下,SCORPIO使用的是简单易得的常规血液检测数据和基本临床特征,使其在资源有限的环境中也能够发挥作用。
通过机器学习技术的加持,SCORPIO模型从患者的血液和临床数据中提取关键特征,为预测ICIs疗效提供了高效、低成本的解决方案。这不仅有助于优化治疗决策,减少不必要的治疗负担,也为未来精准医学的发展奠定了坚实基础。

真实世界与临床试验的双重验证:SCORPIO是否值得信赖?
SCORPIO模型的可靠性来自于其在多维度、多数据集中的全面验证。这种双重验证策略,不仅确保了模型在真实世界患者中的适用性,也展示了它在严格控制的临床试验环境中的一致性。
研究首先在真实世界数据集中对SCORPIO进行了全面测试。模型的开发和初步验证基于来自纪念斯隆-凯特琳癌症中心(MSKCC)的近4000名患者的数据,这些患者涵盖了21种癌症类型,并接受了免疫检查点抑制剂(ICIs)治疗。在测试数据集中,SCORPIO在6至30个月的时间范围内展现出稳定的时间依赖性AUC(t)(中位值为0.763),远高于传统方法。这一结果证明,模型能够在真实世界的复杂条件下有效预测患者的总体生存期(Overall Survival, OS)和临床获益(Clinical Benefit)。
此外,为了进一步验证模型的普适性,研究团队将SCORPIO应用于来自10项全球三期临床试验的4447名患者数据中。这些试验覆盖了包括非小细胞肺癌(NSCLC)、黑色素瘤、膀胱癌和肝胆癌在内的6种癌症类型。在这些独立的临床试验数据中,SCORPIO继续展现出卓越的表现。例如,在IMvigor211膀胱癌试验中,SCORPIO预测OS的中位AUC(t)达到了0.782,而在IMspire150黑色素瘤试验中,其预测临床获益的AUC值为0.684。这种跨数据集的稳定性,进一步巩固了SCORPIO作为预测工具的可信度。
值得注意的是,SCORPIO的预测效果与患者的性别、年龄、治疗线别和ECOG体能状态评分等变量无显著关联。这表明,模型的性能不受特定患者特征的影响,具有广泛的适用性。
通过结合真实世界数据和严格的临床试验结果,SCORPIO模型以其可靠性和一致性脱颖而出。它的双重验证不仅强化了其在临床应用中的价值,也为未来精准医学的发展提供了强有力的科学支持。

小数据,大智慧:血液检测背后的科学意义
SCORPIO模型以简单的血液检测为核心,却揭示了免疫治疗效果背后深刻的科学联系。通过对关键血液指标的深入分析,研究人员发现,这些指标不仅与患者的整体健康状况相关,还能反映肿瘤微环境和免疫系统的状态,为预测免疫检查点抑制剂(ICIs)疗效提供了坚实的科学依据。
在SCORPIO模型的33个关键特征中,血液指标占据重要地位,例如白细胞计数(WBC)、血红蛋白(HGB)、血清白蛋白(ALB)、氯离子浓度(CL)和嗜酸性粒细胞比例(EOS%)。这些指标反映了患者的免疫功能、代谢状况和全身炎症水平。例如,ALB不仅是一种常见的营养状态标志物,还与免疫系统的抗肿瘤活性相关。研究表明,高ALB水平通常与更活跃的T细胞和B细胞功能相关,显示出一种“免疫炎症型”的肿瘤微环境(TME),这往往预示更好的免疫治疗效果。
同样,EOS%作为一种反映免疫调节功能的标志物,其升高可能表明患者的免疫系统更具活性。此外,血清氯离子浓度(CL)和血红蛋白(HGB)等指标,则可能与患者的整体代谢状态和组织氧合作用密切相关,间接影响免疫反应的效率。
通过SHapley Additive Explanations(SHAP)方法,研究人员进一步揭示了这些血液指标如何在SCORPIO模型的预测中发挥作用。例如,在预测ICIs疗效的风险评分中,ALB和HGB等指标对结果的影响方向和强度可以根据患者的具体情况动态变化。这种特性不仅增强了模型的可解释性,也为医生提供了关于患者生物状态的宝贵信息。
值得一提的是,这些血液指标的科学意义超越了它们的简单测量值。它们代表了患者身体系统的整体反应,包括免疫、代谢和炎症等多个层面的协同作用。SCORPIO模型通过解析这些指标背后的复杂关系,将“常规检测”转化为“精准预测”,为免疫治疗提供了一个高效且低成本的解决方案。
这一发现再次证明,小数据也蕴含着大智慧。通过对常规血液检测数据的充分利用,SCORPIO不仅揭示了免疫治疗效果的生物学基础,还为未来探索更多的癌症疗效预测指标提供了启示。

SCORPIO的未来应用潜力
SCORPIO模型的出现为免疫检查点抑制剂(ICIs)的个体化治疗带来了全新的希望。通过对患者疗效的精准预测,该模型不仅可以帮助医生优化治疗决策,还能够大幅减少不必要治疗所带来的经济和健康负担。其在精准医学中的潜力和未来应用方向,令人期待。
首先,SCORPIO可以作为临床决策的核心工具,用于筛选可能从ICIs治疗中获益的患者。研究数据显示,仅一部分患者对ICIs有显著反应,而大多数患者可能面临高昂的治疗费用及潜在的不良反应。SCORPIO能够通过简单的血液检测和临床数据快速评估疗效风险,从而帮助医生避免不必要的治疗。这不仅节约了患者的医疗费用,也减少了不必要的毒副作用对身体的损害。
此外,SCORPIO还具有在资源有限的医疗环境中广泛应用的潜力。传统的疗效预测方法(如TMB检测)需要昂贵的基因组测序,而SCORPIO依赖的是常规血液检测,这一特性使其能够惠及更多患者,尤其是经济条件较差或医疗资源不足的地区。
在未来,SCORPIO还可以通过技术改进进一步提升其性能。例如,模型的准确性和适应性可以通过整合更大规模、更多样化的数据集得到增强。同时,随着多组学数据(如基因组学、蛋白组学和代谢组学)的不断积累,研究人员可以尝试将这些复杂数据与现有模型相结合,进一步提高预测能力。此外,开发实时数据更新的动态模型,也能够帮助SCORPIO更好地适应不断变化的临床环境和患者特征。
SCORPIO的未来应用不仅局限于免疫治疗的疗效预测。其核心方法和技术也可推广到其他癌症治疗领域,例如化疗、靶向治疗等。通过建立类似的模型,医生可以更全面地为患者量身定制治疗方案,最大限度提高治疗效率。
总之,SCORPIO为精准医学开辟了一条新路径。它不仅为当前的免疫治疗提供了可靠的辅助工具,也为未来的医学研究和技术创新提供了广阔的空间。这一模型的潜力,不仅是科学的突破,更是患者的福音,推动我们迈向更加高效和人性化的医疗未来。




参考文献


Yoo, SK., Fitzgerald, C.W., Cho, B.A. et al. Prediction of checkpoint inhibitor immunotherapy efficacy for cancer using routine blood tests and clinical data. Nat Med (2025). https://doi.org/10.1038/s41591-024-03398-5



责编|探索君