临床研究为何需要双重评估?BICR 和 INV 评估有何区别?

抗肿瘤药物已成为当前全球新药研发的焦点领域之一,随着肿瘤治疗方法的日益多样化,患者的生存期限得到了显著延长。在众多药物的临床研究,特别是上市前至关重要的 III 期临床研究中,我们常会发现一个现象:对于同一研究终点,研究报告中往往会呈现两个评估结果,最常见的是基于独立评审委员会(BICR)的评估与研究者(INV)的评估。那么,为何这些研究会需要双重结果的呈现?哪些特定的研究终点会要求这样的双重评估呢?接下来,让我们深入探讨这一话题。

抗肿瘤药物临床研究终点


抗肿瘤药物临床试验最常用的疗效终点有总生存期(Overall Survival,OS)、客观缓解率(Objective Response Rate,ORR)、无进展生存期(Progression Free Survival,PFS)。与客观缓解率 ORR 类似的终点有疾病控制率(Disease Control Rate,DCR)。与 PFS 类似的终点还包括无病生存期(Disease Free Survival,DFS)、无事件生存期(Event Free Survival,EFS)、疾病进展时间(Time To Progression,TTP)、治疗失败时间(Time To Treatment Failure,TTF)。各个终点的定义如下:

总生存期(OS):指从随机化开始(或单臂试验中治疗开始)到任何原因导致死亡的时间。

客观缓解率(ORR):指按照公认的缓解评价标准(如实体瘤 RECIST v1.1),肿瘤体积缩小达到预先规定值(CR/PR)并能维持最低时限要求的患者比例。实体瘤的缓解可以是完全缓解(CR)或部分缓解(PR),对于非实体瘤的评估则有一些其它评价标准。

疾病控制率(DCR):指按照公认的缓解评价标准(如实体瘤 RECIST v1.1),肿瘤经治疗后获得缓解(PR+CR)和病变稳定(SD)并能维持最低时限要求的患者比例。

无进展生存期(PFS):指从随机化开始(或单臂试验中治疗开始)至肿瘤进展(PD)或任何原因导致死亡(以先发生者为准)的时间。

无病生存期(DFS): 是指从随机化开始(或单臂试验中治疗开始)至疾病复发或任何原因导致死亡的时间(以先发生者为准)。

无事件生存期(EFS) : 是指从随机化开始(或单臂试验中治疗开始)到首次发生以下任何事件的时间:疾病进展而无法进行手术治疗、局部或远处复发、任何原因导致的死亡等。

疾病进展时间(TTP): 是指从随机化至出现肿瘤客观进展的时间,不包括死亡。

治疗失败时间(TTF): 是指从随机化至治疗失败或退出试验的时间,退出试验的原因可为患者要求、疾病进展、死亡或不良事件等。


实体瘤疗效评价标准(RECIST v1.1)


评估肿瘤疗效的标准在逐渐发展,以改进评估准确性并同时限制经济等负担。第一个被广泛接受的二维标准是世界卫生组织(WHO)反应标准(1981 年),其在 2000 年被一维的实体肿瘤反应评估标准(Response Evaluation Criteria in Solid Tumours,RECIST)所替代。目前被广泛使用的反应评估标准是 RECIST v1.1。在 RECIST v1.1 标准中,每次评价时的客观缓解状态分为:

完全缓解(CR):所有目标病灶完全消失,所有目标结节须缩小至正常大小。

部分缓解(PR):所有可测量目标病灶的直径总和低于基线 ≥30%。

疾病进展(PD):直径和相对增加至少 20%,或出现一个或多个新病灶。

疾病稳定(SD):介于 PR 和 PD 之间。

 

基于肿瘤测量的临床试验终点

 
抗肿瘤药物临床试验疗效终点中,大家不难发现 ORR、PFS、DCR、EFS、TTP、TTF 这些终点的判定时需要配合「CR、PR、PD、SD」为标准予以界定。而对于实体瘤来说,CR、PR、PD、SD 又需要配合影像学予以界定,所以我们把 ORR、PFS 和 DFS 等这些需要进行影像学测量评估肿瘤大小的终点称为基于肿瘤测量的临床试验终点,也称为基于医学影像评估结果的替代终点

临床或影像科医师对医学影像进行分析和诊断时,通常以主观判断及病灶测量为主,不需要系统性的量化评估也能满足临床对影像诊断的需求。但在临床试验中,影像检查及评估过程的差异可导致相关测量误差增加、临床试验终点评估变异增大,最终影响临床试验结果,因而临床试验影像评估程序的标准化在以影像评估为主的临床试验中变得十分重要。而研究者在疗效评估时不仅有影像数据,还可获得影像外的临床数据。该因素有助于研究者对影像学资料的判读,但在开放性设计的临床试验中,研究者可能对试验组受试者产生倾向获益的预期,由此可能导致研究的影像评估结果出现潜在的偏倚或倾向性。因此有必要设立独立于研究者的评估委员会(Independent Review Committee,IRC)对此进行客观评估。

举个例子

假设在一项临床研究中,在接受相对应的治疗后,实验组与对照组各有一名患者的所有可测量目标病灶直径总和的减少均低于基线值的 29.9%,理论上均未达到 PR(即低于基线 30%)。由于研究者可能对实验组抱有更高的获益预期,因此在解读结果时,可能会倾向于将实验组患者的疗效判定为 PR,而将对照组患者的疗效判定为 SD,从而导致研究结果产生偏差。而在评估 OS,即判断患者是否死亡这一客观指标时,对实验组抱有更高的获益预期的主观倾向也不太可能导致研究者对受试者死亡或存活的状态作出错误判断。因此对于 OS 这一终点指标,研究者出具的结果同样具有相对较高的可信度。

 
因此,国家药品评审中心(CDE)在发布的《抗肿瘤药物临床试验统计学设计指导原则》中明确指出,对于拟申请注册的试验,关于肿瘤反应的 ORR 和 PFS 评估,通常需基于盲态独立中心审查委员会(Blinded Independent Central Review,BICR)进行的肿瘤测量和缓解评估。然而,对于 OS 这一指标,该指导原则中并未规定必须采用 BICR 的评估方式。

一项关键研究是否需要 IRC,采用前瞻性或回顾性 IRC,是否将 IRC 终点设置为主要研究终点,以及 IRC 的章程设计(例如采用同步评价、阶段性评价或者回顾性评价)须在关键研究方案设计时沟通明确。《抗肿瘤药临床试验影像评估程序标准技术指导原则》中指出,当拟支持注册的关键研究存在以下情况时,建议使用独立影像评估:

 单臂设计的试验(当前须采用 BICR 评估);

 无法设盲、可能存在评估偏倚的对照试验;

③ 有效性假设/预期结果趋于临界值的随机对照试验;

④ 影像源数据质量易出现偏差,需要设置 IRC 对影像源数据质量进行控制的试验;

⑤ 使用特殊评估标准的试验,如需要特殊影像量化方法:少数罕见病如神经母细胞瘤间位碘代苄胍扫描(MIGB)或 PET,或影像数据须借助特殊软件进行处理和评估,在实施时难以控制各中心的一致性。

 
表 1. 晚期 NSCLC 药物常用临床试验终点比较;来源:参考文献 2
图片
 

BICR、BIRC、ICR、IRF、CRO、INV

 
在临床研究中 BICR、BIRC、ICR、IRF、CRO、INV 是我们不时碰到的专业术语,这些术语的含义和关系如下:



IRC 和 IRF

IRC 独立评审委员会  (independent review committee)
IRF 独立评估机构(independent review facility)
IRC 和 IRF 为相同含义的机构因国内外制度不同导致的不同表述,两者都是独立与研究组的评审机构,国内一般称为独立评审委员会(IRC),国外称为独立评估机构(IRF)。
 


BIRC 和 BICR

BIRC 盲态独立评审委员会(blinded independent review committee)
BICR 盲态独立中心评估(blinded independent central review)
独立中心化的影像评估流程通常采取完全盲态设计,评估者在评估过程中不了解所评估病例的治疗信息(在非单臂试验中)以及研究者的评估结果,这一过程被称为盲态独立中心评估(BICR)。BICR 能够提升影像评估的独立性和可信度,并与研究者的评估结果进行比对,从而可能增强研究结果的客观性。
在国内,负责执行盲态独立中心评估(BICR)的机构是盲态独立评审委员会(BIRC)。因此,BIRC 是 BICR 的运作机构,而 BIRC 评估与 BICR 评估在表述上具有相同含义。由于国外文献大多采用 BICR 这一术语,所以 BICR 的使用频率更高。



CRO

CRO 影像合同研究机构 (Contract Research Organization)
CRO 为 IRC 独立评审委员会下属的影像终点独立评估合同研究机构,其主要职责为严格执行影像评估章程和/或影像采集协议对影像终点相关标准的设计;独立实施影像终点评估的过程中,不应被任何组织或个人进行干预和/或诱导,影响其终点结论的判断。



IVN

INV 研究者(Investigator)
研究中心或第三方的影像科室专门负责临床试验影像相关事务人员。



小结:



基于肿瘤测量的临床试验终点 ORR、PFS 和 DFS 等一般需要额外进行独立评估,而 OS 一般不需独立评估。

独立评估中 IRC 和 IRF 两者为相同机构在国内外不同表述。BIRC 为负责执行 BICR 机构, BIRC 评估与 BICR 评估在表述上具有相同含义。


参考文献

[1] 国家药品评审中心. 抗肿瘤药物试验终点技术指导原则.
[2] 国家药品评审中心. 晚期非小细胞肺癌临床试验终点技术指导原则.
[3] 国家药品评审中心. 抗肿瘤药临床试验影像评估程序标准技术指导原则.
[4] 国家药品评审中心. 抗肿瘤药物临床试验统计学设计指导原则 (试行).
[5] Seymour L et al.iRECIST: guidelines for response criteria for use in trials testingimmunotherapeutics. Lancet Oncol. 2017 Mar;18(3):e143-e152.



作者:毛阳;编辑:lsh
题图:丁香园创意团队