75万人的血液基因组,重新审视一个衰老标志
这项研究的规模很大。研究人员使用 UK Biobank(UKB)和 All of Us(AoU)两大队列的全基因组测序(whole-genome sequencing, WGS)数据,对 736,038 名个体的 mtDNA 序列、mtDNA 丰度和异质性变异(heteroplasmic variants)进行了分析。经过质量控制后,最终在 620,385 名个体中识别出 19,051,526 个变异。
其中,异质性变异共有 1,151,297 个,包括 754,108 个插入/缺失变异(indels)和 397,189 个单核苷酸变异(single-nucleotide variants, SNVs)。这里的“异质性”很关键:一个细胞或组织中,mtDNA 往往不是完全一致的,而是可能同时存在不同等位基因。这种混合状态被称为异质性(heteroplasmy)。
过去,mtDNA 异质性常被用于解释线粒体遗传病,尤其是高比例、有功能损害的致病突变。但这篇研究关注的是另一类现象:在普通人血液中,低水平 mtDNA 单核苷酸变异为什么会随年龄增加而更容易被检测到?
在 AoU 的 236,749 名个体中,平均异质性 mtSNV 数量在年轻和中年阶段较低,到了约 60 岁后明显上升,90 岁附近平均值接近 1.5 个/人。UKB 中也观察到类似趋势:在 40—70 岁范围内,平均异质性 mtSNV 数量随年龄稳步增加。吸烟者的 mtSNV 数量整体更高,但无论是否吸烟,年龄相关上升趋势都存在。
这说明:吸烟会增加背景负担,但并不能解释全部年龄效应。
如果是氧化损伤,突变谱应该长什么样?
判断突变从哪里来,不能只看“有没有变多”,还要看“变成了什么”。这就是突变谱(mutational spectrum)的价值。
传统观点认为,mtDNA 突变积累与氧化应激有关。如果氧化损伤是主因,研究人员预期会看到较多 C>A 颠换(transversion),因为鸟嘌呤氧化后常导致这类改变。
但实际结果并不支持这个图景。
在控制 mtDNA 复制起点区域后,年龄相关累积最明显的变异主要是转换(transition),尤其是重链(heavy strand)上的 C>T,以及重链和轻链(light strand)上的 A>G。相反,与氧化损伤更相符的 C>A 变异非常少,而且没有随年龄明显累积。
这组数据把线索从“氧化损伤”转向了“复制错误”。在线粒体DNA复制的链置换模型(strand displacement model)中,轻链复制开始后,亲本重链会在一段时间内处于单链状态,直到复制进程推进到 mtDNA 分子的约三分之二。单链状态下的胞嘧啶和腺嘌呤更容易发生脱氨基(deamination),从而产生 C>T 和 A>G。
这并不等于氧化损伤在衰老中不重要,而是说:至少在人类血液中,被大规模测序捕捉到的这类年龄相关 mtSNV,更符合复制相关错误,而不是典型氧化损伤。
如果主因是氧化,C>A 应该更突出;但数据里更突出的恰恰是 C>T 和 A>G。
这些突变不是“强者胜出”,更像是“搭便车”
下一步问题是:这些 mtSNV 为什么会在血液中变得可见?一种可能是正选择(positive selection):某些 mtDNA 突变让细胞更容易扩张,于是突变频率升高。
研究人员做了几个检验,结果并不支持这个解释。
首先,年龄相关累积的 mtSNV 大多处于低异质性水平,很多低于 0.2。换句话说,在一个样本的所有 mtDNA 分子中,突变型比例通常并不高。
其次,在亲缘分析中,高异质性 SNV 更像遗传来源:异质性高于 0.2 的 SNV,在兄弟姐妹之间共享的概率超过 75%。但低异质性 SNV 的共享概率低于 30%。作为对照,常见且多为母系遗传的 chrM:302:A:AC,即使异质性低于 0.2,兄弟姐妹共享比例仍超过 60%。这提示:年龄相关的低异质性 mtSNV,多数更可能是体细胞来源,而不是母系遗传。
再次,研究人员比较了错义突变(missense variants)和同义突变(synonymous variants)。如果功能性 mtDNA 突变推动克隆扩张,错义突变应该表现出更强的扩张信号。但数据中,年龄相关突变的链偏倚在错义和同义突变中相似。dN/dS 分析也显示,低异质性年龄相关变异最接近中性;随着异质性升高,dN/dS 下降,提示有害非同义变异在高异质性水平会受到更强的净化选择(purifying selection)。
这是第二个反向检查:如果 mtDNA 突变本身驱动细胞扩张,功能改变更强的错义突变应更突出;但研究看到的是错义和同义突变都随克隆状态增加,且没有强正选择信号。
因此,一个更合理的解释是:这些 mtSNV 多数不是司机(driver),而是乘客(passenger)。
真正把突变推到台前的,是克隆性造血
关键证据来自核基因组关联分析。研究人员以年龄相关 mtSNV 负担为表型,在 547,947 名个体中进行了全基因组关联研究(genome-wide association study, GWAS)。
如果 mtSNV 增加主要由线粒体维护机制控制,关联信号应集中在线粒体复制、修复或稳态相关基因附近。但结果出人意料:显著关联位点包括 TERT、TCL1A、THRB、SMC4、VSIG4 等,其中大多数并不是线粒体蛋白编码基因,而是与克隆性造血有关。
TERT 和 SMC4 是已知与 CH 强相关的位点;TCL1A 也与 DNMT3A、TET2、ASXL1 驱动的 CH 扩张有关。进一步的孟德尔随机化(Mendelian randomization)显示,CH 相关遗传效应与 mtSNV 负担效应呈正相关,P 值为 3.576 × 10−10,支持“CH 增加 mtSNV 负担”的方向。反过来,mtSNV 负担并不支持会增加 CH 风险。
研究人员还识别了 17,504 名携带已知 CH 驱动突变的个体。即使把这些人排除,TERT、TCL1A 等关联信号仍然存在,只是显著性略有下降。这一点很重要:它暗示 mtSNV 负担可能捕捉到了部分“尚未被常规 CH 识别方法发现”的隐匿克隆扩张。
罕见变异关联分析(rare-variant association study, RVAS)也指向同一方向。高 mtSNV 负担与多个经典 CH 驱动基因的预测功能缺失变异和错义变异相关,包括 ASXL1、DNMT3A、TET2、SRSF2、JAK2、CHEK2 等。研究还提出 NEMF 可能是潜在的新候选基因,因为它与高 mtSNV 负担相关,但尚未被明确纳入经典 CH 驱动框架。
TERT 把端粒、mtDNA 和血液克隆连到一起
TERT 是这项研究中很值得停顿思考的基因。它编码端粒酶(telomerase)相关成分,长期以来与端粒长度(telomere length)和衰老生物学有关。
研究中,TERT 位点的 rs7705526 变异在 mtSNV 负担分析中的后验包含概率(posterior inclusion probability, PIP)接近 1,在 mtDNA 拷贝数(mtDNA copy number, mtCN)分析中的 PIP 为 0.39。结合既往 CH 和端粒长度研究,这个遗传变异同时指向四个现象:增加校正后的 mtCN、增加 mtSNV 负担、增加 CH 风险、增加端粒长度。
但有趣的是,表型层面上,mtSNV 负担并没有与端粒长度直接显著相关。研究人员给出的解释是:遗传上更长的端粒可能提高 CH 倾向,而 CH 扩张过程中细胞复制增加,又会消耗端粒长度。于是,在个体表型上,简单相关可能被抵消。
这提醒我们:遗传因果链和横断面相关不是一回事。一个变量可以在遗传层面参与因果路径,却不一定在样本表型中呈现简单线性相关。
血液肿瘤风险:mtSNV 更像标志物,而不是元凶
如果 mtSNV 负担随年龄升高,它是否也预示疾病风险?研究人员在 UKB 中评估了 28 类常见疾病,并排除了曾吸烟者,以减少吸烟混杂。结果显示,mtSNV 负担与血液系统恶性肿瘤(haematologic cancer)的关联最强;慢性肾病(chronic kidney disease)也有较弱但显著的关联。其他常见疾病并没有显示类似强关联。
在更细分的肿瘤表型中,效应量最大的包括骨髓增生异常综合征(myelodysplastic syndrome),其次是多类白血病(leukaemia)相关表型。这与 CH 的已知生物学相吻合:CH 本身就是血液肿瘤风险的重要前状态。
更关键的是,即使去掉已经检测到 CH 的个体,mtSNV 负担与血液系统恶性肿瘤的关联仍然存在,优势比(odds ratio, OR)为 1.27,P = 3.06 × 10−47;在全部样本中,这一关联为 OR = 1.29,P = 2.33 × 10−59。两者非常接近。
这说明 mtSNV 负担可能不是单纯重复已知 CH 信息,而是能补充识别某些隐匿的体细胞克隆状态。
但这里必须谨慎:这并不意味着 mtSNV 是血液肿瘤的病因。结合突变谱、中性选择信号、错义和同义突变的表现,一个更稳妥的判断是:mtSNV 负担是克隆扩张的敏感标志物,而不是主要驱动因素。
一个两步模型:先随机出现,再被克隆扩张放大
把整项研究压缩成一句话,就是:血液中年龄相关 mtDNA 突变的可见性,可能来自“随机生成 + 克隆放大”的两步过程。
第一步单个血细胞中的 mtDNA 在复制过程中随机产生低水平变异。这些变异的异质性很低,多数功能上近似中性,在整体血液样本中低于检测阈值。
第二步某些血细胞获得核基因组体细胞驱动突变,例如 DNMT3A、TET2、ASXL1、JAK2 等相关改变,发生克隆性造血。这个克隆扩张时,并不会只带着核基因组突变扩张,也会把它原本携带的低水平 mtDNA 乘客突变一起放大。于是,原本“看不见”的 mtSNV 变得可检测,并表现为随年龄增加而积累。
这个模型把三个衰老生物学中的重要现象连在了一起:TERT 等常见遗传变异、克隆性造血、以及血液中 mtDNA 突变随年龄增加。
这项研究真正改变了什么?
它改变的不是一个细节,而是一种解释路径。
过去我们容易把“衰老组织中突变变多”理解为“突变导致衰老表型”。这项研究提醒我们,至少在血液中,观察到的 mtDNA 突变增加可能更多反映细胞群体结构的改变:哪些细胞克隆变大了,哪些低水平乘客突变因此被测序技术看见了。
这也解释了为什么 mtSNV 负担可以成为一个有潜力的血液标志物。mtDNA 拷贝数高、突变率高,在常规全基因组测序中往往具有较高覆盖深度,因此对低比例体细胞克隆可能更敏感。它未必告诉我们“这个 mtDNA 突变导致了疾病”,但可能提示“血液里已经出现了某种克隆扩张”。
当然,研究仍有边界。所有核心分析来自 bulk 血液样本,无法直接判断同一个人多个 mtSNV 是否来自同一个克隆,也不能解析单个细胞内的异质性分布。NUMTs,即核基因组中的线粒体DNA同源片段,也可能造成低水平假阳性;研究人员通过过滤策略降低了这一风险,但长读长测序(long-read sequencing)、mtDNA 富集或单细胞联合测序仍会提供更清晰的答案。
当我们看到一个“衰老标志物”随年龄上升时,它究竟是在推动衰老,还是在记录另一个过程留下的痕迹?
在这项研究中,mtDNA 突变更像后者。它们像血液克隆扩张的分子足迹,安静地记录了造血系统随年龄重塑的过程。真正令人兴奋的地方在于:这些足迹或许能帮助我们更早识别隐匿的体细胞嵌合(somatic mosaicism)和克隆性造血,也让我们重新思考衰老研究中的一个基本问题——我们测到的“损伤”,究竟是原因,还是回声?
参考文献