Nature Genetics | 阿尔茨海默病的遗传拼图,又多了16块

问AI · 为何遗传风险主要指向tau缠结而非血管病变?

引言

为什么同样进入老年,有些人的大脑逐渐积累tau缠结和淀粉样斑块,有些人却相对“躲开”了这条路径?如果把阿尔茨海默病(Alzheimer’s disease, AD)理解为一种临床诊断,我们可能只看到记忆衰退的终点;但如果把它放回基因、病理和人群数据之间,它更像是一组长期积累的风险轨迹。

6月3日,《Nature Genetics》的研究报道“Consensus meta-analysis of genome-wide association studies for Alzheimer’s disease and related dementias”,把多个大型联盟的数据重新“对齐”,完成了一项AD及相关痴呆(AD and related dementias, ADRD)的全基因组关联研究(genome-wide association study, GWAS)共识荟萃分析(meta-analysis)。
这项研究纳入128,681例ADRD病例或代理病例(proxy cases),以及849,833名对照或代理对照,最终识别出91个与ADRD风险相关的遗传位点,其中16个是在欧洲 ancestry 样本中新的位点。更重要的是,研究人员没有停在“又找到一些基因”这一层,而是继续追问:这些遗传信号,究竟更像AD,还是更像“痴呆”这个混合标签?
图片

最大的难题,不是找信号,而是确认信号来自哪里

AD遗传学研究的一大矛盾在于:样本越大,统计效能越强;但病例定义越宽,信号也越容易混杂。大型生物样本库常用国际疾病分类编码(International Classification of Diseases codes)识别病例,也会纳入“父母或兄弟姐妹患有痴呆”的代理病例。这能扩大样本,却可能把AD、路易体痴呆(Lewy body dementia)、血管性痴呆(vascular dementia)等不同病理背景在一起。

这项研究的处理方式值得注意。主分析纳入52项研究,其中包括72,721例AD病例、55,960例代理ADRD病例、614,267名对照和235,566名代理对照,粗略有效样本量为230,631。经过质控后,研究人员分析了20,045,120个遗传变异。这样的规模足以让许多小效应变异浮出水面,但研究人员又做了两类敏感性分析:一类去除代理病例,另一类进一步去除使用诊断编码的大型生物样本库,尽量聚焦临床诊断 AD。

结果很有意思。91个一级(tier 1)全基因组显著(genome-wide significant, GWS)位点中,75个在去除代理病例后仍达到显著,占82.4%56个在去除大型生物样本库后仍与临床诊断AD相关,占61.5%。换句话说,大多数信号并不是完全由宽泛病例定义“堆”出来的,但也有相当一部分信号需要在更严格的AD样本中继续验证。

这正是遗传学研究中常被忽略的问题:样本量不是唯一答案。一个位点能否被发现,取决于统计效能;但一个位点究竟代表AD病理、混合痴呆风险,还是病例定义的偏差,则需要更细的拆解。

91个位点:不是名单变长,而是路径变清楚

这项研究识别出91个一级位点,其中16个为新的欧洲 ancestry 样本位点,包括EIF4G3、PTPRC、MGAT5、PPP2R3A、ADGRL3、FAM193B、TMEM184A、DOCK4、IPMK、UBFD1、VMAC、VAV1、LRRC25、CEP89、LILRB1/LILRB4和SRC。除此之外,研究人员还提出18个二级(tier 2)位点,其中15个为新位点,但这些信号需要外部验证。

为什么要区分tier 1和tier 2?因为统计显著并不总等于稳健。一级位点不仅在无条件分析中达到P≤5×10-8,还需要在条件分析(conditional analysis)中维持足够强的信号;二级位点则可能在某些分析中显著,但在条件分析后减弱,或只在敏感性分析中出现。因此,它们更像是“值得追踪的线索”,而不是已经稳固的结论。

研究还发现25个独立次级信号(secondary signals),分布在16个位点中。CD33、HLA、PICALM和RHOH等位点出现新的独立关联信号;ABCA7、BIN1、PTK2B/CLU、NCK2和PLCG2等已知位点中也发现额外信号。这意味着,一个“位点”并不一定只有一个遗传故事。某些区域可能包含多个独立变异,分别影响不同基因或不同调控环节。

如果我们把GWAS结果只看作“基因名单”,就会错过更重要的信息。真正有价值的是,哪些信号在严格AD诊断中仍然存在,哪些信号与脑内病理对应,哪些信号可能只是宽泛痴呆表型的投影。

小胶质细胞再次站到台前,但故事不止免疫

这项研究与既往AD遗传学结果相呼应:关联信号富集在tau、淀粉样蛋白(amyloid)、脂质(lipids)、免疫(immunity)以及内体/溶酶体(endosome/lysosome)相关通路中。基因表达层面,这些信号相关基因在多个脑区数据集中表现出小胶质细胞(microglia)过表达富集

这并不等于“AD就是免疫病”。更稳妥的理解是:小胶质细胞相关通路反复出现在AD遗传风险中,提示脑内免疫、清除、脂质处理和蛋白聚集之间可能存在长期耦合。比如TREM2、PLCG2、INPP5D等已知免疫相关位点早已提示这一方向;新发现的PTPRC、VAV1、LRRC25、LILRB1/LILRB4等,也让免疫调节这条线索更值得深入。

但研究还提示另一层复杂性。C16orf95位点与脑脊液(cerebrospinal fluid, CSF)磷酸化tau(phosphorylated tau)水平以及脑室体积相关。这种跨表型线索说明,一些尚待验证的位点可能并不是噪音,而是现有样本量下刚刚露头的真实生物信号。

更少见、但更值得追踪的是罕见变异(rare variants)。在主要或次级一级信号的索引变异(index variants)中,只有7个为罕见变异,涉及SORT1、NCK2、ADGRL3、TREM2、PLCG2和ABCA7等位点。研究人员还在SRC基因中观察到,功能缺失变异(loss-of-function variants)和预测损伤性错义变异(missense variants)联合与AD风险相关,优势比(odds ratio, OR)为4.23,95%置信区间(confidence interval, CI)为2.04–8.79,P值为1.06×10-4。这个结果的方向很吸引人,但它来自基因负担分析,需要测序数据和功能实验继续确认。

APOE之外,遗传风险到底指向哪种脑病理?

APOE是AD遗传风险中最醒目的信号,但也正因为它太强,容易遮住其他位点的贡献。这项研究构建了排除APOE的多基因评分(polygenic score, PGS),并放到一个更严格的问题中检验:这个评分是否真的对应AD相关脑病理,而不是泛泛的痴呆风险?

研究人员分析了11类神经病理内表型(neuropathology endophenotypes, NPEs),包括三类AD相关病理:Braak神经原纤维缠结分期(Braak neurofibrillary tangles stage)、β淀粉样斑块(amyloid-β plaques)和CERAD神经炎性淀粉样斑块评分(CERAD score for neuritic amyloid plaques);五类脑血管病理(cerebrovascular NPEs);以及LATE-NC、路易体(Lewy bodies)和海马硬化(hippocampal sclerosis)三类非AD病理。

数据来自两个尸检队列:Adult Changes in Thought (ACT)队列有677例,其中12.9%有痴呆;ADC/NACC数据集有5,808例,其中82.7%有痴呆。在ADC/NACC中,主PGS与三类AD相关病理以及LATE-NC显著相关;但在进一步调整AD相关病理后,仍保持显著的主要是Braak分期和CERAD评分。相反,这些PGS没有与脑血管病理、海马硬化或路易体达到显著关联。

这条结果很关键。它提示,排除APOE后,ADRD遗传位点组合出来的风险评分,主要仍指向AD相关病理,而不是所有痴呆病理的混合风险。当然,这不是最终定论。LATE-NC与AD病理常共同出现,样本量和诊断误差也可能影响结果。研究人员对此保持谨慎,认为更大的、病理表征更清楚的样本仍然必要。

两倍风险听起来很大,但别把PGS当成命运判决

最容易被传播的数字,是“高PGS人群风险约翻倍”。具体来看,在ADC/NACC数据集中,以PGS中位五分位作为参考,主PGS位于最高十分位的人,死亡时Braak分期>4的风险增加2.05倍(95% CI为1.47–2.85);出现中重度神经炎性淀粉样斑块病理的风险增加1.96倍(95% CI为1.39–2.78)。相反,PGS最低十分位的人,Braak分期>4的风险降至0.47倍,中重度斑块病理风险降至0.43倍

这些数字说明,APOE之外的常见遗传变异组合确实能捕捉到一部分AD病理风险。但同一组结果也提醒我们:PGS不是预言书。加入PGS后,模型对Braak分期和CERAD评分的区分能力确有显著改善;然而解释度仍然有限。Nagelkerke伪R平方分别只有3.98%4.37%;换算到责任度量表(liability scale)后,Braak分期解释度约为2.43%–3.6%,CERAD评分约为3.32%–4.93%。

也就是说,PGS能把人群风险分层做得更细,但远不足以单独预测一个人的大脑未来。年龄、APOE、生活方式、血管风险、共病、环境暴露,以及我们尚未理解的分子事件,都会继续参与这场漫长的过程。

真正的价值,是把“AD”拆回可验证的机制

这项研究最有价值的地方,不只是把ADRD相关位点扩展到91个,也不只是新增16个欧洲 ancestry 样本位点,而是提出了一套更严格的读法:先用大样本发现信号,再用去代理病例、去生物样本库的敏感性分析检验信号是否仍指向临床AD;再用尸检病理数据追问,遗传风险到底对应tau缠结、淀粉样斑块,还是其他非AD病理。

这项研究对未来科学探索带来了直接的启发:

第一,病例定义会越来越重要。随着代理病例和生物样本库病例在GWAS中占比上升,研究人员必须反复确认信号是否仍适用于临床诊断AD。

第二,病理终点会越来越重要。临床“痴呆”只是结果,Braak分期、CERAD评分、淀粉样斑块、LATE-NC和脑血管病理才更接近疾病过程本身。

第三,稀有损伤变异和结构变异(structural variants)可能帮助我们从统计关联走向机制验证,尤其是在SRC、ABCA7、TREM2、PLCG2等值得追踪的区域。

这项研究,最值得思考的问题或许是:我们到底想用遗传学回答什么?如果只是问“谁风险更高”,PGS会给出一个不完整但有用的分层工具;如果问“AD为什么发生”,这些位点更像通向免疫、脂质代谢、蛋白清除、tau与淀粉样病理的路标。

AD不是一个单基因故事,也不是一个单通路故事。它更像是在几十年时间里,由许多小效应遗传因素、少数较大效应罕见变异、脑内细胞状态和全身风险共同推动的病理过程。新的91个位点告诉我们:拼图正在变清晰,但每一块拼图真正指向哪条机制,还需要更严格的样本、更深的测序和更接近病理本身的验证。



参考文献


EADB., EADI., Bonn. et al. Consensus meta-analysis of genome-wide association studies for Alzheimer’s disease and related dementias. Nat Genet (2026).