【Cell子刊】人类基因组的秘密:8,222个基因组中的VNTR基序多态性全解析

图片

【导读】变数串联重复(VNTR)是一种普遍存在且高度易变的遗传特征,其长度和重复序列都各不相同。尽管拷贝数变异研究得很好,但重复序列多态性对功能的影响仍然未知。在这项研究中,团队展示了迄今为止最大的全基因组VNTR多态性图谱,在8,222个高覆盖基因组中检测到250多万个VNTR长度多态性(VNTR-LPs)和1,100多万个VNTR主题多态性(VNTR-MPs)。

2024年11月27日,中国科学院生物物理所何顺民教授团队在期刊《Cell Genomics》上发表了题为“Genome-wide investigation of VNTR motif polymorphisms in 8,222 genomes: Implications for biological regulation and human traits”的研究论文。利用大规模的NyuWa队列,团队发现了2,982,456个(31.8%)NyuWa特异性VNTR-MPs,其中95.3%为罕见。此外,在38,685个VNTR中,团队发现了1,937个VNTR通过淋巴母细胞系中的VNTR-MPs与基因表达相关。团队还探讨了VNTR多态性对表型分化和疾病易感性的潜在影响。

图片

https://www.cell.com/cell-genomics/fulltext/S2666-979X(24)00328-8

关于VNTR

 01 

可变数目串联重复序列(VNTR)是以重复模式为特征的连续DNA,通常跨度为7到100个碱基对。然而,“缺失遗传率 ”问题仍是一个重要问题,SNPs无法完全阐明这一问题,但VNTR多态性可部分归因于此。例如,Mukamel等人分析了415,280名英国生物库参与者的118个改变蛋白质的VNTR,发现常见的VNTR变异与人类身高、毛发形态和健康生物标志物有显著关联。他们还研究了418,136名英国生物库参与者的9,561个常染色体VNTR位点,发现位于TMCO1和EIF3H的两个非编码VNTR与青光眼和结直肠癌风险有显著关系。


在这项研究中,团队构建了一个包含38,685个全基因组VNTR和916,938个VNTR主题的变异图谱,横跨8,222个基因组,其中包括4,126个中国个体(∼30.5×,NyuWa)和4,096个多种族个体(∼33×,1KGP 和人类基因组多样性项目 [HGDP])。团队发现,839,211个(34.8%)VNTR-LPs和2,982,456个(31.8%)VNTR-MPs是NyuWa群体特有的。其中,74.4%的VNTR-LPs和95.3%的VNTR-MPs被归类为罕见。团队阐明了特定VNTR基因在基因表达中的调控作用,还发现了在不同大陆人群中长度和图案组成存在显著差异的VNTR,评估了它们对不同人群表型分化和疾病发生的影响。

图片

图形摘要

超变异VNTR主题与人类性状的相关性

 02 

团队利用变异系数(CV)来识别每个超种群的超变异基因组(STAR方法),并识别出180,177个在所有超种群中都具有高变异剂量的基因组。基因本体(Gene Ontology,GO)富集分析表明,包围这些图案的基因在神经元发育和突触传递中起着关键作用。同样,这些基因对那些主要在大脑皮层中表达的基因显示出显著的富集作用。这些结果表明,高度可变的VNTR参与了人类各种神经表型的研究。FADS2和TCF25外显子中的两个VNTR,在不同人群中具有显著差异。非洲人VNTR FADS2的总长度,明显长于其他人群。鉴于非洲血统与其他血统相比,一直与较高的血清IgA水平相关 ,这表明VNTR FADS2的扩展可能参与了非洲人IgA水平的调节。与棕色/黑色发色相关的GWAS目录SNPs,标记了TCF25外显子中的另一个VNTR。该VNTR在东亚人中的长度明显长于其他人群,这意味着它对东亚人发色的形成有潜在影响。

图片

 与人类表型相关的超群内的超变异VNTR主题

HSE VNTR与疾病的相关性

 03 

除了在分析中发现了Course等人报告的VNTR DYNC2I1外,团队还发现了与RPH3AL和VIPR2基因相关的两个新的异常值。超过一半的非裔美国人表现出RPH3AL的杂合性缺失,这与非裔美国人结肠直肠腺癌患者的存活率低有关。非洲人的VNTR RPH3AL长度,短于所有其他人群。同样,该基因位点的重复图案频率在不同的超级人群中也存在差异,与其他超级人群相比,非洲人的重复图案频率明显不足。这一观察结果表明,RPH3AL中的VNTR可能与肿瘤进展有关。团队在VIPR2基因附近发现了另一个VNTR,与其他血统的人相比,东亚人的VNTR长度明显较短,图案频率也较低。据报道,VIPR2的功能缺失可能会损害双极细胞的功能,并与中国汉族队列中的高度近视相关。

图片

  5个超级种群中360个人类特异性扩展VNTR的长度比较

总结

 04 

1. NyuWa基因组资源价值:团队发现31.8%的VNTR-MPs为NyuWa独有,其中95.3%为罕见变异,显示了NyuWa基因组资源在发现人类罕见变异方面的重要价值。


2. VNTR与基因表达关联:通过整合Geuvasis项目的RNA-seq数据,团队发现了影响基因表达的VNTR,并评估了这些VNTR的功能影响,发现它们富集在调控元件、可访问的染色质区域和保守区域。


3. 新型VNTR基序发现:在基因MAD1L1中发现了一个可能与基因表达有关的新型VNTR基序,并通过生物实验验证了其功能。


4. 人群分层与VNTR多态性:利用多种族数据实现了有效的人群分层,并发现了各大洲人群中长度和图案组成存在显著差异的VNTR。


5. VNTR与疾病易感性:团队生成了包括外显子VNTR和HSE VNTR的数据,以研究VNTR多态性对不同人群表型分化和疾病易感性的潜在影响,并发现了4个重要的风险VNTR,包括其与IgA水平、头发颜色、结直肠腺癌和高度近视的关系。


参考资料:


1.Vergnaud, G. ∙ Denoeud, F.

Minisatellites: mutability and genome architecture

Genome Res. 2000; 10:899-907


2.Sulovari, A. ∙ Li, R. ∙ Audano, P.A. ..., Human Genome Structural Variation Consortium

Human-specific tandem repeat expansion and differential gene expression during primate evolution

Proc. Natl. Acad. Sci. USA. 2019; 116:23243-23253


【关于投稿】

转化医学网(360zhyx.com)是转化医学核心门户,旨在推动基础研究、临床诊疗和产业的发展,核心内容涵盖组学、检验、免疫、肿瘤、心血管、糖尿病等。如您有最新的研究内容发表,欢迎联系我们进行免费报道(公众号菜单栏-在线客服联系),我们的理念:内容创造价值,转化铸就未来!

转化医学网(360zhyx.com)发布的文章旨在介绍前沿医学研究进展,不能作为治疗方案使用;如需获得健康指导,请至正规医院就诊。