古DNA改写选择研究
自从科学家从古人类遗骸中获取了全基因组数据以来,古DNA研究就不断拓展着我们对不同时代、不同地区的人群之间关系的理解。
但遗传学家始终难以真正实现这项技术中的一重潜力:阐明自然选择在过去一万年间是如何塑造人类的遗传变异的——即便这一时期已经有足够多保存良好的遗传材料可用于大规模研究。
截止到2024年,对古人类DNA的研究只识别出大约21个定向选择的例子。所谓定向选择,指的是一种自然选择,它发生在当某个基因版本能赋予某种性状的极端形式,而这一版本对生存和繁殖足够有利时,它就会比不那么有利的基因版本传递给更多后代,并在群体中迅速提高频率。
证据的匮乏曾让科学家们曾经认为,自从约30万年前现代人类在非洲出现并开始分化为世界各地不同人群以来,定向选择一直相当稀有。
现在,在一项新发表于《自然》杂志的研究中,一个研究团队针对欧亚大陆西部、跨越一万多年、近1.6万人的古DNA进行了研究。这项新分析将空前规模的古基因组数据与新的计算方法结合起来,结果表明:自冰期结束以来,定向选择推动了欧亚大陆西部(如今的欧洲和中东部分地区)的数百种基因变异体的扩散或减少;而且,自从人类从狩猎采集转向农业之后,这种选择实际上还加快了。
1万个古基因组与新方法
在新的研究中,研究人员利用两项创新实现了突破:
首先,研究人员用七年时间,建立起一个来自欧亚大陆西部的古人类DNA序列库,其规模和时间跨度都足以支撑这项研究。
他们与250多位考古学家和人类学家合作,发布了来自欧亚大陆西部的10,016名古人类个体的新DNA数据,并将这与另外5,820份已发表的古人类基因序列和6,438份现代人的基因序列结合起来进行分析。
这样的数据让古人类DNA的规模在文献中翻了一倍,有针对性地填补此前研究中的空白——而正是这些空白限制了以往研究检测自然选择的能力。
新研究所分析的古人类与近现代人类的DNA样本来源区域。所涵盖的国家北起冰岛和俄罗斯,南至西班牙和伊朗。(图/Akbari A et al. / Nature)
第二项创新是研究人员开发出了一套强大的计算方法,用来把定向选择的信号,从其他导致基因频率变化的因素(如人类迁徙、群体混合,以及小群体中出现的随机遗传波动)中分离出来,进而能让研究人员聚焦到那些真正重要的模式上。
最终,他们检测到的确实是一个非常微弱的信号。按照团队的计算,定向选择仅占所有基因频率变化的大约2%。
自然选择究竟选择了什么
不过,这是不容忽视的2%——它仍然对应着大量DNA。研究人员在欧亚大陆西部人群的基因组中识别出479个受到强烈正向选择或负向选择的基因版本,也就是等位基因。
他们确定了其中一些等位基因是在何时、何地开始在欧亚大陆西部基因库中扩散,或被逐渐清除出去的。并且还计算了一个总体的选择频率,并检测到了这一频率的变化。结果显示,在农业出现之后,选择加速了,这反映出随着人类转向农业环境和生活方式时,不同性状开始变得更有优势。
在这些被标记为受到强烈选择的单个DNA变异体中,超过60%被标记为强选择的个体DNA变异体(其中大多数是单核苷酸多态性,即SNP),都已经被证实与当代人类性状有关,例如:
较浅的肤色,
红发,
乳糜泻和克罗恩病的患病风险,
对HIV感染的免疫力以及对麻风病的抵抗力,
更低的男性型脱发率,
更低的类风湿关节炎和酒精依赖风险,
红细胞表面携带决定A、B、O血型并影响对细菌和病毒感染抵抗力的B 型蛋白版本。
在某些情况下,同一组的SNP会共同受到选择,从而影响多基因性状。有些变化提高了有利性状的频率,其中包括一些如今被解释为:
与“健康寿命”相关性状,如更快的步行速度,
行为和社会地位或认知功能的指标,如智力测试得分、家庭收入和受教育年限。
还有一些变化则降低了有害性状的频率,比如它们如今被解释为:
更低的双相障碍和精神分裂症风险,
更低的体脂率、腰臀比和体重指数,
更低的吸烟易感性。
团队还发现,还有一些SNP在几千年间的频率会先上升后下降,这表明环境压力,以及什么样的性状会被证明是有利的,都是会发生变化的。
这些关联有些看起来合乎逻辑,有些则显得违反直觉。比如,在人类开始种植小麦之后,与麸质不耐受相关的主要遗传风险因素反而显著增加了。
需要谨慎解读的结果
但研究人员指出,在解读这类SNP关联之前,有几个关键问题必须先弄清楚。
第一:某个变异体今天与什么性状相关,并不等于它当初为什么会在欧亚大陆西部的基因库中扩散。
第二:某个等位基因、SNP或性状在这一时期进入或退出欧亚大陆西部,并不意味着这种事只发生在欧亚大陆西部。研究人员可以利用这套新的计算方法,在全球其他拥有足够古代DNA序列的人群中寻找定向选择,从而更清楚地区分:哪些是不同群体各自独有的,哪些则是跨群体普遍存在的规律。
他们预计,未来的研究将显示:尽管不同人群在数万年间不断分化并迁徙到世界各地,但某些共同的选择压力,仍然作用在一些相同的核心性状上。
接下来还能发现什么
这项工作展示了古DNA研究在揭示人类遗传适应性以及进化生物学的其他基本原理方面的强大力量。现在,研究团队已经将数据和方法免费公开,以推动新的研究。
一个后续方向是继续挖掘数据中其他可能存在的信号。研究人员表示,他们已经识别出超过7600个遗传位点,这些位点有超过一半的概率是真实的定向选择实例,因此值得进一步跟进研究。
而最令人兴奋的方向,是用这套新方法去研究其他人群,以及更早时期的数据。他们想要探究,究竟能在多大程度上,在东亚、东非,或者中美洲与安第斯中部的美洲原住民中看到类似的模式?
对科学家来说,开展分子层面的研究、以更好理解这些被选择的等位基因会带来哪些健康后果,也将至关重要。这些结果或许有助于发现与健康和疾病有关的新遗传因素,从而提升评估疾病风险、预防疾病和开发新药的能力。
此外,科学家也可以利用这套新方法研究其他物种中的自然选择。这些都是十分令人期待的可能性,因为它们或将加深我们对人类多样性、历史与健康的理解。