100万年前DNA揭秘美洲猛犸象身世

图片
通讯作者之一的Love Dalén和共同第一作者的PatríciaPečnerová。
由于存在复活的可能,曾经遍布俄罗斯西伯利亚地区的长毛猛犸象一直受到科学家和公众的关注。其实,美洲地区也曾经生活过一种体型更大的哥伦比亚猛犸象。一般认为,哥伦比亚猛犸象比长毛猛犸象早数十万年出现,不过瑞典科学家从距今一百多万年的猛犸象牙齿中成功提取出DNA,并揭开了哥伦比亚猛犸象的身世之谜,该研究成果2021年2月17日在线发表在国际著名学术期刊《自然》上,引起关注。
易降解的古DNA
已有研究表明,猛犸象的祖先最早于500万年前在非洲大陆出现,是现存亚洲象和非洲象的近亲。之后,最早的猛犸象向北半球迁徙,演化出南方猛犸象、草原猛犸象、哥伦比亚猛犸象和大家所熟悉的长毛猛犸象等属于不同物种的猛犸象。目前,所有猛犸象均已灭绝,其中最晚灭绝的长毛猛犸象是在四千年前从丹麦格陵兰岛上彻底消失的。因为西伯利亚地区长年极寒,猛犸象等动物遗骸保存较为完好,从这些遗骸中提取猛犸象DNA,可以解开猛犸象遗传特征、演化历史和灭绝原因等谜团。
不过,从远古生物遗骸中提取DNA并非易事。因为古生物的DNA受到自身或环境微生物的DNA酶、酸、碱、紫外光等影响容易降解,往往从成百上千万个碱基对的长链DNA降解成数百个甚至数十个碱基对的短链DNA片段,而且会混杂环境微生物或其他生物的DNA。要想将这些短链DNA提取出来测序,并拼接成猛犸象的长链DNA,就如同将约10亿个字的《四库全书》全部分拆成几十个字不等的短句,然后让从没有读过它的人将其复原,其难度可想而知。
在此之前,最古老的完整基因组DNA记录属于约70万年前的普氏原羚马。据2013年7月《自然》杂志报道,丹麦等国的科学家从2003年加拿大育空地区出土的马脚掌骨化石中成功提取出DNA,并获得了1.15倍的基因组DNA序列。年代测定显示该马骨化石年代为距今56万-78万年。通过这些古马基因组DNA序列信息分析,研究人员认为马、斑马、驴等马属动物的共同祖先可追溯到400万-450万年前,比目前广泛认为的年代增加了一倍。相比而言,其他古DNA的年代就要晚得多,例如德国马克斯·普朗克进化人类学研究所的研究人员先后在2005年和2010年分别获得距今约4.3万年的洞熊基因组DNA序列和距今约3.8万年的尼安德特人基因组DNA序列,洞熊和尼安德特人均是在距今约2.4万年前灭绝的。
最古老的基因组诞生
此前,最古老的猛犸象基因组DNA记录也只有数万年的历史。2008年,美国宾夕法尼亚州立大学等机构的研究人员从距今约2万年的长毛猛犸象遗骸中分离出DNA并测序,首次拼接出基因组级别的猛犸象DNA序列。该基因组DNA序列总长度约为4.17Gb(Gb为10亿个碱基对),经与非洲象的基因组比对,确定这些超过4Gb的DNA序列约有80%是属于长毛猛犸象的。2015年,瑞典国家自然历史博物馆洛夫·达伦(Love Dalén)博士领导的一个国际研究团队从猛犸象样品中获得两个猛犸象高质量完整基因组DNA序列,一个来自4300年前的猛犸象,该基因组序列为猛犸象参考基因组序列的17倍,另一个来自距今4.5万年前的猛犸象遗骸,该基因组序列为猛犸象参考基因组序列的11倍。这些从猛犸象遗骸中获得的基因组信息为科学家研究猛犸象的演化历史、灭绝原因等科学问题提供了良好素材。不过鉴于猛犸象有数百万年的演化历史,要使相关科学问题研究得更准确,还需要找到更古老的基因组DNA。
洛夫·达伦博士领导的科研团队一直在古生物基因组DNA研究上不断努力,最近又取得重大突破。从2017年开始,瑞典国家自然历史博物馆和瑞典古遗传学中心的洛夫·达伦等人联合丹麦、德国、英国、美国、俄罗斯、中国等国家的科学家,成功从20世纪70年代俄罗斯西伯利亚东北部地区出土的三块猛犸象臼齿遗骸中提取了DNA。其中最古老的样本来自名为克雷斯托夫卡(Krestovka)的猛犸象臼齿化石,其年代约为165万年前,另外两个样本阿迪查(Adycha)和楚科奇亚(Chukochya)的年代测定值分别约为134万年前和87万年前。
研究人员采取严格的古生物DNA提取方法,以避免环境微生物以及人类DNA的污染。首先将提取出的DNA构建成双链或单链DNA文库,然后对最短为25碱基对的DNA进行测序。提取DNA和测序只是该项研究的第一步,最关键的步骤是排除非猛犸象DNA序列,以及将短DNA序列拼接成属于猛犸象的长DNA序列。
为了排除非猛犸象DNA序列的污染,研究人员一方面在采样和提取DNA过程中做好防护,如实验人员会穿上类似新冠病毒防护服的衣服进行采样和DNA操作,尽量避免外源DNA的污染,另一方面则与已知微生物基因组和人类基因组序列进行全面比对,以排除非猛犸象的DNA序列,这都有赖于计算机的帮助。
同样地,在经过专门编制的计算机程序数周的比对和拼接,并参考之前测序完成的猛犸象基因组序列,研究人员成功将短至35个碱基对的猛犸象短DNA序列拼接起来,最后得到了克雷斯托夫卡、阿迪查和楚科奇亚三个样本的核基因组DNA序列分别为4900万、8.84亿和36.71亿个碱基对。显然年代越久远,基因组DNA完整性越差。由于克雷斯托夫卡和阿迪查两个样本的年代都在100万年以上,因此这也是迄今为止科学家获得的最古老基因组DNA序列。该研究成果在线发表在2021年2月17日《自然》杂志上,洛夫·达伦博士为该论文的通讯作者之一。
几乎在同时,诺丁汉特伦特大学的阿克塞尔·巴罗(Axel Barlow)领导的国际研究小组从一块距今约36万年的洞熊头骨内耳化石中分离出DNA并进行测序,采取类似瑞典团队的方法,最后拼接出低覆盖率的洞熊基因组DNA。通过遗传分析,研究人员发现洞熊是在距今150万年前从与棕熊和北极熊的共同祖先中演化出来的,而且洞熊与棕熊可以相互杂交,现存的棕熊基因组中还残留有洞熊的遗传痕迹。该研究于2021年2月15日发表在《当代生物学》杂志上。
图片
三块猛犸象臼齿化石。
哥伦比亚猛犸象的身世
如此古老的基因组DNA有什么重要用途呢?最主要的用途当然是与已获得古生物基因组或现存大象的基因组进行遗传分析,以研究古生物的起源、演化历史、灭绝原因以及物种特征等。
在破译这些猛犸象遗骸基因组DNA信息之后,洛夫·达伦博士团队的研究人员利用这些猛犸象的DNA序列进行系统发生分析,发现阿迪查和楚科奇亚两个样本属于长毛猛犸象的直系祖先,而更古老的克雷斯托夫卡样本则属于一种未知的猛犸象物种,该物种可能是在266万年-178万年前演化出来的。该研究证实,猛犸象在150万年前就已在美洲出现,美洲猛犸象源自欧亚草原猛犸象,而非南方猛犸象的后裔。
进一步分析发现,美洲地区之前曾经生活过至少两种猛犸象,一种是北美长毛猛犸象,一种是哥伦比亚猛犸象,而哥伦比亚猛犸象则是克雷斯托夫卡样本所属的猛犸象与长毛猛犸象杂交后代形成的物种,而且长毛猛犸象的遗传贡献更大一些。研究人员推测,13000年前灭绝的哥伦比亚猛犸象是42万年前演化形成的,而且哥伦比亚猛犸象至少经历了两次混杂事件,在第一次混杂事件中,克雷斯托夫卡猛犸象与长毛猛犸象的血统各占约50%,而第二次混杂事件则由北美的长毛猛犸象贡献了约12%的血统。
另外,研究人员还发现,与长毛猛犸象的毛发生长、昼夜节律、温度感知以及脂肪沉积等相关的大多数蛋白质编码变化,在100万年前的猛犸象样本中即已出现,即长毛猛犸象与寒冷环境相适应的特征早在物种形成之前就已经积累下来,而并非是在寒冷环境中适应性进化的产物。
这项研究无疑为古生物学研究树立了新的灯塔,预计将有更多的古生物基因组DNA被发现,用以揭示古生物物种形成与演化的更多谜团。甚至还会出现更古老的古生物DNA,因为从理论上讲,研究人员有可能从260万年前的样本中获得DNA信息。
南方周末特约撰稿 汤波