研发“基因组之铲”,中国科学家解析迄今最完整小鼠基因组图谱

图片
论文截图

基因测序技术发展至今已有近半个世纪,但能够看清基因组全貌,却是在近两年刚实现。昨天,国际知名学术期刊《科学》在线发表了来自中国科学家团队的最新成果:人类在历史上第一次看清了小鼠基因组DNA全貌。

由于实验小鼠在生命科学、生物医药研发的实验中扮演重要角色,这一解析小鼠参考基因组方面的重要突破,也将为人类健康的探索带来新的工具。

破解基因区域“剩余的8%”

其实,首个被看清全貌的是人类基因组。2022年3月底,《科学》杂志报道了国际科学团队“端粒到端粒联盟”完成首个完整的、无间隙的人类基因组序列的成果。这填补了2003年“人类基因组计划”遗留下的8%尚未读取的基因区域。

彼时,西湖大学生命科学学院、西湖实验室俞晓春教授团队在关注到这一新闻后,感到无比振奋,因为他们日常打交道的小鼠身上也存在约7%—8%未被解析的基因区域。

俞晓春实验室助理研究员李麒麟解释,小鼠是生命科学研究中最常见的实验动物,它们的基因组信息直接关系到人类健康的探索,“小鼠基因组中的未知区域,或许就潜藏着人类难以破解的遗传性疾病之谜”。

自从弗雷德里克·桑格于1977年发明了第一代测序技术以来,基因测序技术读取DNA片段的本领不断增强,但直到2010年左右诞生的第三代测序技术,才实现了对每一条DNA分子的单独测序。这也为科学家破解完整的人类基因组图谱的进程按下加速键。

既然人类的“基因拼图”已完成,想必小鼠的“拼图”也胜利在望了?可是,令人意外的是,欧美实验室直到2023年也没动静。于是,俞晓春实验室决定自己动手拼完这幅小鼠基因组“拼图”。

最终目标是攻克人类顽疾

通过综合众多三代基因测序技术,俞晓春团队开发出了一把能够充分挖掘小鼠基因的“金铲子”,由此获得了长度为2.77Gbp(Gbp表示十亿个碱基对)的完整、高质量小鼠参考基因组序列,其中包含先前未被鉴定的序列,填补了约7.7%的基因组空白。

与先前的参考基因组版本相比,俞晓春团队额外注释了639个蛋白质编码基因,其中全新的蛋白质编码基因有140个。这些新发现的蛋白质编码基因可能参与多种生物学过程,为未来的研究提供了新的方向。

研究组还较精确地“看清”了核糖体DNA的基因序列,为进一步解析核糖体潜在的蛋白质翻译功能的差异性提供了参考。俞晓春解释,核糖体是细胞内的“蛋白质工厂”,负责合成蛋白质。核糖体DNA是细胞中的一种特殊DNA,它专门负责编码核糖体的RNA(rRNA)——一种核糖体的重要组成部分,帮助核糖体合成蛋白。用简洁的比拟来说,核糖体DNA给出了细胞内rRNA的“蓝图”。这个发现为进一步解析核糖体潜在的蛋白质翻译功能的差异性提供参考。

此外,研究组解析了着丝粒区域的基因序列详情,对着丝粒区域的解析,有助于理解因着丝粒功能缺陷导致的染色体重排、非整倍性等相关疾病的发病机制。这些发现不仅提高了对小鼠基因组结构和功能的理解,也为基因组学研究提供了重要的技术参考和数据资源。

成功完成了小鼠基因组的端粒到端粒组装,填补了现有参考基因组中的空白区域,揭示出新的基因和结构变异,俞晓春认为,这仅仅是迈出了第一步,最终目标是为了助力攻克人类顽疾。他们希望借助这把“基因组之铲”,深入探索遗传性癌症、发育性疾病未解的致病机理。

  作者:刘琦

文:刘琦图:受访者提供编辑:刘琦责任编辑:许琦敏

转载此文请注明出处。