2024 年10 月 7 日北京时间 17 时 30 分许,两位美国科学家维克托·安布罗斯(Victor R. Ambros)和加里·鲁夫昆(Gary Ruvkun)因发现微 RNA (microRNA)及其在转录后基因调控中的作用,获得 2024 年诺贝尔生理学或医学奖。
维克托·安布罗斯是美国发育生物学家,马萨诸塞州大学医学院教授。安布罗斯 1953 年出生于美国新罕布什尔州,1975 年在麻省理工学院获得学士学位,其后师从诺奖得主戴维·巴尔的摩,在麻省理工学院获得博士学位。
加里·鲁夫昆是美国分子生物学家、哈佛大学及麻省总医院遗传学教授。鲁夫昆1952 年出生于美国加利福尼亚州,1973 年在加利福尼亚大学伯克利分校获得学士学位,1982 年在哈佛大学获得博士学位。
20 世纪 80 年代末,安布罗斯和鲁夫昆同在麻省理工学院罗伯特·霍维茨(Robert Horvitz)的实验室担任博士后研究员(霍维茨是2002年诺贝尔生理学与医学奖得主之一)。在霍维茨的实验室里,两位年轻的科学家开始研究一种不起眼的小蠕虫——秀丽隐杆线虫,这将为他们打开一扇通往基因调控领域的新大门,为其今天获得诺贝尔奖的工作奠定基础。
我们染色体中储存的信息是身体内所有细胞的一本“说明手册”。每个细胞都含有相同的染色体,因此每个细胞都包含完全相同的基因集合和指令集合。然而,不同类型的细胞——如肌肉细胞、心脏细胞和神经细胞——大不相同,它们都具有自己独有的特征。
这些差异是如何产生的?答案在于基因调控。如果说生命是一出交响乐,基因调控便是指挥棒、是节拍器,它允许每种细胞只选择与自己相关的指令。
2024 年诺贝尔生理学或医学奖得主维克托·安布罗斯和加里·鲁夫昆,对不同类型的细胞的发育过程充满兴趣。他们发现了微 RNA——一类新型的小 RNA 分子——在基因调控中发挥的关键作用。这一研究揭示了一种全新的基因调控原理,对于包括人类在内的多细胞生物至关重要。人们一开始对发生在转录后的基因调控颇感意外,但这一发现将基因调控领域的研究扩展到了一个全新维度:蛋白质在细胞核中调控 RNA 的转录和剪接,而微 RNA 则在细胞质中控制 mRNA 的翻译和降解。
微 RNA 及其在转录后基因调控中的作用
多细胞生物从单细胞生物祖先演化而来时,其体内每种细胞类型都会获得专门的功能,因此需要越来越复杂的基因调控机制。除了作用于调控序列的 DNA 结合因子介导的转录水平的基因调控外,随着复杂生物的演化,其他形式的控制系统也逐渐出现。在数亿年的时间里,编码微 RNA 的基因在多细胞生物的基因组中逐渐发展,以在 mRNA 稳定性和蛋白质翻译水平上发挥转录后调控作用。
不过直到 1993 年,维克托·安布罗斯和加里·鲁夫昆发现了微 RNA 及其基因调控方式,这些才完全为人所知。2024 年的两位诺贝尔奖得主研究了因 lin-4 和 lin-14 遗传位点变异而出现发育缺陷的突变秀丽隐杆线虫:安布罗斯的实验室克隆了 lin-4 基因,并惊讶地发现它并不编码蛋白质。相反,它编码一个由 22 个核苷酸组成的非编码 RNA。与此同时,鲁夫昆实验室发现 lin-4 通过 lin-14 3' 非翻译区(3'-UTR)中的多个元件调控 lin-14(一种核蛋白)。
通过比较序列信息,他们发现了短链非编码 RNA lin-4 与 lin-14 对应基因的 3'-UTR 元件之间存在部分序列互补性。这首次揭示了一种在概念上新颖的调控 RNA 类型:微 RNA。2000 年,鲁夫昆实验室发现了高度保守的 let-7 微 RNA,随后科学家进一步在包括人类在内的多种动物中发现了同源的微 RNA。这一发现引发了动物界微 RNA 的广泛克隆和测序研究,结果表明微 RNA 囊括了一大类调节元件,控制着庞大的蛋白质编码基因网络。
安布罗斯和鲁夫昆的发现完全出人意料,揭示了一种由微 RNA 介导的、演化上保守的转录后调控机制,在动物发育和成年生物体的组织功能中起着关键作用。
基因的调控机制
生命可以控制自己在何时何地转录基因、产生 RNA,并将其翻译成蛋白质,这是生物中一个极其基础的过程(图 1)。例如,胰岛素由胰岛中的 β 细胞产生,而视蛋白则由视网膜中的细胞产生。针对不同细胞精确的特异性基因调控指令被编码在其遗传物质中,并通过序列特异性的 DNA 结合蛋白发挥作用。弗朗索瓦·雅各布(François Jacob)和雅克·莫诺(Jacque Monod)因发现基因的调控机制,于 1965 年获得了诺贝尔生理学或医学奖。在单细胞和多细胞真核生物中,DNA 结合转录因子是高度保守的,而在多细胞生物体内则出现了额外的基因调控层级,以确保在任何特定时间,每种细胞中都能正确地产生 RNA 和蛋白质。
图 1. 细胞类型特异性的功能调控。每个细胞都包含一套相同的染色体,因此具有完全相同的基因组。细胞类型特异性功能指的是,在每种不同类型的细胞中只有一部分特定的基因被激活。(图片来源:诺贝尔生理学或医学委员会。制图:Mattias Karlén)
真核生物模型在遗传研究中具有不可估量的价值,带来了许多意想不到的发现。半个多世纪前,悉尼·布伦纳(Sydney Brenner)将秀丽隐杆线虫(Caenorhabditis elegans)引入到了遗传学研究中。这种生物每一代的寿命较短,且身体透明,具有易于进行遗传操作的特性,因此得到了广泛的研究。布伦纳、约翰·萨尔斯顿(John Sulston)和罗伯特·霍维茨(Robert Horvit)利用这种线虫,揭示了在器官发育过程中,遗传基因如何控制细胞分裂、分化和死亡,这些发现使他们获得了 2002 年诺贝尔生理学或医学奖。
20 世纪 70 年代,布伦纳实验室通过秀丽隐杆线虫的突变筛选,发现了 lin-4 突变体(e912)。这些线虫具有一些明显的表型:许多细胞类型和形态结构完全缺失,例如因阴门发育失败导致卵子积聚(图 2),这似乎是由一些特定细胞谱系的发育程序出现了重复而引发的。
在 lin-4 线虫突变体中观察到的显著发育中断表明,lin-4 编码了发育时序中的一个主调控因子。大量具有不同时序发育缺陷的异时性突变体被鉴定了出来,其中包括霍维茨实验室发现的第二个突变体——lin-14 突变体。
与此同时,安布罗斯正在跟随戴维·巴尔的摩(David Baltimore)研究脊髓灰质炎病毒基因组的结构与复制。获得博士学位后,他加入了霍维茨实验室。作为博士后研究员,安布罗斯立即着手对异时性突变体进行遗传分析,并发现,lin-14 突变体具有与 lin-4 突变体相反的发育时序缺陷(图 2)。在 lin-14 突变体中,幼虫程序完全缺失。值得注意的是,安布罗斯后来发现 lin-4 是 lin-14 的负调控因子。
在此期间,鲁夫昆在 Frederick Ausubel 的指导下完成了细菌遗传学博士学位。在欧洲旅行期间,他学会了异时性突变体的细胞谱系分析,对线虫遗传学开始产生了浓厚的兴趣。随后,他与 Martin Chalfie 和霍维茨进行了讨论,这进一步激发了他利用秀丽隐杆线虫来研究这些问题的兴趣。1982 年,鲁夫昆开始在 Walter Gilbert 和霍维茨的实验室进行联合博士后研究。
发现微RNA介导转录后基因调控
在霍维茨实验室,安布罗斯和鲁夫昆开始了他们漫长的克隆 lin-14 的历程。当时,通过遗传学确定基因座的 DNA 序列是一项艰巨的任务。经过多年的实验,他们成功使用经典的限制性片段长度多态性方法确定了该区域。
在此期间,安布罗斯和鲁夫昆都获得了教职:安布罗斯就职于美国哈佛大学,而鲁夫昆在麻省总医院和哈佛医学院任职。他们致力于自己的研究问题,继续进行分子分析。鲁夫昆证明,lin-14 是一种在发育过程特定阶段表达的核蛋白,在 L1 阶段(幼虫的第一阶段)表达量高,而在 lin-4 和 lin-14 发生突变的个体中,其表达量会发生改变。有趣的是,研究人员发现了 lin-14 的功能获得突变体,其 3'-UTR 区域存在缺失,导致 lin-14 蛋白在 L1 阶段之后仍能被检测到。3'-UTR 元件的破坏对蛋白质序列没有影响。因此,鲁夫昆推测,一种作用于 mRNA 稳定性、核输出或翻译的转录后机制可能介导了 lin-14 的时间切换。
相比于 lin-14 有若干个突变体,科学家只发现了一个 lin-4 突变体(e912)。安布罗斯实验室着手通过限制性片段长度多态性和 DNA 印迹探针来克隆 lin-4 基因。通过沿着染色体序列依次并反复测试较小的基因组片段,研究它们能否挽救 lin-4 突变的表型,他们精确定位了一个 693 个碱基对长的、被 SalI 限制性内切酶切下来的片段。多轮开放阅读框(ORF)预测和克隆重测序后,他们排除了许多错误选项,然后开始怀疑 lin-4 基因可能是一个非编码 RNA,因为它的 ORF 序列较短。他们将移码突变引入到了秀丽隐杆线虫的基因组中,结果并未影响 lin-4 的功能,这证实了他们的怀疑。1991 年,他们通过 RNA 印迹法和 RNA 酶保护实验检测了 lin-4 的转录本,发现了两个长度分别为 61 和 22 个核苷酸的短 RNA 转录物(图 3)。
在独立解析出 lin-4(安布罗斯实验室)和 lin-14(鲁夫昆实验室)的序列后,1992 年 6 月 11 日晚,安布罗斯和鲁夫昆交换了 lin-4 和 lin-14 基因的序列数据。两人都注意到 lin-4 非编码 RNA 与 lin-14 的 3'-UTR 中的多个元素之间存在显著的部分互补性(图 4)。
意识到这一观察的重要性后,两个实验室进一步开展了一系列实验,证明 lin-4 微 RNA 通过与位于 3'-UTR 上的元件碱基互补配对来调控 lin-14 的 mRNA。他们的这一开创性发现于 1993 年发表在《细胞》(Cell)杂志上,两篇论文以“背靠背”的方式发表。
图 4. lin-4 和 lin-14 RNA 中的互补序列元件。 通过比较 lin-4 和 lin-14 的克隆序列,他们发现了长度为 22 个核苷酸的 lin-4 RNA 与 lin-14 的3'-UTR 中的重复元件存在部分互补性。(图片来源:诺贝尔生理学或医学委员会。插图:Mattias Karlén)
基于秀丽隐杆线虫的 lin-4 序列,安布罗斯实验室在其他线虫物种中鉴定出了包含 lin-4 的克隆。这些实验表明,来自其他线虫的 lin-4 克隆能够挽救 lin-4 突变的秀丽隐杆线虫的表型。他们还筛选了超过 20 000 个突变染色体,鉴定出了第二个 lin-4 突变体(ma161),该突变体包含单个核苷酸突变。值得注意的是,该突变位于互补序列内,进一步支持了 lin-4 微 RNA 与lin-14 的 3'-UTR 元件之间互补碱基的功能重要性。
鲁夫昆实验室则比较了野生型和 lin-14 功能获得突变体中 lin-14 蛋白和 RNA 的含量。突变体中的 lin-14 蛋白水平提高了 4 至 7 倍,而 RNA 含量没有差异,这表明 lin-14 是在转录后水平(即 RNA 转录完成后)受到调控的。将 lin-14 的 3'-UTR 转入报告基因后,报告基因的转录后调控与 lin-14 相似,表明异源 3'-UTR 足以控制 mRNA 翻译。进一步地,研究人员将lin-14 3'-UTR 的较小片段转入报告基因,直至识别出一个功能性的 124 个核苷酸长的 3'-UTR 片段。该 3'-UTR 区域包含多个与 lin-4 部分互补的序列,并且该区域在双桅隐杆线虫(C. briggsae)中也是保守的。
通过对新发现的 lin-4 微 RNA 与来自所有物种的全面的核苷酸序列数据库进行计算分析,研究人员发现,与 lin-4 相匹配的序列仅存在于其他线虫中,例如双桅隐杆线虫。因此,一个关键的问题仍然存在:微 RNA 的存在是否是线虫特有的现象,还是在整个动物界中都具有深远功能影响的保守性特征?
保守的 let-7 微 RNA
首个微 RNA 基因 lin-4 “面世”七年后,第二个微 RNA 基因 let-7 也被发现了。鲁夫昆实验室进行了一项遗传筛选,重点关注一类突变体,它们可以抑制 lin-14 和 egl-35 位点突变的合成不育表型。let-7 编码一个由 21 个核苷酸构成的短链 RNA,该 RNA 与多个异时性基因的 3'-UTRs(包括 lin-14、lin-28、lin-41、lin-42 和 daf-12)具有互补性。let-7 的缺失会导致成虫重复出现幼虫阶段的细胞命运,这表明微 RNA 可能在调控细胞系形成的阶段特异性时序方面,发挥更广泛的作用。
下一个突破也来自鲁夫昆实验室。他们发现,与 lin-4 不同,let-7 基因在多种动物中具有演化保守性。科学家将 let-7 微 RNA 的序列与核苷酸数据库进行了比对,结果在果蝇和人类中均发现了匹配序列。在秀丽隐杆线虫中,let-7 的一个已知靶标是 lin-41,这是一种在斑马鱼和果蝇中具有同源蛋白的蛋白质。令人欣慰的是,斑马鱼和果蝇 lin-41 同源基因的 3'-UTR 均显示出与 let-7 的互补性。此外,多种人体组织中也存在 let-7 微 RNA,这表明 let-7 与哺乳动物细胞的基因表达普遍相关。
与线虫类似,let-7 微 RNA在果蝇中也表现出时序调控性,这表明 let-7 在昆虫、甲壳类和线虫中具有保守作用。值得注意的是,科学家在软体动物和环节动物的成体阶段,也检测到了时序性质的 let-7 表达,而这些物种并没有幼虫阶段。此外,脊椎动物也没有明显的幼虫阶段,但在发育过程中也出现了时序调控的 let-7 表达(包括在成年斑马鱼中的强烈表达)。令人印象深刻的是,在具有左右对称性的动物中,let-7 的表达也是时序调控的,这种特性可能是在这些动物从双胚层物种(即从两个主要胚层发育而不是三个,如人类和其他脊椎动物)分化后演化产生的(图 5)。let-7 在演化上高度保守,大大增加了人们对微 RNA 作为基因表达后转录调控因子的兴趣。
随着 let-7 的发现,利用小 RNA 克隆技术,多个实验室开始在人类及其他物种中寻找其他微 RNA。例如,Thomas Tuschl 实验室从人体和果蝇组织中克隆出了新的微 RNA,David Bartel 实验室从线虫中分离出了新的微 RNA,而安布罗斯的实验室也进行了类似的研究。如今,这些综合证据已非常具有说服力:动物界中存在大量调控性微 RNA,可能在基因调控中发挥重要作用。分子生物学和测序技术的进步使得我们已在人类基因组中鉴定出超过一千种微 RNA 基因。目前,微 RNA 基因的数据库 miRBase 已包含超过 38 000 个发卡前体和 48 860 个成熟的微 RNA 基因序列,涵盖 271 个物种;就连在病毒里,科学家也发现了编码微 RNA 的基因。
得益于更多微 RNA 的克隆以及全基因组序列技术的日益完善,科学家可以更好地找到微 RNA 与 3'-UTR 区域之间的碱基配对规则。David Bartel、Christopher Burge 和 Stephen Cohen 实验室提出了将实验和比较基因组学方法相结合的研究规范,专门用于识别微 RNA 靶标。这些研究表明,微 RNA 通常与目标 mRNA 具有部分互补性,主要集中在微 RNA 的“种子”区域。该研究还揭示,每个微 RNA 可能调控多个蛋白质编码基因,因为许多基因的 3'-UTR 区域表现出了与微 RNA 种子序列的极度保守性互补。
有趣的是,与细胞类型或谱系特异性微 RNA 共表达的基因缺乏该特定微 RNA 的目标位点。相比之下,这类微 RNA 靶点在相邻细胞和组织中表达的基因中很常见。这些观察结果强化了一种假说,即微 RNA 在多细胞生物的细胞系形成,以及细胞类型稳定性中具有重要功能。
微 RNA 的生物合成与功能
在克隆其他微 RNA 基因的同时,多个研究团队也投入了大量精力来理解微 RNA 的生物合成及其作用机制。微 RNA 基因的转录策略多种多样。许多微 RNA 基因是独立的转录单元,有时会成簇存在,而其他微 RNA 则位于蛋白质编码基因的内含子中。典型的初级微 RNA(pri-microRNA)由 RNA 聚合酶 II 转录,并具有发卡结构。这种发卡结构作为底物,由细胞核内的特定微处理器(一种包含 Drosha 内切酶的异三聚体复合物)进行加工,来切断其双链以产生前体微 RNA(pre-microRNA),通常为 60-70 个核苷酸长度,由安布罗斯实验室首先检测到(图 2)。Exportin 5 和 RAN-GTP 则促进前体微 RNA向细胞质的运输。
随后,前体由 Dicer(一种最初由 Greg Hannon 实验室鉴定的内切酶,核糖核酸酶 III 家族成员之一)进一步加工,形成微 RNA 双链。这些微 RNA 链会被加载到含有 Argonaute 蛋白的沉默复合物上,而另一个“随从链”则会被取代。一旦微 RNA 链被加载到沉默复合物中,它就可以通过减少翻译和/或促进 mRNA 降解来执行具有序列特异性的负调控。这种调控过程会涉及衔接蛋白质 TNRC6 和多聚腺苷酸结合蛋白 PABPC,它们可以招募脱腺苷酶复合物,缩短 mRNA 的多聚腺苷酸尾巴,从而基于细胞中的环境(例如细胞所处的发育阶段及其类型),导致 mRNA 降解、翻译被抑制。
微 RNA 功能处理和执行的机制同样可用于其他基于 RNA 的沉默机制,通常称为 RNA 干扰(RNAi)。其中包括小干扰 RNA(siRNAs)、内源性 piwi 相互作用 RNA(piRNAs)和重复相关小干扰 RNA(rasiRNAs)。有关双链 RNA 可以诱导序列依赖性基因沉默的发现,使安德鲁·Z.法尔(Andrew Z. Fire)和克雷格·C.梅洛(Craig C. Mello)获得了 2006 年诺贝尔生理学或医学奖。虽然 RNAi (在低复杂性的植物和动物中)主要用于防御病毒感染,对抗不必要的基因组移动元件活动,但微 RNA 在发育过程和成体的不同细胞中会参与 mRNA 的转录后调控。为此,微 RNA 已演化出与其目标 mRNA 序列相应的部分互补性,以“调整”对每个 mRNA 目标的影响,而例如 siRNAs 通常是外源的,与特定 RNA 目标序列具有完全互补性,并会切割这些序列。1999 年,David Baulcombe 证明植物中的转录后基因沉默与具有特异性的短 RNA 对靶序列进行处理有关,这进一步将不同领域中的观察联系了起来。
微 RNA 的演化及其生理作用
微 RNA 基因的出现和发展与更复杂的生物体的演化紧密相关(图 5)。在早期的两侧对称动物的演化过程中,微 RNA 基因的数量显著增加,据推测,它们在原口动物和后口动物分开之前的两侧对称动物的最后共同祖先中发挥作用。自那时起,随着复杂生物体中出现了更特化的细胞类型和组织,又出现了数百个额外的微 RNA 基因。在早期的后生动物海绵、植物以及两种单细胞真核生物物种中,科学家也发现了微 RNA 基因。因此,微 RNA 可能在演化过程中多次出现,包括出现在大约 6 亿年前多细胞动物早期谱系,或者 10 亿年前植物和动物的共同祖先中。值得注意的是,许多在演化上古老的微 RNA 基因在后来的生物中都得以保留。另外,这些基因很少在演化过程中丢失,这表明它们在基因调控中起着至关重要的作用。
通过消除微 RNA 生物合成途径中的组分,科学家证明了微 RNA 在多细胞生物发育和组织功能中的关键作用。负责在细胞质中处理前体微 RNA 的 Dicer 的缺失,在小鼠和斑马鱼中具有胚胎致死性。在果蝇和小鼠中,单个或一组微 RNA 基因的缺失也会导致强烈的表型变化。然而,由于多个微 RNA 基因均作用于相同的目标序列,可能存在冗余作用,导致单个微 RNA 基因的功能被掩盖。尽管这些系统中的冗余性阻碍了科学家对单个微 RNA 基因的功能进行深入研究,但它也展示了该系统的稳健性,并解释了为何该系统不易被病毒等外界因素轻易操控。
为了突出微 RNA 的基础作用,值得关注的是,在两侧对称生物中共享的、演化上最为保守的微 RNA 基因会在胚胎发育早期发挥作用,而那些特别在哺乳动物中演化出的微 RNA 则在胚胎发育的后期阶段发挥作用。相比之下,物种特异性的微 RNA 基因通常在成体细胞类型中发挥作用,而不是在胚胎发育过程中。通过对不同演化保守性的微 RNA 基因的系统性敲除实验,科学家发现这些模式显而易见。在动物发育过程中,微 RNA 特定的调控作用包括调控发育时序、细胞命运的形成和稳定性,以及普遍生理学和内稳态。
通过选择性地将 Dicer 从转基因小鼠体内敲除,研究人员已阐明微 RNA 在成体细胞和组织中的功能。例如,在 B 细胞成熟过程的早期,敲除 Dicer1 会导致该细胞分化停滞在祖 B 细胞阶段。在胚胎发育的第 15.5 天,从神经元中敲除 Dicer1 会导致新生儿早早地死去,同时伴随小头畸形、神经元树突分支减少和树突棘长度增加。胚胎发育两周时,在分裂后的小脑浦肯野细胞中敲除 Dicer1,还会引发小脑退化和共济失调(肌肉运动不协调)。同样,中脑多巴胺能神经元中 Dicer1 的缺失会导致渐进性神经元丧失和运动活动减少。研究人员在其他多种细胞类型和组织中也观察到了严重的表型,证明微 RNA 在发育过程和成体细胞类型的功能中具有关键作用。
随着人们发现了越来越多与特定微 RNA 基因突变或相关生物合成通路中的成分突变相关的综合征,微 RNA 在人类发育和机体功能中的重要性变得显而易见。例如,DICER1 综合征是一种罕见的遗传性疾病,由 DICER1 基因突变引起,患者易患肾、甲状腺、卵巢、宫颈、睾丸、脑、眼和肺的肿瘤。在这些患者体内,通常 DICER1 的一个等位基因存在使其失活的胚系突变,降低了细胞中功能性 DICER1 蛋白的含量。这些个体容易发生额外的体细胞突变,因此往往在儿童期就发展出了肿瘤。
微 RNA 基因的碱基配对部分(即种子序列)较短,使得它们不太可能因随机突变而改变。然而,人们已知微 RNA 基因的种子序列中存在与疾病相关的突变,其中包括与进行性听力损失相关的 miRNA-96 突变,导致 EDICT 综合征(一种罕见的眼疾,表现为虹膜发育不全、内皮营养不良和先天性白内障)的 miRNA-184 突变,以及导致先天性骨骼疾病的 miRNA-140-5p 突变。目前,针对代谢紊乱、心血管疾病、神经退行性疾病和癌症等疾病,基于微 RNA 的诊断和治疗方法正在取得进展。
诺贝尔奖官方网站: