两位归国学者联合打造新型单细胞多组学技术,可对单细胞的染色质可及性和基因表达,进行灵敏灵活的多模式分析

图片
近日,靳文菲的邮箱颇为“忙碌”,总有人问他关于 ISSAAC-seq 的细节。其目前是南方科技大学生命科学学院的副教授,ISSAAC-seq 是他和该校生物系助理教授陈曦联合研发的一项单细胞多组学技术,英文全称是 in situ SHERRY after ATAC-seq。
图片图 | 靳文菲(来源:靳文菲)
这是一项操作步骤简单、可重复性好的单细胞多组学技术,采用了模块化和开放式的设计,价格也比较低廉。在功能上,它可对来自同一细胞的染色质可及性和转录组进行较大规模刻画。鉴于这些优点,相关论文一发表就引来诸多关注。
图片(来源:Nature Methods)
其中一位审稿人直言:“ISSAAC-seq 似乎是 10x Genomics(一家美国基因测序公司)的多组学检测技术的有力竞争者。”另一位审稿人也表示:“虽然此前已有许多类似的方法,但我们认为 ISSAAC-seq 有潜力成为最被广泛使用的多组学刻画方法。”
当前领域内的共识是:单细胞多组学将成为研究发育、细胞分化、肿瘤等领域的常用技术。而 ISSAAC-seq 有望快速降低单细胞多组学技术的门槛。靳文菲表示:“我们对该方法的实用性、扩展性、和经济性持乐观态度,相信其会得到广泛应用。”
图片(来源:Nature Methods)
图片
如何全面刻画细胞内的“秘密”?
要想了解单细胞多组学技术,得先从细胞说起。细胞是生物结构、组织和功能的基本单位,也是生命活动的基本单位。
受限于常见检查分析方法的灵敏度,生物医学检测或研究一般使用含有大量不同类型细胞的组织块,只有这样大的起始量才能检测获得样本的的特征参数。最终得来的参数,是很多细胞的平均值。
但是,这很有可能代表不了任何类型的细胞的特征。因此,在没有单个细胞特征参数的情况下,人们无法理解这些细胞到底如何进行协调、进而实现其特定组织功能。
最近十年,单细胞测序技术的发展,让学界得以分析每一个细胞的状态,从而理解细胞的发育过程、以及组织内细胞异质性和细胞互作通讯等。
不过,单细胞测序一般只能捕获细胞的一种组学信息,对于细胞状态的刻画并不全面,也不能很好地解析不同模态数据之间的关系。
比如,T 细胞是人体中非常重要的一类免疫细胞。初始 T 细胞(Naïve T)是从未接触过病原的 T 细胞,而记忆 T 细胞 (memory T) 是接触过病原体、并产生过免疫反应的一类细胞。
在人体内,初始 T 细胞和记忆 T 细胞均处于一种静息状态,转录组非常相似。然而,记忆 T 细胞能够快速应答病原刺激,而初始 T 细胞需要较长时间才能应答。
当检测这两种细胞的染色质可及性时就能看到:很多免疫应激基因的启动子,在记忆 T 细胞中处于开放状态;而在初始 T 细胞中,则处于一种沉默状态。
这意味着,结合不同模态信息,可以更精确地刻画细胞类型和状态。同时,单细胞多组学测到的数据,结合假时间轨迹推演,即可对复杂组织中的细胞亚型进行细致的刻画,清晰地呈现发育和分化过程中不同层次组学数据间的变化差异和动态,从而获得基因调控的关键信息。
近几年,人们逐渐意识到同时刻画单个细胞的多种模态数据的重要性。这也让开发单细胞多模态组学技术,成为组学领域的前沿热点。
在同一细胞中,尽管已有多种技术能同时检测染色质开放性和基因表达,比如 SNARE-seq、 SHARE-seq、Paired-seq 等。但是,由于步骤多、过程复杂、数据质量不高等原因,上述技术并未得到广泛使用。
基于此,非常有必要研发出一款更简洁、更灵敏、更能广泛应用的单细胞多组学技术。而靳文菲及其合作课题组研发的 ISSAAC-seq,完全具备上述优点。
近日,相关论文以《ISSAAC-seq 可对单细胞中的染色质可及性和基因表达进行灵敏灵活的多模式分析》(ISSAAC-seq enables sensitive and flexible multimodal profiling of chromatin accessibility and gene expression in single cells)为题发表在 Nature Methods 上 [1]。
图片图 | 相关论文(来源:Nature Methods)
徐炜、杨伟龙担任共同第一作者,靳文菲、陈曦担任共同通讯作者。
除前面提及的审稿意见之外,还有一位评审专家表示,尽管已经有商业化的试剂套装可以同时检测一个细胞的染色质可及性和基因表达。但是,仍然需要易于使用的更便宜、更灵敏和更稳健的方法。
在成本高昂的大规模细胞图谱项目中,尤其需要这些方法。而此次论文的作者表明 ISSAAC-seq 是灵敏的,他们通过发现比单模态更加精细的细胞异质性、以及跨细胞轨迹的基因调控动态机制,进一步证实了单细胞多组学的生物学价值。
图片(来源:南科大网站)
图片
“结缘”南科大的两位归国学者
2017 年,结束在美国国立卫生研究院的博后研究之后,靳文菲加入南科大。当时,他已经产生开发单细胞多模态组学技术的想法。
其表示:“我实验室的袁昕等同学做过一些早期尝试,但一直没有太多进展。主要原因之一是当时的设计太复杂、数据质量不好,相比已有技术不具备优势,也无法得到应用。”
2019 年,从英国维康桑格研究所回国的陈曦,加入南科大任职。他俩都拥有开发单细胞染色质可及性测序技术的经历,这让两人找到了共同的科研兴趣,经常一起讨论单细胞组学前沿技术和科研进展。
图片图 | 陈曦(来源:陈曦)
2020 年初,清华和北大团队联合发现分子生物学中常用的一种转座酶 Tn5,不仅能以双链 DNA 作为底物,还能将逆转录之后的 DNA/RNA 杂合物作为底物进行反应。他们利用这种性质,开发了一个非常简易的全转录组测序方法 SHERRY(Sequencing HEteRo RNA-DNA-hYbrid)。当年晚些时候,北大另一支团队公布了类似的技术——TRACE-seq。
这给靳文菲带来了一定启迪,他说:“SHERRY 这种方法的简易性深深吸引了我。于是我开始思考如何把这个方法整合到我们已有的组学研究方法之中。”
不久后的一天,他想既然 SHERRY 和 ATAC-seq 都使用 Tn5 做 tagmentation,那么使用 Tn5 逐个针对 DNA/RNA 杂合物和染色质做 tagmentation,则将分别获得基因表达和染色质可及性状态。
说到这里他表示:“当时我和陈曦打电话聊合作的可能性。他似乎显得更兴奋,并且觉得是可行的。而且,他在使用 Tn5 研究染色质可及性方面具备丰富的经验,曾经开发过一种单细胞 ATAC-seq 技术。于是,我们一致决定建立基于 SHERRY 和 ATAC-seq 的单细胞多组学技术。”
图片
“flow cells 不停地堆积起来”
研究进行到这里,接下来的问题是如何将 Sherry 和 ATAC-seq 结合?很快,陈曦开始设计具体的实验步骤,经过一番讨论后,双方确定了最终的实验方案。
在细胞原位做了两轮差异化的 Tn5 转座反应之后,他们分别标记了 ATAC-seq 和 RNA-seq 序列,并在混合扩增建库之后进行测序。
在 RNA 原位逆转录时,该团队使用含有 TruSeq adapter 序列的特异逆转录引物,从而让 TruSeq adapter 序列为 index,进而能将 RNA-seq 数据与 ATAC-seq 数据分离,以便进行后续的数据分析。
这一设计避免了同类方法中的多次细胞混合和分离过程,无需 index 片段连接的同时,也让实验流程得以简化。模块化的设计,则可分为原位反应模块、和单细胞分选模块。在原位反应模块中,所有的化学反应均在群体水平的细胞核内完成。
随后,研究人员根据自身课题需要、以及现有仪器设备等因素,决定采用单细胞分选的方法。这样的好处是:既能通过孔板进行小量的测试、或对稀有样品进行解析,也能采用微流控装置进行大量的单细胞测序。
对于微流控装置来说,凡是带有 Nextera TruSeq Read 1 序列的平台均可使用该技术,例如 10x Genomics Single Cell ATAC、Bio-Rad dscATAC-seq 以及 HyDrop-ATAC。
有了实验方案后,两位一作徐炜和杨伟龙分别负责实验执行和实验数据分析。他们表示,这是一个漫长的过程,经历了多次失败、除错调试和方案优化,最后终于获得了高质量的数据。
具体来说,定下实验流程之后,要对设计方案进行检验和测试。正如谚语说的 ideas are cheap,刚开始的实验都失败了。
那时,徐炜天天都在做测试,实验室里测序平台的 NextSeq 几乎都被他和陈曦包下。但是,失败的 flow cells 仍是不停地堆积起来。
图片图 | “失败的 flow cells 不停地堆积起来”(来源:陈曦)
持续一年的失败,让大家的信心备受打击。当时面临的问题是,不仅从细胞中所提取的 RNA 分子数目非常少,而且完全不达标。
后来在一次讨论中,徐玮提出:“平时我们单独在原位做 SHERRY 没有任何问题,现在却无法拿到很好的 RNA-seq 数据。所以,肯定是在做 SHERRY 之前的那些 ATAC-seq 的步骤中,RNA 丢失或者降解了。”
基于此,她认为出于某种原因,日常的 ATAC-seq 条件对 RNA 并不友好。这一猜想确实也合理,因为日常 ATAC-seq 是在含有二价金属离子(一般为 Mg²+)和 37℃ 的温度下进行的,这两个因素都比较容易导致 RNA 断裂、降解,也许问题症结就在这里。
于是,抱着试一下的态度,在不影响 ATAC-seq 效率的情况下,徐炜降低了反应温度并做了一些其他改动。这时,高质量的 ATAC-seq 和 RNA-seq 数据果真出现了。
图片(来源:Nature Methods)
另据悉,组学技术的开发涉及到文库构建、测序和数据分析等三个主要步骤。由于涉及步骤多、数据量巨大,往往需要等实验结果出来,才能知道下一步如何走。
因此,实验周期一般比较长,好在团队成员努力又奋进,并且具备完善的组学平台。尤其是作为通讯作者的陈曦,投入了大量时间来做实验的优化设计。而最终的成功,也让整个合作团队备受鼓舞。
2022 年 6 月,当期刊编辑发邮件说“原则接受”论文之后,该团队就开始酝酿后续工作。
未来则主要采取“两步走”:其一,使用 ISSAAC-seq 来研究胚胎发育和造血过程等,以期解决更多的生物学难题;其二,探讨开发更多单细胞多组学技术,并把更多表观组信息整合到单细胞多组学技术中,以便获得更全面的基因调控信息。
图片
参考资料:
1.Xu, W., Yang, W., Zhang, Y. et al. ISSAAC-seq enables sensitive and flexible multimodal profiling of chromatin accessibility and gene expression in single cells. Nat Methods 19, 1243–1249 (2022). https://doi.org/10.1038/s41592-022-01601-4
图片
图片