视频内容简介
Element公司的亲合子高通量测序技术,具有:
1、数据质量高
2、测序成本低
3、使用灵活性高
这3个优点。
本视频介绍了Element公司开创的“亲和子测序”化学原理,以及这种测序原理是如何让Element公司同时获得了上述的三种测序优势的。
视频字幕
大家好,欢迎来到【陈巍学基因】,今天我要给大家讲的是《Element 公司的亲和子高通量测序》
Element biosciences 公司亲和子测序有3个巨大的优势:
1、是它的测序数据的质量很高。它的实测数据中,80%的数据可以达到Q40以上的质量,90%的数据可以达到Q30以上的质量。而且,Element公司是我所知道的第一家提出把Q40作为数据质量标准的高通量测序公司;
2、它的测序成本很低。目前Element能给出的价格是每1个G的数据成本在5~6个美金,或者说35到42元人民币(测一个G的数据)。这个价格已经和用illumina公司的NovaSeq 6000型测序仪一般给到市场终端客户的测序价格一样了;
3、它的灵活性高。Element的AVITI测序仪的上机测序现在是1张Flowcell测300个G的数据。相比之下,能给出相同价格的NovaSeq 6000,它的主力测序芯片,也就是S4芯片的数据量,是一张芯片产3000个G。也就是说Element凑够300个G数据量就可以开一次机,而不是需要等凑够3000个G才能开机。
之所以element测序方法能有这么多优秀的特性,原因是它采用了全新的的化学原理,完全不同于传统的SBS,也就是“边合成边测序”的化学原理。
Element用的新化学原理是一种被称为“亲和子”测序的测序原理。
接下来,我们会分成三个部分来介绍Element的测序:
1、测序的化学原理
2、实用中的优势
3、未来可能的应用
我们先来说它的测序化学原理。
Element测序的过程,先把文库从线性DNA分子做成一个环化的单链DNA分子。
测序芯片上则是共价地结合了引物,这些引物也被称为“草皮引物”。
然后,把单链环状文库放到芯片上,环状文库的接头序列就会吸附到引物的互补序列上。
然后,加入聚合酶,在引物的引导下,聚合酶进行滚环复制。滚环复制的过程,会把要测序的目标序列的拷贝数增加一千倍左右。
滚环复制出来的DNA链,就像一团毛线团,这一团DNA是共价连接在芯片上的。
接下来,我们来看是如何检测DNA链的序列。
Element测序原理中,最重要的一点,是把用通过荧光信号检测模板上的碱基种类,与测序链的碱基延伸,这两个步骤拆分开来。荧光检测归荧光检测,碱基延伸归碱基延伸,拆分成两个步骤后,分别优化。
这里要重点介绍,Element公司设计的“亲和子”。
如图所示,亲和子这个化物的样子,它的中心是几个同一种颜色的荧光基团,向外伸出4根链,每条链的末端连着一个碱基,每一种亲和子上的4条链的末端所连的碱基是一样的。
一共设计了4种亲和子,每种亲和子各有一种荧光颜色,每种亲和子伸出去的链的末端各自连着一种碱基。这样,4种荧光颜色和4种碱基种类就分别对应起来了。
有了这4种亲和子,就可以把4种亲和子与聚合酶、引物都加入到芯片上。
我们可以看到,模板上的对应于引物接下来要延伸位置的,是一个A碱基。在聚合酶的配对作用下,亲和子末端的T碱基被配对到模板上A碱基所对应的配对位置上。
另一方面,因为亲和子上连的这个T碱基是有化学修饰的,所以它不能与引物发生聚合反应,所以延伸反应不能发生。
而一个亲和子伸出4条链,每条链的末端的那个T碱基,都会被吸附在这个毛线团上的某个引物末端要延伸的位置。这样,有了4重吸附力,整个亲和子就被较为牢固地吸附在这个毛线团上。
然后,进行清洗,把没有吸附到毛线团上的亲和子都洗掉,只留下能够吸附在毛线团上的亲和子。
那么所有留下来的亲和子,都是各个毛线团上引物延伸方向的下一个碱基所连的亲和子。
接下来,进行荧光拍照。
这是Element荧光拍照得到的有4种荧光颜色的照片。照片中的每一个光点,就是一个毛线团。每个毛线团都吸附了许多个亲和子,亲和子在激发光的照射下发出相应颜色的荧光。
因为是4种荧光分别对应4种碱基,所以,仪器就可以很方便地根据一个毛线团上所发出的荧光颜色,来判断这个毛线团上(要延伸的位置)相应的碱基种类。
在荧光拍照完成之后,先把吸附在毛线团上的亲和子都洗掉。
接下来,用带可逆终止基团的dNTP进行核酸链的延伸,是在dNTP的3’端有一个叠氮基团,这个叠氮基团起到了可逆终止的作用。
因为有这个终止基团,所以延伸步骤只会延长一个碱基。
然后,用化学试剂处理,把这个叠氮基团去除掉,露出3’端的羟基。
有了自由的3’羟基,这条链就可以继续延伸了。
为了更好地理解element的化学优势,我们先来比较一下element公司和illumina公司各自用的带修饰的单核苷酸。
我们可以看到,illumina用的修饰核苷酸,它的碱基上连一个长柄,长柄末端连着一个荧光染料。这个荧光染料就起到报告这个碱基是哪种碱基的作用。
这个长柄会在拍完照成之后,被用化学的方法切断。但是切断反应后会在碱基上留下一段残留的“柄”。
这张图,展示了illumina测序中切掉荧光基团之后,经过延伸的这条链上所残留下的柄。
测序行业把这些留下来的柄称为“scar”,“疤痕”的意思。很显然,这些残留下来的疤痕,让illumina测序中这根延伸的DNA链不再是天然结构的DNA链,而是多出了许多根额外的长柄。
这自然就会影响到illumina测序链的进一步延伸的效率。
我们回过来看Element用的dNTP,它没有伸出去的侧链,它在去掉了叠氮基团之后,就是一个自然的核苷酸。所以,Element测序过程中,延伸出来的链是自然的DNA链没有疤痕。
因此,Element的链在聚合酶的作用下,延伸的效率会更高。
这个动画,展示了SBS测序与亲和子测序,这两种方法带来的亲和力的变化,和试剂成本的变化。
左图是SBS测序,4个带着荧光基团的T碱基,在聚合酶的帮助下,与4条模板上的A碱基相结合。
但是,单个的核苷酸与模板的结合力较弱,单核苷酸很容易与模板解离。
为此,SBS测序中,要用1~10微摩尔浓度的核苷酸来进行反应。
这是一个较高的单核苷酸浓度,目的是用高的浓度来弥补修饰的单核苷酸与模板结合力的不足。
再看右图的亲和子测序,亲和子伸出4个链,4个链的末端的T碱基与模板的亲和在一起,4个亲和力叠加就会是一个很强的亲和力。
而且,就算有1、2个链松开了,也不影响整个亲和子还是吸附在这个毛线团上。
因此,亲和子测序中,只要10几个纳摩尔的浓度的亲和子,就可以进行测序了。
这样Element的测序直接把反应所用的核心化学试剂(带修饰的核苷酸)的浓度相比于SBS测序降低了约100倍。
这就是Element公司作为一家新的测序公司,一开始,就可以把测序的价格降到与Illumina成熟测序平台相似的价格的根本原因。
亲和子测序的第二个优势,是可以降低phasing和prephasing对测序数据准确性的影响。
Phasing是指部分延伸链的延伸步伐比大部分的延伸链慢了一个碱基,Prephasing则是指部分延伸链的延伸步伐比大部分的延伸链快了一个碱基。
左图,在SBS测序中,一个毛线团上的几个条延伸链,因为会有phasing和prephasing的情况发生,所以DNA链在延伸了几个循环之后,就会有少数的延伸链的末端的碱基与主流的链有不同步。
这些不同步的链所连上荧光碱基与主流链上的荧光修饰碱基的不同,就会造成信号的下降、噪音的增加。
这也是造成SBS测序在测序循环数增加之后,数据的准确性下降的主要原因,也是限制SBS测序长度的主要原因。
我们再看右图,在亲和子测序中,同样会有phasing和prephasing造成的部分链的延伸步伐与主流的链的步伐不同步。
但是这些不同步的链中,phasing的链只占全部延伸链的少数,prephasing的链也只占全部延伸链的少数。
而亲和子是有4条链,4条延伸链中就算有2条链上的碱基是A,1条是T,1条是G,结果我们可以看到,还是带有T的这个亲和子结合到了毛线团上。
这就是一种“选举效应”,也就是4种亲和子竞选,所有延伸链上吸附到延伸位置的碱基对4种亲和子进行投票,通过选票的多少来选出胜者。
最后是获得大部分选票的那种亲和子胜出,而只获得少部分选票的亲和子会输掉竞选。
“选举效应”会增强数量占大多数的那种碱基的胜出效果,弱化那些占少数的碱基的作用。
也就是说,选举效应会在一定程度上盖掉phasing和prephasing产生的噪音,同时突出主流链上的碱基信号,这是亲和子测序的数据质量高的原因之一。
Element的测序是可以做双端测序的,我去查了Element公司公开的专利,大致地了解了Element做双端测序的方法。
接下来,我就来给大家说一下我对它的双端测序方法的理解。
首先,在合成第一链的时候,是在4种正常碱基的dNTP之外,还掺入了dUTP(替代部分dTTP)。
U碱基在测序过程中,会被读成T碱基,所以,U碱基不影响对第一链的测序。
在第一链的测序完成之后,在反应体系中加入引物和phi29 DNA聚合酶,合成第二链。
因为毛线团中有多个引物结合位点的拷贝,所以引物会在多个位点起动互补链的合成,也就是形成多条第二链。而phi29酶的作用是后面的链可以把前面的链推开。
这样,可以保证最后只有一条第二链吸附在原来的第一链上。
接下来,在反应体系中加入USER酶,在第一链上有U碱基的位置产生切口,大量的切口就切碎了原来的第一链。
这里用到的USER酶,它的作用,是可以在带有U碱基的DNA链上,在U碱基所在的位置切出一个单链的缺口。
关于USER酶的文字介绍,我打在屏幕上了,有兴趣的同学可以暂停一下视频慢慢看,我在这里就不念了。
第一链被切碎后,碎片被洗掉。
然后,新合成的第二链通过与原始的草皮引物的互补关系,还是吸附在芯片上。
接下来,加入第二链测序的引物,再加入酶和亲和子,进行第二链的测序。
这就是Element实现双端测序的原理。
Element公司的另一项化学上的创新,是对芯片的表面经过了特别的处理,让芯片的表面变成低吸附的。这可以明显地降低检测过程当中的背景噪音,让信号可以被更好地检测出来。
第二部分,我们来说一下Element测序在实用中的优势。
Element测序的第一个优势,就是数据的质量很高。
Element公司公开承诺的数据质量,可以达到Q30以上的数据比例大于90%,Q40以上的数据比例大于80%。相比之下,illumina的NextSeq 2000的公开承诺的数据质量,是2X150的测序,可以达到Q30以上的数据比例大于85%。
我的几个同事和朋友,都已经实际用过Element进行测序,他们都一致表示:Element的测序数据质量很好。
第二个优点,是对于高GC含量和低GC含量的测序,能有更好的覆盖均一性。
这张图,横轴是把全基因组分成许多个测序窗口。把窗口按照GC含量,从低到高,进行排列;纵轴是均一化后,各窗口被覆盖的测序深度。
理论上,覆盖的这条线越平、越接近高度1,是越好的。
这里,蓝色的线是element的实测结果,黄色的虚线是illumina的实测结果。
可以看到,element的蓝线比illumina的黄色虚线,更加平,更加接近1。也就是说,element的测序结果,对高GC含量和低GC含量的区域的覆盖均一度是优于illumina的。
这在实用中会体现为对甲基化的文库更加友好。因为甲基化测序的文库当中,绝大部分的C碱基已经被转化成了T碱基,这会导致文库分子中GC比例极度偏低。Element的实测结果中,可以对甲基化测序文库得到较好的测序结果。
第三点,对同聚物序列的耐受性更好。同聚物序列,就是指一长串相同的碱基,比如连着10个甚至20个A碱基,或者连着10个、甚至20个T碱基。
这张图展示了连续12个相同的碱基之后,Illumina的NovaSeq测序仪的准确性、和Element的AVITI测序仪的碱基准确性。
横轴是以同聚物序列为中心,向左右两边延伸,纵轴是错配的碱基的比例。
我们可以看到,在illumina的测序结果中,在同聚物之后的序列中出现了较高比例的错配碱基。
而在Element的测序结果中,在同聚物之后的序列中,错配碱基的比例相比于illumina的要低许多。
所以,Element的测序对长的同聚物的耐受性更好。
第四点,Element的AVITI测序仪的测序速度较快。
AVITI这个测序仪一次可以测2张芯片,每张芯片产出约300G的数据,2张芯片一共产出600G的数据。
我去查了一下illumina和华大这两家公司的相似测序通量的测序仪的测序速度,在都测2X150的测序长度,都测几百个G的这个级别的数据量,AVITI这个机器用的时间是38小时,比另外两家的用时略短一些。
第五个优点,是Element测序的duplication率低,index hopping率也低。
Duplication是一个原始文库的分子在上机测序之后,产生了多条reads,这就叫“duplication”。duplication会浪费测序通量,是测序中应该尽量避免的。
左图是element与另两家主流的高通量测序公司的比较,可以看到element测序中的duplication率明显更低。
右图是index hopping的结果,也就是index序列和实际的文库插入片段的序列之间,产生了张冠李戴的问题。
右图是用一个大肠杆菌的文库,和3个人类样本的文库,放在一条lane里测序。
因为大肠杆菌的基因组序列与人的基因组序列有很大的区别,所以很容易从测序结果中找出index hopping的情况。
右图中显示,element的测序结果中,index hopping的比例远低于0.5%。这是一个很低的index hopping比例。
第三部分,我们来说一下Element测序未来可能的应用。
我看到了element的各项参数和性能之后,第一个想到的,就是它很适用于各种临床肿瘤样本当中的低频突变的检测。
比如:MRD,也就是白血病的微小残留病变;TMB,肿瘤突变负担;ctDNA,也就是血液中的循环肿瘤DNA。
这几项检测都是大海捞针的检测,有突变的reads可能只占全部测序得到的reads的几千分之一,甚至几万分之一。
1、element数据的高准确率,让检测肿瘤中的各种低频突变的准确率会大幅提高。
2、临床检测要求测得快,element的AVITI测序仪较快的测序速度,和它中等测序通量带来的不需要太多凑样,可以快速开机测序的优势,都可以加快交付测序数据的速度。
3、较低的测序价格,可以让医院有可能用得起element的测序服务。
4、低的index hopping的概率,也可以让医院、临检所可以更加放心大胆地用element测序来检测肿瘤样本,而不用太担心index hopping带来的错误index信息的张冠李戴的问题。
当然,在开展各项临床应用之前,Element还需要先通过国家的医疗器械认证。
以上,是本次讲座的全部内容。