【陈巍学基因】视频:高通量蛋白质测序

视频内容简介
Quantum-Si 公司提出的高通量蛋白质测序方案,目前已经可以测出长达10几个氨基酸残基的肽段的部分序列。本视频介绍了这种测序方案的原理,和它存在的问题。这个测序方法正在进一步的完善优化过程。预计未来会带来巨大的应用市场。
视频内容
大家好,欢迎来到【陈巍学基因】,今天我要讲的是《高通量蛋白质测序》。
这项技术有可能会和高通量 DNA 测序技术一样,又带来一波新的生物检测技术大发展。
今天要讲的这项技术,出自题为《Real-time dynamic single-molecule protein sequencing on an integrated semiconductor device》的这篇文章。这篇文章发表在 Science 杂志 2022 年的 10 月刊上。
文章的题目,翻译成中文意思是《在一个集成半导体设备上做实时动态的单分子蛋白测序》。
发表这篇文章的机构是 Quantum-Si 公司。Brian D. Reed 是 Quantum-Si 公司的技术负责人,也是这篇论文的第一作者和通讯作者。
接下来,我会分 4 个部分来讲这项技术。
先说第一部分,测序仪及测序芯片。
图片
图中,是 Quantum-Si 公司的多肽测序仪。左边的这张图是测序仪的外观。右边的这张图,是仪器的分解图。中间可以看到放芯片的位置。
图片
测序的过程是在专用的芯片上完成的。左边的两张图是测序芯片的外观样子。右边的图展示了芯片上的多个小孔。
据论文作者 Brian 自己介绍,一张芯片上有 200 万个小孔,检测反应就是在这些小孔中发生的。每个小孔中容纳的液体容量小于 5x10^-18 升。
图片
这是测序芯片的构造。
上面是反应的小孔,这个反应小孔的直径很小,这可以保证只有在这个小孔中的荧光会被检测到,而漂散在上面液体中的荧光染料所发出的荧光,不会被检测到。
下面是检测光信息的像素点,一个像素点对应于一个反应小孔。
目前,这个芯片的感光像素点只能感知有没有接收到光,但不能分辨光的颜色。
通过光路可以让入射激光射进芯片,有反射镜和光栅耦合器来引导光路。
第二部分,我们来说测序原理。
图片
这是测序的原理图,我们会逐段地进行讲解。
图片
先把要测的蛋白质样本,用限制性蛋白内切酶进行切断。
切断后的多肽溶液,铺到芯片上。芯片小孔的底部有能与多肽的羧基端结合的化学物质,多肽的羧基端就会与小孔底部的这种化学物质共价结合。
每个小孔中能结合几条多肽,是符合泊松分布的。理想情况下,有 1/3 的小孔中结合了一条肽;另外,有 1/3 的小孔中结合了多条多肽;还有 1/3 的小孔中没有结合多肽。只有那些只结合了一条多肽的孔,会给出有用的信息。
图片
接下来,把识别子加入到反应体系中。
识别子的英文叫“recognizer”,是能够识别特定的一种或几种 N 末端的氨基酸残基的蛋白。
图片
在这篇论文中,作者说他们找到了三种识别子:
PS610 这种识别子,可以识别:F、Y、W,这三种 N 端的氨基酸残基。也就是:苯丙氨酸、酪氨基、和色氨酸,这三种氨基酸都是有苯香侧链的氨基酸。
PS961 识别子,可以识别:V、L、I,这三种氨基酸残基。也就是:缬氨酸、亮氨酸、异亮氨酸,这三种氨基酸都是有脂肪碳链侧链的氨基酸。
PS691 识别子,可以识别精氨酸,也就是“R”。
最近,在2023年7月份的一个研讨会上,作者 Brian 说他又找到了 2 种新的识别子:
一种可以识别甘氨酸和丙氨酸。
另一种可以识别天冬酰胺和谷氨酰胺。
这样,到现在止,这个方法可以识别 11 种氨基酸残基。
不同的识别子都被分别标上了不同的荧光染料,不同荧光染料的荧光特征被用于区分不同的识别子。
论文作者还在继续寻找新的识别子,所以未来这个方法将可以识别更多的氨基酸残基,一直到可以识别所有的氨基酸残基,甚至带有修饰的氨基酸残基。
图片
为了区分不同的荧光染料所发出的光,论文作者在荧光时间上对它们做区分。
这两张图的横轴,是以纳秒为单位的时间轴。
纵轴是一个感光像素在不同的时间能检测到的电压,也就感光像素检测得到的信号。
绿色的尖峰,是感光像素是直接检测到的入射激光所带来的光信号。这个入射的激光是脉冲式的,一次只入射很短的时间,所以是一个尖峰。
后面这个先升高、后降低的这个峰,是荧光染料被激发后发出荧光,感光像素测到的信号。可以看到,在荧光染料刚被激发后,信号最强,而后逐步减弱。
图中,虚线标出的是有时间门限制后,接收的光信号。
注意上面这张图,与下面这张图,它们接收信号的时间范围是有差异的。
上面这张图是激发光照了之后,很快就开始收集光信号,是 Bin 1。
而下面这张图,是激发光照了之后,过 3 纳秒,才开始收集光信号,是 Bin 0。
它们两者之间有一个时间差。
图片
作者定义了一个指标,叫“bin ratio”。bin ratio 是指 Bin 0 收集到光信号强度,与 Bin 1 收集到的光信号强度,这两者的比值。
不同的荧光染料有不同的 bin ratio。
这两张图展示了两种有不同荧光寿命的荧光染料,它们的荧光特点。
可以看到,左边的这个短荧光寿命的荧光染料,它的 bin ratio 值较小,只有0.26;而右边这个长荧光寿命的荧光染料,它的 bin ratio 值更大,可以达到 0.61。
每种荧光染料都有其特征的 bin ratio,所以可以跟据 bin ratio 的差异来区分不同的荧光染料。
图片
接下来,我们来看,对于同一个识别子,如何区分它所识别的几种氨基酸残基。
每一种识别子,对它所识别的几种氨基酸的残基的结合牢固程度是不一样的,有的结合得更牢,有的结合得不牢。这就导致识别子结合到残基上之后,能够维持在结合的状态的时间长短是不一样的。
作者把识别子结合到某种氨基酸残基之后,能够持续结合的时间,叫作“pulse duration”,“脉冲持续时间”的意思,缩写成“PD”。
图中展示了 PS610 这种结合子,分别与三种氨基酸残基相结合,所能检测到荧光的情况。
横轴是时间。
我们可以看到,结合到 F 残基上之后,荧光峰的顶部往往较宽,也就是识别子与 F 残基的结合时间较长。
而结合到 Y 残基之后,峰宽会窄一些,也就是识别子与 Y 残基的结合时间较短。
再看结合到 W 残基上之后的情况,峰很尖,也就是识别子与 W 残基的结合时间很短。
最右侧的图,展示了识别子分别与三种残基结合的结合时间的长度,也就是“PD”,
分别是:2.49 秒、0.73 秒、和 0.31 秒。
图片
也就是说,同一种识别子所识别的几种氨基酸残基,PD 时间长度是不一样的。它们分别给出的荧光信号,会在 bin ratio 和 PD 这两个维度上显示出差异。那么就可以通过这两个维度的差异,来区分多种氨基酸残基。
这张图,横轴是 PD,纵轴是 bin ratio。图中展示出了 4 种残基给出的信号
可以在两个维度上被区分开来。
更多种类的残基,也可以通过同样的方式被区分开来。
图片
前面我们了解了如何识别一个氨基酸残基,接下来我们看如何连续地读出肽的序列。我陈巍给这种测序方式起个名字,叫“边降解边测序”。
在反应体系中加入针对蛋白质氨基端的外切酶、和各种识别子。
能识别第一个残基的识别子就会与第一个残基结合,在激发光的照射下,就会发出相应的荧光,并被检测到。
当第一个残基被外切酶切掉,第二个残基就会暴露出来,能够识别第二个氨基端残基的识别子就会结合到多肽的氨基端上。同样,在激发光的照射下,这种识别子上标记的荧光染料也会发出相应荧光。
再接着第二个残基被切掉,第三个残基暴露出来,并被识别子结合,并发出相应的荧光。
这样,经过多轮的切割、识别、再切割、再识别,就可以把肽的氨基酸序列识别来。
其中,当遇到没有识别子的氨基酸残基的时候,就会留出一段没有荧光信号的时间。
为了保证每个被识别子识别到的氨基酸残基,都能给出足够的荧光信号,作者控制蛋白外切酶的浓度,让每个氨基酸残基被切掉的时间,控制在大约 30 分钟左右。
图片
上面这张图,是实测到的信号。
其中,有 5 段是有明确的识别信号的,被用彩色标出来。每一段被称为一个“recognition segment”,缩写为“RS”,“被识别出来的区段”的意思。
其间相隔了一些没有明确识别信号的时间段,被用灰色标出来,被称为“nonrecognition segment”,缩写为“NRS”,也就是“没有被识别出来的区段”意思。
下图,是软件用几个长方块标出了抽象后的信号。这些抽象出来的信号序列,就是测出来的部分肽序列。
第三部分,我们来说论文是提到实测中遇到的一些问题。
图片
作者发现,决定氨基酸残基与识别子相互结合的 PD 值的,是多肽氨基端第一位的残基。但是,排第二、和第三位的残基,也会影响到 PD 值。
作者进一步研究发现,第二位、第三位的残基对 PD 值的影响,是符合经验规律的。因此,它们的影响可以在分析过程中,通过软件加以排除。
图片
文章中提到的最长的测序距离是 18 个氨基酸,也就是图中所测到的 Y 这个氨基酸所在的位置。这说明,目前能够测出来的肽的长度还不算太长。
图片
作者发现,随着残基离 N 端越远,它被切除所花的时间就越长,而且这是呈指数递增的。
以我陈巍的理解,这是因为反应体系中,蛋白外切酶的活性是随时间而递减的。所以离 N 端越远的残基,它被切到的时间就排在越后面,所以它被切掉所花的时间也越长。
这也是限制 Quantum-Si 测序长度的原因之一。
图片
论文作者发现,当脯氨酸残基处于多肽氨基端的第二位时,多肽不能被所用的外切酶所切割。所以,当多肽序列中有脯氨酸的时候,切割就会停下来,信号一直停留在脯氨酸的前一个残基。
图片
这张图,显示了蛋氨酸被氧化成蛋氨酸亚砜后,也就是硫原子被部分氧化后,原先能够识别蛋氨酸的识别子,不再能识别氧化后形成的蛋氨酸亚砜。
这说明,Quantum-Si 测序方法,是可以感知到蛋白质翻译后修饰变化的。
最后第四部分,来说一下我对这个方法的一些想法。
1. 高通量的蛋白质测序未来一定会有巨大的应用市场;
2. 对外切酶和识别子的改进将会大大提升测序的效率,包括第二位是脯氨酸残基时,外切酶切不动的问题;对蛋白翻译后修饰的问题,可以增加新的能识别修饰后残基的识别子;这些都是可以通过基因工程改造来实现的;
3. 可以考虑把感光元件、光路元件,从芯片中剥离出来,集成在仪器上。这样可以大幅降低芯片的成本。而感光元件集成在仪器上之后,就成了可以反复使用的部件,那整体上测序成本会大幅降低;
4. 用不同的荧光颜色来代替 bin ration,能更快、更好地区分识别子的种类。
以上是本次讲的全部内容,谢谢您的宝贵时间。
参考文献:Brian D. Reed, Michael J. Meyer, et al. Real-time dynamic single-molecule protein sequencing on an integrated semiconductor device [J] Science, 378, 186–192 (2022)
图片
关于逆耳生物公司
上海逆耳生物科技有限公司专注于单细胞领域和空间领域的前沿技术服务,依托样本制备、单细胞处理、高通量测序、和生物信息等技术平台,为客户提供融科技服务、项目转化、产品研发于一体的整体解决方案。
逆耳公司拥有完善的技术服务体系,在保证质量的同时缩短实验周期。我们着重为客户提供个性化的解决方案,真正满足客户的科研需求。
联系方式
电话:021-57725235
电邮:sales@neo-bio.cn
网址:https://www.neo-bio.cn
地址:上海市松江区新桥镇莘砖公路518号28幢402室
微信订阅号二维码:
图片