Nature | 抗CRISPR蛋白Acrs新发现:或源起病毒cas同源蛋白

图片

引言

当下火热的CRISPR-Cas基因编辑工具源自原核生物的适应性免疫系统:细菌借助CRISPR-Cas系统对抗噬菌体等病毒的侵染。与此同时,病毒也借助抗CRISPR蛋白Acrs等各类“武器”以拮抗CRISPR系统活性【1】。近年来研究者借助序列/结构特征分析和机器学习等策略挖掘出多种Acrs蛋白【2-4】,但由于多数Acrs蛋白缺少显著的序列同源性,因此其起源及演化过程一直缺少足够的研究。
近来研究者发现AcrIF3具有类似Cas8f的结构并能阻断I-F型CRISPR核酸酶Cas2-3复合物的形成,但由于AcrIF3与Cas8f之间并无显著的序列同源性,这让研究者很难判断两者属于趋同进化还是源自共同的祖先蛋白【5-6】。研究还发现,病毒来源的Cas4蛋白能抑制CRISPR系统间隔序列的捕获过程,表明病毒很可能会变相利用cas蛋白以拮抗CRISPR活性【7】。总体而言,虽然病毒中已发现了大量不同类型的CRISPR-Cas系统,且已有研究提示病毒很可能会“劫持”利用cas蛋白抵抗CRISPR系统,但目前领域内仍缺少足够的证据并有待更进一步的研究。
近日,来自美国华盛顿大学微生物系的Alexander J. Meeske实验室在Nature发表题为Diverse viral cas genes antagonize CRISPR immunity的论文。文章对不同李斯特菌菌株中潜在的Acrs蛋白进行了系统性挖掘和功能评估,首次鉴定出11种新型Acrs蛋白家族,并发现其中3种与I-B型Cas蛋白存在序列同源性,且存在1种具有广谱抗CRISPR活性的新型Acr蛋白。本研究为Acrs蛋白的起源和演化提供了新的视角,提供了Acrs起源于病毒cas的直接证据,也为基因编辑技术活性调控提供了新的潜在工具。

图片

研究者已基于斯氏李斯特菌Listeria seeligeri建立了适合VI-A型CRISPR系统研究的可追踪模型,并发现斯氏李斯特菌不同菌株中富含包括I-B、II-A和II-C型在内的多种CRISPR系统以及原噬菌体和质粒组分,因此适合Acrs蛋白鉴定和分析。为系统性分析李斯特菌中潜在的Acrs蛋白,研究者将I-B、II-A、II-C和VI-A四种CRISPR系统分别克隆整合至54种斯氏李斯特菌菌株内进行外源表达,发现29%菌株中的VI-A型、77%菌株中的I-B型、36%菌株中的II-A型和39%菌株中的II-C型CRISPR系统活性被抑制,表明其中可能存在Acrs蛋白。之后研究者借助迭代式关联推定生信分析法在李斯特菌中进行数据挖掘和Acrs筛选,最终鉴定出11种新的Acr蛋白家族,其中10/11种为李斯特菌及相关噬菌体所特有,且3种与I-B型Cas蛋白存在序列同源性。


已知I-B型Cas蛋白Cas61-Cas51-Cas8b1-Cas77会形成功能性Cascade复合物发挥对抗噬菌体侵染,而上述2种I-B型Acr蛋白AcrIB3和AcrIB4分别与Cas5和Cas8b存在序列同源性并能抑制I-B型CRISPR功能。进化树分析提示,AcrIB3和AcrIB4与Cas同源蛋白的分歧发生在非常早期。功能和机制研究指出,AcrIB3能取代Cas5组分,通过结合Cas6导致功能失活型Cascade复合物的形成。根据Alphafold2预测结果可知,Cas5存在一段18氨基酸长度的钩状区可特异性结合Cas8,而AcrIB3中存在一段6氨基酸长度的环状延伸区可特异性结合Cas7,这种结构差异是AcrIB3导致功能失活型Cascade复合物形成的关键。


除AcrIB3和AcrIB4外,研究还发现AcrVIA2与Cas3存在序列同源性。研究者随后通过同源蛋白分析发现了8种AcrVIA2同源蛋白,其中2种位于李斯特菌的可移动遗传元件上,其余则由肌病毒噬菌体编码。功能分析指出,AcrVIA2并不能抑制I-B型CRISPR功能,而是显著抑制RNA靶向的VI-A型CRISPR活性。功能和机制分析指出,AcrVIA2的DEAD解旋酶结构域是其抑制VI-A型CRISPR系统活性的关键:AcrVIA2并不直接结合Cas13,而是通过促进成熟crRNA降解的方式发挥功能。


在上述3种与I-B型Cas同源的Acrs蛋白基础上,研究者通过生物信息学分析在IMGVR病毒数据库中进行cas同源蛋白挖掘,最终发现358种cas同源的潜在的Acrs蛋白。随后研究者挑选了肌尾噬菌体基因组编码的一种cas3同源蛋白进行功能和机制研究,发现该蛋白与斯氏李斯特菌的Cas3及AcrVIA2均存在序列相似性,因此被称为AcrVIA2.1。AcrVIA2.1长度达1128氨基酸,并能有效抑制VI-A、I-B和II-A三种CRISPR系统,是目前为止最长也最广谱的Acrs蛋白。


总体而言,研究者从李斯特菌不同菌株入手,通过分析各类CRISPR系统的活性差异,结合系统性的数据挖掘和功能研究,鉴定出11种与I-B型CRISPR系统Cas蛋白同源的新型Acrs蛋白家族,并揭示了多种新的抗CRISPR机制,包括形成功能失活型Cascade复合物以及促进crRNA降解。本研究拓展了Acrs蛋白的种类,为细菌-噬菌体的免疫-抗免疫演化研究以及Acrs蛋白的起源和演化提供了新的证据和研究思路。




参考文献


2. Gussow, A.B., Park, A.E., Borges, A.L., Shmakov, S.A., Makarova, K.S., Wolf, Y.I., Bondy-Denomy, J., and Koonin, E.V. (2020). Machine-learning approach expands the repertoire of anti-CRISPR protein families. Nat. Commun.11, 3784.
4. Wang, J., Dai, W., Li, J., Xie, R., Dunstan, R.A., Stubenrauch, C., Zhang, Y., and Lithgow, T. (2020). PaCRISPR: a server for predicting and visualizing anti-CRISPR proteins. Nucleic Acids Res 48, W348–W357.
5. Chowdhury, S. et al. Structure reveals mechanisms of viral suppressors that intercept a CRISPR RNA-guided surveillance complex. Cell 169, 47–57 e11 (2017).


责编|探索君

排版|探索君