最美自组装,登上Nature,首次发现!

天然蛋白质首次自组装成最著名分形之王——谢尔宾斯基三角形

在数学上,分形是重复的模式,其中小尺度的子结构类似于大尺度的结构。它们可以用简单的数学规则描述,从而产生高度的复杂性。分形在自然界中广泛存在,例如植物叶脉的分枝形态、海岸线和河流系统等。大多数自然分形是不规则的,它们在不同尺度上的结构并不完全匹配。自然界中十分罕见的具有规则形状的分形例子,如罗马花椰菜中的重复结构,已经被人们深入研究。这些研究使人们深入理解了产生精确自相似性的潜在机制。自然界中所有已知的规则分形都是由生物体形成的,存在于宏观尺度上。然而,尽管科学上已知生物分子组装的多样性非常之大,但迄今为止还没有在分子尺度上发现这样的规则分形结构。其原因可能是分形构造难以转化为分子自组装。

图片
图1. 什么是谢尔宾斯基(Sierpiński)三角形,谢尔宾斯基三角形最早由波兰数学家谢尔宾斯基在1915年提出。它的构造方法是:以一个正三角形为初始图形,每次将正三角形分割成4个边长为原来一半的小三角形,并去掉其中间的小三角形,重复这一过程,直到不能再分割为止。如图所示。
例如,谢尔宾斯基(Sierpiński)三角形是最著名的正则分形之一,可以通过三角细分或通过依赖于非局部规则的随机“混沌”来创建,或者通过在帕斯卡三角形中具有奇数二项式系数的所有元素来创建。与之相反,生物分子的自组装是通过不同官能团排列的有序性而不是通过细分发生的,并且依赖于原聚体之间的局部接触来协调组装。合成设计已经克服了这些限制,人们已经可以使用某些有机小分子构建来Sierpiński三角形。这些设计的关键是精确控制分子构建块的结构形状和官能团排列,这些设计需要特殊的表面,在装配过程中精确的温度控制,微调不同前体的比例,以产生Sierpiński分形。在细胞中不太可能满足如此精细的组装要求,这使得这些分形的自然版本的可能性很低。

图片

在该工作中,来自德国马普所的Georg K. A. Hochberg教授Jan M. Schuller教授团队报道了一种天然蛋白质,柠檬酸合成酶的发现,它来自蓝细菌长聚球藻,并发现这种酶可以自我组装成谢尔宾斯基(Sierpiński)三角形该工作以题为“Emergence of fractal geometries in the evolution of a metabolic enzyme”发表在《Nature》上。
图片
【形成Sierpiński三角形的蛋白质】
细菌柠檬酸合成酶(CS)蛋白是一种同源寡聚酶,可以组装成二聚体和六聚体。作者发现来自蓝细菌S.elongatus PCC 7942 (SeCS)的CS形成了一个不寻常的组装体。质量光度(MP)分析表明纯化酶在纳摩尔浓可以形成一个包含18个CS亚基的复合物。通过负染色电镜(EM)研究了这些组装体的结构,并观察到SeCS组装成不同大小的规则三角形配合物。该三角形配合物为18聚体,包含9个可识别的密度单元,每个单元对应一个二聚体。首先将三个二聚体排列成六聚体环,然后将三个六聚体连接成一个三角形。这个18聚体代表了MP条件下的主要寡聚物物种。在显微镜下可以观察到包含36或54个CS亚基的更大复合物,形成这么大聚合体的蛋白质浓度比MP 条件450 nM)高9倍。54聚合体由三个18聚体所组成,它们排列成一个更大的三角形,中间有一个大的空隙。6聚体、18聚体和54聚体代表了Sierpiński三角形的零阶,一阶和二阶,这是一个规则分形几何形状。36m聚体代表另一种三角形,但它们共享6聚体的构筑基元。此外,观察到的少量其他形状的规则组装体也都保留了三角形边缘。
为了验证18聚体和54聚体是几何分形,作者估算了它们的Hausdorff维D。对于非分形形状,D取整数值(正方形为2,立方体为3,等等),而对于分形,它可以是非整数,不同的分形有其特定的特征D值。估算结果为:D(18聚体) = 1.53±0.02,D(54聚体)= 1.67±0.02,D(Sierpiński三角形)= 1.59。数学分形无限重复,作者探索了该蛋白质分形是否可以增加到超过54个亚基的大小。使用小角度x射线散射(SAXS)测量评估了溶液在一定浓度下的旋转半径(Rg),并将测量值与6聚体、18聚体和54聚体结构模型计算的理论Rg值进行比较。在高于100µM的浓度下,测量到的Rg值超过54聚体的大小。虽然不能证明较大的组装是Sierpiński三角形而不是其他类型的组装,但这些实验证明了蛋白质能够扩展生长。
图2. 蛋白质组装成分形结构
【Sierpiński组装的结构基础】
为了将六聚体构筑基元组装成Sierpiński分形,需要在二聚体之间引入新的界面。这个接口必须满足两个条件。首先,它必须沿着120°外角连接六面体,从而形成一个三角形。其次,只能在两个二聚体之间形成界面,这样就不会有更多的亚基与三角形的边缘相关联。这些标准确保三角形的边缘保持钝化,并使Sierpiński三角形得以形成。这些要求很难满足通常在同聚体中发现的蛋白质-蛋白质界面。然而,六聚体之间的120°角可以通过在二聚体之间引入三倍对称,头尾C3界面来实现。但这样的界面不能满足第二个要求,因为它允许第三个二聚体与之结合,从而形成三角形晶格,而不是分形。可以通过二聚体之间的双向头对头C2界面来满足第二个需求,但这要求六聚体不再以正确的角度相互作用,从而形成六边形晶格。
为了了解分形形式是如何组装的,作者用冷冻电镜(cryo-EM)求解了蛋白质Sierpiński三角形的零阶(6聚体, 3.1 Å)、一阶(18聚体, 3.9 Å)和二阶(54聚体, 5.9 Å)结构。在18聚体中,CS二聚体通过异源界面组装成六聚体,类似于已知的六聚体CS蛋白。然后通过相邻六聚体的两个二聚体之间的额外接触形成18聚体。该界面具有特殊的几何形状,因此每个二聚体中只有一个单体参与相互作用。一种单体的残基E6与另一种单体的H369之间的相互作用建立了重要的联系,将E6或H369突变为丙氨酸或者删除氨基酸2-6 (Δ2-6 SeCS)可以避免分形的形成。在18聚体中,链之间的不等效性使残基之间的相互作用以正确的角度形成,从而使更多的二聚体不能结合进去。这种几何结构进一步证明了18聚体晶格不仅是普通三角形晶格的子结构,而且实际上代表了Sierpiński三角形的一阶。作者发现,参与分形连接的两个二聚体相对于它们在自由六聚体中的构象具有一个较小的顺时针旋转,这巧妙地打破了分形中六聚体基元的D3对称。
接下来,作者进一步研究了18聚体是如何组装成54 聚体的。作者在结构-功能分析过程中通过点突变体(H369R)生成了一个蛋白质,该蛋白在50 nM处也形成了与野生型SeCS难以区分的18聚体。此外,它能够形成更大的组装体,并且产生较少聚集的低温电镜网格,因此作者可以解析出5.9 Å结构的54聚体。该结构首次揭示了沿其外向边缘以及面向其巨大内部空隙的边缘钝化,这使得六聚体不可能在不引入空间冲突的情况下附着在那里。此外,电镜结构还揭示了将18聚体纳入54聚体的相互作用与将6聚体纳入18聚体的相互作用类似的机制。然而,对于54聚体内的两种不同的连接方式,二聚体的二面角是不同的。也就是说,6聚体之间的相互作用是在60°发生的,这与在自由的18聚体中发生的角度相同。相比之下,在54聚体中,18聚体之间的夹角为34°。对于更大的组装体,这个角度将进一步缩小。
这些观察结果揭示了Sierpiński三角形产生的基本原理。所观察到的所有组合似乎都使不良的分形界面数量最小化。在中间化学计量中,蛋白质明显分布在非分形但仍然是三角形的集合中。将这些组合结合在一起的是它们独特的三角形形状,这也将它们与其他几种形成二维晶格的天然蛋白质区分开来。
图3. 组装层级
图片
图4. 单晶结构解析
【Sierpiński组装体的功能】
接着作者进一步研究了在生理蛋白浓度下占优势的低聚物18聚体的组装是否对酶的功能产生影响。CS催化乙酰辅酶a和草酰乙酸缩合成柠檬酸盐是三羧酸循环的第一步。添加底物或反应产物中的任何一种都会导致结构分解成六聚体,这意味着六聚体具有催化活性的化学计量。作者首先测量了野生型和不能形成分形的变体(SeCS L18Q)的酶动力学。在完全破坏分形组装的饱和基质条件下,两种变体的动力学参数几乎相同。在不饱和条件下,部分18聚体仍然存在,野生型SeCS的活性只有六聚体变体的一半。其次,作者构建了一个突变体(cys4),它通过二硫桥共价稳定分形界面。对于这种变体,一定比例的分形复合物保持在饱和底物浓度。与野生型SeCS相比,cys4的催化速率常数降低。这种活性的下降在加入还原剂后是可逆的,还原剂破坏了二硫桥。这些结果表明,组装成分形配合物显著降低催化活性
为了解释为什么18聚体活性较低,作者在2.7 Å水平上解出了柠檬酸结合六聚体的晶体结构。将这种结构与自由六聚体(Δ2-6 SeCS)的结构进行比较,发现六聚体中的CS二聚体在与柠檬酸盐结合后发生逆时针旋转。这种刚体旋转在其他CS酶中是常见的。它发生在底物结合之后,并将CS从开放构象推进到催化发生的封闭形式。进入闭合形式的旋转与二聚体进入分形的顺时针旋转方向相反。这一结果表明,分形复合物必须进行更大的构象运动才能诱导底物结合或催化,这可能施加了更高的能量屏障,这可以解释酶活性的降低。
接下来,作者想知道这种不寻常的组装是否可能在S.elongatus中具有功能,例如,是否可能是调节酶的一种手段。分形复合物对pH值敏感。pH值从7.5增加到9导致结构完全分解为六聚体。这种行为是由分形界面中的残留物H369驱动的,将其改变为精氨酸可以消除pH敏感性,而不会影响其组装成分形。长叶参胞内pH值的日变化与分形界面的pKa基本一致。在白天,它的碳浓度机制通过吸收碳酸氢盐将pH值调整至8.4。到了晚上,pH值恢复到7.3左右。由于分形组装降低了活性,昼夜pH值的变化可以抑制夜间SeCS的活动。为了验证这一想法,作者创造了携带野生型CS或突变型CS的转基因菌株,这些突变型CS不能在长形葡萄球菌的本地位点形成分形。作者量化了它们在连续光照和12 h昼夜循环下的生长情况,但发现两种条件下没有差异。作者进一步研究了分形的形成是否会阻止氮饥饿期间氨基酸合成导致的三羧酸循环耗竭。因此,作者测试了两种转基因长形葡萄球菌从氮饥饿中恢复的能力。并再次发现携带野生型CS或非分形CS变体的菌株之间没有差异。
图片
图5. 分形组装对催化功能的影响
【Sierpiński组装体的演化】
基于以上观察和实验,作者想知道这种蛋白质组装行为是否只是一个偶然事件,而在功能上是无关紧要的。因此,作者在它的进化史及CS蛋白的系统发育树中,除木氏浮游蓟马外,均未发现18聚体。这表明,通过扩展分形,18聚体一定是沿着S. elongatus的谱系进化而来的,可能是在P. mougeotii和S. elongatus的最后共同祖先中,然后沿着蓝藻/原绿球藻的谱系迅速消失。为了验证这一理论,作者使用祖先序列重建在从SeCS到根的连续节点上复活祖先CS蛋白,并通过MP对其组装进行了表征。结果表明,相对较弱的分形从ancC和ancB之间的六聚体进化而来,然后在ancB和ancA之间变得更强。
然后,作者试图确定哪些历史上的氨基酸取代使蛋白质形成了分形组装。侧链E6和H369形成了分形界面的关键和并赋予了蛋白质组装的pH敏感性,它们已经存在于尚未形成分形的祖先中。分形最初演化时,分形界面在ancC和ancB区间内只发生了一次取代q18L(大写字母和小写字母分别代表祖先氨基酸和衍生氨基酸)。仅在ancC中引入q18L就足以触发分形配合物的形成,包括大于18聚体的配合物。在SeCS中逆转这种替换(L18q)消除了分形组装。在18聚体结构中,来自两个非参与单体的L18侧链位于分形界面的中心,但不会在界面上相互作用。因此,q18L可能从界面中去除了阻止分形形成的排斥性极性相互作用。然而,将q18L替换引入比ancC更古老的祖先中并没有产生分形。因此,分形仅通过q18L替换而进化的历史机会窗口非常狭窄。接下来,作者沿着ancB和ancA之间的区间寻找强化分形界面的因素。只有两个保守取代发生在这个区间的界面上k8R和y80F。在SeCS中,F80在六聚体界面上参与阳离子-π相互作用。y80F可能影响了这种相互作用的强度,潜在地使二聚体的旋转更加有利,而这是结合成18聚体所必需的。
研究结果表明,建立稳定的分形只需要少量的取代。这一结果与先前的研究结果一致,表明单个取代可以显著改变低聚体的形态或诱导超分子组装。这种简单的起源使得非适应性起源是可信的。此外,新界面的pKa在组装出现时就已经准备好与生理pH波动相匹配:将q18L引入ancC导致界面在与野生型SeCS相似的pH范围内解离。因此,组装体中明显经过生理调整的pKa要么是一种分子扩张,要么只是一种看似适应性的巧合。这种蛋白质所能形成的大型组合更明显是进化的偶然,虽然高阶Sierpiński三角形非常规则和复杂,但它们只有在非生理浓度下才会出现,而且它们的大小很难适应S. elongatus的细胞质。即使18聚体完成了一个有用的功能,蛋白质制造更大组合的能力几乎可以肯定是它碰巧进化出的不寻常的对称性的偶然副产品。
图片
图6. 进化谱系分析
总结,该工作基于偶然发现的蛋白质自组装为自然界种极其罕见的分形结构,通过结合多种分析表征技术,揭示了该蛋白质形成分形的必要条件以及分形结构对蛋白质功能的影响。该工作对未来人们深入理解蛋白质组装体的结构和功能提供了更广阔的视角。
来源:高分子科学前沿