1.字节跳动ByteDance Research团队提出CryoSTAR方法,成功将结构先验应用到冷冻电镜实验数据的动态解析中。
2.该方法在多个公开数据集上的实验验证表明,结合结构先验的冷冻电镜解析具有更高的精度与可靠性。
3.除此之外,CryoSTAR方法能同时输出粗粒度的原子模型和密度图解析结果,有助于更全面地了解生物分子的结构和动态过程。
4.未来,这一方法有望在生命科学和制药领域带来新的突破和希望。
以上内容由腾讯混元大模型生成,仅供参考
机器之心发布
机器之心编辑部
2024 年的诺贝尔化学奖颁发给了在结构生物学领域取得重大成就的 David Baker 团队和 AlphaFold 团队,激发了 AI for science 领域新的研究热潮。
近两年科学界一个饱受争议的命题是:“AlphaFold 是否终结了结构生物学?” 首先,AlphaFold 之类的结构预测模型的训练数据正是来自于以 X 射线、冷冻电镜(cryo-EM)等为代表的传统结构解析方法。其次,冷冻电镜技术非常擅长解析蛋白质的动态,而这正是 AlphaFold 所无法做到的。巧合的是,冷冻电镜这项技术于 2017 年也获得了诺贝尔化学奖。
那么,以 AlphaFold 为代表的 AI 技术能否辅助以 cryo-EM 为代表的传统方法?两个诺奖级技术的碰撞,能够擦出什么样的火花?
ByteDance Research 提出 AI for Science 模型被 Nature 子刊收录
近日,来自字节跳动 ByteDance Research 团队的研究人员提出了 CryoSTAR 方法,成功将来自原子模型的结构先验应用到冷冻电镜实验数据的动态解析中,为解决这一问题带来了新的思路和方法。该成果相关论文 “CryoSTAR: Leveraging Structural Prior and Constraints for Cryo-EM Heterogeneous Reconstruction” 已刊发于 Nature 旗下刊物 Nature Methods,李宜来、周奕、袁璟为共同一作,顾全全教授为通讯作者。
论文链接:https://www.nature.com/articles/s41592-024-02486-1
论文主页:https://bytedance.github.io/cryostar/
开源链接:https://github.com/bytedance/cryostar
基于结构先验和约束的动态解析
CryoSTAR 是首个成功在冷冻电镜实验数据上应用蛋白质原子结构模态先验的方法,方法的主要特点有:
结合蛋白质结构先验知识:CryoSTAR 方法创新性地利用原子模型信息作为结构正则化来解决冷冻电镜数据中的构象动态问题,这与以往大多数仅从计算机视觉角度处理问题的方法不同。它要求一个初始原子模型作为参考,将其结构信息用于适当地约束模型解析出的构象动态,从而缩小搜索空间,避免错误的解析结果,实现更好更快的收敛。
输出两种模态的解析结果:该方法独特之处在于它能同时输出粗粒度的原子模型和密度图解析结果,这种多维度的结果输出有助于研究人员更全面地了解生物分子的结构和动态过程。同时,密度图的输出结果也可以验证原子模型结果的置信程度,检验粗粒度原子模型的动态是否能够充分被数据所支持。
该方法分为两个阶段:
第一阶段通过结构正则化约束的变分自动编码器(VAE)解析数据中的动态构象。CryoSTAR 通过 Encoder,将构象的动态压缩到一个潜在变量中;Decoder 将潜在变量解析成相应的先验粗粒度原子模型的变形来拟合数据。它在三个基本假设下进行基于结构正则化:一是同一链上的两个相邻残基应始终保持连接,通过连续损失函数来约束;二是预测变形后残基不应过于靠近,通过冲突损失函数来惩罚碰撞;三是局部结构应尽可能刚性,通过从先验原子结构模型构建弹性网络并使用弹性网络损失函数来鼓励这种刚性,同时还采用自适应松弛方法来选择弹性网络中的边进行正则化,以避免参考原子模型带来的过度偏差。
第二阶段通过训练一个密度图解码器来得到密度图模态的动态构象解析结果。在 VAE 训练完成后,提取所有图像对应的潜在变量并用于训练密度图解码器。密度图的细节优化由输入图像约束,不受结构先验和正则化的直接影响,从而最小化结构先验对输出密度图的 bias,使得生成的密度图可用于评估和验证粗粒度原子结构模型。
多种典型蛋白数据上的实验验证
图 3 EMPIAR-10180 结果