2024年10月9日,谷歌DeepMind的 Demis Hassabis、John Jumpe 因对蛋白质结构的预测,与蛋白质设计先驱 David Baker 分享了2024年诺贝尔化学奖。
2021年,DeepMind推出了AlphaFold2,其能够根据氨基酸序列来准确预测蛋白质的三维结构。AlphaFold2的出现,引发了蛋白质结构及其相互作用建模领域的一场革命,为蛋白质建模和设计应用提供了广泛的可能。
而最近,DeepMind团队带来了AlphaFold2的全面升级版——AlphaFold3。
2024年5月9日,Demis Hassabis、John Jumpe 等人在 Nature 期刊发表了题为:Accurate structure prediction of biomolecular interactions with AlphaFold 3 的研究论文。
该研究推出了AlphaFold3,这是一个强大的结构预测统一框架,涵盖了前所未有的广度和精确度,能够高准确性预测蛋白质与其他各种生物分子相互作用的结构。这一最新模型能预测含有蛋白质数据库(Protein Data Bank)内几乎所有分子类型的复合物的结构,包括配体(小分子)、蛋白质、核酸(DNA和RNA)如何聚集在一起并相互作用,以及预测翻译后修饰和离子对这些分子系统的结构影响,从而帮助我们在原子水平上精确地观察生物分子系统的结构。
这种用计算机解析蛋白质与其他分子复杂相互作用的能力,有助于为疾病通路、基因组学、治疗靶点、蛋白质工程及合成生物学等领域带来新见解。更重要的是,AlphaFold3为药物研发开辟了令人兴奋的可能性,有望颠覆当前的药物研发模式。
研究团队希望AlphaFold3能够帮助我们重新认识生物世界、重新思考药物发现。值得一提的是,科研工作者可以免费使用AlphaFold3的大部分功能。为了进一步挖掘AlphaFold3在药物开发和设计方面的潜力,Isomorphic Labs已经与制药公司合作,将它应用于现实世界的挑战,最终开发出治疗人类最致命疾病的新疗法。在每一种植物、动物和人类细胞内部都有数十亿计的分子机器。它们由蛋白质、DNA及其他分子组成,只有通过观察它们在这无数种组合中的相互作用,我们才能开始真正理解生命过程。了解我们体内的生物分子世界,以及我们细胞内复杂的分子网络如何相互作用,是理解疾病和理性设计药物治疗疾病的关键起点。2020年,谷歌旗下公司DeepMind推出了基于人工智能(AI)的蛋白质结构预测工具——AlphaFold,2021年7月,DeepMind团队推出了AlphaFold2,其能够根据氨基酸序列来准确预测蛋白质的三维结构。此后,DeepMind团队还推出了AlphaFold-Multimer,用于预测蛋白质-蛋白质复合物的结构和相互作用。不过,扩大单一深度学习模型能预测的复合物范围一直很难,因为不同类型的特异性相互作用差异太大。
鉴于AlphaFold的强大能力,谷歌从DeepMind拆分出了一家名为Isomorphic Labs的新药研发公司,致力于使用人工智能加速药物研发。
该研究在AlphaFold2的基础上推出了AlphaFold3,能够以前所未有的准确度预测所有生命分子的结构和相互作用(包括蛋白质、核酸、小分子、离子)。在蛋白质-配体相互作用方面的预测精度远高于当前最先进的分子对接工具,在蛋白质-核酸相互作用方面的预测精度远高于专门针对核酸的预测工具,在抗体-抗原相互作用方面的预测精度也显著高于AlphaFold-Multimer v2。AlphaFold3的强大功能源于其新一代的架构和训练,涵盖了生命中所有分子。AlphaFold3的核心是一个改进版的Evoformer模块(一种蛋白质语言模型),在处理输入后,AlphaFold 3使用扩散(diffusion)网络进行预测(类似于AI绘图或ChatGPT生成文字),扩散过程从一团原子云开始,经过许多步骤后,最终生成最准确的分子结构。其对分子相互作用的预测准确度超过了所有已有的系统。AlphaFold3能够通过对药物分子(例如与蛋白质结合的配体和抗体)的预测,为药物设计赋能,从而改变人类健康和疾病过程中蛋白质的相互作用方式。AlphaFold3在预测药物相互作用方面达到了前所未有的准确度,包括蛋白质与配体的结合以及抗体与靶蛋白的结合。AlphaFold3在不使用任何结构信息的情况下,比最好的传统方法在PoseBusters基准测试中的准确率提高了50%,这使得AlphaFold3成为第一个在生物分子结构预测方面超越基于物理学工具的AI系统。而预测抗体-蛋白质结合的能力对于理解人类免疫反应的各个方面以及设计新型抗体药物至关重要。Isomorphic Labs正在使用AlphaFold3以及一系列自主研发的AI模型,为内部项目以及与制药公司合作进行药物研发。AlphaFold3能够在几秒钟内生成高度精确的结构预测,为药物研发人员提供了快速准确预测从未被表征的复杂结构的能力,从而大大加速药物研发进程。Isomorphic Labs在日常工作中使用AlphaFold3并发现:- 针对AlphaFold3的结构预测设计小分子,有助于设计出能有效结合靶蛋白的分子。
- AlphaFold3提高了蛋白-蛋白相互作用结构的准确性,为设计新的治疗模式(如抗体或其他治疗性蛋白质)打开了可能性。
- 通过观察目标蛋白在完整生物环境中(与其他蛋白质、DNA、RNA或配体的结合)的结构,可以更深入地了解新靶点,有助于开发更有效的临床药物。
DeepMind推出了AlphaFold Server平台,全世界的科学工作者都可以免费使用(非商业用途)这一全球范围内最精准的结构预测工具,只需点几下鼠标,就可以利用AlphaFold3预测蛋白质、DNA、RNA以及一系列配体、离子和化学修饰组成的结构模型。DeepMind表示,该平台为研究人员提供了一种便捷的方式来生成预测模型,无论他们是否拥有计算资源或人工智能方面的专业知识,从而帮助他们加快工作流程,促进科学创新。在AlphaFold出现之前,往往需要耗费整个博士生阶段,并花费数十万美元,才能解析一个蛋白质的精确三维结构。而AlphaFold2仅仅用了不到3年时间就已经成功预测了数亿个蛋白质结构,几乎覆盖了地球上所有已知的蛋白质,以当前的结构生物学实验进度,完成这一工作量可能需要耗费十亿年时间。AlphaFold3将生物世界带入了高清时代,它使科学家们得以观察复杂的细胞系统,包括结构、相互作用和修饰等。这一生命分子的新窗口揭示了它们是如何相互关联的,并有助于理解这些联系如何影响生物功能——例如药物的作用、激素的产生和DNA的修复等过程。AlphaFold3以及免费开放的AlphaFold Server平台,将通过AI的强大能力赋能科学家加速解决生物学中的开放性问题和新的研究方向。AlphaFold3还有多大潜力,我们拭目以待...下图展示了AlphaFold3对普通感冒病毒(冠状病毒OC43)刺突蛋白(蓝色)与抗体(绿松石色)和单糖(黄色)相互作用时的结构,预测结构与真实结构(灰色)准确吻合。下图展示了AlphaFold3对蛋白质(蓝色)与DNA双螺旋(粉色)结合的分子复合物的预测,与真实分子结构(灰色)几乎完美匹配。下图展示了AlphaFold3对RNA修饰蛋白复合物的结构预测,该复合物包含一个蛋白质(蓝色)、一条RNA链(紫色)和两个离子(黄色),预测结果与真实结构(灰色)非常吻合。下图展示了AlphaFold3对一种分子复合物的结构预测,该复合物包含一种酶蛋白(蓝色)、离子(黄色球体)和单糖(黄色),预测结果与真实结构(灰色)非常吻合。这种酶存在于一种土壤寄生真菌(大丽轮枝菌)中,会损害多种植物,了解这种酶与植物细胞的相互作用有助于研究人员培育更健康、更具抗性的作物。作者也指出了一些局限性,比如约4.4%的结构会出现不正确的手性(一种对称特性),或是幻觉导致“飘带”(一种常见的蛋白质二级结构元素)的出现减少。他们补充道,模拟准确率的进一步提升需要生成一个很大的预测集并对预测结构进行排序,而这会产生额外的计算成本。