诺贝尔化学奖:利用人工智能巧妙的解决了蛋白质难题

戴密斯·哈萨比斯(Demis Hassabis)、约翰·M·詹珀(John Jumper)和戴维·贝克(David Baker)利用机器学习解决了生物学最大的挑战之一:预测蛋白质的3D形状,并从零开始设计它们,从而获得了2024年诺贝尔化学奖。

图片

今年的奖项之所以引人注目,是因为它表彰了来自一家科技公司的研究:DeepMind,一家人工智能研究初创公司,于2014年被谷歌收购。此前的诺贝尔化学奖大多授予了学术界的研究人员。

许多获奖者后来成立了创业公司,以进一步扩大和商业化他们的突破性工作,例如CRISPR基因编辑技术和量子点,但这些研究从头到尾都没有在商业领域完成。

虽然诺贝尔物理学奖和化学奖是分开颁发的,但2024年这两个领域的获奖研究之间存在着令人着迷的联系。

物理学奖颁给了两位计算机科学家,他们为机器学习奠定了基础,而化学奖颁给了他们利用机器学习解决了生物学最大的谜团之一:蛋白质是如何折叠的。

2024年的诺贝尔奖既强调了这种人工智能的重要性,也强调了当今科学如何跨越传统界限,融合不同领域以取得突破性成果。

蛋白质折叠的挑战

蛋白质是生命的分子机器。它们构成了我们身体的重要组成部分,包括肌肉、酶、激素、血液、头发和软骨。

了解蛋白质的结构至关重要,因为它们的形状决定了它们的功能。

图片

早在1972年,克里斯蒂安·安芬森(Christian Anfinsen)就获得了诺贝尔化学奖,因为他证明了蛋白质的氨基酸组成模块的序列决定了蛋白质的形状,而形状反过来又影响了蛋白质的功能。如果蛋白质折叠不正确,它可能无法正常工作,并可能导致阿尔茨海默氏症、囊性纤维化或糖尿病等疾病。

蛋白质的整体形状取决于构成它的氨基酸中所有原子之间的微小相互作用,引力和斥力。有些想在一起,有些不想。基于成千上万的化学相互作用,蛋白质扭曲并折叠成最终的形状。

几十年来,生物学最大的挑战之一是仅根据氨基酸序列来预测蛋白质的形状。

虽然研究人员现在可以预测形状,但我们仍然不明白蛋白质是如何操纵成特定的形状,并在几微秒内将所有原子间相互作用的排斥最小化的。

为了了解蛋白质的工作原理并防止错误折叠,科学家们需要一种方法来预测蛋白质的折叠方式,但解决这个难题绝非易事。

2003年,华盛顿大学的生物化学家戴维·贝克(David Baker)编写了一个设计蛋白质的计算机程序Rosetta。有了它,他证明了通过设计一种蛋白质形状,然后预测创造它所需的氨基酸序列,逆转蛋白质折叠问题是可能的。

这是一个惊人的飞跃,但为计算选择的形状很简单,计算很复杂。常规设计具有所需结构的新型蛋白质需要进行重大的范式转变。

机器学习的新时代

机器学习是人工智能的一种,计算机通过分析大量数据来学习解决问题。它被应用于从游戏、语音识别到自动驾驶汽车和科学研究的各个领域。

机器学习背后的思想是利用数据中的隐藏模式来回答复杂的问题。

这种方法在2010年取得了巨大的飞跃,当时戴密斯·哈萨比斯联合创立了DeepMind公司,该公司旨在将神经科学与人工智能结合起来解决现实世界的问题。

哈萨比斯是一名4岁的国际象棋神童,他凭借AlphaZero迅速成为头条新闻,AlphaZero是一种自学下棋的人工智能,具有超人的水平。2017年,AlphaZero彻底击败了世界顶级计算机国际象棋程序Stockfish-8。

AI能够从自己的游戏玩法中学习,而不是依赖于预先编程的策略,这标志着AI世界的一个转折点。

不久之后,DeepMind将类似的技术应用于围棋,这是一种以其巨大的复杂性而闻名的古老棋盘游戏。2016年,该公司的人工智能程序AlphaGo击败了世界顶级棋手李世石,这场比赛受到了广泛关注,震惊了数百万人。

2016年,哈萨比斯将DeepMind的重点转移到了一个新的挑战上:蛋白质折叠问题。在具有蛋白质科学背景的化学家约翰·M·詹珀的领导下,AlphaFold项目开始了。

该团队使用实验确定的蛋白质结构的大型数据库来训练人工智能,这使其能够学习蛋白质折叠的原理。

结果就是AlphaFold2,这是一种人工智能,可以通过氨基酸序列预测蛋白质的3D结构,准确度非常高。

这是一个重大的科学突破。此后,AlphaFold预测了超过2亿种蛋白质的结构 —— 基本上是迄今为止科学家们已经测序的所有蛋白质。这个庞大的蛋白质结构数据库现在可以免费使用,加速了生物学、医学和药物开发的研究。

设计蛋白质来对抗疾病

了解蛋白质的折叠和功能对设计新药至关重要。酶是一种蛋白质,在生物化学反应中起催化剂的作用,可以加速或调节这些过程。

为了治疗癌症或糖尿病等疾病,研究人员经常针对与疾病途径有关的特定酶。通过预测蛋白质的形状,科学家们可以找出小分子 —— 潜在的候选药物 —— 可能与蛋白质结合的地方,这是设计新药的第一步。

2024年,DeepMind推出了AlphaFold d3,这是AlphaFold程序的升级版,不仅可以预测蛋白质形状,还可以识别小分子的潜在结合位点。这一进步使研究人员更容易设计出精确靶向正确蛋白质的药物。

据报道,谷歌在2014年以大约5亿美元的价格收购了Deepmind。谷歌DeepMind现在成立了一家名为Isomorphic Labs的新公司,利用AlphaFold3的预测与制药公司合作开发现实世界的药物。

就戴维·贝克而言,他继续为蛋白质科学做出重大贡献。他在华盛顿大学的团队开发了一种基于人工智能的方法,称为“全家族幻觉”,他们用这种方法从头开始设计全新的蛋白质。

幻觉是一种新的模式 —— 在这种情况下,是蛋白质 —— 是可信的,这意味着它们与人工智能训练数据中的模式非常吻合。

这些新蛋白质包括一种发光酶,这表明机器学习可以帮助创造新的合成蛋白质。这些人工智能工具提供了设计功能性酶和其他蛋白质的新方法,这些酶和蛋白质永远不可能自然进化。

人工智能将开启研究的下一个篇章

哈萨比斯、詹珀和贝克获得诺贝尔奖的成就表明,机器学习不仅仅是计算机科学家的工具,它现在是生物学和医学未来的重要组成部分。

通过解决生物学中最棘手的问题之一,2024年诺贝尔化学奖的获奖者为药物发现、个性化医疗甚至我们对生命化学本身的理解开辟了新的可能性。


如果朋友们喜欢,敬请关注“知新了了”!