两项诺奖“花落AI” “AI辅助创新”将如何改变科学研究?

湖北日报全媒记者田佩雯
日前,2024年诺贝尔奖自然科学奖的三大奖项全部公布,今年物理学奖和化学奖的获奖成果都与人工智能(AI)技术密切相关,这折射出AI在全球科研舞台上的崛起与影响,也深刻反映了AI在推动科学研究范式的改变。
图片
图片
人工智能解决50年化学难题
本次获得诺贝尔化学奖的项目主要涉及计算蛋白质设计和蛋白质结构预测两大领域,分别授予了美国华盛顿大学西雅图分校的大卫·贝克(David Baker),以肯定他在计算蛋白质设计领域的杰出贡献;另一半则联合授予谷歌Deepmind公司的德米斯·哈萨比斯(Demis Hassabis)和约翰·詹伯(John M. Jumper),以此表彰他们在蛋白质结构预测领域的卓越成就。
一切生命活动都离不开蛋白质。蛋白质通常由20种天然氨基酸经肽键形成肽链,并折叠成三维形状。正是这种结构赋予了蛋白质特异的生物功能,使其成为生命的基本单元。
武汉大学化学与分子科学学院教授付磊介绍,有些蛋白质可以构建肌肉,有些则可能成为激素或抗体,还有蛋白质会形成酶或在细胞表面充当其与其周围环境间的信号及物质传递通道。20世纪70年代,研究人员证实了蛋白质的三维结构完全由氨基酸序列决定。从那时起,研究人员一直怀有一个梦想,即试图根据已知的氨基酸序列预测蛋白质三维结构,但这非常困难,一个只由100个氨基酸组成的蛋白质,理论上至少可以呈现1047种不同的三维结构,这巨大的工作量甚至一度被认为是不可能实现的梦想。
新晋诺贝尔化学奖得主德米斯·哈萨比斯(Demis Hassabis)和约翰·詹伯(John M. Jumper)开发的AlphaFold人工智能系统,通过将未知结构的肽链在所有已知蛋白质结构和氨基酸序列的庞大数据库中对比学习,快速给出预测结构,目前已预测了数亿种蛋白质的结构。
AlphaFold彻底改变了蛋白质结构预测领域,预测的蛋白质结构能达到原子水平的准确度。付磊认为,这意味着生物化学领域50年来在蛋白质折叠问题上的挑战结束了。该技术不仅加速了生物医学研究的发展,还为治疗疾病、设计新型材料和应对全球性健康挑战提供了新的工具。
另一位获奖者大卫·贝克(David Baker)的工作其实是蛋白质结构预测的“反向操作”。自然界中的蛋白质种类有限,研究人员希望创建出新的蛋白质种类,使其具有诸如分解有害物质或作为化学制造业工具等高精准度、高选择性的功能。输入蛋白质空间结构的“设计图纸”,蛋白质分析软件Rosetta会根据图纸反推出对应的氨基酸序列。只要按照这个氨基酸序列进行合成,就可以得到人们想要的、具有特定功能的新蛋白质。这种方法除了在疫苗开发、靶向药物研发和遗传病治疗等生物医学领域大显身手,新蛋白质甚至能被开发成工业催化剂或是新型传感器。
科学研究进入AI驱动科研的新范式
10月8日,诺贝尔物理学奖的发布让很多人出乎意料。该奖项授予了美国普林斯顿大学教授约翰·J·霍普菲尔德(John J. Hopfield )和加拿大多伦多大学教授杰弗里·E·辛顿( Geoffrey E. Hinton),以表彰他们“在人工神经网络机器学习方面的基础性发现和发明”。
两位获奖者使用物理学工具训练了人工神经网络,这些方法已成为当今强大的机器学习的基础。正是他们的研究,让如今的深度神经网络和深度学习得以诞生。
其中,杰弗里·欣顿因其在深度学习领域的开创性工作,被誉为“AI教父”,并在2018年荣获有“计算机领域的诺贝尔奖”之称的图灵奖。他还因对AI安全性的持续呼吁而备受关注。此次获奖,让杰弗里·欣顿成为史上首位同时获得图灵奖和诺贝尔奖的科学家。
中国科学院高能物理所研究员邢志忠在接受采访时表示,传统诺奖划分无法覆盖当前的新型交叉学科,所以把机器学习、人工智能放在物理学奖相对于其他奖项是最合适的。他介绍,人工智能在高能物理领域有广泛应用。例如在高能粒子束流的对撞过程中,会打出海量的粒子,想要提取出目标粒子的相应数据是十分困难的,采用机器学习可以大大提升效率。
“AI的核心优势在于能够处理海量数据并从中提炼规律,这是人类难以在短时间内完成的。”付磊坦言,在其科研工作中也深刻体会到AI带来的巨大利好。比如在合金设计中,理解成分—性能关系背后的基本物理原理是合金设计的关键任务,对于成分复杂的材料来说,这是一项特别具有挑战性的任务。高熵合金(HEA)需要至少5种元素组合。仅考虑元素周期表中最常用的元素都能够产生1050种不同的组合,如此多变灵活的成分导致传统的合金设计方法难以胜任。
“当前AI在预测HEA的相或微观结构方面获得了极高的准确性,进一步精准预测材料的机械、催化等性能也指日可待。这些进展能够充分激发高熵材料的潜能。”2023年,付磊课题组利用机器学习构建了含Ga高熵合金势函数,有效地验证了液态金属在高熵合金合成中的巨大作用,相关成果发表在《自然》期刊上。在教学活动中,付磊同样利用AI和虚拟现实技术,为学生提供虚拟实验室体验,帮助学生在安全的虚拟环境中进行实验,从而弥补实际实验设备的限制。
“未来的科学研究可能会更加依赖AI进行高效的数据分析和模型构建,推动科学研究范式从人类主导向AI辅助甚至AI驱动转变。这一范式的转变不仅会提升科学发现的速度,还可能开启全新的研究领域。”付磊表示。