“在学校里做科研时,我们会更喜欢在一个点上深入拓展,最终达到开辟一个新领域的目标。
而我对自己的研究有更多期待,既希望在一个创新点上深入并转化,又希望能够启发未来 AI 在药物发现领域的全流程覆盖,使得能逐渐通过 AI 大规模、可持续地产出高价值药物。”
上海交通大学助理教授、2024 亚洲青年科学家基金项目-生命科学研究员郑双佳在近日举办的 2024 未来科学大奖周期间表示。
图丨郑双佳(来源:资料图)
传统的药物研发往往漫长且昂贵。例如,开发一款药物,通常需要 10 年以上的时间,平均投入 26 亿美金。
AI 尤其是生成式 AI 的出现,已经开始改变这一过程。目前,它几乎全链条地覆盖到传统制药的每一个环节中,包括靶点发现、临床前药物研发和临床开发等。
不管是从为疾病定位有价值的生物靶点,还是从已知的化学空间里找到一个不错的起始分子,AI 都能在其中发挥有效作用。
利用生成式 AI 加速药物研发的进程,也正是郑双佳近年来专注的研究领域。
在该领域,他曾取得诸多优秀成果,比如,为实现动态复合物结构预测而设计的几何深度生成模型 DynamicBind[1],针对难成药靶点的生成式智能药物设计算法 [2],有效融合原子结构和分子网络尺度之间多尺度信息的学习框架 MUSE[3] 等。
凭借这些贡献,他成功获得 2024 亚洲青年科学家基金项目资助,成为生命科学领域的获奖人。
开发深度学习方法 DynamicBind,实现对动态复合物的结构预测
谷歌 DeepMind 团队推出的 AlphaFold 系列模型,让 AI 在实现静态蛋白质结构预测方面取得显著进展。
然而,由于其不具备预测蛋白质结构动态变化的能力,因此无法助力该领域的研究人员,更好地理解蛋白质功能和推进药物发现。
基于此,郑双佳带领团队开发深度学习方法 DynamicBind,能够在 AlphaFold 完成蛋白质静态结构预测的基础上,进行复合物结构的动态结合模式预测。
另外,值得一提的是,与只能预测蛋白质单体结构的 AlphaFold2 相比,DynamicBind 能够同时预测小分子和蛋白的结合模式和亲和力强弱。
“从这一点来看,DynamicBind 实现了从结构到功能的转变。也就是说,完成从仅仅进行结构预测,到能够有一定落地场景的药物发现的转变。”郑双佳表示。
与此同时,对于该成果而言,该团队也引入了一些 Dynamic 模块。
这是结构生物学家以及该领域许多研究人员都非常关注的模块,通常指的是动态建模或动态分析的组件或工具,旨在研究和描述生物分子(如蛋白质、核酸等)在时间和空间上的动态行为。
在研发药物的过程中,研究人员可能会看到一个蛋白结构出现多个口袋的情况,其中有些口袋在平常是不打开的,直到某些特定场景才会打开。
通过 AlphaFold 预测的结构,往往捕捉不到这种被称为隐蔽口袋的东西,但由于引入了 Dynamic 模块,DynamicBind 能够很好地捕捉到这种隐蔽口袋是如何出现的,以及它们和小分子是怎么结合的。
“换言之,可以帮助我们找到特异性更好的药物,实现对症下药的目标。”郑双佳表示。
他指出,课题组很早就将 DynamicBind 以及系列工作投入到实际应用中。
“我们当时做了一个比较暴力的事情,就是选了 15 至 20 个高价值靶点,包括一些难成药靶点,用 AI 的方法对每个靶点进行层次化的药物筛选,而后每个靶点都会送测 100 至 200 个分子去进行湿实验验证。”郑双佳说。
从中,他们也看到令人惊喜的效果。
那就是,在这 15 至 20 个靶点中,有 85% 的靶点都能找到很不错的苗头化合物。
同时,在整个过程中获得的筛选成功率,比用传统的计算化学方法以及高通量实验方法获得的成功率要高许多。
“我们每送测 100 至 200 个分子,按照生物学家制定的活性标准,平均在这近二十个靶点上的筛选命中率能达到 20%。”郑双佳表示。
如上所说,除了这个成果,他也系统地开发了一套针对难成药靶点的生成式智能药物设计算法,用于蛋白水解靶向嵌合体(PROTAC,Proteolysis-Targeting Chimera)的设计。
需要说明的是,PROTAC 作为一种创新的药物设计策略,拥有特异性地降解目标蛋白质的功能。
它的设计难点在于,让分子在拥有降解活性的同时,也有良好的选择性和成药性。也就是降低毒副作用且提高生物利用度。
为攻克这一问题,该团队通过生成式 AI 构建了一个化学大模型,然后配合强化学习的方式,去优化 PROTAC 中间的连接子。这就是上述算法背后的原理。
基于该算法,研究人员设计了 6 个分子,并进行实验验证。结果显示,其中 3 个都表现出很好的降解活性,且在成药性上得到明显提高。
“诺奖进入‘AI 时代’,未来会有更多 AI 学者获得该奖项”
2024 年,诺贝尔物理学和化学奖接连颁发给 AI 研究者。这在很多人看来,是诺奖进入“AI 时代”的表现。
那么,郑双佳是如何看待的呢?
首先,他表示很开心,因为看到 AI 获得了更多关注。
其次,他认为,获得化学诺奖的大卫·贝克(David Baker)在蛋白设计领域做出了先驱式的工作,却还未真正开发出一款非常优秀的药物产品进入产业界。换句话说,他的研究让人看到希望,但还未到达终点。
“然而,不管怎样,诺奖确实是进入到 AI 时代了,未来我相信会有更多国内外的 AI 学者获得诺奖。”郑双佳表示。
回到生命科学领域,很多人都觉得,以 AlphaFold 为代表的 AI 技术,给结构生物学家带来了冲击。
对此,郑双佳认为,不仅仅只有冲击,而是赋能和革新了结构生物学。
“但这并不意味着结构生物学会消失,或者结构生物学家会消失。就像马车升级变成了汽车,驾驶员的形式和职能也会随之升级进步。所以,这只是时代发展的必然。”郑双佳说。
从这个层面来看,结构生物学是在更加蓬勃地发展,而且变得愈发重要,能够作为生命科学的基座,支撑科研人员在此基础上开展进一步的科学研究和转化落地。
此外,对于蛋白质 3D 结构预测来说,目前的 AI 技术已经能将预测精度提升至 90% 以上。面向未来,还会存在哪些新的发展方向?
郑双佳认为,顺着业务设计的角度,他看到三个方面的发展空间。
其一是朝着 Dynamic 方向发展。
原因在于,目前即便 AlphaFold 已经能实现超高的预测结构精度,却还是一个偏静态的预测方式,但所有的生物分子都是动态的,并会在动态中形成功能。所以,像 Dynamic 这种动态预测,必将成为未来的发展趋势。
其二是回到功能。
当下领域内学者已经能利用 AI 预测出一个好的结构,但这个结构如何和其他生物分子相互作用从而行使具体生物功能,还有待进一步探究。
其三是朝着设计的方向发展。
“这也是贝克能拿到诺贝尔化学奖的核心原因。他并不是被奖励在蛋白结构预测上做得有多好,而是被奖励在他为蛋白设计领域的开辟和成熟化所做出的贡献。”郑双佳表示。
由此,他认为,基于结构预测方法的逆向设计,不管是结构启发式的,还是功能启发式的,都将是该领域发展的重点方向。
如果从更长远的角度来讲,结构生物只是整个生物链条中的一部分。所以,对于 AI 而言,还需要更多跨尺度的思考。
“说到底就是回到组学概念上,通过不同尺度的组学去更好地表征生命。当然,这是一个长期的事情,但我觉得 AI 会在其中扮演非常重要的角色。”郑双佳如是说。
参考资料:
1.Lu, W., Zhang, J., Huang, W. et al. DynamicBind: predicting ligand-specific protein-ligand complex structure with a deep equivariant generative model. Nature Communications 15, 1071 (2024). https://doi.org/10.1038/s41467-024-45461-2
2.Zheng, S., Tan, Y., Wang, Z. et al. Accelerated rational PROTAC design via deep learning and molecular simulations.Nature Machine Intelligence 4, 739–748 (2022). https://doi.org/10.1038/s42256-022-00527-y
3.Rao, J., Xie, J., Yuan, Q. et al. A variational expectation-maximization framework for balanced multi-scale learning of protein and drug interactions.Nature Communications 15, 4476 (2024). https://doi.org/10.1038/s41467-024-48801-4
运营/排版:何晨龙