从天空到海洋,从生命科学到化学、物理学,AI是否能成为推动科技创新的核心动力?
生成式AI的崛起以人们想不到的形态出现,一如理科生的考卷由文科生批改。
席卷生活的方方面面之后,AI又以迅雷不及掩耳之势,叩击科学殿堂的大门。
一个时代、一个领域只有一个发展的“主范式”,与范式吻合才能踩在历史发展进步的一边,但范式本身有惯性,所以每一代新的范式转换都需要付出努力和代价。
AI4S就是范式转换的重要表征,它不以人的主观意志为转移,也不能人为的对抗范式转换。但是,它也不会自然降临,每个范式转换期都要付出巨大的劳动甚至代价,而只有经历这个过山车式的过程并始终不被甩出第一梯队,才能最终驾驭范式转换带来的红利,能驾驭范式转换的才能笑到最后。
关于AI4S最前沿的理论、实践和争论,都在这篇文章里。
——导语
故宫里的计算机——计算科学研究的历史叙事与现实突破
人类历史上得到普遍认可的较早期的机械式计算机之一,是1642年法国哲学家兼数学家布累斯·帕斯卡发明的加法器(Pascaline)。帕斯卡发明它的目的,是为帮助父亲减少税务计算上的劳作;而此后,二进制和微积分的发明者莱布尼茨在加法器的基础上,发明了人类第一台可进行四则运算的机械计算机。帕斯卡自己亲手制作了50台加法器,而后,人们又生产了许多复制品。据说,在中国的故宫博物院,也保存着两台铜制的复制品,是当年外国人送给慈禧太后的礼品,但“老佛爷”哪里懂得它的奥妙,只把它当成了西方的洋玩具,藏在深宫里面。此后的几个世纪里,机械式计算机、机电式计算机和现代意义上的电子计算机相继出现,但某种程度上,它们都有一个共同的前提——目的就是发明一个“代替人做数学计算”的机器。某种意义上,人类在现代科学技术上真正的进步,是从上世纪50年代开始的。因为有了大型电子计算机,并且基于机器计算的原理发展出来了许许多多的算法,我们才可以普遍的实现了从基本原理出发来解决实际问题。基本原理虽然此前就存在,但就效率而言,用它解决实际问题是非常困难、几乎做不到的。例如,我们经常听说天才科学家破解密码的故事,但这几乎是不可复制的;而现在的黑客,哪怕数学知识粗浅,只要下载一个工具,在破解密码的速度上就可以超过许多百年前的天才。之所以能如此,这是因为程序里已经内置了一代又一代的计算机科学家开发和改善过的算法,而这些算法又基本有一个共同的出发点:可以用多项式来逼近一般的函数,从本质上来说,这是牛顿、莱布尼茨的时代就发明出来的,但只有依赖现代计算机,才能使之真正的被应用于现实。最早的计算机出现是为了把数学家从繁冗、人力所不能及的数学计算中解脱出来,但在摩尔定律加持之下,人类计算能力得以快速增加,这是它被用于科研进而迈进公众生活的一个前提。它提出于1852年,是英国制图师弗朗西斯·古特里的一个假说。他指出,无论地图上有多少个国家,只需要四种颜色就可以对地图进行着色,并且相邻的国家颜色不会相同。这个假说难以证明,主要是因为涉及庞大的计算量。因此,足足过了120多年,到了1976年才由美国的两位数学家用计算机证明了这个假说,这背后是1200多个机器小时中进行的100亿次判断所支撑的。如果说图灵时代的炸弹机、巨人机只是辅助数学家运算一些步骤。那么,四色问题的解决则是在人类设定程序(算法)后,完全由计算机完成的证明。历史在这里前进了一大步——计算机正式走到了解决科学问题的舞台上, 计算数学、计算力学、计算化学、计算生物学等交替出现。比四色问题的解决更具有标志性意义的,是现代计算机科学的最前沿——人工智能技术与科学的结合,而其代表事件则是2024年诺贝尔化学奖的颁发。这次由三人分享的化学奖中,来自谷歌的英国科学家哈萨比斯和江珀的工作十分醒目,他们开发了一种名为AlphaFold2的人工智能模型,这种模型解决了一个已有50年历史的难题,能够预测大约两亿种已知蛋白质的复杂结构,并且已被全球200多万人使用。我们可以借助对这个迷人案例的解析,来看看AI特别是深度学习是如何帮助人类解决顶级科学难题。蛋白质结构是指蛋白质分子的空间结构。作为和我们息息相关的一类重要的生物大分子,了解清楚它的结构,对生命科学研究至关重要。通过分析蛋白质的结构,人们可以确认它们的生理功能,这样在遗传学的实践上就有很大的现实意义;同时,它还可以为人们设计新的蛋白质或改造已有蛋白质提供可靠的依据,而这就是当今世界上基于精准蛋白质靶点的“救命神药”的发明速度越来越快的背后推动力。但是这其中涉及到海量的计算,因为蛋白质结构非常复杂。解决蛋白质结构预测问题一直是结构生物学的圣杯。在深度学习介入之前,人类依赖电子显微镜对蛋白质进行实际观测,已经做了大量艰苦的工作,并据此产生了蛋白质数据库(PDB)。简单来说,蛋白质预测有两条路径——打个比方,TBM方法就是用采集到的指纹和已有的指纹库相对比,一旦比中,就可以高度确信,但短板是数据库中必须已经有可靠的指纹;而FM方法则类似于在白纸上凭借想象力画画,其本质是非常复杂的函数运算。人类从1994年起就设立了蛋白质预测的奖项,但其中FM方向一直得分很低,大多数只有20到40分。但AlphaFold的出现改变了这一切,其中的Fold指的就是“折叠”——2018年,AlphaFold采用深度学习基础上的FM预测策略,通过三个系统支撑(建模、预测、优化),出道就拿下当年蛋白质预测大奖;2020改进后的模型AlphaFold2在第14届CASP竞赛上进一步大杀四方,在给定预测蛋白质中GDT平均得分92.4,远超所有竞争对手。至此,深度学习支撑下的蛋白质预测取得历史性进展,也开始消融TFM和FM之间的间隔,人类对于蛋白质结构预测乃至设计的能力得到极大增强。可以说,哈萨比斯等学者的成就,和当年四色问题的证明可以相提并论,同样是计算服务于科研的里程碑事件。人们由此认为,AI在未来科学研究中成为中坚力量的可能性大幅度提升,一个新的时代即将开启。在今天,用AI服务于科研被称为“科学智能”,但人们往往使用一个更通俗的简称:AI4S(AI for Science的缩写),值得自豪的是,这个名称是两位中国科学家提出的。今天,在中国开展AI4S的研究,具有许多有利的条件。在笔者看来,有三个条件比较重要:2.中国的算力,特别是AI算力的基础设施非常发达,在全球数一数二;3.AI4S的实践日益展开,已经在许多领域得到实证,理论基础也正在探索和夯实;关于第一点,中国科学院的汤超院士是这样描述的:“好几年前,鄂维南(北京大数据研究院院长、中国科学院院士)找到我,商量是否可能在北大设立一个交叉学科的项目,用来探索机器学习在不同的科学和工程领域的应用。我们给它取了一个名字,叫AI for Science。我们两个当时都很为这个名字得意。现在来看,应该是很多人都想到了这个名字,AI for Science也成为了一个趋势”。而这件事更大的背景是,国家自然科学基金委在2020年底设立了交叉科学部,来统筹基金委在交叉科学领域的整体资助工作,其中任务之一就是探索建立交叉科学研究范式,而交叉科学部成立以来的第一个重大研究计划就是在AI for Science方向的。所以严格来讲,AI4S的概念是中国科学家提出的,而这个方向得到了国家的大力支持。某种程度上,这也说明中国科学家的思路越来越具有超前性,对国际顶级前沿技术的感知和参与,已经在完成一个“从跟随到开创”的新阶段。从整体规模上来说,截至2023年底,我国提供算力服务的在用机架数达到810万标准机架,各类算力提供主体超5000家,算力总规模位居全球第二,成为AI4S的基础条件之一。但是,仅仅看算力的总规模是不够的,还要看算力平台的对AI的亲和度。以华为云为例,就以系统性创新,重新定义了云基础设施。可以满足随着计算场景的多元化以及智能算力需求飞速增长而不断产生的新需求。最传统的云计算中心,是以CPU为中心的主从架构,但这很难满足以GPU为核心的智算需求。同时,科学家们发现,在某种程度上,用通用算力(CPU、GPU)来满足特定场景的需求,存在成本高、能耗高的问题。因此专用集成电路的概念开始盛行,针对不同的AI计算场景,又发展出了NPU(神经网络处理器)、TPU(针对专门为加速深层神经网络运算能力的芯片)、DPU(深度学习处理器)等等。但是,不同架构和方向的处理器如何整合和调度又成了大问题,这就像好一辆车却装上了好几个发动机,没有协调好是开不走的。各种基于不同需求、不同技术栈而研发的芯片如果不能协同,反而成为一盘散沙。在这个背景下,华为云研发了CloudMatrix架构,就像让一只雄狮带领着一群羚羊去战斗,这种架构实现了“一切可池化”,让CPU、NPU、GPU、高速内存等多样资源统一抽象,被放进一个资源池里。基于精妙的调动,相比传统单体算力,这种紧耦合矩阵算力规模提升了一个数量级以上。此外,“一切皆对等”指通过超高带宽的Scale Up网络,打破单体算力性能和集群线性度瓶颈,以盘古大模型训练为例,效率可提升68%;“一切可组合”则指通过瑶光智慧云脑提供NPU、GPU、CPU、内存等资源按需组合,通过匹配最优算力组合,实现百亿到万亿级模型训练所需的资源。另外,基于自主创新的AI底层硬件,华为云昇腾AI云服务整合了大规模算力集群、计算引擎CANN、AI 开发框架MindSpore、ModelArts AI 开发生产线和ModelArts Studio大模型即服务平台,为大模型的训练,推理,AI 应用的开发、运行提供稳定可靠的全栈算力保障。举一个很容易理解的例子,以一个常见的万卡大集群为例,由于涉及到数十万计的处理器、内存、存储阵列、跨网络的高度并行和满负荷运转,经常会出现因为部分硬件损坏和软件故障导致的训练中断。一位AI专家告诉我,早期的大模型训练经常运行几分钟、十几分钟就会中断,而即使经过多次迭代,平均可持续水平也不超过3天。但针对万亿模型训练这个典型场景,昇腾AI云服务已经可实现40天无中断,是业界标准的十几倍乃至几十倍。由此可以说,目前我们已经拥有世界级的高AI亲和度的智算基础设施,这是实现AI4S的重要前提之一。如鄂维南院士就指出,科学研究总体上可分成基于数据驱动的开普勒范式和基于原理驱动的牛顿范式,这两种范式在现代遇到了各自的挑战,但这一挑战又有一个共同的解决方向——“缺乏有效手段解决高维数学问题,是阻碍科学研究与技术发展取得进一步突破的主因之一。而深度学习,或者说人工智能,可以帮助解决这个问题“。各个学科都有一些基本规律,其特点是都以微分方程呈现,而且都是非常困难的微分方程。鄂维南指出,传统的计算机算法基于用多项式逼近一般的函数,但在目前的科研领域遇到的问题是,依赖的变量太多了。随着变量个数(也就是维数)的增加,计算的复杂度呈指数级增加,这就是维数灾难,而多项式方法对此是无效的。反之,AI对于多维问题反而是好手,以大模型“最拿手”的人脸识别为例,“每个像素都是1个自由度,这里一共有32x32=1024个维度;此外,颜色空间有三维,所以再乘以3,每一个图像都可以看成是3072维空间的一个点,所以Cifar10的分类问题可以看成是寻找一个3072维空间上的函数。这样的高维函数以前我们是根本没办法处理的”。由此可见,从科学研究的角度来说,深度学习可以带来新的计算方法、新的科学模型和新的实验方法,这似乎已经是不争的事实。在主流科学界认知到位和软硬件支撑条件均已十分完备的情况下,中国的AI4S拥有了一个非常良好的开局。让国人骄傲的C919大飞机现在已经在国航、东航和南航的航线上发挥作用,正在研发的C929和C939更是国人心心念念的“国之重器”。也正是因为此,中国商用飞机公司联合华为发布的业界首个工业级流体仿真大模型“东方御风”,就更加受到关注。很多网民津津乐道的是,为什么中国最近飞行器的研发周期屡屡打破此前的世界纪录?很多人都知道,中国的风洞技术全球领先,这是近年来中国飞行器研究屡屡取得突破的重要原因。此话不假。但是,这其中也有AI技术的功劳。AI4S的方式,在一定程度上颠覆了飞行器的研发周期率。人们很少知道的是,一个超级风洞不仅造价高昂,而且使用成本极高。其驱动功率动则超过1万兆瓦。更重要的是,高级别风洞的稳定输出时间极短,100毫秒往往已经是极限。所以,在绝大多数真实研究中,吹风洞只能解决一部分问题,而持续的优化和模拟运行,则要依靠计算机模拟,这就是我们前面谈到的计算科技的一个重要分支——计算流体力学(CFD)。用计算机仿真模拟来解决流体力学问题,从上世纪50年代就开始发展,随着计算机算力的增长和软件的升级,其能力已经十分成熟。但魔鬼在细节里——一位航空专家告诉我——由于在计算时所提供的计算模型,并不能包含所有实际流动的细节,所以数值模拟结果可以预测实验器件的气动性能变化规律,但是不能反映实际的各种流动细节,因此真实风洞试验仍不可或缺。而之所以不足以反映各种细节,有软件设计、数值设置的问题,但还有一个更重要的问题,就在于我们前面提到的高维问题——因为实际变量细节太多,导致计算维度太高,传统仿真计算效果不够好。例如,在设计飞机翼型时,当攻角发生变化时,流场会发生剧烈的变化,甚至出现激波现象。而激波前后的流场变化剧烈、复杂,导致无论是传统的CFD,还是一些传统的AI算法都会预测困难。而“东方御风”的强悍就在于,使用用更新后的AI模型替换传统Navier-Stokes方程求解,提升了典型场景的仿真效率,而且通过将流动剧烈变化区域的特征划分为更多、更精细的维度来进行精细捕捉,从而实现了前所未有的整体AI流体仿真的预测精度提升。由于华为云底座提供了前所未有的并行AI算力,加之模型的优化,得以在降低仿真时间同时又沉淀出了新的模型和工具。其不但局部改变了CFD的发展范式,也会很容易被华为云作为一种流体力学方面的解决方案利器,复用于高铁、汽车等研发场景中。这是一次标准的AI4S工程,而它的成绩赫然是——降低仿真时间1000倍。另一个高度值得关注的是在气象预报领域,目前,该领域已经成为国际AI巨头展示AI4S能力的竞技场。天气预报是一个非常适合AI4S来“炫技”的领域。一方面,各国都会有过去数十年甚至更长时间的天气气象数据,是天然的优质训练数据集;另一方面,数值预报已经把基于计算的预报在数学上发展到了一个相当高的水平,给AI用来改进或突破确定了较好的“靶点”。先是国际顶级学术期刊《自然》(Nature)杂志在正刊发表了华为云盘古大模型研发团队的研究成果——《三维神经网络用于精准中期全球天气预报》,这是近年来中国科技公司首篇作为唯一署名单位发表的《自然》正刊论文,它们的成果的英文名称是Pango-Weather,也就是盘古气象大模型。《自然》审稿人对该成果给予高度评价:“华为云盘古气象大模型让人们重新审视气象预报模型的未来,模型的开放将推动该领域的发展。”或许是华为云的大模型引发的连带效应,谷歌和旗下的DeepMind连发三个天气类模型NeuralGCM、GraphCast和Cencast,反映了这一领域的激烈竞争。而华为云盘古气象大模型主要的看点,则不但是史上首个精度超过传统数值预报方法的AI模型,而且速度相比传统预报提速10000倍以上。从技术上说,盘古气象大模型的核心是提出了3D Earth-Specific Transformer模块,其主要思想是使用一个视觉transformer的3D变种来处理复杂的不均匀的气象要素。这让人不由想到此前鄂维南院士的话:高维计算是传统计算的难点,但对于基于多模态的大模型来说,只要把用于图像或人脸识别的模型进行改进,就可以很好的解决这个问题,这也是大模型的先进之处。同时,由于气象要素数据对应的经纬度网格是不均匀的,而不同的要素在不同纬度、高度的分布也是不均匀的。盘古天气大模型对这些不均匀性的建模,提升了预测精度,也有利于学习气象数据背后潜藏着的复杂物理规律。而无论是盘古-天气大模型还是与之类似和竞争的多个大模型,共同点都是利用深度学习方法,在大规模的历史天气数据上进行训练,并使用改良的模型模块,从而在效率、效益和成本上,都具有显著的优势。很简单的一个对比是,虽然训练需要的数据很大、过程也不短,但生成的模型只需要很少的算力、时间和能耗就能完成,这里的“很少”是对比传统方式,其则至少需要在超级计算机集群上运行很长时间。其实,数值天气预报的“嫡系”升级版并不是气象大模型,而是一种被称为集合天气预报的方法,它的代表机构——欧洲中期天气预报中心(ECMWF)雄心勃勃的宣称,2023年完全转变为100个成员的集合预报系统。而气象大模型相当于半路上杀出的程咬金,是典型的跨越式技术对渐进式技术突发的“降维打击”。可以想见,未来5-10年,两种不同的模式将激烈冲突或融合发展,而这一幕也会在多个科技领域上演。由于前文已经充分的描绘了AI4S的美好前景和积极实践,那我们在这里就总结一些未来的机遇与挑战。首先,目前产生的一些AI4S的成果,用汤超院士的话说就是“大多是1到100,或者1到1000的成果,而较少是从0到1的”。这句话深刻的揭示了AI4S的现状。如果说的尖锐一点,就是这些问题的解决刚好进入了大模型的舒适区,比如把一个视觉模型改造成力学模型,而且所解决问题的症结也比较显性。当然,进步就是进步,就像华为云的成就登上《自然》杂志一样,让中国的AI4S得到世界级的认可,甚至激发了科技巨头的跟进,这都是值得嘉赏的。但我们并不应该满足,如哈萨比斯就提出——AGI(通用人工智能) 的一个重要测试标准,将是其是否能够自主生成像广义相对论那样的全新假设和理论。如果说“图灵测试”基本已经在这一轮生成式大模型浪潮中得到验证。那“哈萨比斯假说”,就应该是我们的AI产业,特别是华为这样的AI领军企业的长期目标。我们一般称研究AI发展的高层次科研人才为AI科学家,但推动AI发展的,不应该只有AI科学家。2023 年,《自然》杂志(Nature)进行了一项针对 1600 名科学家的调查研究,以了解科研工作者对生成式AI的使用状况和想法。结果显示,有一半的参与者本身就是研究 AI 领域的研究者。而如果排除这部分人群,在非 AI 领域的研究者中,也有超过一半的人会在科研工作中使用 AI。但不要高兴太早,这些科学家使用AI的三个主要场景是——辅助非英语母语的作者撰写论文(包括编辑和翻译)、用 AI 编写代码、用 AI 提炼论文内容以节省阅读时间。除了用AI编写代码有一定的科技属性以外,另外两项都是文字性的工作,这也和目前的大模型主要是大语言模型的现状相匹配,但也从一定程度上反映了目前AI距离科研的核心场景还较远。如果你希望AI解决核心的科研问题,首先得有熟悉这方面研究的科学家来描述需求、寻找靶点,而AI科学家则配合其完成工作——不得不说,这很会很难。我不由想起我对杨振宁先生的一次采访,杨先生告诉我,上世纪50年代的时候,IBM发明了大型计算机,因此联系了一些他这样的高级科学家来研究使用计算机是否对科研工作有帮助。“我确实感到计算机有很强的计算能力,可以帮我解决一些科研上的问题。但当时的计算机使用非常困难,你得自己编写程序并输入,我很快学会了,因为它本质上是数学。我甚至研究出了一种编程的方法,如果发展下去可能是未来的Fortune语言”,他回忆说:“但太耗时了,所以我试了一段时间就放弃了。”这段话至今读来仍然令人警醒——当一种先进的科研工具的使用门槛,高到令当时的顶级科学家都有使用后就想放弃的念头时,它一定是很难推广的。事实上,正是一代代编程语言的进化,从用代码到可视化,从半自动到自动化,再到今天的可由AI自动生成,计算机的科研价值和社会价值的释放才能充分、彻底。华为云对此已经有深刻的认知,例如他们已经广泛的和科学界合作。如在药物研发方面,与华中科技大学、西交大一附院的教授通过华为云辅助制药平台发现新靶点活性物质;又如北京大学高毅勤教授基于华为云,研发的蛋白质结构预测功能,支持孤儿序列预测,功能上已经超出AlphaFold2……此外,在气象、农业、海洋科学方面都有不错的尝试。我为这些做法点赞,但我更激赏的做法,是华为云已经把平台服务覆盖到了10+AI4S领域(包括生物医药、计算化学、地球科学、电磁学、流体仿真、量子力学等)和80+模型,这才是真正的为科学家赋能的“大道”。点对点、人对人形态的AI赋能,一定没有1对多、工具性和生态型的赋能更有效率,我相信华为云会在这个方向上不断拉低AI4S的使能方式,让经过工程化和产品化,支持开箱即用和二次开发的更多的AI4S工具和套件,去提升敏捷创新的效率,提高用户科学计算AI的开发效率。科学哲学家托马斯·库恩的《科学革命的结构》是无数科创领域大佬的案头书,他也被广泛认为是20世纪最重要的科学哲学家。库恩的核心理论就是“范式说”,这是一种对时代进步的全新概念,简单说,库恩认为一个时代、一个领域只有一个发展的“主范式”,与范式吻合才能踩在历史发展进步的一边,但范式本身有惯性,所以每一代新的范式转换都需要付出努力和代价。AI4S就是范式转换的重要表征,它不以人的主观意志为转移,也不能人为的对抗范式转换。但是,它也不会自然降临,每个范式转换期都要付出巨大的劳动甚至代价,而只有经历这个过山车式的过程并始终不被甩出第一梯队,才能最终驾驭范式转换带来的红利,能驾驭范式转换的才能笑到最后。
数字产业资深观察家,曾任雷锋网副总编、《电脑报》新闻中心主任多年,后应邀加入百度多年,成为百度历史上第一位CEO品牌专任负责人;亦较早服务于UCWeb的创业,后投身移动互联网创业企业任联合创始人、市场副总裁等。品牌研究专家,受聘为分众传媒终身顾问、百度、妙可蓝多、问界汽车等企业和品牌的CEO品牌顾问、企业文化品牌顾问,作品被收入于《人心红利》《抢占心智》等著作中。互联网史名作《沸腾新十年》联合作者,该书曾获得豆瓣、当当等权威图书平台的“2022年中国财经商管图书Top10”荣誉。