随着2024年诺贝尔物理学奖和化学奖授予人工智能的相关研究,科学智能在科学研究领域的强劲实力终于得到了全球关注。未来科学智能将会向何处发展?科学智能将在哪些方面会有所突破?科学智能还有哪些需要解决的难题?在11月11日的“2024科学智能创新论坛”上,上海科学智能研究院(下称“上智院“)联合复旦大学、集智科学研究中心和阿里云,共同发布了“科学智能前沿观察”。
这一科学智能前沿观察是建立在与从事科学智能领域前沿研究学者的大量深度访谈基础上,共有十大前沿方向。
上海科学智能研究院院长、复旦大学浩清教授漆远表示,AI与基础科学的深度融合,将开启AI与科学“双螺旋引擎”共振驱动的科学研究新范式。AI for Science和Science for AI,类似DNA和RNA的双螺旋结构,一方面,AI将成为科学研究探索的最前沿;另一方面,科学启发的AI也将成为实现AGI的重要支撑。希望推动和支持更多AI和基础研究领域的科学家,深度融合无缝合作,共同探索科学智能的新未来,打造能够自主发现复杂世界未知规律的“AI爱因斯坦”。
“科学智能前沿观察”涵盖AI for Science、Science for AI和科学智能基础设施三个维度,其中,AI for Science的前沿方向包括垂直领域科学大模型、融入先验知识的AI模型、基于LLM模型的科学研究、从提出假设到自动验证的AI科学家、以及复杂世界的多智能体建模;Science for AI的前沿方向则覆盖了物理世界的第一性原理和科学启发的可解释AI新架构;科学智能基础设施前沿方向包括合成数据和新型智能计算。展望未来,面向可信可解释的科学世界模型和上述九个方向共同构成科学智能十大前沿。
科学智能新范式
科学智能(AI X Science)是一个新兴的跨学科研究领域,致力于融合AI与领域科学,其研究方向和驱动力可以形象地表述为“双螺旋引擎“:其一,将AI技术应用于具体领域的科学研究(AI for Science);其二,将领域学科知识用于AI算法和架构的理解和改进(Science for AI)。
AI for Science虽已获重大突破,但AI仍然面临数据稀缺、耗能过大、解释性较差等重大挑战。而人类科学家已经积累了各个学科领域的海量知识, 如何将科学家的经验和知识,甚至直觉和启发式想法,转化为AI系统的能力,构成了Science for AI研究的重点。Science for AI的典型案例除了已获诺奖的Hopfield网络与受限Boltzmann机,也包括受视觉架构启发的CNN网络等。
更进一步,科学智能指向AI和科学更复杂、全面、多维和多向度的深度融合,AI参与到从假设提出到自动验证的科研全流程,并构建包括合成数据和新型智能计算在内的基础设施。
科学智能的新范式包括:第一,构建AI驱动的灰盒模型,将第一性原理和人类先验知识引入AI,形成领域知识启发的AI基础模型,既可数据驱动,也提高了可解释性。第二,从单一尺度走向跨尺度,传统的科学研究大多集中在某个尺度,或两个尺度的互动,而科学智能则同时在多个尺度构建具有深度的科学大模型。第三,从单一模态到多模态,科学智能突破单一模态的局限,可以整合时间序列数据、图像数据或文本数据,建立多模态大模型进行前沿科学探索。最后,科学智能领域有望形成跨学科的统一框架和方法论。
科学智能的无尽前沿
目前,科学智能最多的前沿研究集中在AI for Science领域,又尤以垂直领域科学大模型为代表。虽然目前还没有出现跨学科的统一科学基础模型,但在物质科学、生命科学、医学和气象等领域已经涌现出一批创新性垂直领域科学大模型,以解决特定领域科学问题。
在构建科学大模型的过程中,数据驱动和先验知识的融合是关键。从基础设施的视角看,科学数据不足是制约科学智能发展的核心掣肘。合成数据(Synthetic Data)是解决挑战的科学利器。OpenAI的o1模型运用了大量合成数据,生命科学、物质科学、数学和气象科学领域合成数据的前沿运用也渐成气候。合成数据在推进构建科学大模型方面意义重大。
遵循规模定律(Scaling law),目前AI模型的参数规模和计算需求已经远超现代计算硬件的更新速度、而其能耗和成本也已经到了经济和生态系统难以承载的地步,从而凸显出新型智能计算的前沿和重要意义,基于光学、量子力学的新型高效新型计算架构,以更低的资源消耗和更小的边际成本,为科学人工智能的高速高能效计算开辟新路径。
面向可信可解释的科学世界模型
2024年堪称科学智能“新元年”。通观全局,科学智能发展迅猛,可望引领科学和AI的未来研究突破。
科学智能的挑战和机遇体现在两个方面:第一,AI系统如何运用人类知识 ,这既包括如何将第一性原理和专家知识融入AI系统,也包括如何提高AI系统的可解释性。第二,AI如何和现实互动并具备实验思维,科学智能需要设计实验,自主与物理世界互动,获取数据,形成世界模型,从而最终实现AGI和“AI爱因斯坦”。
面向未来,可信可解释的科学世界模型是一个可行解决方案。该模型包含两大智能主体:数据驱动为主的AI系统(Data-driven Model),即系统I,融入第一性原理和人类知识的“深思者(Deep Thinker)”,即系统II。从交互机制看,则包括AI-现实互动(AI-Reality Interaction)界面和人机对齐界面(Human-AI Alignment)。以科学规律为基础、输出结果可靠可信、可泛化、可解释,同时AI与现实世界交互、AI与科学家互动、并最终与人类价值和科学伦理对齐。
可信可解释的科学世界模型
集智研究中心理事长、北京师范大学系统科学学院教授张江表示,“放眼未来,解决人机协同的瓶颈和对齐,同时赋予AI实验思维,可信可解释的科学世界模型是一个可行的解决方案。科学智能需要多元的探索路径,也需要领域科学家和AI科学家的共同努力,在未来科学智能的探索前沿上,相信科学家的直觉和第一性原理依旧是重要支撑。”
据悉,覆盖上述科学智能前沿方向和完整文献解读的《科学智能前沿观察报告》全文将于近期发布。
作者:姜澎
文:姜澎图:受访者供图编辑:李晨琰责任编辑:唐闻佳
转载此文请注明出处。