AI 求解量子多体问题:GPT 理解人类语言,也理解量子语言吗?


导语


加州大学圣地亚哥分校副教授、集智科学家尤亦庄等人在最新研究中,提出一种名为 ShadowGPT 的新方法,让 GPT 语言模型生成经典阴影(classical shadows),通过直接从量子实验数据中学习来预测量子特性,进而求解量子多体问题。这种 AI 与量子物理的结合开启了理解复杂量子系统的新方式。

研究领域:量子物理,量子计算,量子多体问题,人工智能,大语言模型
图片

ChatGPT 4o | 作者

龚铭康 | 译者



图片
论文题目:
ShadowGPT: Learning to Solve Quantum Many-Body Problems from Randomized Measurements

论文地址:

https://arxiv.org/abs/2411.03285


近年来,我们逐渐习惯了与 GPT 等 AI 模型交流,它们能以惊人的流畅性理解并生成人类语言。如果我们可以教GPT“说”量子语言,会怎么样?


自然在其最基本层面上,是由量子物理描述的。当我们通过测量来探测量子系统时,得到的测量结果可以看作是自然传递给我们关于其量子行为的信息。这些就是自然与我们“交谈”的量子语言。那么,我们能否训练 AI 理解这种量子语言,让它能够像量子系统一样预测量子实验的结果呢?


图片


在最近的工作中,我们提出了一种新方法:ShadowGPT,使 GPT 语言模型能够生成经典阴影(classical shadows)——这是自然通过随机测量来描述量子世界的一种特定“量子语言”。这种 AI 与量子物理的新颖结合开启了理解复杂量子系统的新方式。


这项研究聚焦于物理学中的一个长期难题——求解量子多体问题。给定量子系统的参数,我们希望预测其基态性质,以揭示系统在最低能量状态下的行为。这一挑战不仅是一个数学难题,对于理解量子材料、设计抗误码的量子计算(error-resilient quantum computer)以及开发量子传输(quantum teleportation)技术至关重要。然而,适用于经典计算机的传统数值方法难以模拟量子多体系统,因为一般情况下经典地表示量子多体态具有指数级的复杂性,即使是最强大的经典计算机也望尘莫及。


量子计算提供了一种有前景的替代方案,其核心在于量子态制备和随机测量的强大能力。通过制备量子态(作为量子设备的“输入”)、执行实际的量子操作,再进行随机测量(将“输出”带回经典世界),我们可以通过真实实验从量子系统中收集数据。这些数据揭示了量子系统的行为,向我们展示了自然如何解决量子多体问题。然而,进行量子实验依然代价高昂且资源稀缺,使得这些量子数据极具价值。


那么,为什么不利用这些数据来训练一个机器学习模型,使其能够预测量子行为,从而避免未来重复进行昂贵的实验呢?这正是生成式人工智能的用武之地——我们的方法旨在教会GPT模型从量子数据中学习,从而有效地模拟量子设备。换句话说,我们正在训练 GPT 像量子设备一样“说”量子语言。


ShadowGPT 方法结合了两种强大技术:经典阴影层析成像(classical shadow tomography)和生成式预训练Transformer(GPT)模型。经典阴影层析成像利用随机测量生成“经典阴影”,这是量子态的高效经典表示,使我们能够通过简单的数据统计系统地估计量子态的各种性质。每个经典阴影本质上是随机测量的记录,每个量子比特在随机选择的泡利可观测量(X、Y或Z)下独立测量,得到二进制测量结果(+或−)。这些信息可以组织成一个词元(token)序列,完美地适合语言模型处理。量子态中的量子信息完全编码在不同量子比特集合和不同可观测量组合间测量结果的复杂关联中,并可通过数学公式解码。


假设我们拥有一台量子设备,它能够制备具有特定耦合参数的哈密顿量基态,并能够执行经典阴影层析成像测量。通过运行这样的量子实验,我们可以收集一组数据,将哈密顿量参数直接与其基态的经典阴影关联起来。在本研究中,我们使用模拟数据来演示这一概念。我们在一系列量子哈密顿量的经典阴影数据上训练 GPT 模型,使其能够根据哈密顿量参数生成基态的经典阴影——就像 ChatGPT 对提示词做出响应一样。简单来说,我们让 ShadowGPT 通过直接从量子实验数据中学习来预测量子特性,从而避免了从头开始进行第一性原理数值模拟


为了测试 ShadowGPT,我们将其应用于量子物理中的两个著名模型:横场伊辛模型(transverse-field Ising model)图片团簇伊辛模型(cluster-Ising model)。即使在有限的训练数据集下,ShadowGPT 也能够在参数空间中进行插值,准确预测新的哈密顿量(不在训练数据集内)的一些关键性质,例如基态能量、关联函数、弦算子和纠缠熵。这一突破表明,AI 可以作为探索和理解复杂量子系统的可扩展且强大的工具。


展望未来,数据驱动的量子模拟潜力巨大。随着量子计算技术的进步,我们从量子实验中收集丰富数据集的能力也将不断增强。像 ShadowGPT 这样的 AI 模型可以利用这些数据,可能成为研究人员探索和预测量子现象的强大工具,达到此前难以企及的规模。未来,我们甚至可能迎来量子大语言模型(Large Language Models for Quantum)的新时代,这些机器学习模型不仅能够加速量子模拟,还将为我们理解量子世界开辟新的前沿。

原文题目:Can GPT Speak the Quantum Language?