埃默里大学刘芳/王耀Newton封面文章:机器学习光电子能谱分析,开启热力学相变检测新时代 | Cell Press论文速递

图片


物质科学

Physical science

图片

在低维材料体系中,强量子涨落效应与维度受限的探测手段使得超导态等电子有序相的热力学特征提取面临显著挑战。传统光谱技术虽广泛用于体材料的新奇物相表征,但其依赖的序参量判据在低维强涨落体系中存在显著局限性。


近日,来自埃默里大学的刘芳以及王耀团队联合耶鲁大学的He Yu教授在Cell Press细胞出版社旗下期刊Newton上发表了一篇题为“Detecting thermodynamic phase transition via explainable machine learning of photoemission spectroscopy”的论文,提出一种基于单粒子谱数据的热力学相变识别方法,通过整合角分辨光电子能谱(ARPES)的高分辨率动量空间信息与领域对抗神经网络(DANN)的迁移学习能力,实现了对强涨落体系的鲁棒性分类。以典型铜基高温超导体Bi2Sr2CaCu2O8+δ为研究对象,该方法在强超导涨落背景下达到97.6%的相分类准确率。模型的可解释性研究表明,带隙内谱权重对相涨落及热力学相变检测具有关键作用。本研究对量子材料中新奇物相的快速非接触式检测,助力强关联体系的基础研究及下一代超导体的高效开发开辟了新路径。

图片


图片


研究背景:


热力学相变判定通常依赖长程有序态的出现,但传统体材料测量手段受限于空间分辨率,难以表征范德华薄膜等低维体系。电子能隙Δ作为平均场近似的表征指标,虽具备非接触式、微米级空间分辨等优势,但其描述多体系统的能力存在局限。近期角分辨光电子能谱(ARPES)研究揭示了超导相位相干性特征,表明单粒子谱函数蕴含超越平均场理论的多体物理信息,然而其有效提取仍受限于实验数据规模。


本研究提出基于对抗训练的机器学习模型,通过单次ARPES测量即可实现相变分类,无需温度依赖数据或大量实验样本。该模型通过机器学习整合模拟谱函数与实验数据,成功识别超导相与正常相,其可解释性分析指出费米能级附近的谱权重分布是相区分的关键物理特征。该方法为有限数据条件下的量子材料相变研究提供了新的技术范式。


图片

图1:强涨落体系热力学相变示意图

结果与讨论:


模型构建与ARPES数据处理


卷积神经网络(CNNs)虽能有效保留ARPES能谱的动量-能量二维结构特征,但其在模拟与实验谱间的领域偏移问题限制了实际应用。本研究通过改进域对抗神经网络(DANN),构建包含特征提取器、领域分类器与物相分类器的跨领域学习框架(图2)。特征提取器则通过对抗性优化干扰领域判别。经域对抗训练后,模型能够实现单次模拟或ARPES实验能谱的物相分类。针对实验数据稀缺性约束,物相分类器的训练过程仅使用带标签模拟谱,而未标记实验谱通过领域分类器引导特征提取器学习领域不变性表征。该对抗机制确保了模型在无实验标注条件下的领域迁移能力,即使训练过程中无直接监督,模型对实验数据的预测标签仍能反映真实物相。


图片

图2:模型架构示意图

超导相分类


实验选用铜基超导体Bi₂Sr₂CaCu₂O₈(BSCCO)的两个掺杂样品:过掺杂OD50(Tc=50 K)与优化掺杂OD58(Tc=58 K)。分别采集41组(14-102 K)和45组ARPES能谱,覆盖超导相与正常相。DANN模型以单次能谱为输入,输出标量“超导概率”(阈值>50%判定为超导相)。OD50样品分类准确率达97.6%(40/41),OD58误判仅1例。


鉴于实验数据来自不同温度点的样品,本文开展了温度依赖性分析(图3D-E),模型预测概率在Tc附近呈现陡峭转变(低温区≈1,高温区≈0),与热力学相变过程高度吻合。值得注意的是,尽管传统能隙分析在Tgap≈65 K(OD50)时仍能检测到单粒子能隙开启,但模型在Tc以上未出现概率异常响应。这表明ARPES谱权重分布蕴含超越能隙开启的热力学相变指纹,为量子材料长程有序态识别提供了新视角。


图片

图3:DANN模型超导相分类结果

单能带模型近似与实验噪声导致模拟/实验ARPES能谱存在系统性差异(图1B)。传统CNN模型在无对抗训练时,特征空间呈现明显的模拟-实验数据分离特征(图4A),致使分类规则无法跨领域迁移。DANN通过领域对抗机制强化特征对齐度(图4B),使BSCCO OD50与OD58样品的分类准确率分别提升19.0%和19.2%。该提升证实领域自适应有效消除非物理差异(如噪声干扰),保留反映相变本质的特征模式。


图片

图4:t-SNE特征分布可视化

机器学习模型的物理解释


本研究通过遮挡归因分析揭示单粒子谱特征与超导相变的关联。BSCCO OD50/OD58的显著性分布显示:零结合能处存在特征峰(图5),其强度在Tc以上显著衰减,表明能隙中心及上方谱权重分布是判定超导相的关键依据。该区域对Bogoliubov准粒子上支响应,其温度依赖性特征与铜基超导相位相干判据一致。值得注意的是,本方法通过单次能谱即可识别该特征,无需温度序列数据,与需温度导数分析的现有方法形成互补。这种单快照解析能力为极端条件下量子相变研究提供了新工具。


图片

图5:实验能谱显著值分布 

三元物相分类


本研究拓展至正常态内的涨落超导(fluc-SC)区域,构建超导相(SC)、涨落超导相(fluc-SC)与无隙非超导相(gapless non-SC)的三元分类体系。BSCCO OD50与OD58样品总体准确率分别为85.4%和75.6%,但fluc-SC样品中(15/17)被误判为无隙非超导相。该结果表明:带隙涨落相与无隙相在单粒子谱特征上具有连续性(均存在于Tc以上正常态),其区分复杂度远超传统能隙检测方法的能力边界,揭示了单粒子谱学对复杂涨落态表征的固有局限性。 


图片

图6:两个BSCCO样品的三元分类结果

总结


本研究开发的迁移学习模型通过单次ARPES快照实现强关联材料超导相分类,其核心优势在于无需实验标注数据训练。模型经BSCCO不同组分(OD50/OD58)、能隙尺寸及温度范围的实验数据验证,具备跨体系分类能力,可经归纳推理拓展至同类铜基超导材料。


基于遮挡归因的物理机制分析与温度依赖研究结论一致,证实模型捕捉到本征相变特征。该框架兼容非接触式原位表征,为高通量材料研究提供技术基础。尽管面临实验数据稀缺与模拟差异挑战,模型通过唯象方程数据再训练可扩展至其他热力学相变分类,为即时物相表征的高通量材料设计与合成实验奠定了基础。


图片


相关论文信息

原文刊载于Cell Press细胞出版社

旗下期刊Newton

论文标题:

Detecting thermodynamic phase transition via explainable machine learning of photoemission spectroscopy

论文网址:

https://www.sciencedirect.com/science/article/pii/S2950636025000581

DOI:

https://doi.org/10.1016/j.newton.2025.100066