光子处理器可以以极高的能效实现超快的人工智能计算

这种新设备利用光在芯片上执行深度神经网络的关键操作,为能够实时学习的高速处理器打开了大门。

为当今最苛刻的机器学习应用提供动力的深度神经网络模型已经变得如此庞大和复杂,以至于它们正在突破传统电子计算硬件的极限。

图片

光子硬件可以利用光进行机器学习计算,提供了一种更快、更节能的替代方案。然而,有一些类型的神经网络计算是光子设备无法执行的,需要使用片外电子设备或其他技术,这阻碍了速度和效率。

经过十年的研究,麻省理工学院和其他地方的科学家已经开发出一种新的光子芯片,克服了这些障碍。他们展示了一个完全集成的光子处理器,可以在芯片上光学地执行深度神经网络的所有关键计算。

该光学设备能够在不到半纳秒的时间内完成机器学习分类任务的关键计算,同时实现超过92%的准确率,这一性能与传统硬件相当。

该芯片由相互连接的模块组成,形成一个光学神经网络,采用商业铸造工艺制造,这可以使该技术的规模和集成到电子产品中。

从长远来看,光子处理器可以为激光雷达、天文学粒子物理学的科学研究或高速电信等计算要求高的应用带来更快、更节能的深度学习。

“在很多情况下,模型的表现如何并不是唯一重要的事情,重要的是你能多快得到答案。现在我们有了一个端到端系统,可以在纳秒的时间尺度上运行光学神经网络,我们可以开始在更高层次上思考应用和算法,”Saumil Bandyopadhyay说,他是电子研究实验室(RLE)量子光子学和人工智能小组的访问科学家,也是NTT研究公司的博士后,他是一篇关于新芯片的论文的主要作者。这项研究今天发表在《自然光子学》杂志上。

机器学习与光

深度神经网络由许多相互连接的节点层或神经元组成,它们对输入数据进行操作以产生输出。深度神经网络中的一个关键操作涉及使用线性代数来执行矩阵乘法,它在数据从一层传递到另一层时进行转换。

但除了这些线性操作之外,深度神经网络还执行非线性操作,帮助模型学习更复杂的模式。非线性运算,如激活函数,赋予深度神经网络解决复杂问题的能力。

2017年,该论文的资深作者Dirk Englund的团队与Cecil和Ida Green物理学教授Marin Soljačić实验室的研究人员一起在单个光子芯片上演示了一种光学神经网络,该网络可以与光进行矩阵乘法。

但当时,该设备无法在芯片上执行非线性操作。光学数据必须被转换成电信号,然后送到数字处理器进行非线性运算。

“光学中的非线性是相当具有挑战性的,因为光子不容易相互作用。这使得触发光学非线性非常耗电,因此构建一个可以以可扩展的方式完成的系统变得具有挑战性,”Bandyopadhyay解释道。

他们通过设计一种名为非线性光学功能单元(NOFUs)的设备克服了这一挑战,该设备将电子和光学结合起来,在芯片上实现非线性操作。

研究人员在光子芯片上建立了一个光学深度神经网络,使用三层器件进行线性和非线性操作。

完全集成的网络

一开始,他们的系统将深度神经网络的参数编码为光。然后,2017年论文中展示的一组可编程分束器对这些输入执行矩阵乘法。

然后,数据传递给可编程的NOFU, NOFU通过将少量的光虹吸到光电二极管中来实现非线性功能,光电二极管将光信号转换为电流。这个过程不需要外部放大器,消耗的能量很少。

“我们一直停留在光学领域,直到最后我们想要读出答案。这使我们能够实现超低延迟,”Bandyopadhyay说。

实现如此低的延迟使他们能够有效地在芯片上训练深度神经网络,这一过程被称为原位训练,在数字硬件中通常会消耗大量能量。

他说:“这对导航或电信等对光信号进行域内处理的系统特别有用,但对那些想要实时学习的系统也很有用。”

该光子系统在训练测试中达到96%以上的准确率,在推理过程中达到92%以上的准确率,与传统硬件相当。此外,该芯片在不到半纳秒的时间内完成关键计算。

“这项工作表明,计算 —— 其本质是输入到输出的映射 —— 可以被编译到线性和非线性物理的新架构中,这使得计算与所需的努力有了根本不同的比例规律,”Englund说。

整个电路是使用生产CMOS计算机芯片的相同基础设施和代工工艺制造的。这可以使芯片大规模生产,使用可靠的技术,在制造过程中引入很少的误差。

Bandyopadhyay表示,扩大他们的设备并将其与现实世界的电子设备(如相机或电信系统)集成将是未来工作的主要重点。此外,研究人员希望探索能够利用光学优势的算法,以更快的速度和更好的能源效率训练系统。

这项研究部分由美国国家科学基金会、美国空军科学研究办公室和NTT研究所资助。


如果朋友们喜欢,敬请关注“知新了了”!