这一突破利用超表面镜头超越了传统的人工智能,实现了超快速、低能耗的图像识别,重新定义了机器智能。
普林斯顿大学和华盛顿大学的研究人员取得了突破性进展,他们开发了一种盐粒大小的相机,宽度不到半毫米,能够捕捉到令人难以置信的清晰,全彩图像,细节前所未有。
现在,该团队似乎又一次突破了界限,开发了一种为计算机视觉设计的新型紧凑型相机,这是一种帮助计算机识别图片和视频中的物体的人工智能。
该原型机引入了一种新的计算机视觉方法,它依靠光而不是电,比传统计算机消耗的能量少得多,并且以光速识别物体。
“对我来说,问题一直是我们如何使用算法来感知和理解世界,”普林斯顿大学计算机科学助理教授、该研究的作者之一菲利克斯·海德博士(Felix Heide)说。
“这是一种全新的思考光学的方式,与传统光学非常不同,”Arka Majumdar博士补充道,他是华盛顿大学电子和计算机工程与物理学教授,也是该研究的第二作者。“这是端到端设计,光学元件与计算模块一起设计。
“在这里,我们用工程光学代替了相机镜头,这使我们能够在光学中进行大量计算,”Majumdar博士继续说道。
深入研究
海德博士回忆说,这个想法是在他开始探索超表面时形成的,超表面是一种具有亚波长特征的人造片状材料。
由于其独特的几何形状,超表面不会像传统透镜那样使穿过玻璃或塑料的光线弯曲。相反,它们在微小结构周围衍射光线,就像光线通过窄缝时传播一样。
为了制造它们,海德博士和他的学生与华盛顿纳米制造实验室的专家合作,他们专门研究超小型光控设备,设计相机并制造芯片。
但该团队没有使用传统的玻璃或塑料透镜,而是集成了50个堆叠的、扁平的、轻质的元透镜,它们使用微观纳米结构来操纵光线。
这些元透镜兼作光学神经网络,这是一种受大脑启发的人工智能系统,为该方法提供了几个关键优势。尽管速度非常快,识别和分类图像的速度比传统神经网络快200多倍,但它也非常节能,依靠入射光而不是电力来运行。
在探索这项技术的过程中,海德博士和他的团队惊奇地发现,从柱阵列中发出的光根本不需要与原始图像相似。相反,这些柱子充当了专门的过滤器,将光学数据分类,如边缘、明暗区域,甚至是人类感知不到的特征,从而为计算机提供预处理的结构化信息。
“我们意识到我们不需要记录一个完美的图像,”海德博士说。“我们只能记录某些特征,然后我们可以汇总这些特征来执行分类等任务。”
进一步的见解
不久之后,该团队开发了一个系统,该系统能够使用不到传统方法所需计算能力的1%来识别图像中的物体,而超表面透镜可以处理令人印象深刻的99.4%的工作量。
该系统引入了一种新的范例,可以立即执行数亿次计算(FLOPS)。传统的神经网络使用数学过滤器(核)来提取数据,即使对几个像素也需要大量的计算,而这个神经网络自然地在光线通过时进行复杂的过滤,使几个大型过滤器能够一次分析整个图像。
每个超表面透镜内的微小柱子在没有电或主动控制的情况下重新组织和提取光线。海德博士和他指导下的博士生Ethan Tseng确信,该设计的成功依赖于使用更少的大型光学内核和无缝集成硬件和软件。
“动物视觉是光学硬件和神经后端处理的结合,”Tseng说,他引用了螳螂虾、蜻蜓和墨鱼等例子,它们可以探测到光的偏振,这是传统光学无法做到的。
“有些动物比我们拥有更奇特的视觉,我们怀疑它们的眼睛硬件与大脑一起工作来执行各种任务,”他继续说。
海德博士在新闻发布会上继续说道:“这可能会超出图像处理的范围,而这只是我们触及冰山一角的地方。”
Majumdar博士在一份声明中解释说:“目前,这种光学计算系统是一个研究原型,它适用于一个特定的应用,并补充说他们看到了它在多种技术上的革命性潜力。”“当然,这还有待观察,但在这里,我们展示了第一步。与所有其他现有的光学神经网络实现相比,这是向前迈出的一大步。”
这项研究发表在《科学进展》杂志上。
如果朋友们喜欢,敬请关注“知新了了”!