科学家利用量子隧道技术,训练一个深度神经网络来模拟人类观看视错觉的能力。
得益于借用量子力学定律的原理,一种新的人工智能(AI)系统可以首次模仿人类解释复杂视错觉的方式。
像内克尔立方体和鲁宾花瓶这样的视错觉,在研究图像的过程中,诱使大脑先看到一种解释,然后再看到另一种解释。尽管图像是静态的,但人类的大脑会有效地在两种或更多不同的可能版本之间切换。
然而,计算机视觉不能模拟人类视觉的心理和神经方面,并且努力模仿我们自然进化的模式识别能力。因此,当今最先进的人工智能代理很难像人类那样看到视觉错觉。
但8月22日发表在《APL机器学习》杂志上的一项新研究展示了一种技术,通过利用“量子隧道”的物理现象,让人工智能模仿人类大脑解释视错觉的方式。
该人工智能系统被称为“量子隧道深度神经网络”,将神经网络与量子隧道相结合。深度神经网络是受大脑结构和功能启发的机器学习算法的集合 —— 在输入和输出之间有多层节点。它可以模拟复杂的非线性关系,并且与传统神经网络(在输入和输出之间只有一个层)不同,深度神经网络包含许多隐藏层。
与此同时,当一个亚原子粒子,如电子或光子(光的粒子)有效地穿过一个不可穿透的屏障时,量子隧道就会发生。因为像光这样的亚原子粒子也可以表现得像波一样 —— 当它没有被直接观察到时,它不在任何固定的位置 —— 它有一个很小但有限的概率在屏障的另一边。当有足够的亚原子粒子存在时,一些亚原子粒子会穿过屏障。
在代表视错觉的数据通过量子隧穿阶段后,稍微改变的图像由深度神经网络处理。
新的人工智能模型反复接受视错觉 —— 内克尔立方体和鲁宾花瓶 —— 的训练,以解释它所看到的东西。通过在每次通过量子隧道阶段时稍微干扰图像,引入了微小的差异。然后,深度神经网络决定如何解释图像。
深度神经网络处理视错觉的多种变化,选择与之匹配的视角。这使得它可以模仿人类大脑在观看视觉错觉时如何在不同视角之间切换。
“当我们看到一种有两种可能解释的视错觉时(比如模糊的立方体或花瓶和脸),研究人员认为,我们暂时同时拥有两种解释,直到我们的大脑决定应该看到哪一种图像。这种情况类似于薛定谔的猫的量子力学思想实验,”该研究的作者、澳大利亚查尔斯特大学人工智能首席研究员伊万·马克西莫夫(Ivan Maksymov)在TechXplore上的一篇文章中写道。
“我训练我的量子隧道神经网络来识别内克尔立方体和鲁宾花瓶错觉。当面对作为输入的错觉时,它会产生两种解释中的一种或另一种的输出,”马克西莫夫说。
马克西莫夫表示,这些发现可以帮助航空公司飞行员意识到飞行仪器迷失方向和误解的危险,并帮助宇航员在长时间的太空飞行中解释航天器的仪器。
分析模糊图像也有助于轻度认知障碍和痴呆症患者的诊断。使用这种算法训练的人工智能也可能用于检测这些精神衰弱性疾病。
如果朋友们喜欢,敬请关注“知新了了”!