【VRAR星球原创稿件,未经许可禁止转载】
摘要:从AR品类线上销量来看,VITURE目前暂列第五
我们上天眼查发现,国内AR眼镜厂商VITURE(注:运营主体为北京行者无疆科技有限公司)的一项单目摄像头方案相关的专利曝光了。
该专利的名字叫做一种基于近距离单目灰度摄像头的双手拇指关键点实时检测方法,隶属于发明专利,申请日期为2024年8月28日,申请公开日期为2024年11月29日。
摘要显示,该专利公开了一种基于近距离单目灰度摄像头的双手拇指关键点实时检测方法,通过考虑镜头畸变的同时采用目标检测和关键点检测;将目标检测的提高鲁棒性的特点和关键点检测高精度的特点集成一起,联合解决对于设备使用过程中的拇指关键点检测的实时性与精度问题,针对拇指关键点检测的任务,设计了网络的损失函数作为优化目标,通过监督学习和统计梯度下降获得优化后的深度网络,解决拇指关键点检测的问题,同时根据实时性的要求,本发明设计了轻量化的网络结构,并采用小的卷积核,复用大量参数减小网络的参数量级,在降低计算量,降低内存占用的同时实现拇指特征点检测的任务。
VITURE在专利中提到的单目摄像头让人印象深刻,在笔者的记忆中,VITURE就没有推出过采用该方案的AR眼镜产品,此番申请该方案有关的专利,意味着VITURE正在着手研发或者试图研发采用该方案的AR眼镜产品。
那么问题来了,VITURE为何要钟情于单目摄像头?该方案又有哪些优点与缺点?
众所周知,AR眼镜想要实现虚拟结合的效果离不开眼镜上的摄像头。摄像头虽小但功能巨大,无论是对间定位、平面识别还是手势交互都需要调用摄像头来完成对应的操作。
行业中使用比较广泛的是双摄像头方案,AR眼镜前方搭载双摄像头可以通过采集的数据交叉对比从而测算出物体的数据和位置,由于数据量充足所以对算法的要求比较低,因而技术方案比较成熟。
VITURE之所以对技术难度较大的单目摄像头方案感兴趣,可能是该公司相信通过AI能够将硬件对于传感器的需求降低,从而降低眼镜重量,提供更好的佩戴舒适性(注:在VITURE前面的专利摘要中,用到的深度网络、损失函数、网络结构、大量参数等术语,综合起来其实就是跟AI有关)。单目摄像头方案采用单一摄像头采集数据,先天有限的数据量使它在同等条件下完成识别任务需要更高难度的算法支持。
再者,VITURE看好更难技术路线的单目摄像头方案,也因为双摄像头方案在日常使用中难免会出现一些不可避免的问题。
首先由于双目摄像头分别设置于眼镜两侧,长期使用会导致眼镜框架发生轻微形变,从而导致摄像头的实际位置参数与设定参数有偏差,进而导致识别不准确或漂移现象的出现。因此也增加了一部分产品成本和故障概率,产品的整体质量也会增加影响佩戴体验。
而单目摄像头方案先天避免了因眼镜轻微形变而导致的两个摄像头参数不准的问题。
所以在技术上,VITURE想到用更复杂的AI算法弥补了单目摄像头数据量的不足,通过更先进的AI算法,VITURE可以做到只用一个摄像头就能实现空间定位、场景理解、手势识别等功能。
这一方案不仅使AR眼镜更加轻薄,结构更加稳定,功耗也更低,不得不说VITURE还是很有眼光的。
有意思的是,VITURE不是国内第一个看好单目摄像头方案的AR厂商。AR巨头之一的Rokid)早早地推出了采用了该方案的产品Rokid Max Pro、Rokid Glasses。
据官方介绍,VITURE成立于2021年的北京和旧金山,创始团队来自Google,Apple等国际大厂。研发团队实力强劲,开发了世界首个适配全平台游戏主机,配备云计算单元的XR产品。致力于打造下一代的高端智能影音娱乐产品。
另据洛图科技发布的数据,国内第三季度XR市场的销量持续下滑,该季度XR设备线上监测市场销量为4.2万台,同比下跌17.5%;销额为1.42亿元,同比减少8.8%。
其中,从AR品类线上销量来看,VITURE目前暂列第五。它带头申请单目摄像头方案有关专利,是否会有其他厂商跟进呢?VRAR星球也将持续关注。
文/多弗朗明哥
文中未进行标注的图片均来源于网络
VRAR星球每天都会发布XR领域深度文章及业内新闻,感兴趣的朋友可以持续关注哦