帮助开发者在对象识别和AR增强现实等计算机视觉应用领域取得进展
(映维网Nweon 2024年12月20日)华中师范大学日前提出了一种提高了图像检索系统准确性和效率的全新地标检索方法,并可以帮助开发者在对象识别和AR增强现实等计算机视觉应用领域取得进展。
地标检索模型通常依赖于特征描述符来分析和比较图像。描述符有两种形式:全局和局部。全局描述符捕获图像的整体结构和抽象质量,而局部描述符则专注于纹理和空间安排等细节。这种组合提供了分析图像的补充信息。
然而,大量的冗余会稀释关键信息,导致处理效率低下。另外,拍摄图像的真实性意味着视角、照明条件和障碍物的存在的差异都会导致不准确。
华中师范大学提出的新模型使用纹理增强模块,而它在复杂场景中都能强调重要的纹理特征。模块可以重建特征图以放大表面图案,确保即便是细微或扭曲的纹理都能突出显示。这可以克服由于视角或光线不足而出现的问题。
模型同时使用了一个集成了全局和局部描述符,以消除数据中的冗余的特征融合模块。通过优先考虑相关细节和丢弃多余信息,模型简化了分析,提高了计算效率。
相关论文:Single-stage landmark retrieval with texture feature fusion
https://www.inderscienceonline.com/doi/abs/10.1504/IJICT.2024.143328
研究人员对基准数据集进行了广泛的测试,并表明他们的方法在识别地标方面非常有效和高效。
查看原图 57K