当前位置:首页 > 科技文档 > 软件 > 正文

跨模态交互学习与迭代融合的3D视觉定位

光学精密工程 页数: 16 2025-12-25
摘要: 针对现有3D视觉定位方法存在的对单一模态信息依赖过强、视角变化适应性差以及跨模态特征融合效果有限的问题,提出了一种跨模态交互学习与迭代融合的3D视觉定位方法。该方法包括多模态特征提取与跨模态特征融合两个阶段。在特征提取阶段,分别采用点云编码器和文本编码器提取点云与文本特征,并引入点云的类别信息;在特征融合阶段,设计基于Transformer的点云特征增强模块,以提升点云特征的表... (共16页)

开通会员,享受整站包年服务
说明: 本文档由创作者上传发布,版权归属创作者。若内容存在侵权,请点击申诉举报