Page 359 - 《软件学报》2025年第12期
P. 359

5740                                                      软件学报  2025  年第  36  卷第  12  期


                 Key words:  deep learning; point cloud registration; graph neural network (GNN); feature extraction; feature matching

                    点云配准是三维视觉领域的核心任务之一, 广泛应用于姿态估计                     [1,2] 、自动驾驶  [3,4] 和即时定位与地图构建   [5,6]
                 等前沿技术中. 其主要目标是通过求解最优变换参数, 将来自不同设备或视角的点云对齐至同一坐标系, 从而实现
                 点与点之间的精确对应. 然而, 点云数据常常受到噪声干扰、物体遮挡及部分点缺失等因素的影响, 这使得如何提
                 取具有判别性的特征并进行高效匹配成为亟待解决的关键问题.
                    早期的点云配准方法主要依靠优化算法, 通过反复迭代计算变换参数, 最小化对应点之间的几何误差来完成
                 点云的对齐. 其中, 迭代最近点        [7] 及其变体  [8,9] 是最具代表性的配准方法. 但它们高度依赖初始位姿, 且容易陷入局
                 部最优解. 此外, 基于正态分布变换         [10] 和四点全等集   [11] 的方法也是经典的点云配准方法. 虽然这些方法在处理噪
                 声和部分重叠的点云时能够取得较好的配准效果, 但仍面临计算复杂度高和缺乏特征学习的挑战.
                    近年来, 深度学习技术的迅速发展为点云配准领域带来了诸多突破. Aoki 等人                     [12] 开创性地将  PointNet 网络  [13]
                 与经典的   LK  算法相结合, 提出了首个端到端的点云配准框架. 针对部分到部分点云配准任务, Xu                        等人  [14] 提出了
                 一种基于全局特征的重叠区域估计方法, 减少了非重叠区域的干扰. 然而, 这些基于                        PointNet 的方法主要侧重于全
                 局特征的提取, 未能充分捕捉局部细节信息. 为此, Lu             等人  [15] 引入了  PointNet++网络  [16] , 旨在更有效地获取点云的
                 局部语义特征. Yew    等人  [17] 设计了一种融合几何属性的混合特征提取网络, 以获得更精确的初始匹配. Li 等人                     [18]
                 将局部几何特征和距离特征整合到匹配过程中, 增强了识别正确对应点对的能力. 随后, Mei 等人                           [19] 根据点与点之
                 间的位置关系自适应地构造卷积核来捕获局部相关性. 此外, 一些研究                      [20−22] 致力于将几何结构描述纳入特征学习
                 过程中, 进一步提升对应关系的鲁棒性. 尽管上述方法在局部特征提取方面取得了一定成效, 但仅依赖局部特征进
                 行匹配容易受到局部结构相似性的影响, 从而导致对应关系的不唯一性. 因此, 在局部特征的基础上引入全局特征
                 约束, 以确保两个点云的整体对应关系, 对于提高匹配一致性至关重要.
                    随着图神经网络的兴起, 基于图的点云配准方法取得了显著的进展. Wang                      等人  [23] 通过共享的动态图神经网
                 络提取局部特征, 并结合       Transformer 模块  [24] 建模长程依赖关系, 从而生成更具判别性的点特征. 随后, Huang           等
                 人  [25] 在获得超点的特征后, 利用图神经网络对每个点云的上下文信息进行编码, 以量化点云之间的重叠概率.
                 Fischer 等人  [26] 基于图神经网络架构, 借助多头注意力实现上下文信息的聚合. 在此基础上, Shi 等人                [27] 构建了一种
                 带有注意力机制的动态多路图用于整合全局信息, 同时结合局部邻域信息来增强特征表示. 为了建立鲁棒的点对
                 应关系, Kadam  等人  [28] 基于每个点的局部属性采用多跳学习策略, 提取从局部到全局的层次化特征. Chen                     等人  [29]
                 提出了一种点云结构提取器, 旨在建模全局关系并识别相邻结构特征, 从而增强配准模型对噪声的鲁棒性. 最近,
                 Jiang  等人  [30] 通过引入全局图卷积将局部特征映射为全局特征, 有效地捕捉了点云的上下文关系. 然而, 这些方法
                 提取的特征往往局限于单个点云, 忽略了点云之间的交互关系. 因此, 必须引入特征交互机制, 使得两个点云能够
                 相互影响和更新, 从而提升匹配的准确性.
                    为了实现更精确的对齐, 部分研究者提出了高效的特征匹配方法. Wu                      等人  [31] 选择与另一点云相似的局部特
                 征和全局特征来更新自身点云的特征, 进一步提高了配准精度. Xu                   等人  [32] 设计了一个包含旋转和平移的双分支结
                 构, 并在多个阶段引入逐点特征交互模块, 以促进信息的深度融合. 随后, Fu                    等人  [33] 将软对应关系作为辅助信息,
                 利用交叉图卷积对另一点云的特征进行聚合. 为了更有效地感知两个点云之间的相似点对, 一些研究                                [34−37] 采用了
                 自注意力和交叉注意力机制来实现点云之间的上下文交互, 在一定程度上增强了两个点云的关联性.
                    尽管近年来基于深度学习的点云配准方法在多个方面都取得了重要突破, 但仍然面临一些局限性.
                    ● 大多数现有的局部特征提取方法倾向于直接聚合几何信息和语义特征, 未能充分利用几何信息来指导语义
                 特征的动态调整, 容易导致特征表示对局部几何结构的感知能力不足. 此外, 仅依赖坐标空间的邻近关系来构建图
                 结构, 忽视了特征空间中潜在的关联, 从而限制了特征的表示能力.
                    ● 一些方法在学习全局特征时, 往往采用全连接的方式聚合所有点的信息, 无法区分点对之间的相关性, 从而
                 导致低相关性信息的过度引入.
                    ● 在特征匹配阶段, 许多方法主要侧重两个点云相似信息的交互, 忽略了差异信息的提取与利用. 虽然相似信
   354   355   356   357   358   359   360   361   362   363   364