Page 364 - 《软件学报》2025年第12期
P. 364
邱巧燕 等: 局部-全局动态图学习与互补融合的点云配准方法 5745
( ) ( ( ))
˜ F sim = LN ˜ F X + ˜ F sim +FFN LN ˜ F X + ˜ F sim (15)
X X→Y X→Y
其中, LN(·) 表示层归一化, FFN(·) 表示一个具有两层全连接层的前馈神经网络.
(2) 基于交叉注意力的差异信息提取. 为了弥补仅依赖相似信息进行特征匹配的不足, 该模块进一步引入差异
信息的挖掘. 在通过交叉注意力得到两点云之间相似信息的基础上, 将目标点云的原始特征与提取到的相似特征
进行逐元素相减, 得到目标点云中与源点云无关的差异信息 ˜ F diff . 同样, 这些差异特征也会与源点云的原始特征
X→Y
进行融合关注, 以捕捉两个点云之间的特有的结构差异与姿态变化. 公式表示如下:
˜ F diff = ˜ F Y − ˜ F sim (16)
X→Y X→Y
( ) ( ( ))
˜ F diff = LN ˜ F X + ˜ F diff +FFN LN ˜ F X + ˜ F diff (17)
X X→Y X→Y
类似地, LN(·) 为层归一化操作, FFN(·) 是一个两层前馈神经网络.
(3) 相似-差异特征融合. 将前两个阶段得到的相似增强信息 ˜ F sim 和差异增强信息 ˜ F diff 进行加权融合, 以确保融
X X
合后的特征 ˜ F ds 不仅包含点云之间的共性, 还保留了其独特性:
X
ds
˜ F = η· ˜ F sim +(1−η)· ˜ F diff (18)
X X X
其中, η 是可学习的参数.
(4) 基于自注意力的交互增强. 在完成特征融合之后, 应用自注意力机制对点云内的互补特征进一步优化, 使
得不同点云之间的互补信息能够在消息传递过程中得到有效的交互和强化:
( )( ) ⊤
ds ˜ ds
˜ F W 1 F W 2 (
X X )
ds
˜ F self √ ˜ F W 3 (19)
X = Softmax X
d
( ) ( ( ))
ds
ds
H X = LN ˜ F + ˜ F self +FFN LN ˜ F + ˜ F self (20)
X X X X
通过上述 4 个步骤, 每层交互后得到的源点云可表示为 H (l ′ ) ∈ R N×D , 其中, l = 1,2,...,L . 类似地, 计算目标点
′
′
X
云和源点云之间的相似信息和差异信息并进行融合, 然后对目标点云中的信息进行交互增强, 从而得到目标点云
′
′
的特征表示为 H (l ′ ) ∈ R M×D , 其中, l = 1,2,...,L .
Y
经由上述 4 个阶段的协同作用, 注意力驱动的互补融合模块能够充分挖掘两个点云之间的相似信息和差异信
息, 同时在全局范围内增强特征的融合与交互, 从而在匹配阶段实现更加精确的点云对齐.
1.5 变换估计与损失函数
在获得源点云和目标点云的特征后, 采用文献 M:
[33] 中的方法来计算匹配矩阵
( )
M = Sinkhorn H X WH ⊤ (21)
Y
其中, W 是一个可学习参数矩阵, Sinkhorn(·) 表示 Sinkhorn 算法. 之后, 再使用 SVD 算法来求解变换参数 {R,t}.
M = (M ij ) N×M 之间的交叉熵损失作为损
在训练过程中, 本文利用真实匹配矩阵 ˆ M = ( ˆ M ij ) N×M 与估计匹配矩阵
失函数, 具体可表示为:
N ∑ M ∑(
)
Loss = − ˆ M ij log M i j +(1− ˆ M i j )log(1− M ij ) (22)
i j
2 实验分析
2.1 数据集
为了全面评估所提出的方法在点云配准任务中的性能, 本文在 3 个公共数据集上进行了实验.
(1) ModelNet40 [40] 是 3D 点云配准领域的经典基准数据集, 包含 40 个不同类别的 12 311 个高质量 CAD 模型.
其中, 训练集和测试集分别由 9 843 个和 2 468 个点云样本组成.
(2) ShapeNet Part 数据集 [41] 涵盖 16 个对象类别, 共包含 16 881 个样本, 每个样本由 2 000 多个点组成. 训练集

