Page 148 - 《软件学报》2024年第4期
P. 148
1726 软件学报 2024 年第 35 卷第 4 期
验. 消融模型 1 和消融模型 4 对比可知: 相加连接方式不仅有助于提升模型精度, 而且可降低网络预测延
迟; 消融模型 4 和消融模型 5 对比可知: 深度可分离卷积尽管可以降低网络参数量, 但由于分组数过多导致
内存访问频繁, 进而导致网络预测时长增加; 消融模型 5 和消融模型 6 对比可知: 分组并行模块仅牺牲部分
存储空间, 但可有效降低网络延迟, 并保证网络预测精度. 因此, 本文采用消融模型 6 中分组并行模块和相
加连接方式.
表 1 残差连接与跳跃连接消融实验结果
连接方式 模型参数(个) 延迟(s) MSE
跳跃连接 546 321 2.419 0.027 5
残差连接 540 273 0.437 0.027 5
表 2 分组并行模块消融实验结果
消融模型 基础模块 模型参数(个) 延迟(s) 模型性能 MSE 连接方式
1 常规卷积 1 213 872 0.457 0.051 6
2 深度可分离卷积 200 400 0.463 0.047 3 拼接
3 分组并行模块 444 048 0.399 0.053 4
4 常规卷积 754 020 0.353 0.046 8
5 深度可分离卷积 106 344 0.394 0.047 9 相加
6 分组并行模块 260 853 0.350 0.037 2
结构重参数化的消融实验结果见表 3, 使用与推理阶段相同配置的普通卷积层代替结构重参数化模块.
结果表明: 在延迟不发生改变的情况下, 使用结构化重参数的模型参数量更低, 性能更佳.
表 3 结构重参数化与常规卷积消融实验结果
卷积方式 模型参数(个) 延迟(s) MSE
结构重参数化 540 273 0.437 0.027 5
常规卷积 540 936 0.437 0.033 9
3.3 实验分析
本节根据应用场景的差异分为对比实验、泛化实验和延时实验这 3 类, 分别对不同三维形貌重建方法
进行定量对比和定性分析, 其中, 对比实验通过对公共数据集学习验证网络模型的有效性, 泛化实验可验
证本文数据集在微观领域提出的必要性, 而延时实验则可明确对比各模型在实际应用场景的效率.
[7]
本节主要选择 4D Light Filed [33] , DefocusNet , FlyingsThing3D [33] , Middlebury [33] 和本文的 Micro 3D 数
据集进行测试. 通过对比先进的模型设计类三维形貌重建模型 RDF [15] 和 RR [19] 与基于深度学习的三维形貌
[5]
[8]
[5]
[7]
[6]
重建模型(DDFF , DefocusNet , AiFDepthNet , FVNet , DFVNet )评估本文提出数据集 Micro 3D 数据集
和 GPLWS-Net 算法的性能. 其中: 4D Light Field 数据集中包含了 25 种复杂现实场景, 主要用于测试精细结
构与弱纹理及光滑表面等情形; DefocusNet 数据集构建浮点级深度信息, 主要验证网络模型对于复杂场景
的拟合情况; FlyingThings3D 数据集共公布 1 000 组三维场景数据.
实验中使用均方误差 MSE (mean squared error)、平均绝对误差 MAE (mean absolute error)、均方根误差
RMSE (root mean squared error)、绝对相关系数 AbsRel (absolute relative error)、平方相对误差 SqRel (square
relative error)、颠簸性(bumpiness)和推理时间(secs)指标定量评估 GPLWS-Net 与其他三维形貌重建模型的
性能.
3.3.1 对比实验分析
本节将 GPLWS-Net 与现有的深度学习类三维形貌重建方法进行对比, 为确保实验结果的公正客观, 本节
在公共数据集 4D Light Field 与 DefocusNet 上进行网络模型的性能分析. 具体定量指标对比如表 4 所示, 其中
部分数据来自文献[8,33]. 由表 4 可知, 本文提出的 GPLWS-Net 模型在两类数据集上的重建精度显著优于其
他算法.