Page 313 - 《软件学报》2020年第11期
P. 313
3628 Journal of Software 软件学报 Vol.31, No.11, November 2020
像.解码器包含 2 个上采样层(UpSampling) [40] 和 4 个反卷积层(DeConv) [41] .
上采样层和反卷积层介绍如下.
(1) 上采样层
上采样层的目的是将特征图还原为池化操作之前的大小.FeRCAE 网络中,上采样层采用最近邻插值法计
算目标特征图的像素值.如图 5 所示,最近邻插值法将目标特征图中各点的像素值设为原特征图中与其最邻近
点的像素值.上采样层的卷积核(过滤器)采用 2×2 大小,步长设为 1.
Fig.5 An example for nearest neighbor upsampling
图 5 最近邻插值上采样示例
(2) 反卷积层
反卷积操作是卷积操作的逆过程,目的是尽可能还原特征图执行卷积操作之前的信息.FeRCAE 网络中,所
有反卷积层均采用尺寸为 5×5 的卷积核(过滤器),步长均设为 2.前 3 个反卷积层采用 ReLu 激活函数.最后一个
反卷积层采用 Sigmoid [38] 激活函数,目的是将输出图像的像素值缩放至[0,1]区间,与输入图像对应.
FeRCAE 网络的优化目标是最小化重构的砂岩显微图像与输入图像之间的差异.本文采用均方误差作为
FeRCAE 网络的损失函数,其目标函数形式化为
1 2
minimize || −I O || ,
2 2
其中,I 和 O 分别表示 FeRCAE 网络的输入和输出砂岩显微图像.在 FeRCAE 网络优化过程中,当达到最大迭代
次数或损失函数值小于规定阈值时停止训练.本文设置最大迭代次数为 100.
如表 2 所示,FeRCAE 网络的编码器部分与 FeRNet 网络的卷积部分结构一致.故在 FeRCAE 网络训练完成
后,将编码器部分的参数用于 FeRNet 网络卷积部分的权重初始化,缓解带标记样本数据量不足对网络训练的影
响,改善 FeRNet 网络的训练效果.
3 实验设计
本节详细说明实验设计方案,包括数据集和评测指标等.本文实证研究主要探究 3 个问题.
• RQ1:与人工定义特征相比,本文 FeRNet 网络提取的特征在砂岩显微图像自动分类问题中是否具有更
好的预测性能?
• RQ2:与其他面向小规模数据集的图像特征表示方法相比,本文 FeRNet 网络提取的砂岩显微图像特征
是否具有更好的预测性能?
• RQ3:本文 FeRNet 网络提取的砂岩显微图像特征与哪种分类模型结合,能够获得更好的预测性能?
3.1 砂岩显微图像数据集
本文选用来自西藏 4 个不同地区的砂岩显微图像构成数据集进行实验研究.实验共采集 344 张砂岩显微图
像,其中,长石砂岩 33 张,岩屑砂岩 206 张,石英砂岩 105 张.每张显微图像都由一个独立的砂岩薄片采集而来,没
有重复.所有砂岩显微图像的规格为 1920×1536 像素.
如上所述,该数据集中带标记砂岩显微图像数量较少,特别是长石砂岩,确实难以满足 FeRNet 网络训练的
数据量要求.但本文采集的砂岩显微图像分辨率较高,且具有裁剪语义不变特征,支持第 2.2 节所述的图像扩增
操作.在通过滑动窗口对原图像进行裁剪时,窗口大小的设置非常重要:若窗口设置太大,则可能减小数据的扩
增空间,且容易造成相邻子图像间存在大面积重合;若窗口设置太小,则不能保留原图的语义信息,可能导致扩