Page 310 - 《软件学报》2020年第11期
P. 310
李娜 等:一种基于卷积神经网络的砂岩显微图像特征表示方法 3625
旨在挖掘图像隐含的高级语义信息,提高砂岩显微图像的预测性能.针对砂岩显微图像带标记数据不足的问题,
本文提出一种基于滑动窗口的图像扩增策略,并采用预训练的卷积自编码网络 FeRCAE 的编码器权重来初始
化 FeRNet 网络,改善 FeRNet 网络训练效果,防止过拟合.
2.2 图像扩增
将卷积神经网络应用于自然场景图像的特征表示,可使其分类性能取得很大程度的提升 [24] .砂岩显微图像
与自然场景图像存在一定差别.如图 2(b)所示,自然场景图像区分前景和背景,前景部分为感兴趣的目标对象(图
中的猫),一般只占整张图像的一部分.若对原图像进行裁剪,裁剪后的图像可能只包含目标对象的一小部分,原
图的语义信息将被严重破坏.如图 2(a)所示,与自然场景图像不同,砂岩显微图像由不同的矿物颗粒构成,整张图
像均为感兴趣的目标区域.对砂岩显微图像进行适当地裁剪,裁剪后的图像能保留原图绝大部分的语义信息,不
会对图像分类结果造成影响.
(a) 砂岩显微图像示例 (b) 自然场景图像示例
Fig.2 Comparison between the microscopic sandstone image and natural scene image
图 2 砂岩显微图像与自然场景图像对比
基于以上分析,砂岩显微图像允许对原图像进行合理的裁剪,且不改变原图像的语义信息.本文将砂岩显微
图像这一特性称为裁剪语义不变性.根据此特性,本文提出一种基于滑动窗口的图像扩增方法,对砂岩显微图像
以裁剪的方式进行预处理,实现图像数量的倍数级扩增.具体处理方式如下.
(1) 对原始砂岩显微图像 I,设置滑动窗口 w.
(2) 滑动窗口以步长 h 沿水平方向扫描图像 I,直至到达图像当前“行”最右端,本轮扫描结束.
(3) 滑动窗口返回至本轮扫描起始位置.
(4) 将滑动窗口沿竖直方向滑动步长 v,从新位置开始,执行步骤(2)和步骤(3).
(5) 重复步骤(2)~步骤(4),直至扫描整张砂岩显微图像.
每次扫描取滑动窗口内的图像为一幅新的砂岩显微子图,以图像 I 的类标对其进行标记并保存.图 3 所示为
基于滑动窗口的图像扩增示意图,其中,线框表示滑动窗口,虚线和实线框分别表示滑动窗口先前位置和当前位
置,实心箭头表示窗口滑动方向.
Fig.3 Image augmentation based on sliding window
图 3 基于滑动窗口的图像扩增