Page 310 - 《软件学报》2020年第11期
P. 310

李娜  等:一种基于卷积神经网络的砂岩显微图像特征表示方法                                                   3625


                 旨在挖掘图像隐含的高级语义信息,提高砂岩显微图像的预测性能.针对砂岩显微图像带标记数据不足的问题,
                 本文提出一种基于滑动窗口的图像扩增策略,并采用预训练的卷积自编码网络 FeRCAE 的编码器权重来初始
                 化 FeRNet 网络,改善 FeRNet 网络训练效果,防止过拟合.

                 2.2   图像扩增
                    将卷积神经网络应用于自然场景图像的特征表示,可使其分类性能取得很大程度的提升                                [24] .砂岩显微图像
                 与自然场景图像存在一定差别.如图 2(b)所示,自然场景图像区分前景和背景,前景部分为感兴趣的目标对象(图
                 中的猫),一般只占整张图像的一部分.若对原图像进行裁剪,裁剪后的图像可能只包含目标对象的一小部分,原
                 图的语义信息将被严重破坏.如图 2(a)所示,与自然场景图像不同,砂岩显微图像由不同的矿物颗粒构成,整张图
                 像均为感兴趣的目标区域.对砂岩显微图像进行适当地裁剪,裁剪后的图像能保留原图绝大部分的语义信息,不
                 会对图像分类结果造成影响.












                                     (a)  砂岩显微图像示例                     (b)  自然场景图像示例
                            Fig.2    Comparison between the microscopic sandstone image and natural scene image
                                            图 2   砂岩显微图像与自然场景图像对比
                    基于以上分析,砂岩显微图像允许对原图像进行合理的裁剪,且不改变原图像的语义信息.本文将砂岩显微
                 图像这一特性称为裁剪语义不变性.根据此特性,本文提出一种基于滑动窗口的图像扩增方法,对砂岩显微图像
                 以裁剪的方式进行预处理,实现图像数量的倍数级扩增.具体处理方式如下.
                    (1)  对原始砂岩显微图像 I,设置滑动窗口 w.
                    (2)  滑动窗口以步长 h 沿水平方向扫描图像 I,直至到达图像当前“行”最右端,本轮扫描结束.
                    (3)  滑动窗口返回至本轮扫描起始位置.
                    (4)  将滑动窗口沿竖直方向滑动步长 v,从新位置开始,执行步骤(2)和步骤(3).
                    (5)  重复步骤(2)~步骤(4),直至扫描整张砂岩显微图像.
                    每次扫描取滑动窗口内的图像为一幅新的砂岩显微子图,以图像 I 的类标对其进行标记并保存.图 3 所示为
                 基于滑动窗口的图像扩增示意图,其中,线框表示滑动窗口,虚线和实线框分别表示滑动窗口先前位置和当前位
                 置,实心箭头表示窗口滑动方向.













                                        Fig.3    Image augmentation based on sliding window
                                               图 3   基于滑动窗口的图像扩增
   305   306   307   308   309   310   311   312   313   314   315