Page 309 - 《软件学报》2020年第11期
P. 309

3624                                Journal of Software  软件学报 Vol.31, No.11, November 2020

                 等 [24,30,31] .对图像进行随机变换,可保证用于训练深度网络的图像不会完全相同,有利于提升有效的训练样本量,
                 防止过拟合现象产生.
                    利用深度学习网络的可重用性,一些研究者将在大规模数据集(如 ImageNet)上训练好的模型(如 VGG,
                 GoogleNet 等)应用于小规模数据集图像的特征表示或分类.对与原数据集相近的小规模数据集,一些方法使用
                 预训练模型的卷积层或全连接层的输出作为图像的特征表示,并结合支持向量机等分类模型实现分类                                      [32−34] .
                 Donahue 等人 [34] 提取 Krizhevsky 等人 [24] 预训练的卷积神经网络不同层次的输出作为图像特征,实现目标检测、
                 场景识别等计算机视觉相关任务.另一些研究者基于预训练的深度卷积模型,在新数据集上对网络的部分或全
                 部参数进行微调(fine-tuning),提高图像的特征表示或分类效果              [35,36] .Yosinski 等人 [36] 采用层冻结方法在小规模
                 数据集上微调卷积网络,实现图像分类.
                    此外,一些研究者也通过减少网络的参数数目,如调整网络的层数及各网络层的规模等,或对参数进行正则
                 化约束来降低对带标记样本的数量要求,防止过拟合.
                 2    特征表示方法

                    为提高砂岩显微图像的特征表示,本文提出一种面向小规模数据集的卷积神经网络 FeRNet,提取砂岩显微
                 图像的语义信息,提高砂岩显微图像的自动分类性能.针对带标记砂岩显微图像数量不足的问题,本文分别提出
                 了基于滑动窗口的图像扩增预处理方法和基于卷积自编码网络的权重初始化策略,改善 FeRNet 网络的训练效
                 果,防止过拟合.
                 2.1   方法动机
                    砂岩由各种不同的砂粒胶结而成,因此砂岩显微图像具有复杂的显微结构.图 1 所示为 3 种类型砂岩显微
                 图像示例.如图 1 所示,长石砂岩显微图像的矿物颗粒多表现出双晶、解理和裂理等特性,部分颗粒形状近似不
                 规则矩形,颗粒边界不清晰;岩屑砂岩显微图像包含大量细碎的颗粒,颗粒边界难以分辨;石英砂岩显微图像表
                 面较为平滑,颗粒形状近似椭圆形,颗粒边界较为清晰.复杂多变的显微结构导致砂岩显微图像的特征表示难度
                 增加.












                              (a)  长石砂岩                 (b) 岩屑砂岩                  (c)  石英砂岩
                                       Fig.1    Different types of microscopic sandstone images
                                                图 1   不同类型砂岩显微图像

                    在采用机器学习技术实现自动分类时,砂岩显微图像的特征表示对分类模型的训练非常重要,但现有方法
                 对砂岩显微图像的特征表示能力受到限制.目前,多数自动分类方法主要采用人工定义特征来描述砂岩显微图
                  [5]
                 像 ,包括像素颜色、纹理和形状等.然而,人工定义特征只能描述砂岩显微图像较低级的结构信息,不能捕获其
                 隐含的高级语义信息,可能削弱砂岩显微图像的预测性能.近年来,基于深度卷积神经网络的自动特征表示方法
                 受到广泛关注.经典的卷积神经网络,如 VGG             [25] 、GoogleNet [26] 等,包含大量的网络层,其训练需要大量的带标记
                 数据支持.但是砂岩显微图像的采集和标注成本高昂,带标记的砂岩显微图像数量往往很少,难以满足这些网络
                 对数据量的要求.
                    基于以上原因,本文提出一种面向小规模数据集的卷积神经网络 FeRNet,用于砂岩显微图像的特征表示,
   304   305   306   307   308   309   310   311   312   313   314