Page 307 - 《软件学报》2020年第11期
P. 307

3622                                Journal of Software  软件学报 Vol.31, No.11, November 2020

                 and labeling of sandstone samples are costly, labeled microscopic sandstone images are usually few. In this study, a convolutional neural
                 network based feature representation  method for small-scale data  sets,  called FeRNet, is proposed to  effectively  capture  the  semantic
                 information of microscopic sandstone images and enhance their feature representation. The FeRNet has a simple structure, which reduces
                 the quantity  requirements for labeled images,  and prevents the overfitting.  Aiming  at the  problem of insufficient labeled  microscopic
                 sandstone image, the image augmentation preprocessing and a CAE network-based weight initialization strategy are proposed, to reduce
                 the risk of overfitting. Based on the microscopic sandstone images collected from Tibet, the experiments are designed and conducted. The
                 results show that both image augmentation and CAE network can effectively improve the training of FeRNet network, when the labeled
                 microscopic sandstone images are few; and the FeRNet features are more capable of the representations of microscopic sandstone images
                 than the hand-crafted features.
                 Key words:    feature  representation; microscopic sandstone image; convolutional  neural  network; image augmentation; convolutional
                          autoencoder

                    在地质学中,砂岩鉴别是一项非常重要的任务.砂岩是一种沉积岩,是地壳的重要组成成分,在自然界分布
                 广泛.按照其组成成分,砂岩可分为长石砂岩、岩屑砂岩和石英砂岩这 3 大类.砂岩和砂层是石油、天然气和地
                 下水的主要储集层,世界上 40%的油气都储集在该类储层中.我国的大庆、大港、克拉玛依等油田的主要储集
                 层均为砂岩类.因此,有效的砂岩鉴别在油气储层评估、资源勘探、水利勘测等方面有重要意义.
                    人工砂岩鉴别主要是通过地质工作者在光学显微镜下观察砂岩薄片的光学性质,研究其组成成分,确定砂
                 岩类型.人工鉴别方法耗时费力,且鉴别结果有很强的个人主观性,不同的鉴别人员可能会给出不同的鉴别结
                 果,鉴别效率低.随着计算机技术的发展,砂岩薄片通过显微成像技术被制备成图像,并结合图像处理和机器学
                 习等方法   [1−5] ,实现砂岩薄片的自动分类,提高砂岩鉴别效率.
                    在基于机器学习的砂岩自动分类方法中,砂岩显微图像的特征表示是分类模型训练和预测过程中的重要
                 依据.特征表示的优劣,在很大程度上会对分类模型的预测性能产生影响.因此,合理的特征表示是实现砂岩自
                 动分类的基础.
                    目前已有的砂岩分类方法主要采用人工定义特征来描述砂岩显微图像,包括图像的像素颜色                                 [3,6] 、纹理 [7−11]
                 和形状  [5,12] 等.人工定义特征主要描述砂岩显微图像的低级结构信息,未能捕获其高级语义                        [13] ,对结构复杂的砂
                 岩显微图像特征表示能力受到限制.卷积神经网络(CNN)                  [14] 是一种可用于提取图像高级语义的方法.近年来,卷
                 积神经网络已被成功应用于自然场景图像分类中,并取得了显著成果.但是砂岩显微图像分类与自然场景图像
                 分类存在一定区别:自然场景图像有长时间积累的数据支持,易满足深度卷积神经网络在训练过程中对数据量
                 的要求;而砂岩显微图像在薄片制备、显微图像采集过程中需要非常精密的仪器,且砂岩显微图像的类别需要
                 领域专家标注,时间和经济成本高,因此带标记砂岩显微图像的数量往往很少,难以满足网络训练的要求.
                    针对以上问题,本文提出一种面向小规模数据集的卷积神经网络 FeRNet,用于提取砂岩显微图像的语义特
                 征,提高砂岩显微图像的分类准确性.本文的主要贡献包括:
                    (1)  针对砂岩显微图像的特征表示问题,本文提出一种基于卷积神经网络 FeRNet 的特征表示方法,提取
                        砂岩显微图像中隐含的高级语义特征,为分类模型提供更具判别性的信息.
                    (2)  根据砂岩显微图像裁剪语义不变特性,本文提出一种基于滑动窗口的图像扩增预处理方法,通过滑动
                        窗口对原图像进行裁剪,倍数级增加带标记砂岩显微图像的数量,改善 FeRNet 网络的训练效果.
                    (3)  针对带标记砂岩显微图像数量不足的问题,本文提出一种卷积自编码网络 FeRCAE,预编码砂岩显微
                        图像的语义信息,并使用编码器权重初始化 FeRNet 网络,改善 FeRNet 网络的训练效果.
                    本文第 1 节介绍图像特征表示的相关工作,主要包括人工定义特征、基于深度学习的自学习特征和面向小
                 规模数据集的深度自学习特征.第 2 节介绍本文提出的用于砂岩显微图像特征表示的卷积神经网络 FeRNet,主
                 要描述 FeRNet 的结构及训练过程等.第 3 节详细描述实验设计方案,包括数据集、评价指标、实验设置等.第 4
                 节分析实验结果,探究采用 FeRNet 网络提取的语义特征对砂岩显微图像自动分类预测性能的影响.第 5 节对方
                 法进行讨论,主要探究图像扩增预处理、卷积自编码网络和激活函数的选择对 FeRNet 网络训练的影响.最后总
                 结全文.
   302   303   304   305   306   307   308   309   310   311   312