Page 308 - 《软件学报》2020年第11期

P. 308

李娜等:一种基于卷积神经网络的砂岩显微图像特征表示方法 3623

1 相关工作

1.1 人工定义图像特征
在图像分类应用中,需要根据图像的特征表示进行分析.特别是在基于机器学习的图像分类方法中,作为分
类模型训练和预测的重要依据,图像的特征表示尤为重要.在深度学习被用于图像特征表示之前,人工定义的图
像特征是使用最广泛的特征表示方法.按特征描述的图像范围,人工定义特征可分为全局特征和局部特征两种.
全局特征主要描述图像的整体属性,为像素级的低层可视特征.常见的全局特征包括图像的颜色、纹理和
形状等.颜色特征主要基于直方图、累积直方图、平均灰度级等计算均值、方差等统计特征 [3,6] ,具有计算简单、
性能稳定等优点.纹理特征对粗细和疏密等方面存在较大差别的图像具有不错的表示能力.经典的全局纹理特
征包括小波变换 [7−9] 、灰度共生矩阵 [10,11] 等.相比颜色和纹理特征,形状特征带有一些语义信息,尽可能提取图像
中目标对象的轮廓或区域特征.但是由于形状特征的表示通常以图像分割为基础,而大部分现有图像分割算法
不完全准确,给形状特征的提取带来一定难度.现有的形状特征有二值化阈值、Canny 边界像素数目、周长像素
数目、白色区域数目以及白色区域面积等 [5,15] .全局特征能够表示图像整体信息,但是难以描述图像的细节变化,
图像信息利用率较差.
局部特征主要对图像的局部区域进行描述,更关注图像的细节属性,包括边缘、角点、曲线等.经典的局部
特征包括局部二值模式(LBP) [12] 、Gabor 小波变换 [16] 、尺度不变特征变换(SIFT) [17] 和加速鲁棒特征(SURF) [18]
等.针对图像的局部特征表示,大量学者进行了深入研究,并提出许多有效的方法.周书仁等人 [19] 提出一种具有
Haar 型特性局部二值模式(HLBP)的图像局部纹理特征表示方法,在确保较低计算复杂度的前提下,有效提取深
层次的图像纹理信息.孙俊等人 [20] 基于 LBP 和 Damper-Shafter 证据理论,提出一种结合二者优势的多尺度纹理
识别方法,实验表明,作者提出的方法优于基于 LBP 纹理的方法.
全局图像特征和局部图像特征描述的图像属性不同,仅基于单一模态的图像特征不能全面地描述图像属
性.因此,一些研究者融合不同类型的特征,实现特征之间的优势互补,提高图像的特征表示能力 [21−23] .

1.2 基于深度学习的自学习特征
人工定义图像特征可以描述图像的结构、纹理等属性,这些特征主要表示图像的低级语义 [13] .对于简单结
构图像,人工定义特征可以较好地描述其属性;但对于复杂结构图像,如砂岩显微图像,人工定义特征不具有很
好的表示能力.
卷积神经网络 [14] 可以有效地提取图像的高级语义,常被用于图像的自动特征表示.LeCun 等人 [14] 最早提出
一种有监督的反向传播网络 LeNet,自动学习图像特征,实现数字图像的识别.LeNet 网络可认为是卷积神经网
络的雏形.随后,AlexNet [24] 网络在 2012 年的 ImageNet 图像分类竞赛中以绝对优势获得冠军,卷积神经网络的发
展取得历史性突破.
近年来,网络层次更深、特征表示能力更强的 VGG [25] 、GoogleNet [26] 、ResNet [27] 等网络相继出现,卷积神
经网络受到广泛关注和研究.许多研究者对已有的卷积神经网络进行改进,应用于不同图像的特征表示.
Amrouch 等人 [28] 基于 LeNet-5 网络提取手写图像的语义特征,并结合隐马尔可夫模型(HMM)识别阿拉伯字母
构成的单词.白琮等人 [29] 提出一种可应用于大规模图像分类的深度学习框架,从网络框架和内部结构两方面对
AlexNet 网络进行优化和改进,提高网络对图像的特征表示能力.

1.3 面向小规模数据集的深度自学习特征
随着网络层次的加深,需训练的网络参数也大量增加,网络训练对带标记样本的数量要求也急剧上升.但是
由于数据标注的高昂成本,在很多实际应用中这种要求往往难以满足.目前,已有研究者致力于面向小规模数据
集的图像特征表示的研究.
为尽可能利用有限的带标记样本,研究者通过一系列随机变换对图像进行预处理,提升数据量.常见的方法
包括旋转(rotation)、缩放(zoom)、反射(reflection)、翻转(flipping)、错切(shear mapping)和尺度变换(scaling)

303 304 305 306 307 308 309 310 311 312 313