Page 315 - 《软件学报》2020年第11期
P. 315
3630 Journal of Software 软件学报 Vol.31, No.11, November 2020
灰度图像进行小波分解,得到图像水平、竖直、对角线方向分量及其低频分量的小波系数矩阵,再分别统计 4
个系数矩阵的均值、方差、中位数等 13 个特征指标.两种纹理特征的维度分别为 16 和 52.
(3) 基于颗粒形状的特征(Grain-based)
基于颗粒形状的特征包括基于图像的和基于矿物颗粒的特征两部分.基于图像的特征提取自整张砂岩显
微图像,包括二值化阈值、Canny 边界像素数目、周长像素数目、白色区域数目以及白色区域面积等.基于矿
物颗粒的图像特征在图像分割基础上计算得到.本文选取最大的 3 个矿物颗粒分别计算颗粒面积、凸包差、密
致度和外接特性 4 个指标.基于颗粒形状的图像特征维度为 17.
为探究不同类型的特征在砂岩显微图像自动分类中的预测性能,本文基于不同特征,结合支持向量机 [42] 和
逻辑回归 [43] 分类模型进行实验,对比实验结果.
3.3.2 面向小规模数据集的深度自学习特征
针对研究问题 2,本文选取 3 种常用的面向小规模数据集的、基于卷积神经网络的特征表示方法提取砂岩
图像特征,结合支持向量机 [42] 和逻辑回归 [43] 分类模型进行实验,比较实验结果.
(1) Gen-aug:通过对砂岩显微图像进行尺度变换、缩放、水平和垂直翻转等通用的数据扩增操作,扩充数
据集.基于扩充后的数据集,训练 FeRNet 网络,提取砂岩显微图像特征.
(2) VGG-ft:以 ImageNet 数据集上预训练的 VGG16 网络为基础,将原 VGG16 模型中的全连接层替换为
本文 FeRNet 网络的全连接层,采用层冻结方法,微调(fine-tuning)最后一个卷积模块(convolution
block)及全连接层的参数,取第 2 个全连接层的输出作为砂岩显微图像的特征表示.
(3) VGG-ft-gen:在 VGG-ft 基础上,采用尺度变换、缩放、水平和垂直翻转等通用数据扩增操作,扩充数
据集.
3.3.3 分类模型
针对研究问题 3,本文选取机器学习中经典的分类算法来构建分类模型,探究 FeRNet 特征与不同分类模型
结合的预测性能.实验中采用的分类模型包括线性判别分析(LDA) [44] 、决策树(DT) [45] 、朴素贝叶斯(NB) [46] 、K
近邻(KNN) [47] 、逻辑回归(LR) [43] 、多层感知机(MLP) [48] 、随机森林(RF) [49] 、AdaBoost [50] 和支持向量机(SVM) [42] .
其中,线性判别分析、逻辑回归是线性模型代表,决策树是决策模型代表,朴素贝叶斯是贝叶斯理论模型代表,K
近邻是懒惰学习模型代表,多层感知机是人工神经网络的代表,随机森林和 AdaBoost 是集成学习模型代表,支
持向量机是基于核函数模型代表.以上模型几乎涵盖机器学习中监督学习模型的各个类型,尽可能保证实验结
果的有效性和全面性.
上述实验中,只有在 FeRNet 网络训练时采用第 3.1 节所述 CNN 训练集,其余实验均采用验证数据集,两种
数据集不交叉使用.实验 1 和实验 2 分别计算单个类型砂岩显微图像的精确度和 F1 评测指标,实验 3 计算类别
比例加权的指标.所有实验采用 10 折交叉验证计算结果.为减小随机性,每个实验重复 10 次,评测指标计算均值
得到.
4 实验结果
本节整理并分析实验结果以回答实验设计问题.首先,采用 FeRNet 网络提取砂岩显微图像的特征,基于支
持向量机和逻辑回归分类模型进行实验,并与人工定义特征和常见的面向小规模数据集的深度自学习特征进
行对比,探究 FeRNet 特征对砂岩显微图像的表示能力.然后,将砂岩显微图像的 FeRNet 特征与不同分类模型结
合进行实验,比较实验结果,探究哪种分类模型能获得更好的预测性能.
4.1 与人工定义特征对比
为探究与人工定义特征相比,FeRNet 网络提取的特征在砂岩显微图像自动分类中的预测性能,本文提取不
同类型的人工定义特征,包括颜色、纹理和颗粒形状等,结合支持向量机和逻辑回归分类模型分别进行实验,比
较实验结果.表 4 和表 5 分别列出使用支持向量机和逻辑回归作为分类模型时,不同特征对 3 种类型砂岩显微
图像的预测性能.