Page 327 - 《软件学报》2021年第11期
P. 327
郭松 等:基于多任务学习的眼底图像红色病变点分割 3653
3 实验及分析
本文在 Caffe [26] 框架下实现网络模型,使用 NVIDIA GTX 1080Ti 显卡加速网络训练.另外,实验中使用的操
作系统为 Ubuntu 16.04,CUDA 和 CUDNN 的版本分别为 8.0 和 5.1.下面对数据集、网络中具体的参数设置、
评价指标和实验结果进行具体介绍.
3.1 数据集
IDRiD [14] 是在国际会议 ISBI 2018 举办的视网膜眼底图像分级和分割挑战赛中提出的,提供了眼底 4 种病
变点的像素级标注,包括微动脉瘤、出血点、硬渗和软渗.该数据集共包括 81 张眼底图像,其中,训练集有 54 张,
测试集有 27 张,图像的分辨率为 4288×2848(宽度×高度).另外,由于原始眼底图像的分辨率太高无法直接放入显
存中,文中先将图像和对应病变点标注下采样 4 倍到 1072×712.随后使用旋转和镜像操作对训练集进行扩充,扩
充之后的训练集共包括 324 张眼底图像.
3.2 参数设置
训练使用 ImageNet 上训练好的 VGGNet 初始化分割网络参数,使用随机梯度下降算法优化损失函数.动量
项设置为 0.9,权重衰减项设置为 0.000 5.在训练的第 1 阶段,使用固定的学习率调度策略,学习率初始化为 1e−8,
训练一共迭代 97 200 次(300 轮).Top-k 带权交叉熵损失中,λ 0 初始化为 0.14,S 设置为 10 000.在训练的第 2 阶段,
使用第 1 阶段训练的网络初始化权重,由于第 1 阶段已经学习到了稳定的病变点特征,因此第 2 阶段的学习率
设置为第 1 阶段的 1/10(1e−9),而且总迭代次数设置为 6 480 次(20 轮),避免对第 1 阶段学习到的特征进行过度
调整.
3.3 评价指标
本文使用准确率 P、召回率 R 和 AUC_PR(P-R 曲线下面积)这 3 个指标来评价病变点的分割效果.
TP TP
p = , R = ,
TP + FP TP + FN
其中,TP 为正确分类的病变点像素个数,FP 为背景像素误分成病变点的个数,FN 为病变点误分成背景点的个
数.召回率(查全率)反映的是在所有的病变点中正确找到的病变点的比例,准确率(查准率)反映的是在模型找到
的所有病变点中正确找到的病变点的比例.从公式中可以看出,准确率和召回率只能评估单一阈值下的分割效
果.因此,本文使用 AUC_PR 来综合考虑多个阈值下的准确率和召回率.
3.4 实验结果
模型在微动脉瘤和出血点分割上的指标见表 2,可以看出,仅仅使用第 1 阶段损失或者第 2 阶段损失均无法
取得较好的分割结果,尤其是仅仅使用第 2 阶段损失,会由于样本不均衡造成模型无法训练;但是,当使用两阶段
训练算法时,病变点分割结果的准确率和召回率都得到了提升.这说明了第 2 阶段损失需要在第 1 阶段训练的
权重基础上进行学习,第 1 阶段和第 2 阶段是缺一不可的.同时,从表 2 还可以看出,第 2 阶段训练进一步减少了
误分情况,尤其是在出血点分割上,召回率提高了将近 3%,准确率提高了 2.8%.从图 1 中可以看出,分割微动脉瘤
的难度要大于出血点.尽管如此,两阶段的训练算法也使得微动脉瘤的 AUC_PR 提高了 1.7%,准确率提高了
1.3%.
Table 2 Comparison of segmentation performance of microaneurysms and hemorrhages
under different training methods
表 2 不同训练方法下微动脉瘤和出血点分割性能对比
微动脉瘤 出血点
方法
准确率 召回率 AUC_PR 准确率 召回率 AUC_PR
一阶段训练 0.487 5 0.492 6 0.466 9 0.598 7 0.595 5 0.591 6
只使用第 2 阶段损失 − − − − − −
两阶段训练 0.500 9 0.499 3 0.483 9 0.626 9 0.625 1 0.569 5