Page 327 - 《软件学报》2021年第11期
P. 327

郭松  等:基于多任务学习的眼底图像红色病变点分割                                                       3653


                 3    实验及分析

                    本文在 Caffe [26] 框架下实现网络模型,使用 NVIDIA GTX 1080Ti 显卡加速网络训练.另外,实验中使用的操
                 作系统为 Ubuntu 16.04,CUDA 和 CUDNN 的版本分别为 8.0 和 5.1.下面对数据集、网络中具体的参数设置、
                 评价指标和实验结果进行具体介绍.
                 3.1   数据集

                    IDRiD [14] 是在国际会议 ISBI 2018 举办的视网膜眼底图像分级和分割挑战赛中提出的,提供了眼底 4 种病
                 变点的像素级标注,包括微动脉瘤、出血点、硬渗和软渗.该数据集共包括 81 张眼底图像,其中,训练集有 54 张,
                 测试集有 27 张,图像的分辨率为 4288×2848(宽度×高度).另外,由于原始眼底图像的分辨率太高无法直接放入显
                 存中,文中先将图像和对应病变点标注下采样 4 倍到 1072×712.随后使用旋转和镜像操作对训练集进行扩充,扩
                 充之后的训练集共包括 324 张眼底图像.
                 3.2   参数设置
                    训练使用 ImageNet 上训练好的 VGGNet 初始化分割网络参数,使用随机梯度下降算法优化损失函数.动量
                 项设置为 0.9,权重衰减项设置为 0.000 5.在训练的第 1 阶段,使用固定的学习率调度策略,学习率初始化为 1e−8,
                 训练一共迭代 97 200 次(300 轮).Top-k 带权交叉熵损失中,λ 0 初始化为 0.14,S 设置为 10 000.在训练的第 2 阶段,
                 使用第 1 阶段训练的网络初始化权重,由于第 1 阶段已经学习到了稳定的病变点特征,因此第 2 阶段的学习率
                 设置为第 1 阶段的 1/10(1e−9),而且总迭代次数设置为 6 480 次(20 轮),避免对第 1 阶段学习到的特征进行过度
                 调整.
                 3.3   评价指标

                    本文使用准确率 P、召回率 R 和 AUC_PR(P-R 曲线下面积)这 3 个指标来评价病变点的分割效果.
                                                       TP         TP
                                                  p =      , R =      ,
                                                     TP +  FP   TP +  FN
                 其中,TP 为正确分类的病变点像素个数,FP 为背景像素误分成病变点的个数,FN 为病变点误分成背景点的个
                 数.召回率(查全率)反映的是在所有的病变点中正确找到的病变点的比例,准确率(查准率)反映的是在模型找到
                 的所有病变点中正确找到的病变点的比例.从公式中可以看出,准确率和召回率只能评估单一阈值下的分割效
                 果.因此,本文使用 AUC_PR 来综合考虑多个阈值下的准确率和召回率.
                 3.4   实验结果
                    模型在微动脉瘤和出血点分割上的指标见表 2,可以看出,仅仅使用第 1 阶段损失或者第 2 阶段损失均无法
                 取得较好的分割结果,尤其是仅仅使用第 2 阶段损失,会由于样本不均衡造成模型无法训练;但是,当使用两阶段
                 训练算法时,病变点分割结果的准确率和召回率都得到了提升.这说明了第 2 阶段损失需要在第 1 阶段训练的
                 权重基础上进行学习,第 1 阶段和第 2 阶段是缺一不可的.同时,从表 2 还可以看出,第 2 阶段训练进一步减少了
                 误分情况,尤其是在出血点分割上,召回率提高了将近 3%,准确率提高了 2.8%.从图 1 中可以看出,分割微动脉瘤
                 的难度要大于出血点.尽管如此,两阶段的训练算法也使得微动脉瘤的 AUC_PR 提高了 1.7%,准确率提高了
                 1.3%.
                           Table 2    Comparison of segmentation performance of microaneurysms and hemorrhages
                                                under different training methods
                                      表 2   不同训练方法下微动脉瘤和出血点分割性能对比
                                                     微动脉瘤                       出血点
                                方法
                                             准确率     召回率      AUC_PR   准确率      召回率     AUC_PR
                              一阶段训练          0.487 5   0.492 6   0.466 9   0.598 7   0.595 5   0.591 6
                           只使用第 2 阶段损失         −       −        −        −        −        −
                              两阶段训练          0.500 9   0.499 3   0.483 9   0.626 9   0.625 1   0.569 5
   322   323   324   325   326   327   328   329   330   331   332