Page 323 - 《软件学报》2021年第11期
P. 323

郭松  等:基于多任务学习的眼底图像红色病变点分割                                                       3649


                         ¾   图像级分割网络的输入是一张眼底图像,输出为对应的分割结果,只需一次前向传播.比如,Mo
                             等人设计了一种图像级的分割网络模型 FCRN 来对眼底硬渗点进行分割,取得了不错的分割效
                             果 [13] .Guo 等人设计了一种端到端的多病变点分割网络 L-Seg,对于一张眼底图像,可以同时得到
                                                                                            [8]
                             4 种病变点的分割结果,并且该方法引入了一种新的损失函数来减少误分情况 .Yang  等人提
                             出了一种两阶段的深度卷积神经网络模型,可检测出血点、渗出点等眼底病变,并对糖网病进行
                             分级预测   [18] .本文设计的分割网络即属于图像级分割网络.
                    在训练病变点分割网络方面,常见的基于交叉熵的损失函数包括带权交叉熵                           [11] 、Focal Loss [19] 、Top-k 带权
                      [9]
                 交叉熵 等.除此之外,还存在一些直接对评价指标进行优化的损失函数,如 Dice Loss                       [12] ,IoU Loss [20] 等.带权交
                 叉熵损失由于未考虑难分样本和易分样本,在微动脉瘤和出血点分割这种易将背景误分成病变的情况下,会存
                 在严重的误分问题.Dice Loss 和 IoU Loss 存在的问题是它们的梯度不稳定,有时会出现难以收敛的情况.现有的
                 分割网络训练算法大致可以分为两类:一类是训练过程中只使用单一的损失函数;另一类是使用混合的损失函
                 数,如 Dice Loss+Focal Loss [21] 等.单一的损失函数不能结合其他损失函数的优点,而混合的损失函数需要考虑
                 二者之间的平衡.本文提出了一种两阶段的训练算法,每个阶段使用不同的损失函数,第 2 阶段在第 1 阶段训练
                 的基础之上再进行训练.这种方法既发挥了两种损失函数的优点,也无需像混合的损失函数那样考虑二者之间
                 的平衡.
                 2    分割模型及训练算法


                 2.1   红色病变点分割模型
                    分割模型通常包括编码器和解码器             [22] 两部分:编码器进行特征学习,解码器恢复特征图的分辨率并得到分
                 割结果.本文提出了一种多分支的网络模型 Red-Seg,该模型也遵循这种编码器+解码器的结构,其编码器结构使
                 用 VGGNet [23] ,共包括 5 组卷积,每组卷积都由若干个卷积操作和非线性激活操作组成.VGGNet 中,从 conv2 到
                 conv5 特征图的分辨率依次降低为输入图像的 1/2、1/4、1/8 和 1/16.解码器结构中包含两个分支:一个分支用
                 来进行微动脉瘤的分割,另一个分支用来进行出血点的分割.如图 2 所示为本文提出的红色病变点分割网络结
                 构图.对于微动脉瘤分割,因为微动脉瘤偏小,所以网络融合了 conv2 到 conv4 的特征.而出血点大小不一,存在大
                 块的出血点,也存在小如微动脉瘤的出血点,因此出血点分割分支融合了 conv3 到 conv5 的特征.因为 conv1 的
                 感受野过小,包括太多噪音(如后文图 7 所示),所以在两个分支中都未融合 conv1 的特征.另外,为了进一步提高
                 分割效果,网络中使用了与 HED         [11] 和 GoogLeNet [24] 类似的深度监督方法,除了两个分支各自的损失函数之外,
                 每一个分支还存在 3 个监督损失,分别对应不同尺度下的分割结果.
















                                                Fig.2    Architecture of Red-Seg
                                                  图 2   Red-Seg 模型结构图

                    解码器中微动脉瘤分割分支如图 3 所示.3 组卷积 conv2~conv4 各包含若干个卷积操作,在每组卷积的最后
                 一个卷积操作之后接一个 1×1 的卷积操作,分别得到 3 种不同尺度的特征图,3 个特征图的尺寸分别为 H/2×W/2,
   318   319   320   321   322   323   324   325   326   327   328