Page 217 - 《软件学报》2021年第5期
P. 217
宋杰 等:基于深度学习的数字病理图像分割综述与展望 1441
标外部特征的影响,因此对图像细节特征捕获和紧致表达能力有待加强,尤其是待分割目标存在弱边缘和稀疏
染质的情况.为此,沈琳琳等人 [94] 利用全卷积网络架构对 ResNet 进行拓展,通过在更深的网络中解决梯度消失
问题,以实现精确分割癌细胞的目的;进一步,Jégou 等人 [134] 将 DenseNet 应用到语义分割,通过增强特征传播,以
实现降低外部特征影响的目的.V-Net [133] 是另一种版本的 3D U-Net,与 U-Net 相比,该模型可以实现端到端的 3D
深度监督学习,并通过引入残差学习模块和 Dice 损失函数,避免了前背景体素类别数量不平衡的情况.
Fig.16 U-Net architecture for pathology image segmentation
图 16 用于病理图像分割的 U-Net 体系结构
除了主流的 U-Net,V-Net 及其变种网络,其他类型的编码器-解码器模型 [90,93,98,105] 也已经应用到病理图像
的语义分割.例如:Chen 等人 [90] 和 Fakhry 等人 [93] 针对大脑神经元图像,分别提出了深度上下文分割网络和残差
反卷积分割网络(如图 17 所示);Saha 等人 [98] 针对人表皮生长因子受体-2(HER2)乳腺癌细胞图像,提出了
Her2Net 分割网络;Jin 等人 [105] 针对眼底视网膜血管图像,提出了可变形 U-Net 分割网络;Xie 等人 [113] 针对结直
肠腺癌图像,提出了深度分割校正网络.这些编码器-解码器模型通过解析训练图像的内容,在分割图像的同时
获取图像所有分割区域甚至每个像素的语义类别,从而得到图像基于内容的标注,但仍缺少对病理图像底层信
息的充分利用,导致最终的分割结果比较粗糙.编码器-解码器模型与注意力机制的复合是另外一条技术路线.
与经典池化方法相比,注意力机制通过赋值权重,能够对不同位置特征的重要性进行评估,进而建模局部特征的
上下文依赖关系.方法主要包括逆向注意力网络 [135] 、金字塔注意力网络 [136] 、对偶注意力网络 [137] 等.受上述方
法启发,研究者将复合模型应用于病理图像语义分割.代表性方法包括注意力神经细胞分割模型 [108] 、通道与空
间注意力分割模型 [116] 等.
Fig.17 Residual decovolutional network model for neuron segmentation
图 17 用于神经元分割的残差反卷积网络模型
而对于大量无标签病理图像块的处理问题,许多研究者更倾向于使用自编码器模型.研究发现,可利用自编