Page 219 - 《软件学报》2021年第5期
P. 219
宋杰 等:基于深度学习的数字病理图像分割综述与展望 1443
Fig.20 GRUU-Net architecture for cell segmentation
图 20 用于细胞分割的 GRUU-Net 模型结构
4.5 基于GAN的病理图像分割方法
自 2014 年 GAN 网络出现以来,关于其在病理学领域的应用研究文献不断涌现,其中包括图像生成 [99,141] 、
病灶检测 [123,142,143] 、癌症亚型分类 [118] 、腺和细胞分割 [102,121,122,144,145] (如图 21 所示)等.在实际操作中,由于不需
要预先建模,生成器和判别器可以选择为任何结构的神经网络,也未考虑建模数据的专有属性.此时,GAN 模型
通常会过于自由、训练过程可控性太差、模型稳定性不足.因此,在利用 GAN 模型学习大规模病理数据的分布
时,需要考虑病理数据自身特性,以增强模型及其训练过程的稳定性.一般而言,病理图像更倾向于使用 CGAN
作为基础模型用于图像生成 [99] .至于“将 GAN 应用于病灶检测”,研究者则通过学习正常病理图像的概率分布检
测异常,即具有不同分布的病理图像将被判别器认为是病灶.例如,Alex 等人 [142] 训练了一种 GAN 模型,通过在生
成器网络中建模正常病理图像块的分布和在判别器网络中计算测试图像块的后验分布,较好地解决了大脑损
伤的检测问题.在此基础上,Chen 等人 [143] 提出了对抗自编码器模型,实现了更广泛病理图像的异常检测.
Fig.21 GAN model-based cell and gland segmentation
图 21 基于 GAN 模型的细胞和腺分割
正如第 3.1 节和第 3.2 节所述,CNN 和 FCN 通常使用像素级别的人工分割样本作为训练数据集,进而通过
逐像素计算损失进行学习,例如交叉熵损失.为了得到正确的细胞实例分割结果,网络需要进一步结合后处理步
骤来提升其对空间邻近性的度量能力,如 CNN-CRF 模型.但这类模型往往受限于成对势能的使用,由于只能利
用数据的二阶统计特性,导致其分割的性能受到限制.相比之下,GAN 通过对抗训练将更高阶势能引入网络模
型,从而更好地刻画细胞的复杂本质结构 [102,121,122] .其中,判别器起到形状正则化作用,用于加强目标形状的紧致
表达能力.另外,类似于感知损失 [146] ,通过使用对抗训练方式代替传统人工设计的损失函数,GAN 能够检测到预
测分割和人工分割结果间高阶统计量的细微差异 [144] .尤其随着 CGAN 的引入,对抗分割方法可通过增加感受
野的大小学习基于上下文感知的结构化网络损失 [102] ,从而解决复杂背景结构下的细胞分割问题,如图 22 所示.
Fig.22 CGAN model for nuclear segmentation
图 22 用于细胞核分割的 CGAN 模型