Page 218 - 《软件学报》2021年第5期
P. 218
1442 Journal of Software 软件学报 Vol.32, No.5, May 2021
码器模型学习性能增强的结构化语义特征提取器 [81,138,139] .其中,文献[81]和文献[139]均提出了一种基于栈式稀
疏自编码器(stacked sparse autoencoder,简称 SSAE)的框架,分别用于检测细胞核(如图 18 所示)和分类病理图像.
后者利用自编码器去重建信号,然后将一个学习得到的线性分类映射添加到自编码器之后,用于分类.实验表
明:在同等条件下,该模型在若干重建指标上优于压缩感知技术,且计算复杂度低,具有较好的实时性.
Fig.18 SSAE-based nuclear detection
图 18 基于栈式稀疏自编码器的细胞核检测
4.4 基于RNN的病理图像分割方法
CNN 和 FCN 没有充分考虑相似像素间长期的、全局的依赖关系,因此对分割标记的空间和表观一致性的
捕获能力有待加强 [140] .而在病理图像分割应用中,这种缺陷会导致分割结果目标失真、边界模糊、区域杂小等
突出问题.RNN 网络结构和训练方式为解决上述分割问题提供了有效途径 [84,85,88,98,107,110] .例如,Xie 等人 [85] 首次
将多维循环神经网络(multi-dimensional RNN,简称 MDRNN)应用于骨骼肌显微图像的肌束膜分割中.其主要思
想是:在时空维度上,使用 RNN 的反馈连接学习显微数据内的关系.其中,每个循环单元当前时间步的隐状态由
该时间步的像素输入和上一个时间步各方向上的像素隐状态决定,因而可获取图像中其他所有像素特征信息.
为了在不影响性能的情况下大大降低计算复杂度,Stollenga 等人 [88] 针对经典 RNN 网络的有向性,进一步改进
MDRNN 中反馈连接的拓扑结构,采用逐像素金字塔结构对信息进行传递,从而实现复杂神经元图像和三维脑
图像的分割.
与 CNN 和 FCN 模型相比,RNN 在病理图像分割领域,研究者关注较少,但对于后续改进建模等依然有许多
借鉴之处.一般而言,RNN 利用自身循环结构渐进地训练多个弱预测器,可迭代改进分割结果,增加对局部错误
的鲁棒性,且模型参数规模较小.然而,在基于 RNN 的分割方法中,尤其是待分割目标存在重叠粘连的情况,如何
同时捕捉空间区域内各元素强度的相关性以及它们各自随时间的演变规律,一直是亟待解决的核心难题之一.
针对这一问题,研究者提出了系列 CNN 和 RNN 级联的病理图像分割模型 [84,106,107] .其中,一类模型将 CNN 或
FCN 与 RNN 进行堆叠,这样在每个时间步中,上层卷积网络特征编码的输出为下层 RNN 序列建模的输入,例如
Chakravarty 等人提出的 RACE-Net 模型 [106] (分割结果如图 19 所示)和 Wollmann 等人提出的 GRUU-Net 模型 [107]
(分割框架如图 20 所示).而在文献[84]中,作者采用深度双向 RNN(bi-directional RNN),通过捕获前后时间步的
上下文信息,实现对三维神经元结构的准确分割.除了上述级联方法,其他类型的组合模型也已经应用到病理图
像的分割 [140] .这类模型通过在 RNN 体系结构中使用 CNN 代替循环单元,可将经典平均场迭代推理任务嵌入
RNN,并建模为 CNN 卷积计算问题,进而利用反馈连接实现精准语义分割.
Fig.19 RACE-Net-based object contour inferences in pathology images
图 19 基于 RACE-Net 的病理图像目标轮廓推理