Page 462 - 《软件学报》2024年第6期
P. 462
3038 软件学报 2024 年第 35 卷第 6 期
视网膜层自动分割方法大致可以分为两类: 传统处理方法和基于机器学习的方法. 前者以需要人工提取并选
择与任务强相关的图像特征为共同特性, 分割结果往往取决于特征选取的恰当性, 很大程度上限制了其在 OCT 图
像分割领域的有效应用. 具体包括基于阈值法 [12−14] 、水平集模型 [15] 、马尔可夫随机场模型 [16] 和基于图论 [17−20] 等
传统图像处理方法, 以及充分利用机器学习能较好逼近复杂非线性关系并对噪声有较强鲁棒性和容错能力特性而
产生的诸如支持向量机 [21] 、随机森林 [22,23] 和 K 近邻 [24] 和神经网络 [25−27] 方法等传统机器学习方法. 其中, 图搜索
(graph search, GS) 分割算法近年来表现突出, 它将图像映射为加权图, 图的顶点对应其连接的像素点或区域, 带权
边上的权值代表其连接的相邻顶点间的非负相似度. 图结构有效建立了图像中像素点或区域之间的相互关系, 通
过特定的建图方式以分割目标表面 (surface) 边界来实现目标的准确分割, 从原理上保证了分割效果的固定拓扑结
构和边界连续平滑, 避免了视网膜层的过分割和欠分割现象, 因此基于图搜索算法的视网膜分层具有先天的优势.
但它存在两个方面的不足, 一是由于 OCT 图像分辨率高、影像尺寸大, 直接使用图搜索方法存在计算代价大、运
算时间过长的缺点, 加上 OCT 图像存在大量噪声且对比度低, 手动提取的特征无法充分地表征图像信息, 对视网
膜分割带来挑战; 二是图搜索方法大多基于图像强度和梯度来提取边界, 受到图像本身视网膜层厚度的先验知识
约束, 而不同个体的视网膜层厚度或特征不同, 利用同一组规则处理不同病例的 OCT 图像数据时可能会出现
代替
错误.
近年兴起的深度学习方法 [28] , 摒弃了传统机器学习方法中人工提取图像特征的步骤, 主要通过深度神经网络
进行自动的特征提取和选择, 在 OCT 图像视网膜层分割方面取得了很好进展, 受到了专家学者们的青睐. 根据模
型输入的不同, 基于深度学习的方法大致可分为基于图像块的方法 [29,30] 和端到端的方法 [31−36] . 对于基于图像块的
方法, 其实现方式是在将图像输入到神经网络前对其采集图像块, 从而减少迭代过程中的复杂性和对计算资源的
需求. 相反, 端到端的深度学习方法则无需考虑图像块采样, 而是对输入的整图信息进行建模. 在图像分割的研究
中, 端到端方法略去了裁剪图像的步骤, 以更直接的方式处理输入图像, 减少了图像信息丢失的可能. 如 McDonough
等人 [26] 提出了端到端的 BP 神经网络使其专注于学习视网膜层的特征; Pekala 等人 [33] 提出了一种卷积神经网络与
高斯过程结合的视网膜层分割方法; Kepp 等人 [34] 设计了基于卷积神经网络的形状回归方式以保留视网膜层的拓
扑结构; Wei 等人 [35] 提出了一种新的基于深度最大池化的全卷积网络, 并将不同视网膜层间的互斥关系引入到损
失函数中. 目前深度学习方法是 OCT 图像中视网膜层分割的主流算法, 主要是基于卷积神经网络 (convolutional
neural networks, CNNs) 或循环神经网络 (recurrent neural networks, RNNs) 的方法, CNN 和 RNN 本质上是特征提
取器, 对训练过程自动提取到的图像特征具备很强的表征能力, 但由于它们只对各个像素点的结果进行判断, 因此
存在分割结果的连续性较差, 会出现边界断裂、跳变或模糊等情况, 也不能保证分割层的拓扑结构, 分割结果存在
过分割和欠分割等现象.
研究表明, 人工设计的先验特征和自动学习获取的深度特征是相辅相成的, 二者合理组合应用可以带来更好
的分割结果, 将传统处理算法与深度学习算法结合是图像分割的一种优化选择 [37] , 如在视网膜层分割任务中, 将
图搜索算法与深度学习结合则是已被证明的一种有效方式. 目前常见的是基于图像块的深度学习和图搜索的结
合, 如 Fang 等人 [25] 以图像块输入利用 CNN 得到概率图, 再使用图搜索算法对视网膜层边界进行搜索; Kugelman 等
人 [38] 在 Fang 等人 [25] 所提方法的基础上使用 RNN CNN; Hu 等人 [39] 提出视网膜层多尺度信息提取的策略, 并
将其与图搜索算法结合以优化层分割效果; 唐艳红等人 [40] 则保留了 CNN 部分, 而通过改进图搜索算法以提升视
网膜层的分割效果. 尽管这些方法已经取得了良好的效果, 但在采集图像块的过程中丢失了图像的全局信息和图
像块间的位置信息, 图搜索算法中施加的表面平滑约束仅考虑到各条边界本身的平滑性要求, 而忽略了各边界间
的关联性, 类似于线间最大、最小距离, 或形状相似性等信息. 因此视网膜层边界的连续性在取块的过程中实际上
被破坏, 并且重叠采样也引入了大量冗余的图像信息从而在一定程度上影响分割性能. 如对于糖尿病患者, 通过这
一类方法所得到的分割结果往往会存在如图 2(a) 中明显的“断层”现象, 即使经过了图搜索算法的平滑依然未得到
改善, 而对于黄斑变性患者, 即使病例种类不同, 如图 2(b) 中也同样存在类似的现象.
将图搜索与深度学习结合应用于 OCT 分割还存在另外一种方式, 即基于端到端深度神经网络和图搜索的