Page 463 - 《软件学报》2024年第6期
P. 463
胡凯 等: 基于端到端深度神经网络和图搜索的 OCT 图像视网膜层边界分割方法 3039
OCT 图像视网膜层边界分割方法. 如 Ben-Cohen 等人 [41] 提出了全卷积网络用于视网膜层分割, 并在后处理的
过程中引入了 Sobel 边缘滤波器和图搜索算法; Mishra 等人 [42] 则将经典医学图像分割网络 U-Net [43] 与最短路径
算法结合用于视网膜层的自动分割. 然而, 这些方法所采用的通用医学分割网络由于缺少针对视网膜层的设计
而表现出了明显不足的鲁棒性. 如图 2(c) 和图 2(d) 所示, 由于黄斑中心凹附近的视网膜层形变程度大, 呈现出
两端宽、中心窄的特点, 处于中间层的边界分割往往会出现错误. 实际上, 对于中间层的边界像素而言, 边界两
侧不同视网膜层间的差异性是用于辅助判断其类别的关键信息, 而这些信息往往蕴含于视网膜层边界间的上
下文信息中, 因此如何充分提取和利用 OCT 图像中的上下文信息是获得视网膜层边界精准分割的关键. 已有
方法缺乏对上述问题的考虑, 分割精度还存在较大提升空间. 综上所述, 本文将端到端的深度学习方法与图搜
索算法结合, 提出了一种新颖的由粗到细的基于注意力全局残差网络 (attention global residual network, AGR-
Net) 和图搜索的 OCT 图像视网膜层边界分割方法, 有效弥补了已有 OCT 图像视网膜层边界分割方法的不足.
本文主要贡献如下.
分割
(coarse segmentation stage) 和细分割阶段
结果
专家
标注
(a) 分割示例 1 (b) 分割示例 2 (c) 分割示例 3 (d) 分割示例 4
图 2 不同方法对不同患者类型的视网膜层边界分割结果示例
● 提出了一种新颖的“由粗到细”的端到端深度神经网络与图搜索结合的 OCT 图像视网膜层边界分割框架.
不同于以往的方法, 该框架既能充分利用深度学习自动提取复杂特征和有效表征 OCT 图像信息的长处, 又能充分
利用图搜索方法从原理上保证了分割结果的固定拓扑结构和边界连续平滑, 从而避免了视网膜层的过分割和欠分
割现象, 更能以端到端方式解决原来以图像块方式带来的“断层”现象等弊端.
● 提出了一种基于注意力全局残差网络的端到端深度学习模型, 并将其作为整体框架的粗分割阶段. 该模型
以残差块为基础, 利用短连接能够很好避免底层信息的过度丢失、保护特征提取的完整性. 通过串行组合全局特
征模块 (global feature module, GFM) 和通道注意力模块 (channel attention module, CAM) 并将其嵌入到残差网络
中, 能够充分提取 OCT 图像的全局上下文信息和图像特征之间的关联性信息, 并同时增强视网膜层边界的强相关
信息, 有效地解决了视网膜 OCT 图像由于灰度值与背景十分接近、边界模糊难以定义的问题.
● 在两个公开数据集上开展消融实验验证了本文方法的有效性, 并与多种主流方法展开了对比实验. 实验结
果表明本文方法对于 OCT 图像视网膜层边界分割在定量效果和视觉效果上都优于目前最先进的方法.
2 本文算法
如图 3 所示为本文提出的视网膜层边界分割算法整体流程图, 整个分割过程分为两个串行阶段: 粗分割阶段
(fine segmentation stage). 在粗分割阶段中, 通过利用训练集优化图 3 中
AGR-Net 的参数后将测试集输入网络即得到粗分割结果. 具体地, 本文在残差网络中嵌入了全局特征模块和通道
注意力模块, 前者能够充分捕获图像的全局上下文信息, 后者则使得网络更关注于 OCT 图像中视网膜层边界相关
的显著性信息. 值得注意的是, 神经网络得到的视网膜层分割结果容易出现层边界不连续的现象, 本文利用图搜索
算法进一步对粗分割的结果进行细分割, 以获得连续的视网膜层边界分割结果. 具体地, 本文首先经端到端深度神
经网络得到粗分割结果, 再利用粗分割结果生成的候选边界构造出图模型, 并对该生成图进行最短路径搜索, 弥补
粗分割结果中存在的边界不连续的问题, 从而优化各视网膜层边界.