Page 467 - 《软件学报》2024年第6期
P. 467
胡凯 等: 基于端到端深度神经网络和图搜索的 OCT 图像视网膜层边界分割方法 3043
3 实验与分析
3.1 数据集介绍
数据集 1: U. of Miami OCT 数据集 [46] , 由迈阿密巴斯科姆帕尔默眼科研究所采集, 包含 10 例轻度非增殖性糖
尿病视网膜病变病例的 50 幅 OCT 图像, 其中患者年龄区间为 45–59 岁. 对于每个病例, 采集了患者视网膜黄斑中
央凹中心位置图像 1 幅、中央凹周围图像 2 幅和中央凹旁图像 2 幅, 共 5 幅分辨率大小为 496×768 的 OCT 图像,
每幅图像的垂直分辨率为 11.11 μm/像素, 水平分辨率为 3.867 μm/像素. 所有采集到的视网膜 OCT 图像中的 5 层
边界 (Surface1、Surface2、Surface4、Surface6 和 Surface11) 由两位眼科专家同时进行标注.
数据集 2: 该数据集来自于 4 家不同的眼科研究中心, 由 Chiu 等人 [47] 所在机构的 SD-OCT 成像系统采集, 包
含 20 例年龄相关性黄斑变性 (AMD) 病例的 220 幅 OCT 图像. 其中每个病例包含 11 幅包含中心凹的 OCT 图像
(编号分别为 F±n, 其中 n 等于 0、2、5、10、15 和 20). 所有采集到的视网膜 OCT 图像中 3 层边界 (脉络膜的外
边界 (RBC)、视网膜色素上皮的内边界 (IZ-RPE) 和内界膜的内边界 (ILM-NFL)) 同样由两位眼科专家同时进行
标注.
3.2 实验方案
本文通过消融实验和对比实验的方式, 将从 4 个方面验证所提注意力全局残差网络及其组件的有效性, 以及
其与图搜索算法结合的分割性能, 具体包括: (1) 全局特征模块的消融实验. 通过对比是否加入全局特征模块的实
验结果, 以验证本文设计的全局特征模块是否有助于视网膜层边界分割. (2) 通道注意力的消融实验. 通过验证在
网络框架中嵌入通道注意力模块能否进一步优化模型的分割性能. (3) 图搜索算法的消融实验. 通过比较粗分割和
细分割的结果以验证图搜索算法的有效性. (4) 与已有方法的对比实验. 通过在两个数据集上从数值结果和视觉效
果方面与主流方法进行对比, 以验证本文方法的优越性. 此外, 针对不同病例的 OCT 图像, 本文对其分割结果进行
了分析.
在实验中, 本文采用水平翻转进行了数据增强, 并采用 5 折交叉验证进行性能评估. 其中数据集 1 选择 8 个病
使用
例 (40 幅图像) 作为训练集, 其余 2 个病例 RMSE i =
幅图像) 为测试集; 数据集
个病例
(176
(10
16
2
幅图像) 进行训练,
其余 4 个病例 (44 幅图像) 作为测试集. 数据集 1 和 2 均有两位专家的手动标注, 本文以各自的第 1 位专家标注为
金标准, 并将两位专家的标注差异 (Inter-Observer) 作为判断分割精度的基本标准.
3.3 评价指标
为了更直接公平地对比, 本文在数据集 1 和 2 上采用其最常用的指标作为模型分割性能的评价标准, 即在数
据集 1 上采用如公式 (2) 所示的平均无符号误差 (mean unsigned error, MUE), 在数据集 2 上采用如公式 (3) 所示的
均方根误差 (root mean square error, RMSE), 以上评价指标计算模型的预测边界与真实边界的误差的方式如下:
∑
|P i (x)−G i (x)|
MUE i = x (2)
∥A-scan∥
v
t∑
(P i (x)−G i (x)) 2
x
(3)
∥A-scan∥
其中, x 表示 x 轴向扫描 (A-scan), i 表示第 i 个边界, P(x) 和 G(x) 分别表示第 x 个 A-scan 图像的模型预测图和真
值图. ||A-scan||表示 A-scan 的图像总数.
3.4 对比实验
3.4.1 全局特征模块的消融实验
由第 3.2 节可知, 全局特征模块由 4 个并行的门控循环单元构成, 为了验证全局特征模块的有效性, 本文在两
个数据集上进行了该模块的消融实验. 实验结果如表 1 和表 2 所示, 在使用全局特征模块时, 除数据集 2 上的
RBC 层边界误差稍微升高了 0.03 个像素以外, 其他边界的误差指标都有大幅度的下降. 总之, 当不集成全局特征