Page 115 - 《软件学报》2024年第4期
P. 115
李晴 等: 神经网络结构搜索在脑数据分析领域的研究进展 1693
• 分割
脑结构分割是指基于脑影像数据将脑组织分离出来的过程, 分割精度将直接影响临床诊断的准确性. 由
于不同的采集协议、成像设备以及感兴趣区位置、大小和形状的不同, 脑结构的分割任务往往需要手动设计
深层神经网络的结构. 基于 NAS 的脑结构分割方法能够自动快速地确定最优的网络结构和参数, 有助于更精
确地定位和区分出具有特殊形态和位置关系的脑部组织. 目前, 已有相当数量的工作尝试将 NAS 引入到脑结
构的分割任务中, 这些工作主要包括对脑部肿瘤病灶的分割以及海马、白质等脑区组织的分割.
在脑结构分割任务中, 当前最先进的方法包括 DeepLabv3+, U-Net, nnU-Net 等. 然而, 手工设计神经网络
的架构仍然具有一定局限性, 基于 NAS 算法可以提高脑影像分割任务的精度并减小计算开销 [5,49−56] . 当前,
面向脑结构分割的 NAS 方法可分为两类: 搜索 2D 体系结构并通过独立处理每个切片来生成最终分割和搜索
3D 分割体系结构. 由于面向 3D 图像直接分割的研究能够保留更多脑结构的空间信息, 因此分割结果更优.
但由于针对 3D 图像的分割计算量更大, 因此大多研究基于微观空间开展研究. 此外, 脑结构的分割更加精细
化, 理想情况下, 微观结构和宏观结构应进行联合优化, 以避免人工定义所导致的部分超参数值丢失. 因此,
目前也有一些研究将微观结构和宏观结构进行联合优化, 从而达到精细化分割的目的.
2019 年, Kim 等人的工作 [49] 首次将 NAS 框架引入到脑结构数据的分割任务中, 证明了基于 NAS 自动优
化的网络优于手动设计的 3D U-Net. 此后, 越来越多的研究持续改善 NAS 在脑结构分割任务上的表现.
为了改善 NAS 在 3D 分割任务中的内存消耗问题, Bae 等人 [57] 提出了一种面向 3D 图像分割的资源优化
NAS 框架 RONASMIS. 该模型采取持续对子网络进行训练的策略, 替代对网络权重的重新初始化, 从而提高
NAS 的搜索效率, 并在脑肿瘤的分割任务中获得了比 nnU-Net 更好的性能. Wong 等人 [50] 提出了一种名为
SegNAS3D 的 NAS 框架, 通过将网络结构表示为可学习的有向无环图, 实现网络结构与分割任务的联合学习,
以提升全局优化效率. SegNAS3D 在脑结构的分割任务中全面超越了基线模型, 并且生成的结构比人工构建
[5]
的结构小得多. Guo 等人 提出了一种名为 SOARS 的搜索架构, 将脑部病灶分为不同的类别, 并为每个类别
执行定制化的 NAS 策略; Wang 等人 [51] 针对不同的模块设计了特定概率参数进行学习的候选操作, 搜索过程
的结束标志为找到最频繁出现的模块结构, 并在脑肿瘤分割任务上证明了 NAS 搜索的网络在可行性和泛化方
面具有竞争力.
为了实现多尺度的分割模式, Yu 等人 [58] 以及 Xiang 等人 [55] 分别设计了由粗到细的两阶段搜索过程, 以减
缓两个阶段同时进行搜索的内存压力. 在上述两阶段搜索过程的基础之上, Calisto 等人 [59] 又进一步提出了名
为 EMONAS-Net 的稳健高效的 3D 医学图像分割框架. 该框架具有两个关键组件: 一个考虑分割体系结构微
观和宏观结构配置的搜索空间和一个基于代理的多目标进化算法, 从而提高网络结构的搜索效率. 其搜索空
间与 SegNAS3D [50] 类似, 其微观结构由有向无环图表示, 而宏观结构用 SaMEA 算法确定节点之间的连接以及
每个节点最适合的卷积操作, 并在大脑海马的分割任务中大幅度提高了性能.
进一步, 为了建立搜索空间与脑白质分割之间的关系, Tchetchenian 等人 [60] 评估了基于手动调整和基于
NAS 搜索的 U 形网络在脑白质分割任务上的性能, 发现 NAS 搜索得到的网络可以减少对 GPU 内存的消耗,
且仅关注于微观结构的 NAS 并未取得性能的明显提升, 并建议用于脑白质分割任务的 NAS 应更关注宏观搜
索空间, 将宏观的结构超参数纳入到搜索范围中.
由于上述工作大多将搜索框架限制在 U 形网络结构中, 为了支持高度灵活的基于梯度的快速搜索, He 等
人 [52] 设计了名为 DiNTS 的 3D 医学图像分割框架, 将深层神经网络结构的搜索问题从离散空间转化成连续且
可微的问题, 从而支持在高度灵活网络拓扑空间中的快速搜索. 由于 DiNTS 可以缓解可微方案中搜索到的最
佳连续模型在离散化后可能会产生次优离散模型的问题, 因此即使基于非 U-Net 主干算法, DiNTS 也能够在
脑肿瘤以及海马的分割任务中获得最佳性能. 与 DiNTS 的计算约束条件类似, Peng 等人 [54] 提出了一种名为
HyperSegNAS 的 3D 医学图像分割 NAS 算法, 通过训练一个超网络来评估分割架构的性能, 以获得一个通用
的分割架构. 该超网络一旦训练完成就可以被移除, 而不会在结构搜索过程中引入额外的开销. 与 DiNTS 相
比, HyperSegNAS 在不同的计算架构上都取得了更好的结果, 并在脑肿瘤以及海马的分割任务上实现了最先