Page 115 - 《软件学报》2024年第4期
P. 115

李晴  等:  神经网络结构搜索在脑数据分析领域的研究进展                                                    1693


             •   分割
             脑结构分割是指基于脑影像数据将脑组织分离出来的过程,  分割精度将直接影响临床诊断的准确性.  由
         于不同的采集协议、成像设备以及感兴趣区位置、大小和形状的不同,  脑结构的分割任务往往需要手动设计
         深层神经网络的结构.  基于 NAS 的脑结构分割方法能够自动快速地确定最优的网络结构和参数,  有助于更精
         确地定位和区分出具有特殊形态和位置关系的脑部组织.  目前,  已有相当数量的工作尝试将 NAS 引入到脑结
         构的分割任务中,  这些工作主要包括对脑部肿瘤病灶的分割以及海马、白质等脑区组织的分割.
             在脑结构分割任务中,  当前最先进的方法包括 DeepLabv3+, U-Net, nnU-Net 等.  然而,  手工设计神经网络
         的架构仍然具有一定局限性,  基于 NAS 算法可以提高脑影像分割任务的精度并减小计算开销                                [5,49−56] .  当前,
         面向脑结构分割的 NAS 方法可分为两类:  搜索 2D 体系结构并通过独立处理每个切片来生成最终分割和搜索
         3D 分割体系结构.  由于面向 3D 图像直接分割的研究能够保留更多脑结构的空间信息,  因此分割结果更优.
         但由于针对 3D 图像的分割计算量更大,  因此大多研究基于微观空间开展研究.  此外,  脑结构的分割更加精细
         化,  理想情况下,  微观结构和宏观结构应进行联合优化,  以避免人工定义所导致的部分超参数值丢失.  因此,
         目前也有一些研究将微观结构和宏观结构进行联合优化,  从而达到精细化分割的目的.
             2019 年,  Kim 等人的工作   [49] 首次将 NAS 框架引入到脑结构数据的分割任务中,  证明了基于 NAS 自动优
         化的网络优于手动设计的 3D U-Net.  此后,  越来越多的研究持续改善 NAS 在脑结构分割任务上的表现.
             为了改善 NAS 在 3D 分割任务中的内存消耗问题,  Bae 等人             [57] 提出了一种面向 3D 图像分割的资源优化
         NAS 框架 RONASMIS.  该模型采取持续对子网络进行训练的策略,  替代对网络权重的重新初始化,  从而提高
         NAS 的搜索效率,  并在脑肿瘤的分割任务中获得了比 nnU-Net 更好的性能.  Wong 等人                     [50] 提出了一种名为
         SegNAS3D 的 NAS 框架,  通过将网络结构表示为可学习的有向无环图,  实现网络结构与分割任务的联合学习,
         以提升全局优化效率.  SegNAS3D 在脑结构的分割任务中全面超越了基线模型,  并且生成的结构比人工构建
                             [5]
         的结构小得多.  Guo 等人 提出了一种名为 SOARS 的搜索架构,  将脑部病灶分为不同的类别,  并为每个类别
         执行定制化的 NAS 策略;  Wang 等人       [51] 针对不同的模块设计了特定概率参数进行学习的候选操作,  搜索过程
         的结束标志为找到最频繁出现的模块结构,  并在脑肿瘤分割任务上证明了 NAS 搜索的网络在可行性和泛化方
         面具有竞争力.
             为了实现多尺度的分割模式,  Yu 等人          [58] 以及 Xiang 等人 [55] 分别设计了由粗到细的两阶段搜索过程,  以减
         缓两个阶段同时进行搜索的内存压力.  在上述两阶段搜索过程的基础之上,  Calisto 等人                        [59] 又进一步提出了名
         为 EMONAS-Net 的稳健高效的 3D 医学图像分割框架.  该框架具有两个关键组件:  一个考虑分割体系结构微
         观和宏观结构配置的搜索空间和一个基于代理的多目标进化算法,  从而提高网络结构的搜索效率.  其搜索空
         间与 SegNAS3D  [50] 类似,  其微观结构由有向无环图表示,  而宏观结构用 SaMEA 算法确定节点之间的连接以及
         每个节点最适合的卷积操作,  并在大脑海马的分割任务中大幅度提高了性能.
             进一步,  为了建立搜索空间与脑白质分割之间的关系,  Tchetchenian 等人                [60] 评估了基于手动调整和基于
         NAS 搜索的 U 形网络在脑白质分割任务上的性能,  发现 NAS 搜索得到的网络可以减少对 GPU 内存的消耗,
         且仅关注于微观结构的 NAS 并未取得性能的明显提升,  并建议用于脑白质分割任务的 NAS 应更关注宏观搜
         索空间,  将宏观的结构超参数纳入到搜索范围中.
             由于上述工作大多将搜索框架限制在 U 形网络结构中,  为了支持高度灵活的基于梯度的快速搜索, He 等
         人 [52] 设计了名为 DiNTS 的 3D 医学图像分割框架,  将深层神经网络结构的搜索问题从离散空间转化成连续且
         可微的问题,  从而支持在高度灵活网络拓扑空间中的快速搜索.  由于 DiNTS 可以缓解可微方案中搜索到的最
         佳连续模型在离散化后可能会产生次优离散模型的问题,  因此即使基于非 U-Net 主干算法,  DiNTS 也能够在
         脑肿瘤以及海马的分割任务中获得最佳性能.  与 DiNTS 的计算约束条件类似,  Peng 等人                        [54] 提出了一种名为
         HyperSegNAS 的 3D 医学图像分割 NAS 算法,  通过训练一个超网络来评估分割架构的性能,  以获得一个通用
         的分割架构.  该超网络一旦训练完成就可以被移除,  而不会在结构搜索过程中引入额外的开销.  与 DiNTS 相
         比,  HyperSegNAS 在不同的计算架构上都取得了更好的结果,  并在脑肿瘤以及海马的分割任务上实现了最先
   110   111   112   113   114   115   116   117   118   119   120