Page 208 - 《软件学报》2021年第5期

P. 208

1432 Journal of Software 软件学报 Vol.32, No.5, May 2021

(4) 大多数已有的分割方法只局限于重叠或接触基元的简单分割,精确的完整轮廓推断能够显著改进个
体基元的形态计算精度.
(5) 在已有方法中,检测与分割是两个相互独立的过程,如何设计一个统一的框架,联立执行检测与分割
是亟待解决的问题.
(6) 已有深度学习方法需要较大规模的训练数据集以经验拟合深层网络参数,如何设计更加高效模型提
升表征学习能力是当前的研究热点之一.
3 深度学习方法及软硬件概述

3.1 卷积神经网络
CNN 是近年来深度学习能够在各个领域取得突破性成果的基石 [47] ,它主要包括 4 类网络层,如图 4 所示.
(1) 卷积层,旨在学习一组卷积核,并通过在输入图像上滑动不同的卷积核计算多张特征图.其中,每张特
征图对应一个卷积核,这意味着同一张特征图共享权重和偏置项.
(2) 非线性层,通过在特征图上逐元素地应用激活函数,增强判定函数和整个网络的非线性,使得网络能
够对非线性函数进行建模.
(3) 池化层,利用池化核对特征图中不同位置的特征进行聚合统计 [48] ,大大降低了特征维数并增加了对局
部变换的鲁棒性.
(4) 全连接层,在网络中起到分类器的作用,将学习到的特征映射到样本标记空间.其中,每个单元都与前
层中的所有单元相连接,并且最后一层通过使用损失函数惩罚预测值与真实值间的差异以实现精确
分类的目的.

Fig.4 Architecture of CNN
图 4 CNN 体系结构

在 CNN 中,影响元素前向计算的所有可能的输入区域称为该元素的感受野(receptive field).可通过更深的
网络使特征图中单个元素的感受野变得更加广阔,从而捕捉输入上更大尺寸的特征.与传统的全连接神经网络
相比,CNN 的主要优势是通过局部感受野、权值共享以及时间或空间子采样减少网络中自由参数的个数,获得
某种程度上的位移、尺度和形变不变性.比较流行的 CNN 网络结构包括:AlexNet [49] 、VGGNet [50] 、ResNet [51] 、
GoogLeNet [52] 、MobileNet [53] 和 DenseNet [54] .
CNN 网络采用随机梯度下降和误差反向传播方法对模型参数进行更新,以实现模型训练的目的.CNN 网络

203 204 205 206 207 208 209 210 211 212 213