Page 305 - 《软件学报》2020年第12期
P. 305

刘宇男  等:基于级联密集网络的轮廓波变换域图像复原                                                       3971


         于图像复原任务,虽然这些方法生成的图像包含了更多逼真的纹理细节,但训练的不稳性定给性能优化带来了
         新的难题.此外,基于生成对抗网络方法生成的图像通常会出现比较严重的失真,导致这些方法通常提供了较差
         的客观评估结果.作为一种简单的解决方案,小波变换与 CNN 结合的方法                        [21−23] 被引入到图像复原任务中.小波
         变换提供的高频子带可以稀疏地捕获到不同方向下的图像特征,借助这个优势,这些方法将空域的非线性映射
         转换到小波变换域,简单有效地实现了图像复原在主观和客观评估结果上的同时优化.但是,小波变换的主要缺
         陷在于:当处理二维图像及更高维信号时,小波变换并不能提供最优的稀疏表示                            [24] ,高频子带用“点”拟合的边缘
         和轮廓会出现不连续问题,各向同性的特点也限制了小波变换对图像的稀疏表示能力.
         2    本文方法

             为了更好地解决图像复原任务,本文提出了一种基于级联密集型的轮廓波域的图像复原方法.首先介绍级
         联密集型卷积神经网络结构,然后对轮廓波变换及其与 CDCNN 结构结合进行详细阐述.

         2.1   级联密集型卷积神经网络
             如图 1 所示,CDCNN 包括两个部分,分别为浅层特征提取模块和深层特征提取模块:浅层特征提取模块中
         包含了串联的两个卷积层;深层特征提取模块由若干个密集块(dense block,简称 DB)级联而成,每个密集块结构
         如图 2 所示.图 2 的结构图中,每个 DB 包含 4 层卷积,与残差块(residual block,简称 RB)          [36] 相比,每个 DB 中的卷
         积层连接更加紧密,通过通道拼接操作,使其中每个卷积层的输出都作为后面卷积层的输入,实现了信息的最大
         化流通   [38] .在 CDCNN 中,位于不同深度的 DB 可以充分地挖掘出不同层次的图像特征,而且每个 DB 的输入是
         浅层特征提取模块以及前面所有 DB 输出特征图的拼接结果.这样的设计使得每个 DB 挖掘出来的不同层次特
         征都会作用于后面 DB,不但为后面 DB 提供了更多的特征挖掘线索,而且解决了深度 CNN 中存在的长期依赖
         问题.










                   Fig.1    Structure of the proposed cascading dense convolutional neural network (CDCNN)
                                          图 1   级联密集型网络结构









                                  Fig.2    Structure of the proposed dense block (DB)
                                              图 2   密集块结构
                                                      HR
             假设退化图像和重建的目标图像分别表示为 I               LR  和 I ,我们 CDCNN 的目的是解决下面问题:
                                                  N
                                                1
                                        ˆ
                                       θ = argmin ∑  ( L F CDN (I i LR ),I i HR )             (1)
                                             θ  N  i= 1
                                   LR
         其中,N 表示训练样本个数,F CDN (I )表示通过 CDCNN 重建的复原图像,θ表示卷积的参数集合,L 表示目标函数.
         Hui 等人 [29] 实验性地证明了:在图像复原任务上先用 L1 损失函数训练,再用 L2 损失函数优化参数,可以达到更
         好的重建结果.为了避免引入额外的训练技巧,本文训练过程将只使用 L1 损失函数.
   300   301   302   303   304   305   306   307   308   309   310