Page 304 - 《软件学报》2020年第12期
P. 304

3970                                Journal of Software  软件学报 Vol.31, No.12, December 2020

                个密集块输出的特征图都会作为后面密集块的输入,有效解决了深层网络中的长期依赖问题;
             •   引入轮廓波变换,将图像问题的求解从空域转换到变换域.具体地,分别将退化图像和重建图像的分解
                子带作为 CDCNN 的输入和输出,借助轮廓波变换优秀的稀疏表示能力,通过低频子带捕获图像的全
                局拓扑结构,高频子带复原出图像更加逼真的结构和纹理细节;
             •   本文提出的模型可以应用于图像去噪、超分辨率及 JPEG 解压缩.标准验证集上的实验表明:本方法在
                3 个图像复原任务上都达到了目前最优性能,主观结果进一步证明了本文方法在结构和纹理细节重建
                上的显著优势.
             本文第 1 节介绍图像复原的相关工作.第 2 节详细叙述基于 CDCNN 和轮廓波变换结合的图像复原方法.
         第 3 节为实验评估.最后为总结.

         1    图像复原相关工作

             与传统方法相比,CNN 凭借极强的学习能力,使图像复原能力得到了显著提升.这部分将对图像复原任务上
         CNN 方法的相关工作进行回顾.
             作为图像超分辨领域最早的 CNN 方法,Dong 等人            [10] 提出的 SRCNN 模型在重建精度上明显高于传统方法.
         但由于输入网络前需要对图像进行上采样预处理,造成该方法存在计算复杂度过高的问题.为了提高速度,Dong
         等人  [13] 和 Shi 等人 [25] 分别引入了反卷积层和亚像素卷积层替换上采样预处理,将这两个卷积层作为 CNN 的上
         采样模块,使大部分的卷积操作可以在低分辨率空间执行.借助上采样模块,计算复杂度大幅度降低,这在此后
         的很多超分辨率方法中也得到了沿用,例如 DDSR                [26] ,LapSRN [27] ,DBPN [28] 及 IDN [29] 在上采样模块中用了反卷
                                  [1]
         积层,CARN   [30] ,EDSR [31] ,SRMD ,MSRN [32] ,RCAN [15] 和 RDN [33] 则使用了亚像素卷积.除了上采样模块,特征提
         取模块是另一个重要组成部分,很多方法的特征提取模块由一系列相同的基础块串联而成                                 [30−35] ,每个基础块对
         特征的挖掘能力将对重建性能起到至关重要的作用.残差块                     [36] 和密集块 [33,37] 是超分辨率 CNN 中比较常用的基
         础块,此外,Hui 等人    [29] 将一种新颖的信息蒸馏块作为基础块,Li 等人           [38] 在残差块和密集块    [37] 的基础上设计了多
         尺度残差块作为基础块,Zhang 等人          [33] 在密集块基础上引入局部残差学习和局部特征融合,使深层网络的学习
         更加稳定.在图像识别等高层计算机视觉任务中,GoogLeNet                [36] 和 ResNet [39] 的优异表现证明了增加 CNN 深度对
         提高性能的有效性.显然,这个结论在底层视觉任务中同样适用.除了提高每个基础块能力,增加基础块数量成
         为了提升性能的有效途径.从最初 3 层卷积的 SRCNN                [14] 到 80 层的 MemNet [34] ,再到最近提出的 400 层的
         RCAN [15] ,CNN 深度的增加带来了性能的显著提升.但是,简单地增加深度会带来很多问题,梯度消失和梯度爆
         炸导致训练不稳定,计算量和参数量的大幅增加导致应用价值降低.为了解决上述问题,很多新颖的 CNN 结构
         设计和训练技巧被相继提出和应用,VDSR               [40] 引入的残差学习和梯度裁剪策略让训练过程变得更加稳定.
         DRCN [41] ,DRRN [35] 和 CARN [30]  通过引入递归结构,在基本保持性能的情况下大幅度降低网络的参数量.
         MemNet [34] ,MSRN [32] 和 RDN [33] 充分地挖掘和利用图像不同层次的特征,为超分辨率重建提供了更多的线索.
             与图像超分辨率领域相同,CNN 在图像去噪及 JPEG 解压缩任务上也取得了丰硕的成果,而且与超分辨率
         领域的发展有很多相似之处,增加 CNN 网络深度同样带来了重建性能的显著提升.早在 2009 年,Jain 等人                            [42] 就
         将一个 4 层卷积的 CNN 结构应用于图像去噪任务,但由于网络深度过浅以及训练数据匮乏等原因,导致早期的
                                                              [2]
         很多 CNN 方法   [42−44] 并不能获得理想的去噪结果.此后,Zhang 等人 提出了 DnCNN 模型,结合残差学习和批标
         准化,使去噪能力得到了大幅度提升.Mao 等人              [45] 提出了 RED 模型,通过对称的跳跃连接,提高了训练的收敛速
         度,并进一步提升了去噪质量.为了实现速度和精度更好的平衡,Santhanam 等人                     [46] 提出了 RBDN 模型,Zhang 等
         人 [47] 引入扩张滤波,提出了 7 层的全卷积网络.Dong 等人          [48] 最早提出了 4 层的 ARCNN 模型,用于去除 JPEG 压
         缩造成的块效应.此后,TNRD        [49] ,DDCN [50] 和 D3 [11] 模型在加深 CNN 结构的同时充分利用了 JPEG 压缩的相关先
         验知识,大幅度提高了 JPEG 解压缩的能力.
             基于 CNN 方法使图像复原的能力得到了显著提升,但这些方法的主要缺陷在于:由于丢失了大量纹理和结
         构细节,造成重建图像存在过度平滑的问题.为了解决这个问题,很多基于生成对抗网络的方法                                 [30,31,38] 开始应用
   299   300   301   302   303   304   305   306   307   308   309