Page 137 - 《软件学报》2021年第9期
P. 137

肖进胜  等:面向图像场景转换的改进型生成对抗网络                                                        2761


         2.3   损失函数
         2.3.1    损失函数组成
             本文损失函数共使用了 4 种,GAN 损失、L 1 损失、VGG 损失和 FM(feature matching,特征匹配)损失.首先,
         对于生成对抗网络,由于本文使用多尺度判决器,因此生成对抗网络的优化问题表示为
                                          min max ∑  L   ( ,GD  )                            (14)
                                           G  DD 2 ,D 3 k = 1,2,3  GAN  k
                                             1 ,
             x 为输入图像,y 为目标图像.其中,GAN 损失表达为
                                 L GAN (G,D k )=E (x,y) [logD k (y)]+E x [log(1−D k (G(x)))]  (15)
             该算法对于生成器的生成结果还要加入限制,对生成图像进行评价,引入 L 1 损失:
                                            () =
                                          LG    E   [|| y G−  ( ) || ]x                      (16)
                                           1 L   (, )x y     1
             为了使输出图像更加逼近真实图像,引入特征匹配(FM)损失.具体来说,从判决器多个层来提取特征并学习
                                                             ()i
         来匹配真实图像和合成图像的中间特征.表示第 i 层特征提取器 D (从输入到 D k 判决器的第 i 层).然后计算 FM
                                                             k
         损失 L FM (G,D k )如下:
                                              T
                                L FM (,D =  G  k )  E (, ) y ∑  1  [|| D () i k  ( , ) y −  x  D k () i  ( , ( )) || ]  (17)
                                                                x G x
                                            x
                                                                      1
                                              i= 1 N i
         其中,T 是判决器总层数,N i 表示层数每层中的元素数量.为了两个图像特征之间的差距,引入 VGG 损失,通过预
         先训练的 VGG 网络,提取图像的特征,定义 FM 损失为
                                              N
                                    L VGG () =  G  i= 1  1  [|| F () i  ( ) y − ∑  F () i  ( ( )) || ]  (18)
                                                             G x
                                                                   1
                                               M
                                                 i
               (i)
         其中,F 表示 VGG 网络的第 i 层,M i 表示该层的元素个数.因此,本文算法最终总的损失函数优化目标表示为
                           ⎛                  ⎞                                ⎞⎛
                        min⎜  max ∑  L   ( ,GD ⎟  ) +  λ  L  ( )G +  λ  2 ∑  L  ( ,G D +  ) λ  L  ( )G ⎟⎜  (19)
                         G ⎜  ⎝  DD 2 ,D 3 k =  1,2,3  GAN  k  ⎠ ⎝  11  k =  1,2,3  FM  k  3 VGG  ⎟  ⎠
                             1 ,
             而对于损失函数各个部分的作用,本文将在第 2.3.2 节中进行实验分析,验证本文算法改进的损失函数的有
         效性和必要性.
         2.3.2    损失函数的设置
             本文的损失函数一共由 4 部分组成,分别为:GAN 损失,L 1 损失,FM 损失,VGG 损失.本文算法是基于 GAN
         框架,故对比了总损失(total loss)、不使用 VGG 损失(no_VGGloss)、不使用 L 1 损失和 FM 损失(no_matchingloss)
         这 3 种情况下的实验结果.
             由图 6 可以看出:在不使用 VGG 损失时,则会出现图像失真,比如图 6 中,线框区域,在天空、跑道等位置会
         出现不规则椭圆形的近似白色的“异物”.没有了 VGG 损失的限制,会出现图像的失真.当没有 L 1 和 FM 损失时,
         图像不会出现失真,但是图像的色彩会出现偏差.在没有 L 1 和 FM 损失时,雾气整体偏深色;而使用了 L 1 和 FM 损
         失后,颜色正常.











                                    Fig.6    Comparison of different loss function
                                         图 6   不同损失函数结果对比
   132   133   134   135   136   137   138   139   140   141   142