Page 481 - 《软件学报》2024年第6期
P. 481

张浩南 等: 高清几何缓存多尺度特征融合的渲染超分方法                                                     3057


                 3.2.1    特征提取
                    为了捕获内容图像与几何缓存中的细节与空间信息, 我们需要对输入进行低层次的特征提取, 并完成对低清
                                                                                      I LR 和I G  中提取浅层特征
                 图像特征的上采样, 以便让两种特征在同一分辨率空间下完成后续操作. 首先我们分别从
                 F LR,0 和F G,0  :
                                                              LR
                                                    F LR,0 = H UP (H (I LR ))
                                                              SF    ,
                                                          G
                                                    
                                                     F G,0 = H (I G )
                                                           SF
                      H UP  为零上采样操作   [9] , 用于将低分辨率内容特征上采样至所需的高分辨率空间. 零上采样将图像中每个像
                 其中,
                 素分配到高分辨率下对应的          s 个像素中的固定一处, 而剩下         s−1 个像素会被置为     0, 其中   s 为上采样比值. 用  h,w
                 分别表示低分辨率图像的高和宽,           I ∈ R h×w , O = H UP (I) ∈ R (sh)×(sw)  分别表示该方法的输入图像与输出图像, 则两者内
                 像素映射关系为:
                                                     
                                                      I(y/s, x/s),  s|x∧ s|y
                                                     
                                                     
                                               O(y, x) =                ,
                                                     
                                                       0,       otherwise
                      (y, x) ∈ {0,1,..., sh−2, sh−1}×{0,1,..., sw−2, sw−1}  . 注意以上公式的输入输出均为单通道图像, 面向多通
                 其中,
                 道特征时同样适用, 只需对各通道逐一操作. 零上采样操作考虑将低清空间下各像素映射到高清空间下某一位置,
                 其余位置可以视为“未被着色”的空像素, 这提升网络针对这些有效或无效信息的辨别能力, 并在后续融合操作中
                 利用几何缓存特征与有效原像素对这些无效信息进行填充着色, 从而提升了模型预测图像的保真度.
                      LR
                      H ,H G   各自包含  3  个卷积-ReLU  激活操作与连接操作. 浅层特征提取模块的更多细节如图                 4  所示, 该部分
                      SF  SF
                 中卷积核大小为      3×3,   C in ,C out  的取值根据情况讨论. 针对  I LR ,I G  的两个模块结构基本一致, 但在最后一次卷积的输
                 出通道数有差别. 为满足后续的融合操作, 从内容图像与几何缓存提取出的浅层特征通道数必须相等, 而前者输入
                 为  3  通道, 后者输入为  9  通道, 所以在进行最后一次卷积时, 针对内容图像的卷积输出通道为                    15, 而针对几何缓存
                 的卷积输出通道为       9. 经过  3  层卷积-ReLU  激活的结果与输入本身连接, 并得到         18  通道的浅层特征.

                                    浅层特征                F LR, i
                                                                    F FU, i
                                                                  (H×W×2C)
                                                                                    F G, i
                              18     Concat
                                                         +         Concat  2C     Global
                                                                                  Pooling
                              C out  Conv&ReLU
                                                        BN                       FC Layer
                                                 C    Conv 3×3
                                                                                  ReLU
                              32   Conv&ReLU
                                                        ReLU
                                                        BN                       FC Layer
                                                 C
                              32   Conv&ReLU          Conv 1×1
                                                                                  Sigmoid
                                                 2C    Concat       SE    C
                                     Input                                         Scale
                              C in
                                                                    F G, i
                                                                                    A
                                     I LR /I G                    (H×W×C)          F G, i
                                                      (H×W×C)
                                 (a) 浅层特征提取                      (b) 融合模块
                                      图 4 浅层特征    (shallow features) 提取模块结构与融合模块

                    在后续步骤中我们参考了          U-Net [21] 的设计思想, 采用不同层次的编码-解码操作来对高清图像进行重建. 第                  i
                 层次的编码器部分对应输入为           F LR,i−1 /F G,i−1  , 通过该层次编码器得到输出  F LR,i /F G,i  :
                                                           LR
                                                    F LR,i = H  (F LR,i−1 )
                                                           EN,i
                                                          G        ,
                                                      F G,i = H  (F G,i−1 )
                                                           EN,i
                       LR
                 其中,   H EN,i ,H G EN,i   分别表示第  i 层次中针对内容图像特征和几何缓存的编码器, 每个编码器内包含           2  个卷积-ReLU
   476   477   478   479   480   481   482   483   484   485   486