Page 130 - 《软件学报》2024年第4期
P. 130

1708                                                       软件学报  2024 年第 35 卷第 4 期

                                             f   p i  =  G  k p  ( f  i k s  ,θ k p  )
                                              s k j   j                                      (6)
                                               f p t k  =  G  k p  ( f t  ,θ k p  )
                                n
         其中,  i = 1,2,...,n  k s  , j =  1,2,..., , k = 1,2,..., .   k p        k p  为相应的网络参数.
                                          KG 表示第 k 个源域的域私有特征提取器,  θ
                                 t
             基于构建的域不变特征提取器和域私有特征提取器,  通过不断训练迭代,  可提取出域不变特征以及域私
         有特征,  进而利用所提特征更好地实现领域对齐.  为保持域不变特征的判别性,  我们对每个源域构建分类器
          G ,  并利用源域的监督信息对域不变特征进行训练.  对于第 k 个源域,  域不变特征的优化目标函数表示如下:
           k y
                                                 1
                                                         (
                                      ( ,
                                                                ( (x
                               min L θθ    ,θ  ) =  ∑  LG    (G f  i  ))), y i  )             (7)
                                  θ
                               f θθ  , y k  k y  f  k c  k y  n  i  ce  k y  k c  k s  k s
                                                  k s  x ∈ X s k
                               , c k
                                                   s k
             此外,  为有效地提取域私有特征,  我们进一步构建域分类器 G d ,  对提取域私有特征后的不同源域样本进
         行域分类,  由此使得所提取域私有特征更具判别性,  为实现多源域的多样性特征提取打下基础.  对于第 k 个源
         域,  域私有特征的优化目标函数表示如下:
                                                 1
                                                                f
                                      ( ,
                                min L θθ    ,θ d  ) =  ∑  L ce (GG  ( (x i  ))),d k )         (8)
                                                            (
                                        f
                                                           d
                               f θθ  , d θ  k d  k p  n  i     k p  k s
                                , p k
                                                  k s  x ∈ X  s k
                                                    s k
         其中, L ce 表示交叉熵损失函数, d k 表示第 k 个源域上样本所对应的域标签.
         2.3   多层次分布对齐
         2.3.1    域级别对齐
             基于上述构建的特征提取器,  可获得源域样本和对应目标域样本的域不变特征和域私有特征表示.  具体
         地,  为获得域不变特征,  需要通过最小化不同域间的公共特征差异来实现,  包括不同源域之间以及源域和目
         标域之间的差异.  为更好地度量这些分布差异,  不失一般性,  我们采用 MMD 度量作为分布差异度量标准,
         为此,  针对于不同源域间的分布差异,  构建如下形式的损失函数:
                                                                                       2
                       2   K −  1  K                2   K −  1  K  1  s n  1 k  1  s n  2 k
               L =  K ⋅  (K  1) k =  ∑∑ 1 1 MMD(X  1 k s  , X  2 k s  ) =  K ⋅  (K  1) k =  ∑∑ 1 1 n  1 k s  ∑   i=  1  ( f  i s c  1 k  ) −  n  2 k s  ∑   j=  1  ( f  j s c  2 k  )     (9)
                ss
                                                        1 1k = −
                            1 1k = −
                                                           2 k +
                              2 k +
                                                                                       =
         其中,  || ||⋅  表示再生核希尔伯特空间范数,  而是核化特征变换.  n 和 n               表示对应源域上的批处理样本数.
                 =                                              1 k s  2 k s
             此外,  对不同源域和目标域之间的特征分布同样需要进行域对齐.  需要指出的是,  来自源域的特征多样
         性会在目标域上有不同程度的体现.  为此,  应对所提取出的域不变特征以及域私有特征同时进行源域和目标
         域之间的适应性对齐.  出于建模的统一考虑,  对提取的域不变特征和域私有特征进行组合表示,  为此,  定义
          F =  [ f  ; f  ] 表示第 k 个源域样本的特征融合,  F =   [ f  ; f  ] 表示基于第 k 个源域特征提取器所得的目标域
           k s  c s k  p s k                      k t  c t k  p t k
         特征融合.  基于上述特征融合,  构建如下形式的源域与目标域之间的域级对齐损失函数:
                                                                                 2
                           1  K  K                1  K  K  1  s n  1 k      1  t n    
                                                     ∑∑
                              ∑∑
                     L =  KK  k =  2 1 MMD(X  1 k s  , X  2 k t  ) =  KK  k =  2 1 n  1 k s  i= 1   ∑     s i F   1 k   − ∑   n t  j= 1     t j F  2 k        (10)
                      st
                                                  ⋅
                           ⋅
                              1 1k =
                                                     1 1k =
                                                                                 =
             除了上述域级别的领域对齐外,  不同源域间的域私有特征也需要进行域级别的对齐,  但在进行域私有特
         征对齐时,  与前文所述域对齐有所不同.  具体而言,  为有效地学到不同源域中的多样性特征以覆盖目标域特
         征的所有特性,  需要最大程度地最大化不同源域私有特征的差异,  使得所提取的域不变特征与域私有特征具
         有更好的区分性和更低的相似性.  基于以上分析,  构建源域私有特征之间的对齐损失函数如下:
                                                                                       2
                        2   K −  1  K               2   K −  1  K  1  s n  1 k  1  s n  2 k
               L diverse  =  KK  1) k =  ∑∑ 1 1 MMD(X  1 k s  , X  2 k s  ) =  KK  1) k =  ∑∑ 1 1 n  1 k s  ∑   i=  1  ( f  i s p  1 k  ) − n  2 k s  ∑   j=  1  ( f  j s p  2 k  )     (11)
                       (
                                                   (
                             1 1k = −
                                                        1 1k = −
                               2 k +
                                                           2 k +
             综合以上特征对齐函数,  可得如下的域级综合对齐函数:                                               =
                                            L domain =L ss +L st −L diverse                  (12)
   125   126   127   128   129   130   131   132   133   134   135