Page 336 - 《软件学报》2025年第7期
P. 336

曹艺 等: 融合扩增技术的无监督域适应方法                                                           3257


                                                        
                   
 
 2
                                                        
   n s ∑     n t ∑ ( )

                                                                 s
                                                2       
 1    ( )  1     t
                                            L d = d (D s ,D t ) = 
  ϕ x −  ϕ x 
                     (4)
                                                k       
       i          j
                                                        
n s       n t
                                                            i=1       j=1
                                                                            H
                    在实际应用中, 由于现有        MMD  是基于单一核函数进行特征映射, 而选择合适的核函数可以从更高阶的角度
                 衡量两个分布间的差异, 故本文在单一核函数基础上采用多个核函数的组合. 为了保证特征映射的多样性, 本文采
                 用  MK-MMD  对源域和目标域进行分布差异的度量, 即通过多个核函数的线性组合得到距离计算的结果, 目的是
                 使变换后的特征具有更好的表达能力.
                                                                  D t  分别视作标注数据和未标注数据, 引入两种半
                    在上述无监督域适应工作基础上, 本文将源域                D s  和目标域
                 监督技术对域适应工作进行改进, 改进后的损失函数计算式如下:

                                                                                                      (5)
                                                     L total = L s +λ t L t +λ d L d
                 其中,  λ t  和  λ d  是权重因子, 分别用于不同任务下对损失函数进行加权. 其权重根据所学习任务的数据集大小来设
                 置, 例如: 在本文数据分类任务中,        λ t  和  λ d  均设为  1; 在视觉对象分类任务中,  λ t = 1 λ d  则采用循序渐进的方式, 逐
                                                                                ,
                 步从  0  增长为  1, 其计算式如下:

                                                             2
                                                      λ d =      −1                                   (6)
                                                          1+e −10× T i
                 其中,  i 表示当前学习器所在迭代步,        T  表示预先设置的学习器总共需要的迭代步数.              λ d  的设置是考虑到图片尺寸
                 较大, 单个迭代步中所选择的样本数目较少, 为了避免初始所选择源域样本数目较少而对整个损失造成的负面影
                 响, 故采用根据迭代步骤的增加而逐步加大这部分损失的策略.                    L s  是源域上基于样本真实标注信息所产生的损失
                 项, 其计算式为:

                                                                n s ∑
                                                       (   )          ( )
                                                         s  s      s   s
                                                 L s = L cls Y , ˆ Y = −  y log ˆy                    (7)
                                                                   i   i
                                                                i=1
                                        ( )
                      s
                                                                        s
                 其中,  x  表示源域中的样本,     ϕ x s   是该样本在核空间中所映射的特征,        ˆ y  表示学习器对该样本的预测软标签.         L t  则
                      i                  i                              i
                 是基于伪标签和基于一致性正则化技术所产生的扩增后的损失项, 下面分别在第                          2.2  节和第  2.3  节中进行介绍.
                    在图  2  中, 本文给出了基于扩增技术的无监督域适应方法的结构图, 其中, classification loss 表示对分类器在
                 源域上进行训练所使用的损失函数, 本文在各个任务中使用交叉熵函数. domain loss 表示基于                       MK-MMD   距离的
                 源域与目标域损失. consistency regularization loss 表示基于伪标记和一致性正则化技术所产生的目标域上的损失,
                 将在第   2.2  节和第  2.3  节对此进行详细解释.

                           Source images                                 s        s
                                                                        y 1 ˆ  Classification          y 1
                                       Conv1  Conv2  Conv3  FC4  FC_adapt  FC5  y i ˆ  s  loss  y i s
                                                                                  s
                                                                        y n ˆ  s  y n
                                                         Domain   loss
                                            Shared  Shared        Shared
                           Target images                                Max  0.85
                                                                        y 1 ˆ t
                                                                        Max
                                       Conv1  Conv2  Conv3  FC4  FC_adapt  FC5  y j t ˆ  0.9
                                                                        Max
                                                                        y n ˆ t  0.3  >阈值  否  0.3
                                   Random   augment  Shared  Shared  Shared         是

                         Augmented images                               y 1 ˆ  a  Consistency  regularization  loss  y 1 ˆ t  0.85  0.9
                                       Conv1  Conv2  Conv3  FC4  FC5    y j a ˆ  y j t ˆ
                                                                        y n ˆ  a

                                       图 2 基于伪标签和一致性正则化的无监督域适应方法
   331   332   333   334   335   336   337   338   339   340   341