Page 128 - 《软件学报》2024年第4期
P. 128

1706                                                       软件学报  2024 年第 35 卷第 4 期

         起以实现域适应任务.
             尽管多源域适应问题已有不少相关研究被提出,  但仍存在较大的改进和提升空间,  如应从不同的视角来
         实现不同源域之间以及源域与目标域之间的对齐,  即在域对齐的前提下再进行类级对齐会更好.  尤其对于多
         源部分域适应问题,  由于源域标记空间和目标域标记空间的不匹配,  域间在存在较大边缘分布差异的同时,
         其条件分布差异也是影响整体域适应性能的重要因素.
         1.2   分布差异度量及最大平均差异方法
             域适应是迁移学习的一种特殊类别,  其从源域数据中学习,  并向相关但不完全相同的目标域数据进行知
         识的迁移    [1−3] ,  即:  在有效地消除分布差异的同时,  将源域知识迁移到任务相似的目标域,  辅助后者更好地学
         习.  域适应通常通过减少领域之间的分布差异来实现,  其中,  分布差异主要包括边缘分布差异                             [17−19] 和条件分
         布差异   [20−22] ,  其表达式分别为
                                         P(X s )≠P(X t ), P(Y|X s )≠P(Y|X t )                 (1)
         其中, P 代表概率分布, X s 和 X t 分别代表源域和目标域, Y 则代表各领域对应的标签.
             显然,  为实现领域对齐,  找到合适的分布差异度量标准至关重要.  目前,  已有多种分布度量策略被提出,
         并被广泛应用于衡量域适应问题中领域之间的差异,  如最大平均差异 MMD.  基于 MMD 的域适应通过最小
         化领域分布间分布均值距离,  拉近源域和目标域,  从而消除源域和目标域数据分布之间的边缘分布差异.
         MMD 基本的假设是:  如果对于所有输入为分布生成的样本空间的函数 f,  如果两个分布生成的足够多的样
         本在 f 上的对应均值相等,  则认为这两个分布是相同分布.  如果用 F 表示在样本空间上的连续函数集,  则
         MMD 可表达如下:
                                   MMD[ , , ] sup(F p q =  E x ~ p [ ( )]f x − E yq [ ( )])f y     (2)
                                                              ~
                                               fF∈
                                                                                     s
             假设 X 和 Y 为分别从分布 p 和 q 中采样得到的两个数据集合.  据此,  则源域表示                   s  = {( ,xy i s )} i= s n  1  和目标
                                                                                     i
         域表示   t  = {}x t ii= t n  1  为服从不同分布的两个数据集.  由此, MMD 可用下面的式子刻画:
                                                    1       1       
                                                                  ( )  ∑
                                                        ( ) − ∑
                                           ,
                                  MMD[ , F  t ] sup=  fF n s  fx s  n t  fx t              (3)
                                                  
                                          s
                                                  
                                                ∈
             基于以上公式表达, Pan 等人       [23] 采用 MMD 来实现边缘分布自适应,  有效地减少了源域和目标域之间的分
         布差异并实现了域适应.  受深度学习在计算机视觉等领域的成功应用启发, Tzeng 等人                         [24] 将 MMD 拓展到深度
         学习结构中,  进一步拓展了差异度量策略在域适应领域的应用效果.  此外,  在上述工作基础上,  Long 等人                             [25]
         拓展了多核 MMD 并将其应用到域适应.  考虑到不同领域之间的多种分布差异,  Yu 等人                         [26] 结合边缘分布差异
         和条件分布差异构建联合 MMD 实现不同领域之间的联合分布.
             MMD 作为应用最为广且适用性较好的一种分布度量标准,  在域适应研究和应用中取得了不错的性能.
         2    基于自适应权重的多源部分域适应

             在本节中,  我们首先对问题场景进行定义,  然后详细说明所提出的 AW-MSPDA 的构成部分,  其包括多样
         性特征提取、多层次分布对齐以及自适应权重学习等模块.  此外,  考虑到不同源域对目标域分类任务的贡献
         不同,  提出了针对目标域分类任务的加权标签预测方式.  然后,  根据所提模型的具体步骤总结出对应的算法
         流程.  所提 AW-MSPDA 算法的模型架构如图 2 所示,  其中,  S 1 ,S 2 ,…,S K 分别表示 K 个源域.  G c 和 G p 表示两个
         不同的特征提取器,  其分别为域不变特征提取器和域私有特征提取器. G y 和 G d 分别为样本类别分类器和域分
         类器.  所提 AW-MSPDA 算法包括多层次的分布对齐,  其由域级别对齐和类级别对齐组成,  并且从特征的层面
         利用分布差异度量方式构建权重 w,  以衡量不同源域对目标域分类任务的贡献.  此外,  基于所构建的类别分
         类器 G y 所获得的伪标签构建源域样本的自适应类级别权重,  过滤掉对目标域而言无关的源域样本. L m 表示实
         现域级对齐和类级对齐的模型训练损失.  L y 和 L d 分别表示源域分类训练损失以及域分类训练损失,  对由上述
         损失项构成的总体目标损失最小优化可实现多源部分域适应.
   123   124   125   126   127   128   129   130   131   132   133