Page 128 - 《软件学报》2024年第4期
P. 128
1706 软件学报 2024 年第 35 卷第 4 期
起以实现域适应任务.
尽管多源域适应问题已有不少相关研究被提出, 但仍存在较大的改进和提升空间, 如应从不同的视角来
实现不同源域之间以及源域与目标域之间的对齐, 即在域对齐的前提下再进行类级对齐会更好. 尤其对于多
源部分域适应问题, 由于源域标记空间和目标域标记空间的不匹配, 域间在存在较大边缘分布差异的同时,
其条件分布差异也是影响整体域适应性能的重要因素.
1.2 分布差异度量及最大平均差异方法
域适应是迁移学习的一种特殊类别, 其从源域数据中学习, 并向相关但不完全相同的目标域数据进行知
识的迁移 [1−3] , 即: 在有效地消除分布差异的同时, 将源域知识迁移到任务相似的目标域, 辅助后者更好地学
习. 域适应通常通过减少领域之间的分布差异来实现, 其中, 分布差异主要包括边缘分布差异 [17−19] 和条件分
布差异 [20−22] , 其表达式分别为
P(X s )≠P(X t ), P(Y|X s )≠P(Y|X t ) (1)
其中, P 代表概率分布, X s 和 X t 分别代表源域和目标域, Y 则代表各领域对应的标签.
显然, 为实现领域对齐, 找到合适的分布差异度量标准至关重要. 目前, 已有多种分布度量策略被提出,
并被广泛应用于衡量域适应问题中领域之间的差异, 如最大平均差异 MMD. 基于 MMD 的域适应通过最小
化领域分布间分布均值距离, 拉近源域和目标域, 从而消除源域和目标域数据分布之间的边缘分布差异.
MMD 基本的假设是: 如果对于所有输入为分布生成的样本空间的函数 f, 如果两个分布生成的足够多的样
本在 f 上的对应均值相等, 则认为这两个分布是相同分布. 如果用 F 表示在样本空间上的连续函数集, 则
MMD 可表达如下:
MMD[ , , ] sup(F p q = E x ~ p [ ( )]f x − E yq [ ( )])f y (2)
~
fF∈
s
假设 X 和 Y 为分别从分布 p 和 q 中采样得到的两个数据集合. 据此, 则源域表示 s = {( ,xy i s )} i= s n 1 和目标
i
域表示 t = {}x t ii= t n 1 为服从不同分布的两个数据集. 由此, MMD 可用下面的式子刻画:
1 1
( ) ∑
( ) − ∑
,
MMD[ , F t ] sup= fF n s fx s n t fx t (3)
s
∈
基于以上公式表达, Pan 等人 [23] 采用 MMD 来实现边缘分布自适应, 有效地减少了源域和目标域之间的分
布差异并实现了域适应. 受深度学习在计算机视觉等领域的成功应用启发, Tzeng 等人 [24] 将 MMD 拓展到深度
学习结构中, 进一步拓展了差异度量策略在域适应领域的应用效果. 此外, 在上述工作基础上, Long 等人 [25]
拓展了多核 MMD 并将其应用到域适应. 考虑到不同领域之间的多种分布差异, Yu 等人 [26] 结合边缘分布差异
和条件分布差异构建联合 MMD 实现不同领域之间的联合分布.
MMD 作为应用最为广且适用性较好的一种分布度量标准, 在域适应研究和应用中取得了不错的性能.
2 基于自适应权重的多源部分域适应
在本节中, 我们首先对问题场景进行定义, 然后详细说明所提出的 AW-MSPDA 的构成部分, 其包括多样
性特征提取、多层次分布对齐以及自适应权重学习等模块. 此外, 考虑到不同源域对目标域分类任务的贡献
不同, 提出了针对目标域分类任务的加权标签预测方式. 然后, 根据所提模型的具体步骤总结出对应的算法
流程. 所提 AW-MSPDA 算法的模型架构如图 2 所示, 其中, S 1 ,S 2 ,…,S K 分别表示 K 个源域. G c 和 G p 表示两个
不同的特征提取器, 其分别为域不变特征提取器和域私有特征提取器. G y 和 G d 分别为样本类别分类器和域分
类器. 所提 AW-MSPDA 算法包括多层次的分布对齐, 其由域级别对齐和类级别对齐组成, 并且从特征的层面
利用分布差异度量方式构建权重 w, 以衡量不同源域对目标域分类任务的贡献. 此外, 基于所构建的类别分
类器 G y 所获得的伪标签构建源域样本的自适应类级别权重, 过滤掉对目标域而言无关的源域样本. L m 表示实
现域级对齐和类级对齐的模型训练损失. L y 和 L d 分别表示源域分类训练损失以及域分类训练损失, 对由上述
损失项构成的总体目标损失最小优化可实现多源部分域适应.