Page 129 - 《软件学报》2024年第4期
P. 129
田青 等: 基于自适应权重的多源部分域适应 1707
图 2 基于自适应权重的多源部分域适应方法模型架构
2.1 符号定义与问题假设
} {x
t n
在多源部分域适应问题中, 存在 K 个有标记的源域 { } K 和 1 个未标记的目标域 = {X = j } , 每
k s k = 1 t t t j= 1
i
个源域 = {(X ,Y )} = {(x i , y i )} n s k 由 n 个样本组成, y 为第 k 个源域中第 i 个样本的标签, 目标域由 n t
k s k s k s k s k s i= 1 k s k s
个样本组成. 该场景中每个源域之间、源域和目标域之间都存在分布差异, 即 (PX ) ≠ ( PX ) ...≠ ≠ ( PX ) ≠
1 s 2 s K s
P(X t ). 此外, 每个源域的标记空间、源域和目标域的标记空间也不相同, 但目标域的标记空间是所有源域标记
Y
空间并集的一个子集, 即 Y ≠ 1 s Y ≠ 2 s ... Y≠ K s ≠ YY ⊆ , t K i= 1 s i .
t
2.2 多样性特征提取
在无监督多源域适应问题中, 单一源域的知识可能不足以覆盖目标任务的解决, 因此考虑利用具有更丰
富可迁移知识的多个源域协同地解决目标域任务. 但不同源域具有不同的知识, 若忽略其相互之间的差异,
往往并不能取得较好的迁移效果, 并给域适应过程中带来阻碍性的负迁移影响. 为进一步对多个源域提取出
具有多样性的特征, 我们构建域不变特征和域私有特征提取器, 对多个源域的特征进行提取. 首先, 我们利用
预训练的深度卷积特征提取网络将源域样本和目标域样本的表征转换到共享特征空间中, 其具体形式如下:
f i = f (x i ,θ f )
k s k s (4)
j
f = f (,θ x t j f )
t
其中, f 和 f t 分别表示映射到共享特征空间的源域和目标域特征. 此外, i = 1,2,...,n , j=1,2,…,n t , k=1,2,…,K,
k s k s
θ f 表示共享特征提取器f的相关参数.
为了有效地消除不同域间的分布差异, 考虑到不同源域与目标域间虽存在一定的分布差异, 但源域与目
标域在整体上存在一定的相似性, 即源域存在一定的潜在特征与目标域特征相似. 除此之外, 目标域样本特
征并非仅由域不变特征构成, 由于多个源域的存在, 其包含了多样性的特征, 因此除域不变特征外, 不同源域
所具有特征空间的联合可能覆盖了目标域特征的所有特性. 结合上述分析, 我们将源域和目标域所共享的特
征空间的表征划分为域不变特征和域私有特征, 其分别表示在域适应过程中源域的可迁移知识以及源域特有
的不可迁移知识, 以有效地实现多个源域到目标域的适应任务. 具体而言, 针对域不变特征, 将其表示如下:
f c i = G k c ( f i k s ,θ k c )
s k (5)
f c t k j = G k c ( f t j ,θ k c )
其中, i = 1,2,...,n , j = 1,2,..., ,n k = 1,2,..., . KG 表示第 k 个源域上由参数 θ 刻画的域不变特征提取器.
k s t k c k c
除上述域不变特征提取器外, 为保持源域特征的多样性, 我们还构建域私有特征提取器, 其形式如下: