Page 336 - 《软件学报》2025年第7期

P. 336

曹艺等: 融合扩增技术的无监督域适应方法 3257

n s ∑ n t ∑ ( )

s
2
1 ( ) 1 t
L d = d (D s ,D t ) =
ϕ x − ϕ x
(4)
k
i j

n s n t
i=1 j=1
H
在实际应用中, 由于现有 MMD 是基于单一核函数进行特征映射, 而选择合适的核函数可以从更高阶的角度
衡量两个分布间的差异, 故本文在单一核函数基础上采用多个核函数的组合. 为了保证特征映射的多样性, 本文采
用 MK-MMD 对源域和目标域进行分布差异的度量, 即通过多个核函数的线性组合得到距离计算的结果, 目的是
使变换后的特征具有更好的表达能力.
D t 分别视作标注数据和未标注数据, 引入两种半
在上述无监督域适应工作基础上, 本文将源域 D s 和目标域
监督技术对域适应工作进行改进, 改进后的损失函数计算式如下:

(5)
L total = L s +λ t L t +λ d L d
其中, λ t 和 λ d 是权重因子, 分别用于不同任务下对损失函数进行加权. 其权重根据所学习任务的数据集大小来设
置, 例如: 在本文数据分类任务中, λ t 和 λ d 均设为 1; 在视觉对象分类任务中, λ t = 1 λ d 则采用循序渐进的方式, 逐
,
步从 0 增长为 1, 其计算式如下:

2
λ d = −1 (6)
1+e −10× T i
其中, i 表示当前学习器所在迭代步, T 表示预先设置的学习器总共需要的迭代步数. λ d 的设置是考虑到图片尺寸
较大, 单个迭代步中所选择的样本数目较少, 为了避免初始所选择源域样本数目较少而对整个损失造成的负面影
响, 故采用根据迭代步骤的增加而逐步加大这部分损失的策略. L s 是源域上基于样本真实标注信息所产生的损失
项, 其计算式为:

n s ∑
( ) ( )
s s s s
L s = L cls Y , ˆ Y = − y log ˆy (7)
i i
i=1
( )
s
s
其中, x 表示源域中的样本, ϕ x s 是该样本在核空间中所映射的特征, ˆ y 表示学习器对该样本的预测软标签. L t 则
i i i
是基于伪标签和基于一致性正则化技术所产生的扩增后的损失项, 下面分别在第 2.2 节和第 2.3 节中进行介绍.
在图 2 中, 本文给出了基于扩增技术的无监督域适应方法的结构图, 其中, classification loss 表示对分类器在
源域上进行训练所使用的损失函数, 本文在各个任务中使用交叉熵函数. domain loss 表示基于 MK-MMD 距离的
源域与目标域损失. consistency regularization loss 表示基于伪标记和一致性正则化技术所产生的目标域上的损失,
将在第 2.2 节和第 2.3 节对此进行详细解释.

Source images s s
y 1 ˆ Classification y 1
Conv1 Conv2 Conv3 FC4 FC_adapt FC5 y i ˆ s loss y i s
s
y n ˆ s y n
Domain loss
Shared Shared Shared
Target images Max 0.85
y 1 ˆ t
Max
Conv1 Conv2 Conv3 FC4 FC_adapt FC5 y j t ˆ 0.9
Max
y n ˆ t 0.3 >阈值否 0.3
Random augment Shared Shared Shared 是

Augmented images y 1 ˆ a Consistency regularization loss y 1 ˆ t 0.85 0.9
Conv1 Conv2 Conv3 FC4 FC5 y j a ˆ y j t ˆ
y n ˆ a

图 2 基于伪标签和一致性正则化的无监督域适应方法

331 332 333 334 335 336 337 338 339 340 341