Page 340 - 《软件学报》2025年第7期
P. 340
曹艺 等: 融合扩增技术的无监督域适应方法 3261
Cutout, Sharpness, AutoContrast, Posterize, ShearX, TranslateX, TranslateY, ShearY, Rotate, Equalize, Contrast, Color,
Solarize, Brightness 等变换方法. 每次增强过程从其中抽取两两组合为一个增强策略并进行随机采样, 幅度范
围 [1, 10], 范围越大表示图像变换程度越大, 随机抽样概率为 0.5. 每个子策略包括图像变换名称、概率和强度这
3 个参数, 用于对目标域中的样本进行扩增.
本文采用模型在测试数据集 (即目标域无标注数据) 上准确率 (Accuracy) 作为评价指标, 准确率计算如下式:
)
m ∑ ( ( )
t
I f x == y t j
j
j=1
Accuracy = (11)
m
( ) ( )
t
t
t
其中, f x t 表示训练后的模型对目标域样本 x 的预测标记, y 为样本 x 的真实标记, I (·) 为指示函数. 当 f x t 与
j j j j j
y 相同, 取值为 1, 否则为 0.
t
j
[9]
在所有实验中, 我们将所提方法 A-UDA 与基于分布差异的方法 (包括 DDC [10] 、DAN 、D-CORAL [15] 和
[3]
JAN [26] )、基于对抗的方法 (包括 DANN 、ADDA [44] 、CoGAN [45] 、MCD [61] 以及 MADA [24] 等) 以及基于重构编码
进行域适应的研究工作 (包括 DSN [41] 和 DRCN [46] ) 进行比较, 可以确定 A-UDA 在实践中的有效性. 其中, 我们将
[9]
A-UDA 方法与 DDC [10] 和 DAN 方法相比较, 这两种方法都是利用数据映射到可再生核希尔伯特空间来减小边界
分布间的差异, 或增加域间混淆程度的方法. D-CORAL [15] 则是在深度网络中添加 CORAL 度量准则. JAN [26] 方法
针对域的特定层, 提出 JMMD 准则用于对齐联合分布.
[3]
同时, 我们还与基于对抗的研究工作进行了对比, DANN 在神经网络的训练中引入对抗性机制. ADDA [44] 首
先固定源域的相关映射, 随后通过使损失函数的值最小达到目标域与源域距离最小的目的. 这两种模型都是经典
的基于对抗的方法. CoGAN [45] 通过共享底层网络的权重参数, 间接利用对抗训练实现域适应任务. MCD [61] 利用两
个分类器和两个特征提取器进行对抗学习. MADA [24] 在多个域识别器的基础上, 实现了不同数据分布的数据域的
细粒度对齐.
此外, 本文还将 A-UDA 与基于重构编码的域适应研究工作进行比较, 其中包括 DSN [41] 和 DRCN [46] 两个模型,
这些方法在先前的工作中已经表现出良好的分类性能. 其中 DSN [41] 主要是利用自动编码器重构出源域数据的特
征表示. DRCN [46] 则采用在域之间重构样本的方法来处理域适应问题.
3.1 手写数字分类任务
3.1.1 数据集介绍
本文依据相关实验设置, 在 3 种无监督域适应任务: MNIST→USPS, USPS→MNIST 和 SVHN→MNIST 上对
所提出方法及各种基线方法进行实验验证. 其中, 所使用数据集信息如表 1 所示.
表 1 数据集信息
数据集 训练集样本数量 测试集样本数量 类别数量 图像尺寸大小
MNIST 60 000 10 000 10 28×28
USPS 7 291 2 007 10 16×16
SVHN 73 257 26 032 10 32×32
MNIST [57] 数据集: MNIST 数据集来自美国国家标准与技术研究所, 由 250 个人的手写数字组成, 数据集共有
70 000 张图片, 包含“0”–“9”这 10 类数字, 其中训练集包含 60 000 张图像, 测试集包含 10 000 张图像, 每张图片的
大小为 28×28 维灰度图像.
[58]
USPS 数据集: 美国国家邮政局 USPS 手写数字库包括“0”–“9”这 10 类数字, 数据集共有 9 298 张图片, 其中
训练集包含 7 291 张图像, 测试集包含 2 007 张图像, 每张图片的大小为 16×16 维灰度图像.
SVHN [59] 数据集: SVHN 数据集是通过裁剪谷歌街景图片中的门牌号来获得的数字数据集, 数字颜色以及数
字背景更具有多样性. 该数据集共有 99 289 张图像. 训练集包含 73 257 张图像, 测试集包含 26 032 张图像, 每张
图片的大小为 32×32.

