Page 342 - 《软件学报》2025年第7期
P. 342
曹艺 等: 融合扩增技术的无监督域适应方法 3263
结果. 特征聚类效果越好, 表明模型具有更好的域适应性能.
MNIST→USPS
Before adaptation Adapted (MCD) Before adaptation Adapted (A-UDA)
SVHN→MNIST
Before adaptation Adapted (MCD) Before adaptation Adapted (A-UDA)
图 5 不同域适应场景下的 t-SNE 可视化结果
借助 t-SNE 图可以看出: 不使用 A-UDA 方法, MNIST→USPS 与 SVHN→MNIST 任务的源域与目标域的类
别决策边界较为模糊, 不同类别之间的距离较小; 使用 A-UDA 方法, 属于同一类别的目标域数据更为集中, 不同
类别的数据之间的间距增大, 从而, 便于对目标域的数据进行分类. 将 A-UDA 和 MCD 算法的可视化特征效果进
行比较, 结果表明, A-UDA 能够使得源域与目标域的特征分布呈现出较为明显的聚类的特点, 目标域与源域的数
据分布更为接近, 表现出较好的域适应能力.
3.2 视觉对象分类
3.2.1 数据集介绍
本节采用 ImageCLEF-DA 和 Office-Home 两个常用于域适应任务的数据集对所提出方法的有效性进行验证,
目的是说明所提出方法在视觉对象分类任务上的有效性. 这里, 所使用数据集的信息如表 3 所示.
表 3 视觉对象分类数据集信息
数据集 样本数量 任务数量 类别数量
ImageCLEF-DA 1 800 6 12
Office-Home 15 500 12 65
ImageCLEF-DA 数据集: ImageCLEF-DA 数据集是 ImageCLEF-DA 2014 领域自适应挑战赛的基准数据集, 包
括 3 个领域: Caltech-256 (C)、ImageNet ILSVRC 2012 (I) 和 Pascal VOC 2012 (P). 每个域有 12 个类别, 每个类别
包含 50 幅图像, 每个域共有 600 幅图像. 实验过程中, 本文使用所有的域组合共计 6 个迁移任务: I→P, P→I, I→C,
C→I, C→P, P→C.
Office-Home 数据集: Office-Home 数据集是领域自适应的基准数据集, 包含 4 个不同的领域: Artistic (A)、
Clipart (C)、Product (P) 和 Real-World (R). 其中每个域由 65 个日常用品类别组成, 共有 15 500 幅图像. 本文使用
将所有的域组合成为 12 个域适应任务.
3.2.2 实验设置
对于 ImageCLEF-DA 数据集和 Office-Home 数据集, 本文使用 ImageNet 图像库上预训练的 ResNet-50 [64] 模型
提取图像特征, 修改 ResNet-50 网络的最后一层全连接层的输出数量, 用于适应不同类别数量的分类任务. 在训练
中, 使用动量为 0.9 的小批量随机梯度下降 (mini-batch SGD) 更新模型参数, 采用与 DANN 中的所提到的学习率
[3]
调整策略来训练网络, 学习率调整方式如下:
η 0
η = (12)
( i )β
1+γ
T

