Page 342 - 《软件学报》2025年第7期
P. 342

曹艺 等: 融合扩增技术的无监督域适应方法                                                           3263


                 结果. 特征聚类效果越好, 表明模型具有更好的域适应性能.

                                                        MNIST→USPS







                                 Before adaptation  Adapted (MCD)  Before adaptation  Adapted (A-UDA)
                                                        SVHN→MNIST







                                 Before adaptation  Adapted (MCD)  Before adaptation  Adapted (A-UDA)
                                           图 5 不同域适应场景下的        t-SNE  可视化结果

                    借助  t-SNE  图可以看出: 不使用     A-UDA  方法, MNIST→USPS  与  SVHN→MNIST  任务的源域与目标域的类
                 别决策边界较为模糊, 不同类别之间的距离较小; 使用                A-UDA  方法, 属于同一类别的目标域数据更为集中, 不同
                 类别的数据之间的间距增大, 从而, 便于对目标域的数据进行分类. 将                    A-UDA  和  MCD  算法的可视化特征效果进
                 行比较, 结果表明, A-UDA     能够使得源域与目标域的特征分布呈现出较为明显的聚类的特点, 目标域与源域的数
                 据分布更为接近, 表现出较好的域适应能力.

                 3.2   视觉对象分类

                 3.2.1    数据集介绍
                    本节采用    ImageCLEF-DA  和  Office-Home 两个常用于域适应任务的数据集对所提出方法的有效性进行验证,
                 目的是说明所提出方法在视觉对象分类任务上的有效性. 这里, 所使用数据集的信息如表                            3  所示.

                                                表 3 视觉对象分类数据集信息

                                 数据集               样本数量            任务数量             类别数量
                              ImageCLEF-DA          1 800             6               12
                               Office-Home          15 500            12              65

                    ImageCLEF-DA  数据集: ImageCLEF-DA  数据集是   ImageCLEF-DA 2014  领域自适应挑战赛的基准数据集, 包
                 括  3  个领域: Caltech-256 (C)、ImageNet ILSVRC 2012 (I) 和  Pascal VOC 2012 (P). 每个域有  12  个类别, 每个类别
                 包含  50  幅图像, 每个域共有    600  幅图像. 实验过程中, 本文使用所有的域组合共计            6  个迁移任务: I→P, P→I, I→C,
                 C→I, C→P, P→C.
                    Office-Home 数据集: Office-Home 数据集是领域自适应的基准数据集, 包含             4  个不同的领域: Artistic (A)、
                 Clipart (C)、Product (P) 和  Real-World (R). 其中每个域由 65  个日常用品类别组成, 共有  15 500  幅图像. 本文使用
                 将所有的域组合成为       12  个域适应任务.

                 3.2.2    实验设置
                    对于  ImageCLEF-DA  数据集和   Office-Home 数据集, 本文使用   ImageNet 图像库上预训练的     ResNet-50 [64] 模型
                 提取图像特征, 修改      ResNet-50  网络的最后一层全连接层的输出数量, 用于适应不同类别数量的分类任务. 在训练
                 中, 使用动量为    0.9  的小批量随机梯度下降      (mini-batch SGD) 更新模型参数, 采用与   DANN 中的所提到的学习率
                                                                                       [3]
                 调整策略来训练网络, 学习率调整方式如下:

                                                             η 0
                                                       η =                                           (12)
                                                          (    i  )β
                                                           1+γ
                                                               T
   337   338   339   340   341   342   343   344   345   346   347