Page 340 - 《软件学报》2025年第7期
P. 340

曹艺 等: 融合扩增技术的无监督域适应方法                                                           3261


                 Cutout, Sharpness, AutoContrast, Posterize, ShearX, TranslateX, TranslateY, ShearY, Rotate, Equalize, Contrast, Color,
                 Solarize, Brightness 等变换方法. 每次增强过程从其中抽取两两组合为一个增强策略并进行随机采样, 幅度范
                 围  [1, 10], 范围越大表示图像变换程度越大, 随机抽样概率为             0.5. 每个子策略包括图像变换名称、概率和强度这
                 3  个参数, 用于对目标域中的样本进行扩增.
                    本文采用模型在测试数据集          (即目标域无标注数据) 上准确率          (Accuracy) 作为评价指标, 准确率计算如下式:

                                                                       )
                                                           m ∑ ( ( )
                                                                 t
                                                             I f x == y t j
                                                                 j
                                                           j=1
                                                 Accuracy =                                          (11)
                                                                m
                       ( )                                                                         ( )
                                                     t
                                                                        t
                                                                t
                 其中,   f x t   表示训练后的模型对目标域样本       x  的预测标记,   y  为样本  x  的真实标记,  I (·) 为指示函数. 当  f x t   与
                        j                            j           j      j                            j
                 y  相同, 取值为  1, 否则为  0.
                  t
                  j
                                                                                         [9]
                    在所有实验中, 我们将所提方法           A-UDA  与基于分布差异的方法         (包括  DDC [10] 、DAN 、D-CORAL  [15] 和
                                               [3]
                 JAN [26] )、基于对抗的方法   (包括  DANN 、ADDA   [44] 、CoGAN [45] 、MCD [61] 以及  MADA [24] 等) 以及基于重构编码
                 进行域适应的研究工作        (包括  DSN [41] 和  DRCN [46] ) 进行比较, 可以确定  A-UDA  在实践中的有效性. 其中, 我们将
                                         [9]
                 A-UDA  方法与  DDC [10] 和  DAN 方法相比较, 这两种方法都是利用数据映射到可再生核希尔伯特空间来减小边界
                 分布间的差异, 或增加域间混淆程度的方法. D-CORAL              [15] 则是在深度网络中添加 CORAL      度量准则. JAN   [26] 方法
                 针对域的特定层, 提出 JMMD       准则用于对齐联合分布.
                                                                [3]
                    同时, 我们还与基于对抗的研究工作进行了对比, DANN 在神经网络的训练中引入对抗性机制. ADDA                              [44] 首
                 先固定源域的相关映射, 随后通过使损失函数的值最小达到目标域与源域距离最小的目的. 这两种模型都是经典
                 的基于对抗的方法. CoGAN      [45] 通过共享底层网络的权重参数, 间接利用对抗训练实现域适应任务. MCD                   [61] 利用两
                 个分类器和两个特征提取器进行对抗学习. MADA               [24] 在多个域识别器的基础上, 实现了不同数据分布的数据域的
                 细粒度对齐.
                    此外, 本文还将     A-UDA  与基于重构编码的域适应研究工作进行比较, 其中包括                 DSN [41] 和  DRCN [46] 两个模型,
                 这些方法在先前的工作中已经表现出良好的分类性能. 其中                    DSN [41] 主要是利用自动编码器重构出源域数据的特
                 征表示. DRCN  [46] 则采用在域之间重构样本的方法来处理域适应问题.

                 3.1   手写数字分类任务

                 3.1.1    数据集介绍
                    本文依据相关实验设置, 在         3  种无监督域适应任务: MNIST→USPS, USPS→MNIST       和  SVHN→MNIST   上对
                 所提出方法及各种基线方法进行实验验证. 其中, 所使用数据集信息如表                      1  所示.

                                                      表 1 数据集信息

                             数据集       训练集样本数量         测试集样本数量         类别数量        图像尺寸大小
                             MNIST         60 000         10 000          10          28×28
                             USPS          7 291           2 007          10          16×16
                             SVHN          73 257         26 032          10          32×32

                    MNIST [57] 数据集: MNIST  数据集来自美国国家标准与技术研究所, 由            250  个人的手写数字组成, 数据集共有
                 70 000  张图片, 包含“0”–“9”这  10  类数字, 其中训练集包含    60 000  张图像, 测试集包含   10 000  张图像, 每张图片的
                 大小为   28×28  维灰度图像.
                         [58]
                    USPS   数据集: 美国国家邮政局       USPS  手写数字库包括“0”–“9”这     10  类数字, 数据集共有    9 298  张图片, 其中
                 训练集包含    7 291 张图像, 测试集包含    2 007  张图像, 每张图片的大小为      16×16  维灰度图像.
                    SVHN [59] 数据集: SVHN  数据集是通过裁剪谷歌街景图片中的门牌号来获得的数字数据集, 数字颜色以及数
                 字背景更具有多样性. 该数据集共有            99 289  张图像. 训练集包含   73 257  张图像, 测试集包含    26 032  张图像, 每张
                 图片的大小为     32×32.
   335   336   337   338   339   340   341   342   343   344   345