Page 167 - 《软件学报》2021年第11期
P. 167

何相腾  等:跨域和跨模态适应学习的无监督细粒度视频分类                                                    3493


                    •   基线实验结果分析
                    为了验证本文 UDAN 方法每个组成部分的效果,在基线方法 JAN                   [22] 上依次加入新提出的联合辨识最大均
                 值差异准则(JDMMD)和渐进式伪标签策略(PL),以 CUB-200-2011 和 YouTube Birds 两个数据集上的实验为例,
                 结果如图 5 所示.
                    (1)  在基线方法 JAN(表示为 baseline)的基础上加入联合辨识最大均值差异准则(表示为+JDMMD),可以
                        在 I→F 和 I→V 这两种适应任务中分别提升 2.2%和 8.2%的细粒度分类准确率.这是因为联合辨识最
                        大均值差异准则能够在域适应任务中有效地高亮辨识性区域的特征,同时削弱背景信息的负面影响.
                    (2)  进一步,加入渐进式伪标签策略(表示为+JDMMD+PL)可以在 I→F 和 I→V 这两种适应任务中分别再
                        提升 3.8%和 3.7%的细粒度分类准确率.这是因为渐进式伪标签策略可以在未标注的目标域视频数据
                        中选择置信度高的视频数据并打标签,进而利用这些伪标签视频数据进行训练,从而使得 UDAN 模型
                        能够直接从目标域视频数据中获取信息.
                    •   渐进式伪标签策略的迭代次数影响
                    在渐进式伪标签策略中,不同的迭代次数对于本文 UDAN 方法的细粒度分类准确率有一定的影响.
                    以 CUB-200-2011 和 YouTube Birds 这两个数据集上的实验为例,图 6 中的结果验证了渐进式伪标签策略
                 在 I→F 和 I→V 这两种适应任务中的有效性,以及渐进式地迭代能够进一步提高细粒度分类准确率.但是,细粒
                 度分类的准确率不会始终随着迭代次数的增加而提升,当迭代一定次数后,准确率开始提升得比较平缓甚至出
                 现下降的情况.在本文实验中,为了在 I→F 和 I→V 这两种适应任务均取得最好的细粒度分类准确率,迭代次数
                 设置为 2.




















                           Fig.5    Effect of each component     Fig.6    Effect of iteration number in progressive
                               in our UDAN approach                       pseudo labeling strategy
                     图 5   本文 UDAN 方法中每个组成部分的影响                   图 6   渐进式伪标签策略中迭代次数的影响
                 4    结   论

                    本文提出了无监督辨识适应网络,能够将知识从源域标注的图像数据迁移到目标域未标注的视频数据.首
                 先,本文提出了联合辨识最大均值差异,将从源域图像数据学习到的辨识性定位能力迁移应用于目标域视频数
                 据;进一步,本文提出了一种渐进式伪标签策略来迭代地引导无监督辨识适应网络来近似目标域视频的数据分
                 布.在实验部分,本文将知识从 CUB-200-2011/Cars-196 图像数据集迁移到 YouTube Birds/YouTube Cars 视频数
                 据集,实验结果证明了本文方法在无监督细粒度视频分类上的优势.
                    下一步工作主要从以下两个方面展开:(1)  发现更多更精细的辨识性区域,以进一步降低域差异和模态差
                 异;(2)  探索使用少量目标域标注的视频数据对于细粒度视频分类的影响.
   162   163   164   165   166   167   168   169   170   171   172