Page 83 - 《软件学报》2024年第4期
P. 83
王帆 等: 局部一致性主动学习的源域无关开集域自适应 1661
表 2 报告了 LCAL, SF-ODA 方法以及最新的主动学习方法在小型数据集 Office-31 和大型数据集 VisDA-C
上的结果. 在 Office-31 上, 在不修改源域模型、不涉及多余的模型参数和训练成本外, LCAL 的效果比
Inheritune 高 4.6%, 比 UMAD 高 1.4%; 同时, LCAL 在 D→W 和 W→D 这两个迁移任务上获得了最好的识别
效果. 相比之下, LCAL 的效果低于为开放类专门设计目标域模型结构的方法 OSHT-SC, 但 OSHT-SC 方法的
效果不仅依赖于增加模型参数的数量, 而且增加了额外的存储空间和训练过程. 在和 LCAL 公平比较的 ASF-
ODA 的主动学习方法中, LCAL 的效果远远超过了现有主动学习方法, 最高超过了 10%. 在 VisDA-C 上,
LCAL 的效果大幅度领先于现有的所有 SF-ODA 方法和目前所有的主动学习的方法. 具体来说, 和现有最好
的 SF-ODA 的方法 UMAD 相比, LCAL 提升了 9%; 同时, LCAL 普遍比现有的主动学习方法高 20%. 进一步
证实了: 利用本文提出的局部多样性选择的方法, 可以挑选少量却有价值的阈值模糊样本, 从而进一步有效
地促进开放类区分能力的同时保证公共类样本的辨别.
表 2 5%主动样本标注后, Office-31 数据集(ResNet50)和 VisDA-C 数据集(ResNet101)上的 HOS (%)
类别 方法 A→D A→W D→A D→W W→A W→D Avg VisDA-C
None Source 66.5 67.9 71.5 93.0 70.2 90.7 76.6 45.2
Inheritune # 78.0 81.4 83.1 92.2 91.3 99.7 87.6 74.8
SF- #
ODA OSHT-SC 91.3 92.4 90.8 95.2 89.6 96.0 92.5 78.6
#
UMAD 88.5 84.4 86.8 95.0 88.2 95.9 89.8 80.2
Random 74.1 80.0 77.1 97.1 76.3 90.7 82.6 69.1
LC 72.7 77.7 75.8 95.7 76.0 88.8 81.1 68.8
Entropy 72.7 75.6 76.4 95.5 76.1 88.8 80.9 66.0
ASF- BVSB 72.9 78.4 75.5 95.7 77.0 88.8 81.4 68.8
ODA K-means 73.3 78.2 76.8 95.9 78.0 92.3 82.4 69.3
Coreset 75.5 78.2 76.8 95.5 76.4 91.6 82.3 65.7
Badge 71.8 77.2 77.6 96.2 78.5 88.8 81.7 69.3
LCAL(Ours) 88.7 87.6 86.8 97.7 87.2 98.9 91.2 89.2
注: #表示结果来自 Liang 等人 [13]
3.4.2 消融分析
• 模型结构
为了进一步验证 LCAL 挑选样本的有效性, 本文在不同的模型结构(VGG16)上开展了 Office-Home 的实
验. 表 3 比较了 LCAL 算法和现有的主动学习方法基于 Office-Home 数据集和 VGG16 网络结构的结果. 如表
3 所示: 相比源域模型在目标域上的识别效果 55.5%, 本文的 LCAL 算法在 5%的主动标记的帮助下, 提升了
16.5%; 相比现有的主动学习方法, LCAL 算法基本上均提升了 12%. 值得注意的是: 利用现有的主动习方法,
比如 LC 和 Entropy, 带来的效果仍然低于随机挑选的方法, 说明仅促进不确定性高的开放类和公共类分离并
不能有效地促进整个数据集上的公共类和开放类的分离. 以上所有结果表明: LCAL 算法可以挑选出更加有
价值的主动样本, 在这些主动样本的帮助下, LCAL 不仅有效地促进开放类别和公共类别的分离, 还显著提高
了公共类样本的辨别能力.
表 3 5%主动样本标注后, Office-Home 数据集(VGG16)上的 HOS (%)
Ar→ Ar→ Ar→ Cl→ Cl→ Cl→ Pr→ Pr→ Pr→ Re→ Re→ Re→
类别 方法 Avg.
Cl Pr Re Ar Pr Re Ar Cl Re Ar Cl Pr
None Source 46.2 61.6 67.1 52.6 56.5 60.7 53.4 40.0 64.0 60.1 42.3 61.2 55.5
Random 50.1 66.9 71.0 55.9 59.8 62.8 55.3 44.5 70.0 63.7 45.3 66.1 59.3
LC 48.8 65.9 69.4 54.7 57.6 61.5 54.9 43.8 69.0 61.0 46.6 64.8 58.2
Entropy 52.6 66.8 68.9 54.8 58.3 62.4 54.3 46.0 68.1 62.1 47.2 65.2 58.9
ASF- BVSB 47.8 65.4 69.6 56.1 59.5 62.6 55.7 44.5 70.1 62.0 48.5 66.1 59.0
ODA K-means 51.9 67.1 70.7 58.4 60.0 64.1 56.7 46.3 70.3 63.4 47.4 67.7 60.3
Coreset 53.4 66.5 70.2 56.2 58.8 62.7 56.5 43.9 70.1 63.2 47.3 66.9 59.6
Badge 52.1 67.6 70.8 57.1 59.8 63.8 55.7 43.4 70.5 63.4 45.0 65.9 59.6
LCAL(Ours) 66.2 83.1 76.2 63.6 82.7 74.4 63.7 63.5 78.0 68.3 62.0 81.7 72.0
• 最近邻居的数量(N)
为了验证不同邻居数量对于 LCAL 算法的影响, 本文在 Ar→Cl 和 Cl→Pr 任务上基于不同的邻居数量(N)
进行了实验. 如图 6(a)所示, 横坐标指邻居数量. 在不同的邻居数量比例下, 模型效果的波动范围始终处于