Page 73 - 《软件学报》2024年第4期
P. 73
软件学报 ISSN 1000-9825, CODEN RUXUEW E-mail: jos@iscas.ac.cn
Journal of Software,2024,35(4):1651−1666 [doi: 10.13328/j.cnki.jos.007010] http://www.jos.org.cn
©中国科学院软件研究所版权所有. Tel: +86-10-62562563
∗
局部一致性主动学习的源域无关开集域自适应
王 帆, 韩忠义, 苏 皖, 尹义龙
(山东大学 软件学院, 山东 济南 250101)
通信作者: 韩忠义, E-mail: hanzhongyicn@gmail.com; 尹义龙, E-mail: ylyin@sdu.edu.cn
摘 要: 无监督域自适应在解决训练集(源域)和测试集(目标域)分布不一致的问题上已经取得了一定的成功. 在
面向低能耗场景和开放动态任务环境时, 在资源约束和开放类别出现的情况下, 现有的无监督域自适应方法面临
着严峻的挑战. 源域无关开集域自适应(SF-ODA)旨在将源域模型中的知识迁移到开放类出现的无标签目标域, 从
而在无源域数据资源的限制下辨别公共类和检测开放类. 现有的源域无关开集域自适应的方法聚焦于设计准确检
测开放类别的源域模型或增改模型的结构. 但是, 这些方法不仅需要额外的存储空间和训练开销, 而且在严格的
隐私保护场景下难以实现. 提出了一个更加实际的场景: 主动学习的源域无关开集域自适应(ASF-ODA), 目标是
基于一个普通训练的源域模型和少量专家标注的有价值的目标域样本来实现鲁棒的迁移. 为了达成此目标, 提出
了局部一致性主动学习(LCAL)算法. 首先, 利用目标域中局部特征标签一致的特点, LCAL 设计了一种新的主动
选择方法: 局部多样性选择, 来挑选更有价值的阈值模糊样本来促进开放类和公共类分离. 接着, LCAL 基于信息
熵初步筛选出潜在的公共类集合和开放类集合, 并利用第一步得到的主动标注样本对这两个集合进行匹配纠正,
得到两个对应的可信集合. 最后, LCAL 引入开集损失和信息最大化损失来进一步促使公共类和开放类分离, 引入
交叉熵损失来实现公共类的辨别. 在 Office-31、Office-Home 和 VisDA-C 这 3 个公开的基准数据集上的大量实验
表明: 在少量有价值的目标域样本的帮助下, LCAL 不仅显著优于现有的源域无关开集域自适应方法, 还大幅度超
过了现有的主动学习方法的表现, 在某些迁移任务上可以提升 20%.
关键词: 资源约束; 开集识别; 源域无关域自适应; 开集域自适应; 主动学习
中图法分类号: TP18
中文引用格式: 王帆, 韩忠义, 苏皖, 尹义龙. 局部一致性主动学习的源域无关开集域自适应. 软件学报, 2024, 35(4):
1651–1666. http://www.jos.org.cn/1000-9825/7010.htm
英文引用格式: Wang F, Han ZY, Su W, Yin YL. Local Consistent Active Learning for Source Free Open-set Domian Adaptation.
Ruan Jian Xue Bao/Journal of Software, 2024, 35(4): 1651−1666 (in Chinese). http://www.jos.org.cn/1000-9825/7010.htm
Local Consistent Active Learning for Source Free Open-set Domian Adaptation
WANG Fan, HAN Zhong-Yi, SU Wan, YIN Yi-Long
(School of Software, Shandong University, Jinan 250101, China)
Abstract: Unsupervised domain adaptation (UDA) has achieved success in solving the problem that the training set (source domain) and
the test set (target domain) come from different distributions. In the low energy consumption and open dynamic task environment, with
the emergence of resource constraints and public classes, existing UDA methods encounter severe challenges. Source free open-set
domain adaptation (SF-ODA) aims to transfer the knowledge from the source model to the unlabeled target domain where public classes
appear, thus realizing the identification of common classes and detection of public class without the source data. Existing SF-ODA
methods focus on designing source models that accurately detect public class or modifying the model structures. However, they not only
∗ 基金项目: 国家自然科学基金(62176139); 山东省自然科学基金(ZR2021ZD15)
本文由“绿色低碳机器学习研究与应用”专题特约编辑封举富教授、俞扬教授、刘淇教授推荐.
收稿时间: 2023-05-13; 修改时间: 2023-07-07; 采用时间: 2023-08-24; jos 在线出版时间: 2023-09-11
CNKI 网络首发时间: 2023-11-24