Page 269 - 《软件学报》2020年第9期

P. 269

2890 Journal of Software 软件学报 Vol.31, No.9, September 2020

也存在于同一领域下的不同摄像头之间(不同摄像头下光照、分辨率、背景和视角等方面也存在差异),Delorme
等人 [73] 和 Qi 等人 [74] 都针对性地提出了基于摄像头的对抗网络来解决在跨域行人重识别任务中的数据分布差
异问题.其中,Delorme 等人 [73] 在源域和目标域中所有的摄像头之间做等价的对抗,并且对无标记的目标域中的
数据采用标记平滑的方式 [32] 分配到源域的类别中进行训练.Qi 等人 [74] 提出了源域和目标域中摄像头交互式的
对抗,并在理论上证明了该对抗方式能够将源域和目标域所有的摄像头下的数据映射到同一空间中;另外,还利
用时序信息从无标记的目标域中挖掘一些判别性的信息来训练更新网络.同时,作者在文中也提到:对于在行人
重识别任务中使用的这种传统领域自适应框架,挖掘无标记的判别性信息是非常重要的,这是因为单一地减少
数据分布差异可能会破坏目标域中的原始样本间的关系.因此引入目标域中的一些信息,能够一定程度地保证
这种信息不会被破坏.
由于从数据分布的视角来解决无监督行人重识别问题是一种间接的处理方法,因此该类方法与基于伪标
记的方法和基于实例分类的方法相比,在性能方面稍有些不足.但是与基于图像生成的方法相比,该类方法的性
能更好.因此,这说明了在行人重识别问题中,从特征层级的迁移效果要比从图像层级的迁移效果更好.

2.5 其他方法
除上述的几大类方法之外,还有少量从其他角度设计的方法.Wu 等人 [75] 观察到摄像头內样本的相似性分
布和摄像头间样本的相似性分布不一致,提出了摄像头一致性的学习方式,以使得摄像头內的数据分布和摄像
头间的样本相似性分布趋于一致,并且在学习过程中保持摄像头內样本间的相似性分布与其在预训练上的模
型一致.也有少部分的研究者关注在基于领域泛化的行人重识别任务上,在该任务的训练过程中,只存在有标记
的源域样本,对于目标域没有任何可用的数据.Kumar 等人 [76] 探索了只简单地结合多个源域来训练一个模型的
方式,在目标域上也具有良好的泛化性能.Jia 等人 [77] 考虑到领域间的差异性主要是由不同领域间的风格信息的
差异引起的,受风格迁移学习的启发,作者提出在神经网络的低层使用实例归一化来减少不同领域的风格的影
响;同时,在高层使用特征归一化进一步地减少领域间风格信息的影响.Song 等人 [78] 提出领域不变性的映射网
络来解决行人重识别任务在未见领域上的泛化问题,该方法专注于在一张行人图像和身份分类器的权重之间
学习一种映射.具体地,对于每一个来自于候选集合中的图像,可以生成一个分类器的权重向量.为了获得领域
间的不变性,作者使用了元学习(meta-learning)中的插曲训练机制(episodic training)来更新网络的参数.在测试
过程中,对于一张来自查询集合的图像和一张来自候选集合的图像,利用查询分支中提取的特征向量和候选分
支中提取的权重向量进行点乘的值作为这两张图像的相似性.

3 半监督场景下的行人重识别问题

近年来,一些研究者也开始关注如何利用较少的标记信息来训练一个较优的模型.特别地,不同于无监督学
习的定义,半监督学习在行人重识别中的有许多不同的设定.对于现有的方法,本文将其划分成如下几个场景.
(1) 少量的人有标记
Liu 等人 [79] 提出利用半监督的对偶字典学习来解决少标记的行人重识别问题,该方法利用少量的标记数据
来学习在不同摄像头之间的特征关系,而大量的未标记数据用来获得鲁棒的稀疏表示.Wu 等人 [80] 假定了只有
少量的行人标记样本的情况,通过在其他有标记的数据集上训练好的多个不同模型来迁移信息,这些模型可以
被视为多个教师模型.该方法使用教师学生网络训练机制来进行网络的训练,通过使用大量的无标记数据训练
更新学生网络,并通过少量有标记样本来判断每个在源域上训练的模型的权重(即对于不同的样本,不同教师模
型贡献程度不同).Xin 等人 [81] 使用少量的有标记数据训练模型,然后通过多视角聚类方法对无标记的数据进行
聚类,再联合有标记数据和带有伪标记的无标记数据更新网络,并继续基于新的网络再次执行聚类算法,整个过
程是迭代交替的.
(2) 每一个人有少量标记
Wu 等人 [82] 提出了一种渐进式的学习方法来解决该问题:首先,根据每个人的少量标记数据训练初始模型;
然后对大量无标记数据中置信度较高的数据分配伪标记,其余置信度较低的数据暂不分配标记信息.在训练过

264 265 266 267 268 269 270 271 272 273 274