Page 267 - 《软件学报》2020年第9期
P. 267
2888 Journal of Software 软件学报 Vol.31, No.9, September 2020
照条件是跨领域行人重识别问题的一个巨大挑战,然而对于当前单一数据集来说,光照情况相对比较单一.因此
作者提出了一个合成的行人重识别数据集(synthetic person Re-Identification,简称 SyRI),其包含在 140 种不同的
光照条件下的 100 个虚拟的行人.该方法首先训练一个 140 类的光照推断模型,用来推断一个目标域与哪种光
照情况下的源域数据接近,然后利用 CycleGAN [62] 将该源域的数据转化成目标域风格的图像,再用来训练特征
提取网络.Deng 等人 [63] 在 CycleGAN 的基础上引入两个重要的跨域行人重识别特性来保证图像风格迁移的质
量:其一,每张风格迁移后的图像应该与转换前的图像保持身份信息的一致性;其二,任何图像从源域迁移到目
标域后都应与目标域中所有图像的身份信息不同.为了在原始的 CycleGAN 上引入这两个特性,作者利用对比
损失 [64] 的子网络来约束原始的 CycleGAN 的训练.Wei 等人 [65] 提出了 PTGAN(person transfer GAN)来对图像进
行从源域到目标域的迁移,该方法在 CycleGAN [62] 的基础上引入行人前景分割图像来保证行人区域迁移前后的
一致性.
怎样使得生成对抗网络能够产生高质量的具有目标领域风格的图像
(即高质量的图像层级的数据迁移) ?
步
骤 源领域源风格 源领域目标风格
一
步
骤 损失
二
特征
Fig.5 Schematic diagram of the methods based on image generation
图 5 基于图像生成方法的学习框架
这类方法的思想是:从图像层面进行风格迁移,其很大程度上依赖于生成对抗网络所生成图像的质量.与其
他场景的不同点在于:从监控摄像头获取的行人图像往往质量较低并且存在一些噪声,导致风格转换后图像的
质量并不高.因此,该类方法在无监督场景下的性能提升并不是很理想,需要进一步研究更加适合于行人场景的
生成对抗网络来解决该类问题.
2.3 基于实例分类的方法
在传统的图像分类问题中,无监督学习已经取得很大的研究进展.受非参数化实例分类的方法 [66] 的启发,近
期也有一些研究者将其引入到无监督行人重识别任务中来.非参数化实例分类的方法考虑到在分类任务中,外
表相似的类别与外表相似性较小的类别相比有一个更大的预测概率值,这说明这些相似的类别在特征学习网
络中存在潜在的相关性,因此该方法将所有独立的样本当作一个单独的类别来训练网络.假设我们有年 n 张图
像 x 1 ,x 2 ,…,x n ,它们的特征分别为 v 1 ,v 2 ,…,v n ,对于一个图像 x,其对应的特征为 v,属于第 i 个样本(类别)的概率为
T
exp(vv / )τ
(| ) =
Pi v i (1)
∑ n j= 1 exp(vv / ) τ
T
j
其中,每个样本的特征 v j 被存储在内存银行(memory bank)M 中.特别地,M 在每一个 epoch 之后会被更新.τ是一
个超参数,用来调节特征向量在单位球体上的集中程度 [67] .基于公式(1),对于样本 x,其对应的特征为 v,我们得到
基于实例的损失函数为
n
L ()x =−∑ r j log ( | )P j v (2)
j