Page 266 - 《软件学报》2020年第9期
P. 266

祁磊  等:弱监督场景下的行人重识别研究综述                                                           2887


             Fu 等人 [48] 利用 DBSCAN 聚类算法   [49] ,基于在源域上预训练的模型提取特征来对无标记的数据进行聚类,
         然后基于聚类的结果构造三元组,并使用三元组损失(triplet loss)              [29] 来进行训练.在每一轮训练之后,利用得到的
         神经网络再次提取特征并进行聚类,重新得到更新的标记信息进行训练.聚类和网络的训练是迭代的过程,这样
         能够不断地获得更优的标记信息和更鲁棒的特征表示.Zhang 等人                     [50] 提出了一种自训练的渐进式增强框架,主
         要分为保守训练和提升训练两个步骤,并在训练过程中使用 HDBSCAN 聚类方法                          [51] 产生伪标记.保守训练过程
         中使用传统的三元组损失和基于排序的三元组损失联合训练网络,提升训练过程中,使用交叉熵损失进一步提
         升网络的泛化性能.在整个训练过程中,保守训练和提升训练也是基于迭代的方式来优化网络.Lin 等人                                  [52] 提出
         了一种自底向上的聚类策略来不断地融合相似的样本,该方法起初将每一个样本视为一个类,并将每一类的特
         征存储在一个空间中,在训练过程中不断地更新融合不同的类,并且更新每一个类的新的表示特征.作者还在文
         中提出了一种多样性的归一化方法,以避免每一类中的图像数量差别过大.
             Tang 等人 [53] 利用神经网络的最后两层(在残差网络中,即全局平均池化层和全连接层)的输出分别作为特
         征,并通过 DBSCAN     [49] 进行聚类,然后基于聚类的结果产生标记信息,在网络的最后两层上都采用三元组损失
         函数同时进行网络的训练,并且也使用交替学习的方式更新网络以及获得新的标记信息.Yang 等人                                [54] 考虑到通
         过聚类产生伪标记的方法往往会带来许多噪声信息,因此提出了一种能够在聚类之后对样本进行过滤的方法.
         作者认为在学习过程中所有的样本都是重要的,因此该方法根据 DBSCAN 聚类                          [49] 将样本划分为正常样本(在
         聚类过程被划分到某个类别)和异常样本(在聚类过程中没有被划分到某个类别),而在一些其他基于聚类的方
         法中一般会忽略这些异常样本.同时,该方法使用主模型和协作模型两种模型来相互促进学习,其中,主模型利
         用正常样本和异常样本来训练,而协作模型只使用正常样本来训练.特别地,对于用来训练主模型的异常样本,
         需要通过协作模型来选择其中一些置信度高的伪标记样本进行训练;而对于用来训练协作模型的正样本,需要
         使用主模型对已分配标记的样本再次进行过滤,以确保选择的样本都是纯净的,即保证这些样本的伪标记具有
         较好的可靠性.整个学习过程通过迭代的方式,不断地提升两种网络的性能.Ding 等人                            [55] 提出一种基于分散度
         的聚类方法来对无标记的样本进行聚类,该聚类方法不仅仅考虑了类别间的差异性信息,而且也考虑到了类别
         內的紧凑程度.相比于其他的聚类方法,该方法能够更广地考虑到多个样本间的关系,并且能够有效处理不平衡
         的数据分布所带来的问题.
             目前,在无监督行人重识别领域中,为无标记样本数据生成伪标记的方法已经成为主流的技术路线.该类方
         法具有思路简单清晰、性能良好的优点,特别是一些基于聚类的伪标记生成方法,可以展现出与有监督学习方
         法相接近的性能.然而,该类方法在伪标记生成的准确度以及如何有效利用生成的伪标记等方面仍然存在进一
         步提升的空间.
         2.2   基于图像生成的方法

             近些年,生成对抗网络已经取得了很大的进展.在无监督行人重识别领域,一些研究者基于该技术从图像层
         级角度来解决领域迁移的问题,如图 5 所示.Huang 等人              [56] 考虑到不同领域图像背景的差异较大,且现有的图像
         分割方法并不能很好地将行人图像的前景和背景分开,因此提出了 SBSGAN 通过产生软掩模的方法来移除图
         像的背景区域,该方法能够有效地抑制图像分割方法带来的错误.考虑到当前许多基于 GAN 的方法只能产生单
         一风格的图像,Chen 等人      [57] 提出了一种对偶条件图像生成器以生成不同风格的行人图像数据,该方法能够将一
         张图像迁移到多个风格下.Liu 等人          [58] 认为领域间的差异信息由多种因素造成,如光照、分辨率、摄像头视角等,
         因此作者采用分而治之的方法将风格迁移网络分成多个子网络,分别针对不同的领域差异因素进行迁移,如光
         照迁移网络、分辨率迁移网络和视角迁移网络等.每个子网络首先进行预训练,最终通过一个选择网络来产生
         每个子网络的权重信息,并融合所有子网络中的信息生成最终的风格迁移图像.
             Zhong 等人 [59] 利用 StarGAN [60] 对目标域中不同摄像头风格下的图像进行转化,训练过程中的正样本对来
         自于同一个摄像头风格下,结合原始目标域图像、源域图像和这些转化的图像一起生成三元组来训练更新神经
         网络.特别地,对于三元组,如果一个 anchor 样本可以容易地在有标记的源域中得到它对应的正样本,同样也能
         从目标域中得到它的负样本,这样的三元组能够减小源域和目标域之间的差异.Bak 等人                             [61] 认为,剧烈变化的光
   261   262   263   264   265   266   267   268   269   270   271