Page 271 - 《软件学报》2020年第9期
P. 271

2892                                 Journal of Software  软件学报 Vol.31, No.9,  September 2020

             Market-1501 [88] 是在大学校园内一个超市前面采集的,由 6 个摄像头拍摄得到.该数据集包含 1 501 个行人
         的 32 668 张图像(标注框),且每个行人都至少在两个摄像头中出现.训练集包括 751 个行人的 12 936 张图像,查
         询集包括 750 个行人的 3 368 张图像,测试集包括 750 个行人的 16 384 张图像.该数据集采用 DPM 检测器                      [90]
         来检测行人标注框,而非采用人工裁剪的方式来获得,这样更加贴近现实应用,即可以考虑到行人检测的标注框
         会存在偏移与不对齐的情况.DukeMTMC-reID           [32] 是基于多摄像头多目标行人跟踪数据集 DukeMTMC              [91] 构建
         而成的,由 8 个摄像头拍摄得到.该数据集包含 1 404 个行人的 36 411 张图像(标注框),且该 1 404 个行人中,每个
         行人都至少在两个摄像头中出现.训练集包含 702 个行人的 16 522 张图像,查询集包括 702 个行人的 2 228 张
         图像,测试集包括 702 个行人的 17 661 张图像.该数据集通过人工剪裁的方式来获得行人标注框.MSMT17                           [65] 是
         从校园中部署的 15 个摄像头中拍摄得到的,包含 4 101 个行人的 126 441 张图像.训练集包含 1 041 个行人的
         32 621 张图像(其中包括验证集的 2 373 张图像),查询集包含 3 060 个行人的 11 659 张图像,测试集包含 3 060
         个行人的 82 161 张图像.该数据集采用 Faster RCNN 检测器          [92] 来检测行人标注框.CUHK03    [89] 由 5 组摄像头拍
         摄得到,每组摄像头包含两个摄像头,且采用人工裁剪(labeled)和 DPM 检测器(detected)                 [90] 两种方式来检测行人
         标注框.该数据集存在两种测试协议,本文仅介绍新的一种协议,以下称为 CUHK03-NP                             [93] .在 CUHK03-NP
         (labeled)中,训练集包含 767 个行人的 7 368 张图像,查询集包含 700 个行人的 1 400 张图像,测试集包含 700 个
         行人的 5 328 张图像;在 CUHK03-NP(detected)中,训练集包含 767 个行人的 7 365 张图像,查询集包含 700 个行
         人的 1 400 张图像,测试集包含 700 个行人的 5 332 张图像.图 8 展示了部分数据集的实例图像,其中左图来自
         Market-1501 [88] ,右图来自 DukeMTMC-reID [32] ,上下两行分别代表不同摄像头下的行人图像.














                                   Fig.8    Examples from the image-based datasets
                                       图 8   部分图像数据集的示例图像
             (2)  视频数据集
             常用的视频数据集除了较早出现的 PRID2011            [94] 和 iLIDS-VID [95] 以外,主要包括 MARS [96] ,DukeMTMC-SI-
         Tracklet [84] 和 DukeMTMC-VideoReID [97] ,这些数据集常用于半监督任务.其基本信息概括在表 2 中.
                        Table 2    Information of some video-based person re-identification datasets
                                     表 2   部分行人重识别视频数据集信息
                   数据集          ID 数量  训练集 ID 数量     测试集 ID 数量      图像数量    tracklet 数量  摄像头数量
                  MARS [96]     1 261     625            636       71 191 003  20 478     6
            DukeMTMC-SI-Tracklet [84]  1 788   702      1 086       833 984   12 647      8
            DukeMTMC-VideoReID [97]  1 812   702   702(and 408 distractors)  815 420   4 832   8
             MARS [96] 是在大学校园中的 6 个摄像头采集得到的,包含 1 261 个行人的 20 478 个 tracklet 共计 1 191 003
         张图片,分别将 626 和 635 个行人作为训练集和测试集,其所有的轨迹片段都是由 DPM 检测器                          [90] 和 GMMCP
         跟踪器   [98] 自动生成的.DukeMTMC-SI-Tracklet [84] 和 DukeMTMC-VideoReID [97] 均来自来自 DukeMTMC [91] ,由 8
         个摄像头进行拍摄,人工裁剪得到标注框.DukeMTMC-SI-Tracklet 由 1 788 个行人的 19 135 个 tracklet 共计
         833 984 张图片组成,并分别将 702 个和 1 086 个行人作为训练集和测试集;DukeMTMC-VideoReID 由 1 812 个
         行人的 4 832 个 tracklet 共计 815 420 张图片组成,并分别将 702 个、702 个和 408 个行人作为训练集、测试集
   266   267   268   269   270   271   272   273   274   275   276