Page 271 - 《软件学报》2020年第9期
P. 271
2892 Journal of Software 软件学报 Vol.31, No.9, September 2020
Market-1501 [88] 是在大学校园内一个超市前面采集的,由 6 个摄像头拍摄得到.该数据集包含 1 501 个行人
的 32 668 张图像(标注框),且每个行人都至少在两个摄像头中出现.训练集包括 751 个行人的 12 936 张图像,查
询集包括 750 个行人的 3 368 张图像,测试集包括 750 个行人的 16 384 张图像.该数据集采用 DPM 检测器 [90]
来检测行人标注框,而非采用人工裁剪的方式来获得,这样更加贴近现实应用,即可以考虑到行人检测的标注框
会存在偏移与不对齐的情况.DukeMTMC-reID [32] 是基于多摄像头多目标行人跟踪数据集 DukeMTMC [91] 构建
而成的,由 8 个摄像头拍摄得到.该数据集包含 1 404 个行人的 36 411 张图像(标注框),且该 1 404 个行人中,每个
行人都至少在两个摄像头中出现.训练集包含 702 个行人的 16 522 张图像,查询集包括 702 个行人的 2 228 张
图像,测试集包括 702 个行人的 17 661 张图像.该数据集通过人工剪裁的方式来获得行人标注框.MSMT17 [65] 是
从校园中部署的 15 个摄像头中拍摄得到的,包含 4 101 个行人的 126 441 张图像.训练集包含 1 041 个行人的
32 621 张图像(其中包括验证集的 2 373 张图像),查询集包含 3 060 个行人的 11 659 张图像,测试集包含 3 060
个行人的 82 161 张图像.该数据集采用 Faster RCNN 检测器 [92] 来检测行人标注框.CUHK03 [89] 由 5 组摄像头拍
摄得到,每组摄像头包含两个摄像头,且采用人工裁剪(labeled)和 DPM 检测器(detected) [90] 两种方式来检测行人
标注框.该数据集存在两种测试协议,本文仅介绍新的一种协议,以下称为 CUHK03-NP [93] .在 CUHK03-NP
(labeled)中,训练集包含 767 个行人的 7 368 张图像,查询集包含 700 个行人的 1 400 张图像,测试集包含 700 个
行人的 5 328 张图像;在 CUHK03-NP(detected)中,训练集包含 767 个行人的 7 365 张图像,查询集包含 700 个行
人的 1 400 张图像,测试集包含 700 个行人的 5 332 张图像.图 8 展示了部分数据集的实例图像,其中左图来自
Market-1501 [88] ,右图来自 DukeMTMC-reID [32] ,上下两行分别代表不同摄像头下的行人图像.
Fig.8 Examples from the image-based datasets
图 8 部分图像数据集的示例图像
(2) 视频数据集
常用的视频数据集除了较早出现的 PRID2011 [94] 和 iLIDS-VID [95] 以外,主要包括 MARS [96] ,DukeMTMC-SI-
Tracklet [84] 和 DukeMTMC-VideoReID [97] ,这些数据集常用于半监督任务.其基本信息概括在表 2 中.
Table 2 Information of some video-based person re-identification datasets
表 2 部分行人重识别视频数据集信息
数据集 ID 数量 训练集 ID 数量 测试集 ID 数量 图像数量 tracklet 数量 摄像头数量
MARS [96] 1 261 625 636 71 191 003 20 478 6
DukeMTMC-SI-Tracklet [84] 1 788 702 1 086 833 984 12 647 8
DukeMTMC-VideoReID [97] 1 812 702 702(and 408 distractors) 815 420 4 832 8
MARS [96] 是在大学校园中的 6 个摄像头采集得到的,包含 1 261 个行人的 20 478 个 tracklet 共计 1 191 003
张图片,分别将 626 和 635 个行人作为训练集和测试集,其所有的轨迹片段都是由 DPM 检测器 [90] 和 GMMCP
跟踪器 [98] 自动生成的.DukeMTMC-SI-Tracklet [84] 和 DukeMTMC-VideoReID [97] 均来自来自 DukeMTMC [91] ,由 8
个摄像头进行拍摄,人工裁剪得到标注框.DukeMTMC-SI-Tracklet 由 1 788 个行人的 19 135 个 tracklet 共计
833 984 张图片组成,并分别将 702 个和 1 086 个行人作为训练集和测试集;DukeMTMC-VideoReID 由 1 812 个
行人的 4 832 个 tracklet 共计 815 420 张图片组成,并分别将 702 个、702 个和 408 个行人作为训练集、测试集