Page 355 - 《软件学报》2021年第10期
P. 355
吴桦 等:大型指纹库场景中加密视频识别方法 3327
型数据库中的数值非常大,导致假阳率高.由此可见,大型指纹库中的假阳率是一个重要的有区分度
的指标;
(5) k=3 时的所有指标都比 k=2 时要好,即:增加 k 值可以提高查准率,降低假阳率.但是 k 越大,需要的 ADU
个数越多,在实际应用中越难采集到需要的数据量.因此,k 的取值不宜过多.由表 1 和表 3 的结果可见:
使用 HHTF 方法后,只需要 3 段匹配就可以满足在 20 万级指纹库中的识别需求.而文献[20,21]中都提
到 ADU 个数要求为 30,文献[23,24]提到 3 分钟的数据,相当于 Facebook 的 90 个 ADU.对比之下,HHTF
方法应用后需要的 ADU 个数大为减少,提高了方法的可用性.
由上述对准确率、查准率、查全率和假阳率的分析比较可见:这两种方法对 ADU 进行修正后进行视频匹
配,准确率和查全率指标比较接近,但是查准率和假阳率在大型数据库中的指标差别很大.
HHTF 方法的查准率和假阳率指标优于 Reed 方法,是因为 Reed 方法对 ADU 长度的复原不够精确.为了保
证视频能够被识别出来,Reed 方法对单个 ADU 需要较大的匹配区间,但是匹配区间的增大,也会导致 FP 数目的
增加.在大型指纹库场景中,ADU 数据多,同样大的匹配区间内存在更多的长度近似的 ADU,因此 Reed 方法的
FP 数目在大型指纹库中急剧增加.查准率的公式为 P TP , 在本次测试中,TP=277,因此 FP 越大,查准率越
TP FP
小.假阳率的公式为 FPR FP , 由于 FP+TN+TP+FN=总的匹配次数,其中,TP=277,FN=0,随着指纹库规模
FP TN
的扩大,总的匹配次数必然增大,在全匹配情况下,是与指纹库规模相关的定量,所以,FP+TN 也是定量,随着 FP
的增加,假阳率也会增加.由此可见,ADU 长度精准复原方法 HHTF 是我们可以在大型指纹库中准确识别视频的
基础.
综合看来,HHTF 方法的指标远远优于 Reed 方法.在本文使用的 20 万级别大型指纹库中,使用 HHTF 方法
复原 ADU 长度后,只需要 3 个连续 ADU(Facebook 视频为 6s 播放数据)就可以准确识别出加密视频,准确率、
查准率、查全率为 100%,假阳率为 0,完全达到实际应用需求的指标要求.
3.6 加密视频识别方法在小型指纹库中的实测结果和分析
为了进一步比较两种修正方法应用于不同规模指纹库的效果,本节给出在小型真实指纹库中分别使用
HHTF 方法和 Reed 方法进行修正后得到的实验结果.使用真实的 277 个视频构成一个小型指纹库,分别用 2 个
和 3 个连续 ADU 匹配,得到了 277 个真实视频在真实指纹库中匹配的预测结果样例数,见表 4.
Table 4 Number of prediction results obtained from a small real fingerprint database
表 4 小型真实指纹库中得到的预测结果样例数
长度指纹修正方法 k TP FP FN TN
2 277 2 0 76 450
HHTF
3 277 0 0 76 452
2 277 23 152 0 53 300
Reed
3 277 1 964 0 74 488
将表 4 结果代入准确率、查准率、查全率和假阳率的公式(1)~公式(4),可以得到表 5 的实验结果.
Table 5 Results of continuous ADU matching experiments in a small real fingerprint database
表 5 小型真实指纹库中连续 ADU 匹配实验结果
长度指纹修正方法 k 准确率 查准率 查全率 假阳率
5
2 99.9974% 99.28% 100% 2.6210
HHTF
3 100% 100% 100% 0%
2 69.83% 1.18% 100% 30.28%
Reed
3 97.44% 12.36% 100% 2.57%
由表 5 的结果可以看到:
(1) HHTF 方法和 Reed 方法修正后,查全率指标都很理想,但事实上,只有 HHTF 的 4 项指标全部符合要
求.这证明了查全率对算法的区分度不高,现有成果中最广泛使用的查全率指标不能全面评估算法,