Page 355 - 《软件学报》2021年第10期
P. 355

吴桦  等:大型指纹库场景中加密视频识别方法                                                          3327


                        型数据库中的数值非常大,导致假阳率高.由此可见,大型指纹库中的假阳率是一个重要的有区分度
                        的指标;
                    (5)  k=3 时的所有指标都比 k=2 时要好,即:增加 k 值可以提高查准率,降低假阳率.但是 k 越大,需要的 ADU
                        个数越多,在实际应用中越难采集到需要的数据量.因此,k 的取值不宜过多.由表 1 和表 3 的结果可见:
                        使用 HHTF 方法后,只需要 3 段匹配就可以满足在 20 万级指纹库中的识别需求.而文献[20,21]中都提
                        到 ADU 个数要求为 30,文献[23,24]提到 3 分钟的数据,相当于 Facebook 的 90 个 ADU.对比之下,HHTF
                        方法应用后需要的 ADU 个数大为减少,提高了方法的可用性.
                    由上述对准确率、查准率、查全率和假阳率的分析比较可见:这两种方法对 ADU 进行修正后进行视频匹
                 配,准确率和查全率指标比较接近,但是查准率和假阳率在大型数据库中的指标差别很大.
                    HHTF 方法的查准率和假阳率指标优于 Reed 方法,是因为 Reed 方法对 ADU 长度的复原不够精确.为了保
                 证视频能够被识别出来,Reed 方法对单个 ADU 需要较大的匹配区间,但是匹配区间的增大,也会导致 FP 数目的
                 增加.在大型指纹库场景中,ADU 数据多,同样大的匹配区间内存在更多的长度近似的 ADU,因此 Reed 方法的

                 FP 数目在大型指纹库中急剧增加.查准率的公式为 P                  TP   , 在本次测试中,TP=277,因此 FP 越大,查准率越
                                                            TP   FP
                 小.假阳率的公式为 FPR         FP  , 由于 FP+TN+TP+FN=总的匹配次数,其中,TP=277,FN=0,随着指纹库规模
                                      FP TN
                 的扩大,总的匹配次数必然增大,在全匹配情况下,是与指纹库规模相关的定量,所以,FP+TN 也是定量,随着 FP
                 的增加,假阳率也会增加.由此可见,ADU 长度精准复原方法 HHTF 是我们可以在大型指纹库中准确识别视频的
                 基础.
                    综合看来,HHTF 方法的指标远远优于 Reed 方法.在本文使用的 20 万级别大型指纹库中,使用 HHTF 方法
                 复原 ADU 长度后,只需要 3 个连续 ADU(Facebook 视频为 6s 播放数据)就可以准确识别出加密视频,准确率、
                 查准率、查全率为 100%,假阳率为 0,完全达到实际应用需求的指标要求.

                 3.6   加密视频识别方法在小型指纹库中的实测结果和分析
                    为了进一步比较两种修正方法应用于不同规模指纹库的效果,本节给出在小型真实指纹库中分别使用
                 HHTF 方法和 Reed 方法进行修正后得到的实验结果.使用真实的 277 个视频构成一个小型指纹库,分别用 2 个
                 和 3 个连续 ADU 匹配,得到了 277 个真实视频在真实指纹库中匹配的预测结果样例数,见表 4.

                            Table 4    Number of prediction results obtained from a small real fingerprint database
                                         表 4   小型真实指纹库中得到的预测结果样例数
                         长度指纹修正方法              k           TP           FP         FN        TN
                                               2           277          2           0       76 450
                             HHTF
                                               3           277          0           0       76 452
                                               2           277        23 152        0       53 300
                             Reed
                                               3           277         1 964        0       74 488
                    将表 4 结果代入准确率、查准率、查全率和假阳率的公式(1)~公式(4),可以得到表 5 的实验结果.
                        Table 5    Results of continuous ADU matching experiments in a small real fingerprint database
                                        表 5   小型真实指纹库中连续 ADU 匹配实验结果
                         长度指纹修正方法              k         准确率         查准率         查全率        假阳率
                                                                                                5
                                               2        99.9974%     99.28%      100%      2.6210
                             HHTF
                                               3         100%        100%        100%        0%
                                               2         69.83%      1.18%       100%       30.28%
                             Reed
                                               3         97.44%      12.36%      100%       2.57%
                    由表 5 的结果可以看到:
                    (1)  HHTF 方法和 Reed 方法修正后,查全率指标都很理想,但事实上,只有 HHTF 的 4 项指标全部符合要
                        求.这证明了查全率对算法的区分度不高,现有成果中最广泛使用的查全率指标不能全面评估算法,
   350   351   352   353   354   355   356   357   358   359   360