Page 343 - 《软件学报》2021年第10期
P. 343

吴桦  等:大型指纹库场景中加密视频识别方法                                                          3315


                    如图 4 所示,根据指纹库构建方式的不同,加密视频识别方法分为两类.
                       图 4(a)是使用视频明文信息构建的指纹库,利用带外知识为视频指纹打上内容标签,从侧信道提取的
                        传输指纹进行修正后与明文指纹进行匹配,基于匹配结果识别视频.这类识别方法也包括对传输指纹
                        不进行任何修正就将其与明文指纹匹配的方法;
                       图 4(b)中使用视频密文传输实例构建指纹库,也是使用带外知识为指纹打上内容标签,从侧信道提取
                        的传输指纹与密文指纹进行匹配,基于匹配结果确定是否识别出视频.
                 1.2   评估测度
                    为了对加密视频识别的效果进行评价,需要选择合适的性能指标.加密视频识别属于二分类任务,我们已知
                 对二分类问题的预测,可以得到 4 种结果,分别为 TN(true positive)、FP(false positive)、FN(false negative)、TP(true
                 positive).在加密视频识别算法评价中,使用准确率(accuracy)、查准率(precision)、查全率(recall)、假阳率(false
                 positive rate)可以全面地评价算法的有效性.计算公式分别如下所示.
                       准确率
                                                            
                                                          TP TN
                                                  A                                                  (1)
                                                     TP TN   FP   FN
                                                        
                       查准率
                                                           TP
                                                      P                                              (2)
                                                         TP   FP
                       查全率
                                                           TP
                                                      R                                              (3)
                                                         TP   FN
                       假阳率
                                                             FP
                                                     FPR                                             (4)
                                                           FP TN
                    准确率、查准率、查全率、假阳率必须联合使用,以全面评测算法的可用性.如果对算法结果只评测其中
                 个别指标,即使个别指标结果很好,其他关键指标没有评测,算法的有效性也无法保证.
                 1.3   相关工作
                    本节首先对已有研究成果结合图 4 所示指纹库的不同构建方法分类阐述,然后讨论这两种方法构建的指
                 纹库的区别,从而确定本文的指纹库构建方法.
                    图 4(a)中使用明文信息构建明文指纹库是最直接的方法.首先分析使用明文指纹库的相关文献.
                    Reed 等人 [20] 开发了一个能够识别加密 Netflix 视频的系统,该系统使用中间人代理获得的视频描述信息构
                 建明文指纹库,对加密视频识别时,通过 adudump           [19] 提取的加密 ADU 特征构建视频传输指纹.但是通过 adudump
                 提取的传输指纹与明文指纹库中的明文指纹长度上存在偏移,Reed 等人考虑到这个问题,指出:HTTP 头部和
                 TLS 协议开销会对数据造成影响,通过将匹配窗口放大到 30 个 ADU,以及对 ADU 特征进行一些修正,可将这个
                 影响尽量降低.该文献在一个包括 330 364 个 Netflix 视频指纹库中做了 200 次识别测试,测试结果为 199 次正
                 确识别出视频,即该方法的查全率是 99.5%,但是该文献并没有给出其他评测指标.Reed 等人的另一篇论文在
                 802.11 无线网络中识别加密的 Netflix 视频流      [21] ,但该文献的测试指纹库只有不到 100 个视频,进行了 25 次识别
                 全都识别出视频,因此查全率为 100%.除此之外,没有给出其他评测指标.该文献数据库规模太小,同时也指出该
                 方法的误判率会随着指纹库规模的扩大而增大,无法应用到实际场景.这两篇论文都要求加密视频数据采集达
                 到 30 个 ADU 才能进行匹配,即采集 30 个连续的 ADU,并且在此期间没有分辨率切换及人工跳转才能用于视
                 频识别.
                    Stikkelorum 等人 [22] 使用有限状态机进行视频识别,使用文献[20]中的修正方法对 ADU 特征进行修正,修正
                 后的视频传输指纹与明文指纹库进行匹配.该文的指纹库只包括 20 个 YouTube 视频,测试结果也只是在这 20
   338   339   340   341   342   343   344   345   346   347   348