Page 343 - 《软件学报》2021年第10期

P. 343

吴桦等:大型指纹库场景中加密视频识别方法 3315

如图 4 所示,根据指纹库构建方式的不同,加密视频识别方法分为两类.
 图 4(a)是使用视频明文信息构建的指纹库,利用带外知识为视频指纹打上内容标签,从侧信道提取的
传输指纹进行修正后与明文指纹进行匹配,基于匹配结果识别视频.这类识别方法也包括对传输指纹
不进行任何修正就将其与明文指纹匹配的方法;
 图 4(b)中使用视频密文传输实例构建指纹库,也是使用带外知识为指纹打上内容标签,从侧信道提取
的传输指纹与密文指纹进行匹配,基于匹配结果确定是否识别出视频.
1.2 评估测度
为了对加密视频识别的效果进行评价,需要选择合适的性能指标.加密视频识别属于二分类任务,我们已知
对二分类问题的预测,可以得到 4 种结果,分别为 TN(true positive)、FP(false positive)、FN(false negative)、TP(true
positive).在加密视频识别算法评价中,使用准确率(accuracy)、查准率(precision)、查全率(recall)、假阳率(false
positive rate)可以全面地评价算法的有效性.计算公式分别如下所示.
 准确率

TP TN
A  (1)
TP TN  FP  FN

 查准率
TP
P  (2)
TP  FP
 查全率
TP
R  (3)
TP  FN
 假阳率
FP
FPR  (4)
FP TN
准确率、查准率、查全率、假阳率必须联合使用,以全面评测算法的可用性.如果对算法结果只评测其中
个别指标,即使个别指标结果很好,其他关键指标没有评测,算法的有效性也无法保证.
1.3 相关工作
本节首先对已有研究成果结合图 4 所示指纹库的不同构建方法分类阐述,然后讨论这两种方法构建的指
纹库的区别,从而确定本文的指纹库构建方法.
图 4(a)中使用明文信息构建明文指纹库是最直接的方法.首先分析使用明文指纹库的相关文献.
Reed 等人 [20] 开发了一个能够识别加密 Netflix 视频的系统,该系统使用中间人代理获得的视频描述信息构
建明文指纹库,对加密视频识别时,通过 adudump [19] 提取的加密 ADU 特征构建视频传输指纹.但是通过 adudump
提取的传输指纹与明文指纹库中的明文指纹长度上存在偏移,Reed 等人考虑到这个问题,指出:HTTP 头部和
TLS 协议开销会对数据造成影响,通过将匹配窗口放大到 30 个 ADU,以及对 ADU 特征进行一些修正,可将这个
影响尽量降低.该文献在一个包括 330 364 个 Netflix 视频指纹库中做了 200 次识别测试,测试结果为 199 次正
确识别出视频,即该方法的查全率是 99.5%,但是该文献并没有给出其他评测指标.Reed 等人的另一篇论文在
802.11 无线网络中识别加密的 Netflix 视频流 [21] ,但该文献的测试指纹库只有不到 100 个视频,进行了 25 次识别
全都识别出视频,因此查全率为 100%.除此之外,没有给出其他评测指标.该文献数据库规模太小,同时也指出该
方法的误判率会随着指纹库规模的扩大而增大,无法应用到实际场景.这两篇论文都要求加密视频数据采集达
到 30 个 ADU 才能进行匹配,即采集 30 个连续的 ADU,并且在此期间没有分辨率切换及人工跳转才能用于视
频识别.
Stikkelorum 等人 [22] 使用有限状态机进行视频识别,使用文献[20]中的修正方法对 ADU 特征进行修正,修正
后的视频传输指纹与明文指纹库进行匹配.该文的指纹库只包括 20 个 YouTube 视频,测试结果也只是在这 20

338 339 340 341 342 343 344 345 346 347 348