Page 478 - 《软件学报》2025年第7期
P. 478

吴桦 等: 面向  HTTP/2  流量多路复用特征的加密视频识别方法                                             3399



                                            140                            133.32
                                            120                         92.35
                                           平均识别时间 (ms)  80    38.17 47.82 60.56
                                            100

                                             60
                                             40
                                             20    12.22 16.41 26.67
                                                8.63
                                              0
                                                0.5  5  10  15  20  25  30  35  40
                                                          指纹库规模 (万)
                               图 16 本文方法在不同规模的指纹库识别场景下的平均匹配识别时间开销

                    图  16  的结果显示, 虽然随着指纹库规模的增加, 单个视频的平均识别耗时会随之增加, 但从整体角度来看, 本
                 文方法在不同指纹库规模下的时间开销较小, 即使是在                    40  万级的指纹库规模下, 单个视频识别时间也仅有
                 133.32 ms, 这也说明了本文方法能够应用于现实大规模指纹库匹配场景.

                 8   与现有工作的对比实验与分析

                    当前加密视频识别研究主要分为两类研究方法, 分别是基于人工智能分类模型的视频识别方法和基于视频指
                 纹的视频识别方法. 由于前者无法识别没有被播放过的视频, 泛化能力很差, 且无法应用于大型视频指纹库场景
                 中, 与本文面向的海量真实场景视频识别应用背景不一致, 因此本文没有与这类研究对比. 后者包括明文指纹识别
                 方法和密文指纹识别方法, 本节对所有现有研究进行了调研分析, 分别选取并复现了这两类方法中的各                                 1  项最新
                 研究成果, 使用    HTTP/2  传输的视频数据进行了实验, 并与本文的方法进行了比较.

                 8.1   与现有明文指纹识别方法的对比实验结果与分析
                    受限于构建大型视频明文指纹库的困难, 大多研究都是基于人工构建的小型视频指纹库进行方法设计和验
                 证. 文献  [22] 基于真实视频指纹模拟构建了          20  万级的视频明文指纹库, 实现了在大规模明文指纹库场景中的加
                 密视频准确识别. 该论文通过分析使用            TLS  协议加密的应用数据单元         (application data unit, ADU) 的密文数据长
                 度相较于明文数据长度发生漂移的原因, 将              TLS  记录特征和    HTTP/1.1  头部特征作为拟合特征来精准还原加密
                 ADU  长度, 从而构建视频指纹. 在视频识别时, 该方法使用基于序列比对算法进行视频指纹的匹配, 从而识别加密
                 视频. 本文与该方法比较了识别效果和识别时间.
                    (1) 识别效果比较
                    本文使用文献      [22] 的方法进行了视频识别对比实验, 使用包含            Facebook  和  Instagram  平台的  HTTP/2  数据集,
                 分别在固定分辨率和自适应分辨率场景, 指纹数量规模为                   0.5 万和  40  万级的视频明文指纹库场景下进行识别实
                 验, 其实验结果如表      8  所示.


                                   表 8 使用明文指纹的对比方法          [22] 在  HTTP/2  数据集上的识别效果

                                     分辨率     指纹库数量        准确率          精确率         召回率         F1得分
                     方法      数据量
                                      类型       级 (万)    (Accuracy) (%)  (Precision) (%)  (Recall) (%)  (F1_Score) (%)
                                                40         98.41        99.83       98.41       99.03
                              6 090   固定
                                                0.5        99.28        99.78       99.28       99.48
                   本文方法
                                                40         97.91        98.69       97.91       98.11
                               766   自适应
                                                0.5        98.82        99.35       98.82       99.06
                                                40         65.35        95.61       65.35       74.77
                              6 090   固定
                                                0.5        74.91        97.21       74.91       82.59
                  对比方法   [22]
                                                40         53.39        79.94       53.39       61.18
                               766   自适应
                                                0.5        64.19        89.42       64.19       71.44
   473   474   475   476   477   478   479   480   481   482   483