Page 478 - 《软件学报》2025年第7期

P. 478

吴桦等: 面向 HTTP/2 流量多路复用特征的加密视频识别方法 3399

140 133.32
120 92.35
平均识别时间 (ms) 80 38.17 47.82 60.56
100

60
40
20 12.22 16.41 26.67
8.63
0
0.5 5 10 15 20 25 30 35 40
指纹库规模 (万)
图 16 本文方法在不同规模的指纹库识别场景下的平均匹配识别时间开销

图 16 的结果显示, 虽然随着指纹库规模的增加, 单个视频的平均识别耗时会随之增加, 但从整体角度来看, 本
文方法在不同指纹库规模下的时间开销较小, 即使是在 40 万级的指纹库规模下, 单个视频识别时间也仅有
133.32 ms, 这也说明了本文方法能够应用于现实大规模指纹库匹配场景.

8 与现有工作的对比实验与分析

当前加密视频识别研究主要分为两类研究方法, 分别是基于人工智能分类模型的视频识别方法和基于视频指
纹的视频识别方法. 由于前者无法识别没有被播放过的视频, 泛化能力很差, 且无法应用于大型视频指纹库场景
中, 与本文面向的海量真实场景视频识别应用背景不一致, 因此本文没有与这类研究对比. 后者包括明文指纹识别
方法和密文指纹识别方法, 本节对所有现有研究进行了调研分析, 分别选取并复现了这两类方法中的各 1 项最新
研究成果, 使用 HTTP/2 传输的视频数据进行了实验, 并与本文的方法进行了比较.

8.1 与现有明文指纹识别方法的对比实验结果与分析
受限于构建大型视频明文指纹库的困难, 大多研究都是基于人工构建的小型视频指纹库进行方法设计和验
证. 文献 [22] 基于真实视频指纹模拟构建了 20 万级的视频明文指纹库, 实现了在大规模明文指纹库场景中的加
密视频准确识别. 该论文通过分析使用 TLS 协议加密的应用数据单元 (application data unit, ADU) 的密文数据长
度相较于明文数据长度发生漂移的原因, 将 TLS 记录特征和 HTTP/1.1 头部特征作为拟合特征来精准还原加密
ADU 长度, 从而构建视频指纹. 在视频识别时, 该方法使用基于序列比对算法进行视频指纹的匹配, 从而识别加密
视频. 本文与该方法比较了识别效果和识别时间.
(1) 识别效果比较
本文使用文献 [22] 的方法进行了视频识别对比实验, 使用包含 Facebook 和 Instagram 平台的 HTTP/2 数据集,
分别在固定分辨率和自适应分辨率场景, 指纹数量规模为 0.5 万和 40 万级的视频明文指纹库场景下进行识别实
验, 其实验结果如表 8 所示.

表 8 使用明文指纹的对比方法 [22] 在 HTTP/2 数据集上的识别效果

分辨率指纹库数量准确率精确率召回率 F1得分
方法数据量
类型级 (万) (Accuracy) (%) (Precision) (%) (Recall) (%) (F1_Score) (%)
40 98.41 99.83 98.41 99.03
6 090 固定
0.5 99.28 99.78 99.28 99.48
本文方法
40 97.91 98.69 97.91 98.11
766 自适应
0.5 98.82 99.35 98.82 99.06
40 65.35 95.61 65.35 74.77
6 090 固定
0.5 74.91 97.21 74.91 82.59
对比方法 [22]
40 53.39 79.94 53.39 61.18
766 自适应
0.5 64.19 89.42 64.19 71.44

473 474 475 476 477 478 479 480 481 482 483