Page 479 - 《软件学报》2025年第7期

P. 479

3400 软件学报 2025 年第 36 卷第 7 期

对比表 8 与表 4 和表 5 的识别结果, 显然, 在固定分辨率加密视频数据集上, 文献 [22] 的方法在识别准确率、
精确率和 F1 得分等评价指标上都低于本文方法, 尤其是在 40 万级的指纹库场景下, 其识别准确率仅有 65.35%.
导致其识别效果较差的主要原因是, 该论文中提出的将加密数据长度精准还原为明文数据长度的方法利用了
HTTP/1.1 传输模式, 其难以适用于使用多路复用的 HTTP/2 协议传输数据的视频. 此外, 分析表 8 可以看出, 相较
固定分辨率, 该论文的方法在自适应分辨率的识别场景中的识别效果显著下降, 原因是该论文提出的方法并没有
考虑视频播放时视频分辨率自适应切换给识别带来的影响, 缺乏鲁棒性.
(2) 识别时间比较
为了评估视频识别方法的时间开销, 本文在相同数据集上进行实验, 得到了文献 [22] 的识别时间, 其结果如
表 9 所示.

表 9 使用明文指纹的对比方法 [22] 在 HTTP/2 数据集上的识别时间统计

识别视频分辨率视频平均指纹库数量文献[22]方法平均本文方法平均
平台
数量类型时长 (s) 级 (万) 识别时间 (ms) 识别时间 (ms)
40 17 150.32 245.07
Facebook & Instagram 6 090 固定 257.19
0.5 1 495.85 25.66
40 2 660.67 128.02
Facebook & Instagram 766 自适应 183.66
0.5 184.78 10.65

从表 9 可以看出, 本文方法相较于文献 [22] 使用的基于序列比对的算法, 无论是在 0.5 万级的指纹库还是在
40 万级的指纹库规模下, 对单个视频的平均识别时间均有数十倍的优势. 通过对表 9 数据的仔细对比, 发现随着
指纹库规模的扩大和视频平均时长的增加, 本文方法在时间开销上的优势呈现进一步扩大的趋势.

8.2 与现有密文指纹识别方法的对比实验结果与分析
密文指纹识别方法的指纹库构建相对容易, 因此在该研究方向上已有较多的文献. Bae 等人 [25] 的研究成果相
对较新. 该方法是利用加密视频传输的流量特征作为输入特征, 以 CNN 神经网络模型作为视频标题分类器来达到
识别加密视频的目的. 本文从 3 个方面与其进行了比较.
(1) 识别效果与样本容量的关系
本文按照文献 [25] 中的数据集规模, 构建了一个与该论文类似的数据集. 数据集选取了 22 个时长在 2.5 min
左右的 Facebook 视频进行自适应分辨率场景下的播放, 且每个视频重复采集了 40 次. 实验使用不同数量的训练
样本进行了训练, 表 10 给出了 Bae 的识别效果与训练集样本容量的关系.

表 10 使用密文指纹的对比方法 [25] 识别效果与训练集样本容量的关系

实验训练集测试集比例划分准确率精确率召回率 F1得分
序号数据量数据量方式 (Accuracy) (%) (Precision) (%) (Recall) (%) (F1_Score) (%)
1 660 220 3:1 随机 87.27 92.16 85.45 88.68
2 586 294 2:1 随机 84.27 89.06 82.52 85.66
3 440 440 1:1 随机 70.00 76.94 67.50 71.91

从表 10 中可以看出, 当模型的训练样本容量变小时, Bae 方法识别的准确率、精确率和召回率等评价指标也
随之下降. 这是因为虽然训练集和测试集是在相同环境下采集的, 但在视频播放过程中, 网络波动和服务器状态变
化会对加密数据传输的流量模式产生影响, 因此需要尽可能大的样本容量来平衡流量模式突变带来的影响. 由此
可知, Bae 方法等密文指纹识别方法的识别效果严重依赖于训练集的样本容量, 需要大量的训练样本来确保识别
模型的识别精度. 而本文方法只需要少量样本来训练各平台的修正参数, 精度不依赖训练样本的数目.
(2) 泛化性比较
为了探究 Bae 等密文指纹方法的泛化性能, 本文设置了两组实验, 结果如表 11 所示.
为了探究训练集中样本流量模型的多样性与识别效果之间的关系, 在相同的采集设备和播放网络环境下, 在

474 475 476 477 478 479 480 481 482 483 484