Page 476 - 《软件学报》2025年第7期

P. 476

吴桦等: 面向 HTTP/2 流量多路复用特征的加密视频识别方法 3397

表 5 动态分辨率场景下的加密视频识别效果

播放视频指纹库数量准确率精确率召回率 F1得分
平台
数量级 (万) (Accuracy) (%) (Precision) (%) (Recall) (%) (F1_Score) (%)
40 97.96 97.96 97.96 97.96
Facebook 490
0.5 98.78 98.98 98.78 98.87
40 97.82 100.00 97.82 98.38
Instagram 276
0.5 98.91 100.00 98.91 99.39
40 97.91 98.69 97.91 98.11
Facebook & Instagram 766
0.5 98.82 99.35 98.82 99.06

在由网络波动引起的被动分辨率自适应切换实验中, 本文选取了 3 min 左右时长的 Instagram 视频, 在播放过
程中通过在中间网关设置网络丢包限制网速的方式改变视频播放的网络环境, 引起视频被动式自适应分辨率切
换, 在播放过程中设置 2 次丢包限制, 每次持续 1 min. 在手动进行的主动分辨率切换实验中, 本文选取了视频时长
在 3 min 左右的 Facebook 视频, 在播放过程中进行 2 次手动分辨率切换, 每次间隔 1 min. 其实验结果如表 5 所示.
从表 4 和表 5 可以看出, 本研究的方法在不同规模的指纹库识别场景和不同播放模式的识别场景中各项评估
指标都表现出了优异的性能, 具体体现在以下两个方面.
(A) 本方法能在大型指纹库中实现较高的识别效果. 从表 4 可以看出, 在固定分辨率场景下, 无论是在
Facebook 平台还是在 Instagram 平台, 本研究所提出的加密视频识别方法在明文指纹数量为 0.5 万的小型指纹库
和 40 万的大型指纹库中都实现了较高的识别准确率和精确率, 尤其是在 40 万级的大型指纹库中, 本文识别方法
仍实现了超过 98% 的识别准确率和超过 99% 的识别精确率.
(B) 本方法能克服视频自适应分辨率机制给加密视频识别带来的不良影响. 视频播放时的分辨率自适应机制
会改变传输数据的流量模式, 给加密视频识别增加一定的难度, 然而本方法使用第 6 节构建的加密视频识别模型,
在极大程度上减少了因视频分辨率切换给加密视频识别带来的影响. 对比表 4 和表 5 的识别效果可知, 本文的识
别方法在自适应视频分辨率识别场景中仍有较好的表现, 在 40 万级的指纹库中, 其识别精确率相较于识别固定分
辨率视频仅下降 0.5%, 对加密视频识别的准确率仍超过 97.8%.
识别过程中仍然存在一些不准确的情况, 通过分析可知, 主要有两个方面的原因: 其一, 加密视频数据片段的
长度不能被 100% 还原, 修正还原出的视频片段长度与其原长度仍存在些许误差; 其二, 由于 HTTP/2 的多路复用
和 DASH 的视频传输机制与分辨率自适应机制的作用, 个别情况下视频在播放时并非严格按照视频明文指纹的
片段序列传输.
(3) 视频识别方法的通用性和泛化性验证
本文提出的加密视频识别方法结合了领域知识和人工智能方法, 首先使用领域知识对通用传输协议和加密协
议分析, 并且由此设计特征提取方法, 然后使用人工智能方法获得各平台的参数. 为了验证本文方法在不同视频平
台和环境下的通用性和泛化性, 本文在 Facebook 和 Instagram 的基础上补充选取了 3 个国内外的视频平台: Triller、
Twitter 和芒果 TV, 其中, Triller 是一个美国的社交网络和娱乐平台, 以短视频为主; Twitter 是美国知名社交网络
及微博客服务平台; 芒果 TV 是国内知名的互联网视频平台.
这 3 个平台同样使用了 HTTP 自适应流媒体技术和 HTTP/2 协议传输音视频数据, 但与 Facebook 和 Instagram
平台不同的是, 这 3 个平台使用的流媒体协议是 HLS 协议, 虽然 HLS 协议和 DASH 协议都属于 HTTP 自适应流
媒体技术, 但两者在服务器系统框架和媒体内容分发机制上有着较大的差异, 本文将使用前文介绍的加密视频识
别方法, 对这 3 个平台进行方法通用性和泛化性验证.
按照前文所介绍的方法流程, 首先, 采集 3 个平台的测试视频的明文指纹, 并存入大型视频明文指纹库. 接着,
对于各个平台, 分别选取 50 个视频的一次播放数据, 进行平台视频识别模型参数的训练. 然后, 进行大规模测试数
据的采集. 最后, 对各平台的测试数据进行视频识别实验.
在固定分辨率播放场景下, 针对 Triller、Twitter 和芒果 TV 这 3 个平台, 实验各选取了 3 184、3 000 和 1 200

471 472 473 474 475 476 477 478 479 480 481