Page 456 - 《软件学报》2025年第7期
P. 456

吴桦 等: 面向  HTTP/2  流量多路复用特征的加密视频识别方法                                             3377


                 密视频类别分类      [12] 、加密视频服务质量识别      [13,14] 、加密视频播放模式识别     [15] 、加密视频内容识别    [16,17] 等. 这些
                 研究中, 只有加密视频内容识别才能满足对网络公害视频进行监管的目的.
                    然而, 已有的加密视频内容识别研究还存在一些普遍性的问题. 第一, 由于采集大型加密视频数据集工作量巨
                 大, 费时费力, 所以当前研究大多使用自建的小型或微型数据集展开研究和验证, 也有少数研究是面向大型数据集
                 进行的, 但使用的是模拟的大型指纹库, 这导致现有研究缺少面向大型真实数据集的验证. 第二, 目前针对加密视
                 频内容的识别主要基于        HTTP/1.1  协议, 近几年来, 随着   HTTP/2、QUIC  和  HTTP/3  等多路复用协议的快速普及,
                 加密视频流量传输特征发生了巨大的变化, 传统基于                 HTTP/1.1  协议的识别方法已无法适用于使用新型多路复用
                 协议的场景. 第三, 当前对加密视频识别的研究大多针对的是播放时分辨率固定的视频, 很少考虑到流媒体自适应
                 播放时分辨率切换给识别带来的影响.
                    针对以上问题, 本文基于自采集的大型真实数据集, 研究使用                   HTTP  自适应流媒体 (HTTP adaptive streaming,
                 HAS) 技术进行视频分发, 并使用多路复用的            HTTP/2  传输的加密视频识别问题.
                    本文主要贡献如下.
                    (1) 针对当前没有公开的大型加密视频数据集的问题, 同时为了在大型数据集中验证本文的方法, 设计实现了
                 自动化的加密视频指纹采集系统, 构建了一个包含                40  万条视频明文指纹的大型数据集.
                    (2) 针对多路复用传输协议导致的加密视频传输数据难以精准还原问题, 本文深入研究了                            HTTP/2  协议数据
                 加密传输过程中, 数据长度发生偏移的原理, 提出从加密传输的组合音视频数据单元中精准修正还原出加密视频
                 修正指纹的方法, 使用       Facebook  和  Instagram  视频平台测试集的实验结果表明, 超过      99.70%  的指纹还原误差都
                 在  0.5‰范围内.
                    (3) 针对在大型指纹库中识别速度慢以及视频分辨率自适应切换导致视频识别难的问题, 本文提出以加密视
                 频修正指纹和视频明文指纹库为基础, 以动态滑动窗口匹配机制、隐马尔可夫模型和维特比算法为实现方法, 构
                 建加密视频识别模型, 最终在         40  万级的真实视频明文指纹库场景中实现了超过               98.23%  的识别准确率, 且能克服
                 视频播放过程中分辨率自适应切换的影响, 与其他识别研究方法相比, 本方法具有明显的优势.
                    本文第   1  节介绍加密视频内容识别领域中的相关工作. 第               2  节介绍加密视频识别过程中的背景技术. 第            3  节
                 介绍加密视频识别的原理和本文方法的主要架构. 第                 4  节介绍本文构建大型数据集的方法. 第           5  节基于大型真实
                 数据集, 给出面向     HTTP/2  多路复用传输的加密视频数据精准修正还原方法, 进而构建出加密视频修正指纹. 第                         6
                 节提出利用加密视频修正指纹和视频明文指纹快速识别出加密视频的方法. 第                          7  节给出本文方法在      40  万级的大
                 型视频指纹库场景下的评估结果与理论分析. 第                8  节给出与类似工作的对比实验结果. 第           9  节对研究进行总结并
                 展望未来的工作.

                 1   相关工作


                    从网络流量中识别加密视频内容是网络监管中的热点和难点问题. 针对此问题, 国内外都已有一些研究成果,
                 从方法上可分为两类. 第       1  类利用人工智能技术, 使用机器学习或深度学习, 直接从视频流信息中提取流量特征,
                 送入机器学习模型, 使用大量加密视频传输数据进行训练, 最终通过模型预测视频内容, 简称机器学习模型预测
                 法. 第  2  类是将领域知识和人工智能相结合, 通过带外方法构建视频指纹库, 监测时从视频流中尽量复原出指纹特
                 征, 与指纹库中的视频指纹进行匹配, 从而识别视频, 这类方法简称为指纹识别法.
                    第  1  类方法使用机器学习模型预测视频内容, 主要的识别思路是将视频播放时的加密音频或视频数据流作为
                 输入, 使用各种机器学习算法训练音视频流的分类器, 训练好的分类器可以用来识别音视频. 选择合适的特征, 可
                 以实现对加密流量的有效分类          [18] . Dubin  等人  [19] 提出了一种使用分类方法识别加密   HTTP  自适应视频流标题的算
                 法. 该算法的识别思路是利用加密视频的流量模式, 结合                   SVM  机器学习算法, 在包含       100  个视频的  10 000  个
                 YouTube 传输实例的数据集中进行实验. 该方法的分类准确率为                 95%, 并且可以将不在训练集中的视频分类为未
                 知视频. 但是, 该算法需要对每个待识别视频进行              100  次的播放用于学习, 训练的代价过大. 此外, 如果在真实网络
   451   452   453   454   455   456   457   458   459   460   461