Page 462 - 《软件学报》2025年第7期
P. 462
吴桦 等: 面向 HTTP/2 流量多路复用特征的加密视频识别方法 3383
量. 在 HTTP/1.1 中, 音视频数据往往会通过两条 TCP 流分别进行不同类型的数据传输, 以提高效率. 而在
HTTP/2 中, 由于多路复用功能的引入, 往往只需要建立 1 条 TCP 流就能够承载多种数据的交互传输, 由于音频数
据和视频数据在同一条 TCP 流上交替传输, 因而两次请求之间的响应数据往往是同时包含音频和视频的混合数
据, 且由于流量是加密的, 这给数据长度的修正带来较大的困难, 本文将在第 5 节中对此展开研究.
(3) 自适应分辨率切换和用户拖动播放导致视频片段不按序传输.
在视频播放过程中, 可能会发生分辨率自适应切换事件和用户手动改变播放进度事件, 这使得重复播放同一
视频时的传输数据特征会发生较大变化, 从而严重影响依靠侧信道特征识别加密视频的准确率. 当固定分辨率播
放时, 多次反复播放同一个视频, 服务器发送的是同一个分辨率的视频资源, 此时, 视频传输数据的流量特征相对
稳定, 只会因为网络延迟和丢包等网络状况变化而发生变化, 可以使用协议相关的领域知识去除这些干扰. 而采用
自适应分辨率播放时, 网络状况的变化会触发分辨率的自适应切换, 实际中多次播放同一个视频时传输的可能是
不同分辨率的视频数据, 这就导致传输过程中的数据量、传输模式会发生很大变化, 从指纹层面上看, 同一视频不
同分辨率的指纹是不同的, 切换分辨率也就改变了对应视频的明文指纹, 同样, 用户手动改变播放进度也会使得视
频片段不按顺序下载, 导致与之对应的明文指纹也发生变化, 因此, 在实际视频播放过程中, 修正指纹和明文指纹
很难完全匹配, 只有选用鲁棒性强的指纹匹配识别算法, 针对上述播放事件进行优化才能实现良好的识别效果, 本
文将在第 6 节给出加密视频指纹匹配识别算法.
4 大型视频数据集自动化构建方法
为了弥补现有视频识别领域缺少真实大型视频数据集的不足, 并使得本文方法能够在真实场景中得到验证,
本文设计实现了一个大型视频数据集自动化构建系统, 如图 4 所示, 该系统包括加密视频明文和加密视频传输数
据的全自动采集, 通过该系统可以自动构建出大型的真实视频数据集.
视频服务器 视频服务器
PyScript
视频 URL 采集模块
控制中枢 控制中枢
描述文件下载模块 控制 控 制
网络 解 析 采集程序 浏览器 采集程序 QtScrcpy 客户端
索引片段下载模块 软路由
解 析
明文指纹解析模块
USB
PC PC PC 手机
1 视频明文指纹自动化采集 2 加密视频传输数据自动化采集
图 4 大型视频数据集自动化构建系统
(1) 视频明文指纹采集
视频明文指纹是指视频明文数据片段长度序列. 视频的明文指纹信息来自对视频的描述文件. 在使用 DASH
流媒体协议的播放场景中, 视频客户端会先向视频服务器请求当前播放视频的视频描述文件 MPD. 该文件中记录
了对视频的各种描述信息, 其中可以用于构建明文指纹的信息是视频索引片段内的字节范围 (IndexRange) 信息.
视频索引片段 [38] 是 DASH 协议中定义的一种特殊的片段, 其中保存着视频经 VBR 编码算法切分后各视频数据片
段的大小. 在视频播放过程中, 客户端会首先请求下载索引片段, 通过解析视频索引片段, 可以直接获取各视频片
段的大小和字节范围, 结合视频资源地址, 即可实现独立请求下载各视频片段. 因此, 通过只下载并解析视频索引
片段, 就能获取到各视频片段的长度信息, 从而得到视频的明文指纹.

