Page 460 - 《软件学报》2025年第7期
P. 460
吴桦 等: 面向 HTTP/2 流量多路复用特征的加密视频识别方法 3381
HTTP/2 协议都是基于 HTTPS 实现的, 这也成为事实上的标准. 研究人员无法根据有效载荷来研究 HTTP/2 的流
量, 只能通过分析加密流量的传输特征得到信息.
HTTP/1.1
应用层 (HTTP/2)
:
Binary framing
t
:
Content-type: application/json
Content-length: 3 600
: 3 600
l
会话层 (TLS)
HTTP/2
传输层 (TCP)
HEADERS frame
网络层 (IP)
DATA frame
图 2 HTTP/2 二进制分帧层
多路复用技术在给 HTTP/2 数据传输带来极大的效率提升的同时, 也给网络流量研究人员带来了新的挑战.
多路复用技术使得 HTTP 流量特征发生很大的变化, 之前基于 HTTP/1.1 传输模式建立的流量模型将不再适用于
HTTP/2 的流量, 因此已有面向 HTTP/1.1 协议的视频识别方法已无法适用于使用 HTTP/2 传输的视频. HTTP/2 中
新的协议功能给加密视频识别带来了新的挑战.
3 加密视频识别方法整体架构与关键技术难点
本节给出本文方法的整体架构, 并明确方法中需要解决的关键技术难点.
根据第 1 节的分析, 只有使用明文指纹识别方法才有可能实现大规模加密视频场景中的精准加密视频识别.
因此本文方法使用明文指纹识别法. 为方便后续叙述, 本文明确如下定义.
定义 1. 明文指纹: 通过使用稳定性较强, 且未加密的视频明文信息构建起来的视频指纹.
定义 2. 明文指纹库: 明文指纹的集合.
定义 3. 传输指纹: 从侧信道提取的加密视频流的流量特征序列, 也称密文指纹.
定义 4. 密文指纹库: 传输指纹 (密文指纹) 的集合.
定义 5. 修正指纹: 通过特定修正还原算法, 还原加密视频数据长度, 将视频传输指纹修正还原形成的指纹, 修
正还原算法的还原精度越高, 修正指纹质量就越高, 视频修正指纹和视频明文指纹也就越接近.
在加密视频传输场景中, 由于无法直接利用视频应用层信息, 所以对加密视频的识别主要利用音视频数据应
用层数据单元的长度和传输顺序. 如第 2.1 节所介绍, 当前全球主流的视频平台都使用了 HAS 技术. 以 DASH 为
例, 为了实现在视频播放过程中视频分辨率的自适应切换, DASH 使用可变比特率编码技术, 将音视频文件进行编
码, 形成不同分辨率质量的视频, 同时将编码后视频切割为时长相等的视频片段. 由于视频内容画面的复杂度和视
频片段大小具有强相关性 [36,37] , 因此视频内容不同, 视频片段的大小也会呈现出较大的差异. 用户请求播放视频时
会根据网络条件依次请求下载各种质量的视频片段. 由于这种视频片段的长度和传输顺序与视频内容具有强关联
性, 且视频在上传时经过一次编码后一般不会再次编码, 具有很强的稳定性, 因此可以将视频的这种片段的原始长
度序列作为标识视频内容的明文指纹. 由于视频内容不同会导致每个视频的片段长度序列不同, 因此如果能从传
输数据中准确地获得这些片段序列的长度, 就能在不解密的情况下识别加密视频.
视频的明文指纹指视频片段的原始长度序列, 是视频资源在应用层的特征. 在网络中传输时, 这些音视频片段
会被各种协议层层处理, 附加上各种传输和安全管理信息, 导致实际传输的数据量要比原始明文数据量略大, 构成
视频传输指纹. 在明文指纹库识别场景中, 需要将视频传输指纹通过设计的修正还原方法处理, 去除掉各种附加管
理信息, 形成视频修正指纹, 最后利用合适的指纹匹配算法, 将还原出的修正指纹和明文指纹库里的视频指纹进行
匹配, 确定视频内容标签.

