Page 461 - 《软件学报》2025年第7期

P. 461

3382 软件学报 2025 年第 36 卷第 7 期

本文使用明文指纹识别加密视频的方法如图 3 所示. 首先利用自动化采集系统, 在真实播放场景中采集视频
明文指纹和加密视频传输数据, 构建视频明文指纹库, 其次从加密视频数据流中提取数据特征, 经修正还原模型处
理后构建出加密视频修正指纹, 最后以加密视频修正指纹和视频明文指纹库为基础, 设计合适的视频识别方法, 进
而识别加密视频内容.

1 大型视频数据集构建视频服务器
V 1:
V 1:
V 2:
V 2:
MPD file V 3:
V 3: A 1:
加密视频传输数据视频明文指纹
加密视频传输数据集自动化采集自动化采集视频明文指纹库
视频客户端

2 加密视频修正指纹构建
输入构建
数据预处理加密数据精确修正还原方法
加密视频修正指纹

3 加密视频内容识别

模型求解构建
识别结果获取相关参数
Viterbi

HMM

图 3 使用明文指纹识别加密视频方法的整体架构

在图 3 所示的识别过程中, 第 1 步的明文指纹库构建过程中得到的明文指纹是准确的. 但是第 2 步从密文中
还原出修正指纹, 需要考虑到加密和传输音视频数据时的多种影响因素, 不同的影响因素以及不同的修正还原技
术会得到不同的还原结果, 这就导致修正的指纹结果是不确定的. 这种不确定性也会进一步影响第 3 步视频识别
的准确性. 因此需要分析各层网络协议, 特别是 HTTP/2 协议对修正还原指纹的影响.
本文的方法需要解决的关键技术难点主要有以下 3 点.
(1) 各层协议对音视频片段的封装和切分导致加密数据长度相对于原始明文长度的随机增加.
在传输过程中, 音视频数据依次经过应用层 HTTP 协议、TLS 协议、TCP 协议和 IP 协议的层层处理, 每层协
议都会给原有的音视频片段数据添加各自的协议头部, 并对音视频数据进行加密、压缩或填充处理, 因此在传输
过程中, 音视频片段数据的传输长度与原有长度相比会增加, 并且增加的长度与每次视频传输时的设备状态、网
络环境相关, 具有一定的随机性. 本文将在第 5 节分析各层协议对应用层数据单位的封装过程, 并给出对应的解决
方案.
(2) HTTP/2 协议对流特征的改变导致需要新的视频修正指纹构建方法.
HTTP/2 协议引入了首部压缩、服务器推送和多路复用等新功能以提高传输效率, 但是其中的首部压缩和多
路复用功能使得之前针对 HTTP/1.1 的视频修正指纹构建方法无法用于 HTTP/2 视频流量. 在 HTTP/1.1 中, 首部
数据的长度通常只分布在特定范围内, 而在 HTTP/2 中由于采用了首部压缩技术, 首部数据的长度分布出现了很
大的变化, 所以在流量分析方法中, 过滤首部数据时所采取的方式也会有所变化; 除了首部压缩之外, 多路复用也
是影响视频识别的主要因素, 直接导致了现有的针对 HTTP/1.1 的视频流分析方法无法适用于 HTTP/2 的视频流

456 457 458 459 460 461 462 463 464 465 466