Page 473 - 《软件学报》2025年第7期
P. 473
3394 软件学报 2025 年第 36 卷第 7 期
模型的构建需要根据加密视频识别的实际场景计算模型的相关参数. 隐马尔可夫模型主要包括 2 个状态集合
和 3 个转移概率矩阵, 共 5 个参数:
λ = (O,S,A,B,π) (8)
根据实际视频播放场景的特点和隐马尔可夫模型的需要, 对加密视频识别场景下的隐马尔可夫模型中的参数
做出如下定义和计算.
O O = {O 1 ,O 2 ,O 3 ,...,O N } 为可观测状态序列, 也称输出状态序列, 在加密视频识别的场景
(1) 可观测状态集合 :
中, 为待识别加密视频的修正指纹的各分片的集合, 即每个修正指纹分片为一个输出状态.
S S = {S 1 ,S 2 ,S 3 ,...,S N } 为隐含状态的集合, 在加密视频识别的场景中, 隐含状态即为加密
(2) 隐含状态集合 :
视频所对应的可能明文指纹分片, 即 S 为通过第 5.1 节动态滑动窗口匹配算法匹配到的各修正指纹分片所对应的
各视频明文指纹序列片段的集合.
(3) 状态转移矩阵 : a i j = P(S j |S i ) 表示在隐马尔可夫模型中从前
A A = (a i j ) 为隐含状态概率转移矩阵, 转移概率
一个状态 S i 进入当前状态 S j 的概率为 P(S j |S i ), 在本文加密视频识别的场景中, 隐含状态为视频明文指纹分片, 隐
含状态之间的转移概率即为明文指纹分片对应的各视频片段在视频播放时的切换概率.
由于视频播放遵循一定的连续性, 视频明文指纹序列分片作为隐含状态, 也必然遵循一定的连续性, 因此可以
根据视频播放的连续性来设定不同隐含状态之间的转移概率. 例如: 不同视频的明文指纹序列分片之间的转移概
率可以设定为 0, 因为通过 TCP 连接下载一个视频时不会在同一连接下载其他视频的片段数据; 在视频播放过程
中下载过的视频数据不会再重复下载, 也不会逆序下载, 所以这类分片之间的转移概率也可以设定为 0, 为保证整
体联合概率的计算, 本文将转移概率为 0 替换为转移概率为一个极小值; 同一视频的符合传输下载顺序的明文指
纹序列分片之间的转移概率可以通过公式 (9) 计算.
0.6, S t 和S t−1 属于同一个明文指纹, 且序号连续
S t 和S t−1 属于不同明文指纹, 但序号连续
0.2,
P(S t |S t−1 ) = (9)
n
S t 和S t−1 序号不连续, 但符合下载时序关系
0.2× ,
N −1
其中, n 为 S t 中包含的视频片段的个数, N 为 S t−1 可转移的状态的个数.
(4) 发射概率矩阵 : b i j = P(O i |S j ) 表示在 t 时刻,
B B = (b ij ) 为观测状态输出概率矩阵, 也称发射概率矩阵, 其中,
隐含状态为 S j 的条件下, 可观测状态为 O i 的概率. 在本文识别场景中, 发射概率即为修正指纹分片和明文指纹分
片组合的匹配概率.
π π = (π i ) 为初始状态概率矩阵,
(5) 初始状态矩阵 : π i = P(S j ) 表示隐含状态在初始时刻 t=1 时的状态概率为
S j . 因为本研究主要关注最优隐含状态序列的寻找, 即找到一个加密视频修正指纹序列所对应的视频明文指纹序
列, 为了简化计算, 这里将初始状态矩阵 π 设置为常数矩阵, 而主要关注隐含状态之间的转移概率的计算.
有了以上 2 个状态集合和 3 个概率转移矩阵就能构建出隐马尔可夫模型——篱笆网络 (如图 14 所示), 后续
可以使用解决隐马尔可夫模型解码问题最常用的维特比算法求解模型, 从而求解出加密视频修正指纹所对应的视
频明文指纹序列, 识别加密视频.
本节所构建的加密视频识别模型能够解决视频分辨率自适应切换带来的问题. 这是因为在使用维特比算法的
动态规划思想求解隐马尔可夫模型的过程中, 视频分辨率的切换在指纹上表现为在不同明文指纹分片之间的切
换, 在隐马尔可夫模型中表现为前后不同隐含状态之间的转移, 因而可将隐马尔可夫模型中的隐含状态看作视频
明文指纹分片, 将视频分辨率切换时的明文指纹分片之间的切换看作模型中隐含状态之间的转移, 将明文指纹分
片间的切换概率看作隐含状态之间的转移概率, 即可将视频播放过程中的分辨率切换事件完全看作隐马尔可夫模
型中的隐含状态的转移事件. 利用维特比算法的动态规划思想在篱笆网络中寻找最短路径的过程, 如图 14 中加粗
路径所示, 主要依据转移概率和发射概率在图中寻找联合概率最大的子路径, 在视频指纹层面, 可以理解为在不同
明文指纹分片中寻找概率最大的组合指纹的过程, 这个由不同明文指纹分片组成的组合指纹即为分辨率切换的加

