Page 350 - 《软件学报》2021年第10期
P. 350

3322                                 Journal of Software  软件学报 Vol.32, No.10, October 2021

                 共为 77 802 个.同时也采集了播放这些视频的密文数据实例,用以进行视频识别实验.图 11 是这 77 802 个 ADU
                 长度的概率密度函数(probability density function,简称 PDF).




















                                              Fig.11    PDF of Facebook ADU length
                                          图 11   Facebook 样本视频 ADU 长度概率密度

                    对于视频识别测试来说,277 个视频构成的指纹库远远不够.虽然我们无法得到 Facebook 的总体视频片段
                 长度分布,但是已经采集的 277 个视频包含了 77 802 个视频片段.因为视频片段的样本容量足够大,所以样本的
                 分布逼近总体分布.因此,我们可以基于图 11 所示的 77 802 个 ADU 长度 PDF,构建一个模拟的大型视频指纹库.
                    大型视频指纹库的构成分为 3 部分:(1)  真实采集的 277 个视频;(2)  以每个真实视频为基础分别模拟出
                 200 个模拟视频,构成了 55 400 个模拟视频,这些模拟视频与真实视频 ADU 个数一样,ADU 长度随机分布在其
                 对应的真实视频 ADU 长度[0.9,1.1]倍区间内;(3)  模拟产生了 150 000 个视频,这些模拟视频的 ADU 个数随机
                 分布在[30,930]范围内,ADU 的长度按照图 11 中的概率密度函数产生.最终产生的模拟指纹库中含有 205 677
                 个视频,87 523 677 个 ADU,平均每个视频 426 个 ADU,ADU 长度的均值为 70KB.
                    这样产生的模拟数据库有 3 个特点:(1)  保证真实的视频包含在其中;(2)  包含了较多与真实视频指纹非常
                 相近的视频指纹,因此可以用以检验是否会将指纹接近的视频混淆,在较为苛刻的情况下进行测试;(3)  视频的
                 ADU 长度是按照真实视频 ADU 长度的概率密度函数产生的,因此整个模拟视频指纹库的 ADU 长度分布与真
                 实的 Facebook 视频是一致的.
                    本文对视频的匹配方法是基于视频 ADU 长度和顺序进行的,模拟指纹库的 ADU 长度分布基于统计理论
                 原理接近真实指纹库,完全可以用于对本文的算法进行验证.
                 3.2   ADU匹配算法与匹配概率
                    单个 ADU 是构成视频指纹的基本元素,也是进行加密视频识别的基础.本节给出将 HHTF 方法应用于单个
                 ADU 匹配时的方法和匹配概率,并给出对比的 Reed 方法应用后的匹配算法和匹配概率.
                 3.2.1    HHTF 方法应用于单个 ADU 匹配算法及其匹配概率
                    根据第 2 节的结果,对符合要求的加密 ADU,HHTF 方法得到的长度复原值 ADU_R 与 ADU 明文的长度
                 ADU_F 是一致的,即获得的是确定性变量,所以在识别时使用的方法是 ADU_R 等于 ADU_F 视之为匹配.
                    匹配概率决定着匹配结果的准确性,匹配概率与数据库大小有着密切的关系,本节使用第 3.1 节构建的大
                 型指纹库进行分析.
                    HHTF 方法进行修正后得到的是确定性变量,假设修正后得到长度为 x,事件 A 为任意明文指纹长度和修正
                 值 x 匹配,事件 A 的概率记为 P(A),使用 HHTF 方法修正后发生事件 A 的概率记为
   345   346   347   348   349   350   351   352   353   354   355