Page 340 - 《软件学报》2021年第10期
P. 340

3312                                 Journal of Software  软件学报 Vol.32, No.10, October 2021

                        算法应用于大型视频指纹库的可行性,也没有文献对方法应用于大型指纹库的可行性进行理论探讨.
                        因此,即使已经有了一些初步的探索成果,在大型指纹库场景中的加密视频识别仍然是空白,这也是国
                        家网络安全建设中亟待解决的问题.
                    针对上述问题,本文对加密视频识别的关键问题进行研究,主要成果包括:
                    (1)  针对加密视频识别中的待匹配数据源进行研究,深入研究 TLS 数据加密传输中数据偏移的基本原理,
                        首次将 HTTP 头部特征和 TLS 片段特征作为 ADU 长度复原的拟合特征,提出了一个将 ADU 加密传
                        输长度精准还原出明文长度的方法 HHTF(http head & TLS fragmentation),该方法适用于多个视频服
                        务平台的 ADU 长度精确还原;
                    (2)  给出了使用 HHTF 方法复原 ADU 长度后,在大型视频指纹库中识别加密传输视频的方法,从理论上
                        计算了加密视频识别方法的准确率、查准率、查全率和假阳率,并通过在大型测试数据库的实验,验
                        证了将 HHTF 方法应用于 20 万级 Facebook 指纹库的加密视频识别效果,只需要 3 个连续的 ADU,
                        就可以达到准确率、查准率、查全率都为 100%,假阳率为 0 的指标要求.
                    本文第 1 节介绍加密视频识别的基本方法和国内外相关工作.第 2 节给出 ADU 长度精准复原方法 HHTF
                 及其适用范围.第 3 节给出使用 HHTF 方法后在大型视频指纹库中进行加密视频识别的方法,从理论和实验两
                 个方面给出方法的准确率、查准率、查全率和假阳率评估结果,根据评估结果推断出:使用 HHTF 方法,只需要
                 3 个连续 ADU 就可以在 20 万级 Facebook 视频指纹库中识别出视频.最后,给出本文的结论并展望未来的工作.
                 1    相关工作与本文的研究内容


                 1.1   加密视频识别基本原理
                    目前,国外主要的视频分享服务商,如 YouTube、Netflix,主要社交网站如 Facebook,都对其提供的视频服务
                 采用了加密传输.国内的视频服务商虽然在用户认证环节已经使用了加密传输,但是视频数据传输还是明文传
                 输.因此,对加密视频的识别研究都是围绕国外视频服务平台进行的.
                    因为无法利用加密视频应用层的内容特征,对加密视频的识别主要的可利用特征是 ADU 的长度特征和传
                 输顺序.现有的加密视频分发平台都使用了 HTTP 自适应流媒体技术(HTTP adaptive  streaming,简称 HAS),如
                 MPEG 与 3GPP 提出的基于 HTTP 的动态自适应流媒体技术 DASH(dynamic adaptive streaming over HTTP)        [27]
                 以及苹果公司的 HLS(HTTP live streaming)  [28] 方案.为了使得视频能够在播放过程中进行自适应切换,这些技术
                 都是将视频文件按照视频的等长播放时间切成一系列的视频 ADU,以便客户端根据传输环境选择下载不同分
                 辨率的视频.这些被切片的视频 ADU 播放时长是固定的,由于视频内容的不同,按序切分的 ADU 数据长度不一
                 样,这样的顺序和长度就构成了一个视频的明文指纹.在实际传输时,由于应用数据被 HTTP 协议和 TLS
                 (transport layer security)协议封装,传输数据量要比明文数据量略大,构成了传输指纹.图 1 即为 Facebook 视频
                 “Avenger4:Endgame”分辨率为 360P 的明文指纹和传输指纹.
                    这些视频片段在用户观看视频时是按序传输的.图 2 所示为使用 DASH 传输机制的示意图,客户端首先获
                 取视频描述文件(media presentation description,简称 MPD),解析后发起 HTTP 请求,每次请求的内容为 1 个视频
                 ADU,通过按序请求视频 ADU 可以在视频播放器完成播放.这些视频 ADU 在播放过程传输的 ADU 长度和传
                 输顺序可以构成一个视频的传输指纹.
                    加密视频的识别过程就是将已知的视频明文指纹与视频播放过程中的加密传输指纹 ADU 进行匹配,由于
                 加密协议封装会导致 ADU 长度变化,不同内容的 ADU 加密后也可能具有相同的长度,这导致匹配结果是有误
                 差的.因此需要给出匹配算法的评估指标,若匹配算法的评估指标在允许范围内,则可认为加密传输的视频就是
                 已知的视频.
                    但是,观看过程可能会发生分辨率自适应切换事件和用户手动改变播放进度事件,因为同一个视频不同分
                 辨率的指纹是不一样的,切换分辨率就改变了明文指纹,同样,改变播放进度也会导致视频的 ADU 不按顺序传
                 输,对应的明文指纹发生了变化.这些情况导致在现实中明文指纹和传输指纹很难全程匹配,这些情况下只有局
   335   336   337   338   339   340   341   342   343   344   345