Page 290 - 《软件学报》2020年第11期
P. 290

宋传鸣  等:采用自适应缩放系数优化的块匹配运动估计                                                      3605


                        阶,尤其适用较大搜索窗口下的块匹配运动估计.
                    (7)  基于块分类的运动估计:以运动补偿帧的编码率失真性能为度量指标,将当前帧的各个待匹配宏块划
                        分为具有不同运动特性的宏块类,并为每个宏块类选取最优的运动估计/补偿算法,有助于在保证整
                        体率失真性能的前提下,降低运动估计的软硬件开销,如文献[1,24]等.
                    一方面,  尽管上述 7 类改进策略在一定程度上缓解了运动估计环节计算复杂度过高的不足,可是这些改进
                 方法却是以牺牲运动估计/补偿质量作为代价的.具体来讲,第(1)类~第(3)类和第(7)类策略仅考察待预测块的某
                 个像素子集的运动补偿误差,第(4)类和第(5)类策略则降低了像素表示和运算的精度,均会不可避免地使运动估
                 计陷入局部最优;而第(6)类策略的性能依赖于散列函数的设计,且需要较大的缓存空间.另一方面,块平移模型
                 既无法有效预测前景物体的非刚性运动、物体与摄像机相对运动产生的复合运动以及 3D 场景空间向 2D 成像
                 平面的几何投影变换,又不能有效逼近具有复杂边缘轮廓的运动区域,以致在运动物体的边缘、轮廓周围产生
                 大量幅值很高的补偿误差,不可避免地影响后续的变换编码和熵编码环节的效率                             [25,26] .于是,便有一些工作尝试
                 将高阶运动模型引入运动估计           [27,28] 来刻画复杂运动场.然而,用来编码高阶运动向量的码流开销、插值多个变
                 形参考帧(warped reference frame)的计算开销和存储变形参考帧的缓存开销随之增加,并且高阶运动参数的求
                 解算法尚存在计算量高、收敛不稳定的问题.在这种情况下,目前较为切实可行的一种帧间预测方案并非是直
                 接采用高阶模型进行运动补偿,而是在平移模型的基础上,借鉴高阶模型刻画复杂运动的思想来优化传统块匹
                 配运动估计.
                    因此,本文首先讨论现有高阶运动模型的优缺点,引出缩放运动模型的主要解决思路;然后,通过实验统计
                 发现,在标准测试视频中约有 56.21%的宏块包含缩放运动,得出了缩放运动是除平移运动以外、最主要运动形
                 式的结论;进而借助双线性插值,在平移模型中引进缩放系数,将基于平移模型的块匹配运动补偿误差建模为该
                 缩放系数的一元二次函数,并由韦达定理来预测最佳缩放系数;最后,提出一种采用自适应缩放系数优化的快速
                 块匹配运动估计算法.实验结果验证了本文算法的有效性.

                 1    相关工作

                    为更加有效地预测视频场景和前景物体的非刚体运动,研究人员进一步引进了仿射变换和射影几何变换,
                 利用 1 个或多个参考帧的几何形变完成运动补偿,提出了基于高阶运动模型的运动估计算法,从而克服平移运
                 动模型的不足.依据几何变换基底的不同,现有的高阶运动估计算法大致可被分为 4 类                            [5,20] :基于网格表示的运
                 动估计  [29−35] 、基于多项式函数的运动估计        [36−43] 、基于弹性变换的运动估计       [28,44−47] 和基于缩放变换的运动估
                 计 [48−50] .其中,网格模型和多项式模型较适用全局运动估计/补偿,弹性模型和缩放运动模型则更适用局部运动
                 估计/补偿.而弹性运动模型的计算复杂度较高,且与块平移模型相结合时,将引入 4 倍数量的运动向量.由仿射
                 变换的性质可知      [51] ,平移和缩放是平面仿射坐标系下的基本运动形式.虽然缩放模型不能描述错切运动和摇摄
                 产生的刚性旋转,但后者在自然视频中所占比例很小,3D 错切则更为鲜见.故此,考虑到缩放运动是自然视频中
                 最广泛的运动形式,利用缩放模型来优化块匹配运动估计是比较理想的选择,能够有效预测更丰富的物体运动.
                    若按照运动形式来分类,关于缩放运动估计的研究可分为全局运动估计和局部运动估计两大类.其中:前者
                 大多作为仿射模型中的一项(如文献[39,40,52]等),用于多参考帧的运动补偿,其目的是对摄像机的拉摄和推摄
                 运动进行预测;后者则与块匹配运动估计相结合,用来处理摄像机与前景物体的局部相对运动.本文工作亦将精
                 力集中于此,下面简要分析此类方法的相关研究.
                    若依据参数求解方法来分类,目前基于缩放模型的块匹配运动估计大致包括两个方面.
                    •   首先,以隐式方式计算缩放系数,无需向解码端传输同步信息,可直接与视频编码标准结合.文献[48]将
                        参考帧进行不同比例的缩放,建立一个包含 23 个等级的缩放参考帧集合,再在该集合上利用典型的多
                        参考帧运动估计展开块匹配运动补偿,从而将平均峰值信噪比(peak signal-to-noise ratio,简称 PSNR)提
                        高了 1.69dB~2.34dB.但是该方法无疑将编码的时间、空间复杂度均提高了数十倍.尽管文献[48]进一
                        步采用 6-抽头有限响应滤波器和双线性插值将参考帧放大 64 倍以内,并将缩放比例减少到 5 级,再利
   285   286   287   288   289   290   291   292   293   294   295