Page 133 - 《武汉大学学报(信息科学版)》2025年第10期
P. 133
2068 武 汉 大 学 学 报 (信 息 科 学 版) 2025 年 10 月
~ 1
的 质 量 评 估 分 数 需 要 代 入 S = β 1 ( -
2
1
̂
)+ β 4 S + β 5,其 中 β i ( i = 1,2,3,4,5 ) 为
e β 2 ( ŝ - β 3 ) ~
̂
回归系数, S 为原始的图像质量评估分数,S 为回
归操作的客观质量分数。
本 文 所 有 代 码 均 在 图 形 处 理 单 元(graphics
图 4 基于伪参考的图像质量评估模块 processing unit,GPU) 1080TI 服务器上进行训练
Fig. 4 Image Quality Assessment Module Based on
和 测 试 ,训 练 或 调 优 过 程 全 部 使 用 Adam 优 化
Pseudo Reference Image
器 [23] ,学 习 率 分 别 为 1×10 -3 和 1×10 ,并 在 第
-5
GAN 训练结束后,在自建数据集上调优时, 0.5 倍、0.25 倍总迭代轮数时退变成原来的 1/10;
使用 GAN 中的生成器网络 g ( ),对待测试的交通 所有数据集被随机分成两部分,80% 用于训练或
监控图像 I x 生成伪参考图 g ( I x ),评估 I x 的图像质 调优,20% 用于测试,保证这两部分图像内容独
量 为 s x|g ( x ) = r ( x,g ( x ) ),计 算 损 失 函 数 L = 立 。 对 于 质 量 评 估 模 块 ,输 入 图 片 大 小 统 一 为
∑ ‖s x|g ( x ) - s‖ 2。在调优过程中,固定生成器网 80 × 80 像素,首先预训练 GAN,然后在自建数据
2
集上调优,调优过程中,GAN 中的参数保持不变。
络 g ( )参数,更新质量评估网络 r ( ,)的参数。
超 参 数 选 择 为 α 1 = 0.5、 α 2 = 0.1 和 α 3 = 0.5。 生
2 图像质量评估实验与分析 成器的网络结构中编码器为 5 层下采样卷积神经
网络,解码器为 5 层上采样卷积神经网络,鉴别器
2.1 实验设置 模块包含残差神经网络(residual neural network,
数据集主要涉及自建质量评估数据集和一 ResNet) [24] 特 征 提 取 器 和 一 层 全 连 接 层 的 分 类
些用于神经网络模型的预训练公开数据集。自 器,特征提取器 ψ 为浅层的 ResNet。
建质量评估数据集由多个交通监控摄像头捕获 2.2 图像质量评估实验结果
的真实照片图像组成,累计 4 241 张图片,分辨率 本文比较了一些先进的无参考图像的图像
从 1 920×1 080 像 素 到 4 096×2 208 像 素 不 等 , 质量评估方法,例如 BRISQUE、NIQE、DBCNN、
MUSIQ、PAQ2PIQ、GraphIQA 和 NLNet-IQA。
每张图片包含多个目标和一个关键目标,并由 4
这些方法均使用官方提供的代码,首先在公开数
位经验丰富的专业标注人员对关键区域的图像
据集上预训练,再在交通监控场景下的数据集上
质量进行标注。LIVE 数据集 [17] 包含 779 张失真
调优。在调优时,将图像中的汽车前挡风玻璃区
图片,这些失真图片全部由 29 张参考图像加入
域缩放为统一尺寸作为模型的输入,结果如表 1
7~8 种退化程度和 5 种失真类型生成,图像质量
所 示 。 其 中 ,MUSIQ-AVA、MUSIQ-KONIQ、
分数为百分制(0~100),值越高则说明质量越低;
MUSIQ-PAQ2PIQ 和 MUSIQ-SPAQ 分 别 指
CID2013 数据集 [18] 包含 3 000 张失真图像,由 25
MUSIQ 在公开数据集 AVA、KONIQ、PAQ2PIQ
张参考图像在 5 种退化程度和 24 种失真类型下
(文献[11]中使用的数据集)、SPAQ 上预训练后,
生成。对于特定区域识别模块,车辆检测采用了
再迁移到监控场景下的质量评估结果,其他方法
基于 YOLOv4 [19] 的目标检测算法,特定区域检测
均 在 LIVE 和 CID2013 数 据 集 上 预 训 练 后 再
算法使用灰度调整、边缘轮廓检测和长宽比特征
迁移。
等方法,车牌识别使用 RPnet 算法 [20] ,车牌号匹配
由表 1 可知,本文方法的 SRCC 高于其他算
算法使用字符串匹配方法 [21] 。 法,PLCC 也处于最优水平。这可能是因为:(1)公
对于质量评估模块,使用两个常用的评估指 开数据集和交通监控图像数据集之间的差异较
标, 斯皮尔曼秩相关系数(Spearman’s rank corre‑ 大,作为无参考图像质量评估方法,其他方法依
lation coefficient , SRCC)和皮尔逊线性相关系数 赖从公开数据集学到的知识,而本文方法能生成
(Pearson correlation coefficient,PLCC) [22] ,前 者 伪参考图,通过与伪参考图的特征对比降低了对
用于评估预测的单调性,而后者描述了算法的客 从公开数据集学到的知识的依赖,更好地适应交
观评价分与人眼主观打分之间的相关性,用于评 通监控场景。(2)其他方法中的网络结构复杂,在
估预测的准确度。另外,在计算 PLCC 之前,预测 调 优 时 容 易 过 拟 合 或 陷 入 局 部 最 优 解 ,而 本 文

