Page 61 - 《武汉大学学报(信息科学版)》2025年第6期
P. 61
第 50 卷第 6 期 谢亚坤等:顾及小目标特征的无人机影像人员检测方法 1083
图 4 检测结果对比
Fig. 4 Comparison of Detection Results
行对比,本文选择了表现最好的 3 种算法进行对 尤其在第 3 组的较暗环境下,不存在误检和漏检
比分析。需要说明的是,所有算法皆没有通过任 的情况。而在第 1 组中,Cascade R-CNN 算法和
何的迁移学习,而是直接在不同场景和天气情况 YOLOv8x 算 法 存 在 小 目 标 人 员 漏 检 ,Cascade
下进行人员检测实验。 R-CNN 算 法 和 FCOS 算 法 将 自 行 车 误 检 为 人
图 5 展示了不同场景下的人员检测结果,其 员 ;在第 2 组中,Cascade R-CNN 算法、FCOS 算
中场景一至场景四分别代表教学楼、图书馆、食 法和 YOLOv8x 算法均存在小目标人员漏检;在
堂 和 宿 舍 楼 。 场 景 一 中 阳 光 极 强 ,有 树 木 及 建 第 3 组 中 ,Cascade R-CNN 算 法 、FCOS 算 法 和
筑 物 产 生 的 阴 影 ,黑 色 衣 服 的 人 员 易 与 阴 影 混 YOLOv8x 算法均将地砖误检为人员。这证明了
淆 ,同 时 小 型 的 自 行 车 也 对 人 员 检 测 产 生 了 干 本文方法在各种光线条件下的场景中均具有较
扰 ,Cascade R-CNN 算 法 和 YOLOv8x 算 法 存 在 强的泛化性。
漏检,Cascade R-CNN 算法和 FCOS 算法存在误 2.3.3 网络模块性能测试
检 。 场 景 二 中 存 在 极 小 的 人 员 目 标 ,且 树 干 较 本 文 方 法 包 括 多 种 模 块 和 复 杂 结 构 ,包 括
多,远距离下干扰严重,Cascade R-CNN 算法和 SPD-Conv、SFF 和 CAM。为充分展示每个模块
FCOS 算法均存在漏检。场景三和场景四由于 的作用,通过详细的消融实验进行了模块性能测
拍 摄 角 度 较 大 ,导 致 对 人 员 的 特 征 表 达 能 力 更 试 ,如 表 2 所 示 。 由 表 2 可 以 看 出 ,去 除 SPD-
弱 。 场 景 三 中 将 自 行 车 误 检 为 人 员 ,存 在 小 目 Conv 模块后,mAP 下降了 1.7%,P 下降了 0.5%,
标 人 员 漏 检 ;场 景 四 中 Cascade R-CNN 算 法 和 R 下降了 3.8%,说明 SPD-Conv 模块可以减少小
YOLOv8x 算法将电动车误检为人员,YOLOv8x 目标特征的丢失,提高网络的特征提取能力。去
算 法 还 存 在 人 员 漏 检 情 况 ,而 本 文 方 法 能 够 准 除 SFF 模 块 后 ,mAP 下 降 了 1.1%,P 下 降 了
确地检测出无人机图像中的小目标人员信息。 0.2%,R 下降了 1.4%,证明 SFF 模块能够减轻低
考虑到场景和天气的复杂性,本文针对同一 层特征中的背景噪声干扰,提高小目标人员的检
场景在不同明暗程度下的检测结果进行了分析, 测能力。去除 CAM 模块后,mAP 下降了 1.3%,
结果如图 6 所示。由图 6 可以看出,本文方法能 P 下降了 0.6%,R 下降了 2.9%,表明 CAM 模块
够检测出明暗程度不同的场景中的小目标人员, 能够丰富小目标的上下文特征。