Page 61 - 《武汉大学学报(信息科学版)》2025年第6期
P. 61

第 50 卷第 6 期              谢亚坤等:顾及小目标特征的无人机影像人员检测方法                                    1083








































                                                      图 4 检测结果对比
                                               Fig.  4 Comparison of Detection Results

                行对比,本文选择了表现最好的 3 种算法进行对                         尤其在第 3 组的较暗环境下,不存在误检和漏检
                比分析。需要说明的是,所有算法皆没有通过任                           的情况。而在第 1 组中,Cascade R-CNN 算法和
                何的迁移学习,而是直接在不同场景和天气情况                           YOLOv8x 算 法 存 在 小 目 标 人 员 漏 检 ,Cascade
                下进行人员检测实验。                                      R-CNN 算 法 和 FCOS 算 法 将 自 行 车 误 检 为 人
                    图 5 展示了不同场景下的人员检测结果,其                       员 ;在第 2 组中,Cascade R-CNN 算法、FCOS 算
                中场景一至场景四分别代表教学楼、图书馆、食                           法和 YOLOv8x 算法均存在小目标人员漏检;在
                堂 和 宿 舍 楼 。 场 景 一 中 阳 光 极 强 ,有 树 木 及 建          第 3 组 中 ,Cascade R-CNN 算 法 、FCOS 算 法 和
                筑 物 产 生 的 阴 影 ,黑 色 衣 服 的 人 员 易 与 阴 影 混          YOLOv8x 算法均将地砖误检为人员。这证明了
                淆 ,同 时 小 型 的 自 行 车 也 对 人 员 检 测 产 生 了 干          本文方法在各种光线条件下的场景中均具有较
                扰 ,Cascade R-CNN 算 法 和 YOLOv8x 算 法 存 在          强的泛化性。
                漏检,Cascade R-CNN 算法和 FCOS 算法存在误                 2.3.3 网络模块性能测试
                检 。 场 景 二 中 存 在 极 小 的 人 员 目 标 ,且 树 干 较              本 文 方 法 包 括 多 种 模 块 和 复 杂 结 构 ,包 括
                多,远距离下干扰严重,Cascade R-CNN 算法和                    SPD-Conv、SFF 和 CAM。为充分展示每个模块
                FCOS 算法均存在漏检。场景三和场景四由于                          的作用,通过详细的消融实验进行了模块性能测
                拍 摄 角 度 较 大 ,导 致 对 人 员 的 特 征 表 达 能 力 更          试 ,如 表 2 所 示 。 由 表 2 可 以 看 出 ,去 除 SPD-
                弱 。 场 景 三 中 将 自 行 车 误 检 为 人 员 ,存 在 小 目          Conv 模块后,mAP 下降了 1.7%,P 下降了 0.5%,
                标 人 员 漏 检 ;场 景 四 中 Cascade R-CNN 算 法 和          R 下降了 3.8%,说明 SPD-Conv 模块可以减少小

                YOLOv8x 算法将电动车误检为人员,YOLOv8x                     目标特征的丢失,提高网络的特征提取能力。去
                算 法 还 存 在 人 员 漏 检 情 况 ,而 本 文 方 法 能 够 准          除 SFF 模 块 后 ,mAP 下 降 了 1.1%,P 下 降 了
                确地检测出无人机图像中的小目标人员信息。                            0.2%,R 下降了 1.4%,证明 SFF 模块能够减轻低
                    考虑到场景和天气的复杂性,本文针对同一                         层特征中的背景噪声干扰,提高小目标人员的检
                场景在不同明暗程度下的检测结果进行了分析,                           测能力。去除 CAM 模块后,mAP 下降了 1.3%,
                结果如图 6 所示。由图 6 可以看出,本文方法能                       P 下降了 0.6%,R 下降了 2.9%,表明 CAM 模块
                够检测出明暗程度不同的场景中的小目标人员,                           能够丰富小目标的上下文特征。
   56   57   58   59   60   61   62   63   64   65   66