Page 61 - 《武汉大学学报（信息科学版）》2025年第6期

P. 61

第 50 卷第 6 期谢亚坤等：顾及小目标特征的无人机影像人员检测方法 1083

图 4 检测结果对比
Fig. 4 Comparison of Detection Results

行对比，本文选择了表现最好的 3 种算法进行对尤其在第 3 组的较暗环境下，不存在误检和漏检
比分析。需要说明的是，所有算法皆没有通过任的情况。而在第 1 组中，Cascade R-CNN 算法和
何的迁移学习，而是直接在不同场景和天气情况 YOLOv8x 算法存在小目标人员漏检，Cascade
下进行人员检测实验。 R-CNN 算法和 FCOS 算法将自行车误检为人
图 5 展示了不同场景下的人员检测结果，其员；在第 2 组中，Cascade R-CNN 算法、FCOS 算
中场景一至场景四分别代表教学楼、图书馆、食法和 YOLOv8x 算法均存在小目标人员漏检；在
堂和宿舍楼。场景一中阳光极强，有树木及建第 3 组中，Cascade R-CNN 算法、FCOS 算法和
筑物产生的阴影，黑色衣服的人员易与阴影混 YOLOv8x 算法均将地砖误检为人员。这证明了
淆，同时小型的自行车也对人员检测产生了干本文方法在各种光线条件下的场景中均具有较
扰，Cascade R-CNN 算法和 YOLOv8x 算法存在强的泛化性。
漏检，Cascade R-CNN 算法和 FCOS 算法存在误 2.3.3 网络模块性能测试
检。场景二中存在极小的人员目标，且树干较本文方法包括多种模块和复杂结构，包括
多，远距离下干扰严重，Cascade R-CNN 算法和 SPD-Conv、SFF 和 CAM。为充分展示每个模块
FCOS 算法均存在漏检。场景三和场景四由于的作用，通过详细的消融实验进行了模块性能测
拍摄角度较大，导致对人员的特征表达能力更试，如表 2 所示。由表 2 可以看出，去除 SPD-
弱。场景三中将自行车误检为人员，存在小目 Conv 模块后，mAP 下降了 1.7%，P 下降了 0.5%，
标人员漏检；场景四中 Cascade R-CNN 算法和 R 下降了 3.8%，说明 SPD-Conv 模块可以减少小

YOLOv8x 算法将电动车误检为人员，YOLOv8x 目标特征的丢失，提高网络的特征提取能力。去
算法还存在人员漏检情况，而本文方法能够准除 SFF 模块后，mAP 下降了 1.1%，P 下降了
确地检测出无人机图像中的小目标人员信息。 0.2%，R 下降了 1.4%，证明 SFF 模块能够减轻低
考虑到场景和天气的复杂性，本文针对同一层特征中的背景噪声干扰，提高小目标人员的检
场景在不同明暗程度下的检测结果进行了分析，测能力。去除 CAM 模块后，mAP 下降了 1.3%，
结果如图 6 所示。由图 6 可以看出，本文方法能 P 下降了 0.6%，R 下降了 2.9%，表明 CAM 模块
够检测出明暗程度不同的场景中的小目标人员，能够丰富小目标的上下文特征。

56 57 58 59 60 61 62 63 64 65 66