Page 55 - 《武汉大学学报(信息科学版)》2025年第6期
P. 55
第 50 卷 第 6 期 武 汉 大 学 学 报( 信 息 科 学 版 ) Vol.50 No.6
2025 年 6 月 Geomatics and Information Science of Wuhan University Jun. 2025
引文格式:谢亚坤,陈铭臻,赵耀纪,等 . 顾及小目标特征的无人机影像人员检测方法[J]. 武汉大学学报(信息科学版),2025,50
(6):1077-1087.DOI:10.13203/j.whugis20240368
Citation:XIE Yakun,CHEN Mingzhen,ZHAO Yaoji,et al.A Person Detection Method for UAV Imagery Considering Small Ob‑
ject Features[J]. Geomatics and Information Science of Wuhan University, 2025, 50(6): 1077-1087. DOI: 10.13203/j. whu‑
gis20240368
顾及小目标特征的无人机影像人员检测方法
谢亚坤 陈铭臻 赵耀纪 李雨霏 涂佳星 1
1
1
1
1
朱 军 朱 庆 1
1
1 西南交通大学地球科学与工程学院,四川 成都,611756
摘 要:利用无人机影像进行人员检测在应急救援与社会安全中具有重要意义,然而无人机影像中的人员目标较小且背
景复杂,导致人员检测精度较低。为解决这一问题,提出了一种顾及小目标特征的无人机影像人员检测网络。首先,在
特征提取阶段使用空间深度转换卷积代替下采样层,减少特征提取过程中的小目标特征丢失;然后,设计选择性特征融
合模块,以深层特征权重引导获取浅层特征图中的重点区域,减轻低层特征中的背景噪声干扰;最后,建立上下文感知模
块,综合多类型上下文信息,提高网络对于小目标人员的判别能力。为验证方法的有效性,在公开数据集上进行实验分
析,结果表明,所提方法的平均准确率为 68.9%,准确率为 75.5%,召回率为 67.7%,相较于经典的目标检测算法分别提升
了 3.1%~29.5%、0.9%~8.6%、1.0%~57.9%,表明所提方法具有较高的精度。此外,通过对不同场景、不同天气下的无
人机影像进行测试,进一步证明了所提方法的泛化性与适用性。
关键词:无人机影像;小目标;人员检测;选择性特征融合;上下文感知
中图分类号:P237 文献标识码:A 收稿日期:2024‑11‑20
DOI:10.13203/j.whugis20240368 文章编号:1671‑8860(2025)06‑1077‑11
A Person Detection Method for UAV Imagery Considering Small
Object Features
1
1
XIE Yakun CHEN Mingzhen ZHAO Yaoji LI Yufei TU Jiaxing 1
1
1
1
ZHU Jun ZHU Qing 1
1 Faculty of Geosciences and Engineering, Southwest Jiaotong University, Chengdu 611756, China
Abstract: Objectives: The rapid development of unmanned aerial vehicle (UAV) remote sensing technolo‑
gy is leading to an increased role for devices in the emergency search and rescue operations and the law en‑
forcement tracking. The unique advantages of UAV include rapid response, wide-area coverage, and
panoramic view. The utilization of UAV imagery for person detection is of paramount importance in the
context of emergency rescue and social security. However, due to the small and complex background of
person in UAV imagery, the high-precision person detection task still presents a significant challenge.
Methods: To address the aforementioned issue, a person detection network for UAV imagery is proposed.
First, the proposed network employs a spatial depth-transformed convolution in lieu of a down sampling
layer in the feature extraction stage. This approach ensures the retention of all information in the channel di‑
mensions, preventing information loss and facilitating the preservation of small object features throughout
the feature extraction process. Then, a selective feature fusion module is designed to address the issue of
noise interference. This module employs high-level features as weights to guide the crucial information in
基金项目:国家自然科学基金(42301473, 42271424, 42171397);中国博士后创新人才支持计划(BX20230299);中国博士后科学基金
(2023M742884);四川省自然科学基金(24NSFSC2264);四川省重点研发项目(24ZDYF0633)。
第一作者:谢亚坤,博士,副教授,研究方向为灾害信息智能感知与数字孪生建模。yakunxie@163.com
通信作者:朱军, 博士,教授。zhujun@swjtu.edu.cn