Page 56 - 《武汉大学学报(信息科学版)》2025年第6期
P. 56
1078 武 汉 大 学 学 报 (信 息 科 学 版) 2025 年 6 月
low-level features, thereby mitigating the impact of background noise on the latter. Furthermore, it facili‑
tates a more comprehensive integration of the semantic information of high-level features and the detailed
information of low-level features. This integration significantly enhances the capacity of network to distin‑
guish between background and foreground information in UAV images. Finally, a context-aware module is
designed to address the issue of limited feature information associated with small objects. This module inte‑
grates environmental information surrounding the object, including local features, contextual information,
and global context, thus enhancing the contextual features of small objects and improving the final object
detection accuracy. Results: To verify the effectiveness of the proposed method, case experiment analysis
is conducted on public datasets. The proposed method achieves mean average precision (mAP) of 68.9%,
with precision of 75.5% and recall of 67.7%. Compared to the conventional object detection algorithms,
the proposed method shows improvements ranging from 3.1% to 29.5% in mAP, from 0.9% to 8.6% in
precision, and from 1.0% to 57.9% in recall. The results indicate that the proposed method exhibits a high
level of accuracy. Additionally, the generalization and applicability are confirmed through testing on UAV
images in various scenarios and under different weather conditions. Conclusions: The proposed method can
effectively solve the challenge of detecting small persons in UAV images and significantly improve the
detection accuracy. It has a wide range of application prospects in the fields of emergency rescue and social
security, and possesses good generalization ability for UAV image detection tasks in different environ‑
ments.
Key words: UAV imagery; small object; person detection; selective feature fusion; context-aware
随 着 无 人 机 遥 感 技 术 的 快 速 发 展 ,其 凭 借 测 结 果 。 单 阶 段 检 测 算 法 ,如 SSD [15] 和 YO‑
快 速 响 应 、广 域 覆 盖 和 全 景 视 角 等 独 特 优 势 , LO [16] ,能 够 直 接 对 目 标 进 行 定 位 ,输 出 目 标 的
在 紧 急 搜 救 和 执 法 追 踪 等 领 域 正 发 挥 着 日 益 类 别 检 测 信 息 。 小 目 标 由 于 占 比 面 积 小 、分 辨
重 要 的 作 用 [1-4] 。 通 过 将 无 人 机 技 术 与 先 进 的 率低、可用特征少,其检测精度相比大中目标有
人 员 检 测 算 法 相 结 合 ,能 够 在 复 杂 多 变 的 环 境 所下降。因此,学者们提出了多种改进方案,文
中 实 时 获 取 精 确 的 感 知 数 据 。 在 自 然 灾 害 发 献[17-19]利用多尺度特征融合以保留更多小目
生 后 的 搜 救 行 动 中 ,无 人 机 能 够 迅 速 覆 盖 整 个 标特征 ;文献[20-21]通过上下文学习来更好地
灾区,及时发现并定位被困人员的位置 [5-6] 。同
理解小目标与周围环境的关系 ;文献[22-23]采
样 ,在 执 法 行 动 中 ,无 人 机 展 现 出 高 效 追 踪 逃
用 注 意 力 机 制 以 提 高 对 小 目 标 的 关 注 ;文 献
犯 或 失 踪 人 员 的 能 力 ,极 大 地 增 强 了 执 法 部 门
[24-25]通过超分辨率技术解决小目标特征不足
的监控与应对能力 [7] 。这不仅显著提升了任务
的 问 题 。 与 其 他 视 角 相 比 ,无 人 机 视 角 下 的 广
执 行 的 效 率 和 准 确 性 ,还 有 效 降 低 了 人 力 成 本
阔 视 场 提 供 了 丰 富 的 信 息 ,但 也 伴 随 着 更 为 复
和 操 作 风 险 ,因 此 ,高 效 的 无 人 机 人 员 检 测 技
杂 的 背 景 和 更 多 噪 声 的 干 扰 。 同 时 ,无 人 机 影
术 对 于 加 强 公 共 安 全 和 提 升 应 急 救 援 能 力 具
像 中 的 目 标 尺 度 变 化 大 ,且 小 目 标 的 比 例 远 高
有重要意义。
于自然场景图像。
人员检测由于其应用的广泛性已成为计算
针对上述问题,本文提出面向小目标的无人
机 视 觉 领 域 中 的 一 个 重 要 研 究 方 向 [8-10] 。 传 统
机 影 像 人 员 检 测 方 法 ,利 用 空 间 深 度 转 换 卷 积
的 人 员 检 测 方 法 如 方 向 梯 度 直 方 图(histogram
of oriented gradient, HOG) [11] 和 支 持 向 量 机 (space-to-depth convolution,SPD-Conv)提 高 检
(support vector machine,SVM) [12] ,首 先 通 过 手 测过程中对于小目标的保持能力,设计选择性特
工 设 计 特 征 描 述 算 子 提 取 图 像 特 征 ,然 后 通 过 征融合模块,更好地融合高层特征的语义信息和
分类器检索图像内的人员目标。基于深度学习 低层特征的细节信息,提高对于背景的抗干扰能
的人员检测算法可以分为两阶段和单阶段检测 力,通过上下文感知模块综合局部、全局及周围
算 法 。 两 阶 段 检 测 算 法 ,如 Faster R-CNN [13] 和 上下文,增强网络对于小目标人员的特征提取能
Cascade R-CNN [14] ,先 通 过 区 域 提 议 网 络 选 取 力,提升无人机影像小目标人员检测的准确性与
生 成 候 选 区 域 ,再 对 其 进 行 分 类 和 回 归 得 到 检 泛化性。