Page 56 - 《武汉大学学报(信息科学版)》2025年第6期
P. 56

1078                            武 汉 大 学 学 报  (信 息 科 学 版)                        2025 年 6 月

                low-level features, thereby mitigating the impact of background noise on the latter. Furthermore, it facili‑
                tates a more comprehensive integration of the semantic information of high-level features and the detailed
                information of low-level features. This integration significantly enhances the capacity of network to distin‑
                guish between background and foreground information in UAV images. Finally, a context-aware module is
                designed to address the issue of limited feature information associated with small objects. This module inte‑
                grates environmental information surrounding the object, including local features, contextual information,
                and global context, thus enhancing the contextual features of small objects and improving the final object
                detection accuracy. Results: To verify the effectiveness of the proposed method, case experiment analysis
                is conducted on public datasets. The proposed method achieves mean average precision (mAP) of 68.9%,
                with precision of 75.5% and recall of 67.7%. Compared to the conventional object detection algorithms,
                the proposed method shows improvements ranging from 3.1% to 29.5% in mAP, from 0.9% to 8.6% in
                precision, and from 1.0% to 57.9% in recall. The results indicate that the proposed method exhibits a high
                level of accuracy. Additionally, the generalization and applicability are confirmed through testing on UAV
                images in various scenarios and under different weather conditions. Conclusions: The proposed method can
                effectively  solve  the  challenge  of  detecting  small  persons  in  UAV  images  and  significantly  improve  the
                detection accuracy. It has a wide range of application prospects in the fields of emergency rescue and social
                security,  and  possesses  good  generalization  ability  for  UAV  image  detection  tasks  in  different  environ‑
                ments.
                Key words: UAV imagery; small object; person detection; selective feature fusion; context-aware


                     随 着 无 人 机 遥 感 技 术 的 快 速 发 展 ,其 凭 借          测 结 果 。 单 阶 段 检 测 算 法 ,如 SSD      [15] 和 YO‑
                快 速 响 应 、广 域 覆 盖 和 全 景 视 角 等 独 特 优 势 ,           LO [16] ,能 够 直 接 对 目 标 进 行 定 位 ,输 出 目 标 的
                在 紧 急 搜 救 和 执 法 追 踪 等 领 域 正 发 挥 着 日 益            类 别 检 测 信 息 。 小 目 标 由 于 占 比 面 积 小 、分 辨
                重 要 的 作 用  [1-4] 。 通 过 将 无 人 机 技 术 与 先 进 的       率低、可用特征少,其检测精度相比大中目标有
                人 员 检 测 算 法 相 结 合 ,能 够 在 复 杂 多 变 的 环 境           所下降。因此,学者们提出了多种改进方案,文
                中 实 时 获 取 精 确 的 感 知 数 据 。 在 自 然 灾 害 发            献[17-19]利用多尺度特征融合以保留更多小目
                生 后 的 搜 救 行 动 中 ,无 人 机 能 够 迅 速 覆 盖 整 个           标特征 ;文献[20-21]通过上下文学习来更好地
                灾区,及时发现并定位被困人员的位置                    [5-6] 。同
                                                                 理解小目标与周围环境的关系 ;文献[22-23]采
                样 ,在 执 法 行 动 中 ,无 人 机 展 现 出 高 效 追 踪 逃
                                                                 用 注 意 力 机 制 以 提 高 对 小 目 标 的 关 注 ;文 献
                犯 或 失 踪 人 员 的 能 力 ,极 大 地 增 强 了 执 法 部 门
                                                                [24-25]通过超分辨率技术解决小目标特征不足
                的监控与应对能力          [7] 。这不仅显著提升了任务
                                                                 的 问 题 。 与 其 他 视 角 相 比 ,无 人 机 视 角 下 的 广
                执 行 的 效 率 和 准 确 性 ,还 有 效 降 低 了 人 力 成 本
                                                                 阔 视 场 提 供 了 丰 富 的 信 息 ,但 也 伴 随 着 更 为 复
                和 操 作 风 险 ,因 此 ,高 效 的 无 人 机 人 员 检 测 技
                                                                 杂 的 背 景 和 更 多 噪 声 的 干 扰 。 同 时 ,无 人 机 影
                术 对 于 加 强 公 共 安 全 和 提 升 应 急 救 援 能 力 具
                                                                 像 中 的 目 标 尺 度 变 化 大 ,且 小 目 标 的 比 例 远 高
                有重要意义。
                                                                 于自然场景图像。
                     人员检测由于其应用的广泛性已成为计算
                                                                     针对上述问题,本文提出面向小目标的无人
                机 视 觉 领 域 中 的 一 个 重 要 研 究 方 向     [8-10] 。 传 统
                                                                 机 影 像 人 员 检 测 方 法 ,利 用 空 间 深 度 转 换 卷 积
                的 人 员 检 测 方 法 如 方 向 梯 度 直 方 图(histogram
                of  oriented  gradient,  HOG) [11] 和 支 持 向 量 机  (space-to-depth  convolution,SPD-Conv)提 高 检
                (support vector machine,SVM) [12] ,首 先 通 过 手     测过程中对于小目标的保持能力,设计选择性特
                工 设 计 特 征 描 述 算 子 提 取 图 像 特 征 ,然 后 通 过           征融合模块,更好地融合高层特征的语义信息和
                分类器检索图像内的人员目标。基于深度学习                             低层特征的细节信息,提高对于背景的抗干扰能
                的人员检测算法可以分为两阶段和单阶段检测                             力,通过上下文感知模块综合局部、全局及周围
                算 法 。 两 阶 段 检 测 算 法 ,如 Faster R-CNN    [13] 和    上下文,增强网络对于小目标人员的特征提取能
                Cascade R-CNN  [14] ,先 通 过 区 域 提 议 网 络 选 取       力,提升无人机影像小目标人员检测的准确性与
                生 成 候 选 区 域 ,再 对 其 进 行 分 类 和 回 归 得 到 检           泛化性。
   51   52   53   54   55   56   57   58   59   60   61