Page 57 - 《武汉大学学报(信息科学版)》2025年第6期
P. 57
第 50 卷第 6 期 谢亚坤等:顾及小目标特征的无人机影像人员检测方法 1079
1 方法 层特征的细节信息;在检测头部分,设计了一个
上下文感知模块(context-aware module,CAM),
1.1 方法框架 综合目标周围的环境信息,丰富小目标的上下文
顾及小目标特征的无人机影像人员检测方 特征,提高大视角下的人员检测精度。
法框架如图 1 所示,包括特征提取、特征融合及 如 图 1 所 示 ,输 入 单 个 无 人 机 影 像 ,首 先 提
[26]
检 测 头 3 个 部 分 。 首 先 ,采 用 CSPDarkNet 进 取多层特征,其中特征映射的通道数 i={1,2,3,
行 特 征 提 取 ,同 时 ,使 用 SPD-Conv [27] 代 替 下 采 4},每 层 对 应 的 通 道 数 为{160,320,640,640},
样层,以减少小目标特征丢失;在特征融合部分, H i=H/2 i+1 代 表 高 度 ,W i=W/2 i+1 代 表 宽 度 ;然
设计了一个选择性特征融合(selective feature fu‑ 后将多层特征自上而下通过 SFF 模块进行特征
sion,SFF)模块,利用高层特征作为权重来引导 融合;最后将融合后的特征通过 CAM 捕获上下
低层特征中的重要信息,减轻低层特征中的背景 文信息,得到最终分类和定位的特征,生成检测
噪声干扰,更好地融合高层特征的语义信息和低 框并进行后处理,得到最终输出。
图 1 本文方法框架
Fig. 1 Framework of the Proposed Method
1.2 SPD-Conv 义信息,若直接利用低层特征进行检测,无法保
常用的图像特征提取过程多通过跨步卷积 证检测的精度。因此,需要将多个尺度的特征融
和池化操作,在目标大小适中时,跨步卷积和池 合在一起,获得既有高级语义特征又有低层细节
化操作忽略的那部分像素信息不会对模型性能 特征的特征图。然而,在特征融合的过程中,无
产生较大影响。然而,在小目标任务下,基于此 人机影像的背景噪声特征也融合到特征金字塔
种设计理念的卷积神经网络(convolutional neural 中 ,影 响 人 员 检 测 的 准 确 性 。 为 了 解 决 这 一 问
network,CNN)会出现低细粒度信息丢失和模型 题,本文设计了一个选择性特征融合模块,如图 2
学 习 特 征 不 足 的 问 题 。 为 此 ,本 文 使 用 SPD- 所示。通过利用高层特征作为权重来引导低层
Conv 替 代 跨 步 卷 积 与 池 化 操 作 。 SPD-Conv 由 特征中的重要信息,减轻低层特征中的背景噪声
一个 SPD 层和一个非跨步卷积层构成,其中 SPD 干扰,并更好地融合高层特征的语义信息和低层
层使用一种图像转换技术对特征图进行下采样, 特 征 的 细 节 信 息 ,以 提 高 小 目 标 人 员 的 检 测
在通道维度中保留所有信息,确保无信息丢失; 能力。
每个 SPD 层后紧跟一个无步长卷积操作,无步长 1)空间信息聚合。输入高层特征 F h 和低层
卷积以逐元素卷积的方式在很大程度上保证不 特征 F l,并利用转置卷积将高层特征的大小与低
丢失图像特征。 层特征统一。在统一大小后的高层特征上,分别
1.3 选择性特征融合 使用最大池化操作和平均池化操作聚合空间信
网络结构中高层特征具有较大的感受野和 息,输出两个池化特征。最大池化操作选取每个
丰富的语义信息,但会丢失几何细节信息,难以 池 化 窗 口 内 的 最 大 值 ,以 强 调 图 像 中 的 显 著 特
检测到小目标人员。相比之下,低层特征在很大 征,有助于提取和突出小目标人员的关键特征;
程度上保留了小目标人员的细节信息,但缺乏语 平均池化操作通过计算每个池化窗口内特征值