Page 57 - 《武汉大学学报(信息科学版)》2025年第6期
P. 57

第 50 卷第 6 期              谢亚坤等:顾及小目标特征的无人机影像人员检测方法                                    1079


                1 方法                                            层特征的细节信息;在检测头部分,设计了一个
                                                                上下文感知模块(context-aware module,CAM),
                1.1 方法框架                                        综合目标周围的环境信息,丰富小目标的上下文

                    顾及小目标特征的无人机影像人员检测方                          特征,提高大视角下的人员检测精度。
                法框架如图 1 所示,包括特征提取、特征融合及                             如 图 1 所 示 ,输 入 单 个 无 人 机 影 像 ,首 先 提
                                                       [26]
                检 测 头 3 个 部 分 。 首 先 ,采 用 CSPDarkNet       进     取多层特征,其中特征映射的通道数 i={1,2,3,
                行 特 征 提 取 ,同 时 ,使 用 SPD-Conv    [27] 代 替 下 采    4},每 层 对 应 的 通 道 数 为{160,320,640,640},
                样层,以减少小目标特征丢失;在特征融合部分,                          H i=H/2 i+1  代 表 高 度 ,W i=W/2 i+1 代 表 宽 度 ;然
                设计了一个选择性特征融合(selective feature fu‑              后将多层特征自上而下通过 SFF 模块进行特征
                sion,SFF)模块,利用高层特征作为权重来引导                       融合;最后将融合后的特征通过 CAM 捕获上下
                低层特征中的重要信息,减轻低层特征中的背景                           文信息,得到最终分类和定位的特征,生成检测
                噪声干扰,更好地融合高层特征的语义信息和低                           框并进行后处理,得到最终输出。





















                                                      图 1 本文方法框架
                                             Fig.  1 Framework of the Proposed Method

                1.2 SPD-Conv                                    义信息,若直接利用低层特征进行检测,无法保
                    常用的图像特征提取过程多通过跨步卷积                          证检测的精度。因此,需要将多个尺度的特征融
                和池化操作,在目标大小适中时,跨步卷积和池                           合在一起,获得既有高级语义特征又有低层细节
                化操作忽略的那部分像素信息不会对模型性能                            特征的特征图。然而,在特征融合的过程中,无
                产生较大影响。然而,在小目标任务下,基于此                           人机影像的背景噪声特征也融合到特征金字塔
                种设计理念的卷积神经网络(convolutional neural               中 ,影 响 人 员 检 测 的 准 确 性 。 为 了 解 决 这 一 问
                network,CNN)会出现低细粒度信息丢失和模型                      题,本文设计了一个选择性特征融合模块,如图 2
                学 习 特 征 不 足 的 问 题 。 为 此 ,本 文 使 用 SPD-           所示。通过利用高层特征作为权重来引导低层
                Conv 替 代 跨 步 卷 积 与 池 化 操 作 。 SPD-Conv 由         特征中的重要信息,减轻低层特征中的背景噪声
                一个 SPD 层和一个非跨步卷积层构成,其中 SPD                      干扰,并更好地融合高层特征的语义信息和低层
                层使用一种图像转换技术对特征图进行下采样,                           特 征 的 细 节 信 息 ,以 提 高 小 目 标 人 员 的 检 测
                在通道维度中保留所有信息,确保无信息丢失;                           能力。
                每个 SPD 层后紧跟一个无步长卷积操作,无步长                            1)空间信息聚合。输入高层特征 F h 和低层
                卷积以逐元素卷积的方式在很大程度上保证不                            特征 F l,并利用转置卷积将高层特征的大小与低
                丢失图像特征。                                         层特征统一。在统一大小后的高层特征上,分别
                1.3 选择性特征融合                                     使用最大池化操作和平均池化操作聚合空间信
                    网络结构中高层特征具有较大的感受野和                          息,输出两个池化特征。最大池化操作选取每个
                丰富的语义信息,但会丢失几何细节信息,难以                           池 化 窗 口 内 的 最 大 值 ,以 强 调 图 像 中 的 显 著 特
                检测到小目标人员。相比之下,低层特征在很大                           征,有助于提取和突出小目标人员的关键特征;
                程度上保留了小目标人员的细节信息,但缺乏语                           平均池化操作通过计算每个池化窗口内特征值
   52   53   54   55   56   57   58   59   60   61   62