Page 59 - 《武汉大学学报（信息科学版）》2025年第6期

P. 59

第 50 卷第 6 期谢亚坤等：顾及小目标特征的无人机影像人员检测方法 1081

malization， BN）和参数化线性单元（parametric 的加工，以增强小目标人员的特征表示能力。联
rectified linear unit， PReLU）等操作进行进一步合特征获取可表示为：
F joint = PReLU ( BN ( Conv 3 × 3 ( Conv 1 × 1 ( X ) ) ⊕DilatedConv( Conv 1 × 1 ( X ) ) ) ) （6）
式中，X 为输入特征；F joint 为联合特征；Conv n×n 表征表达。而全局上下文特征则通过 GAP 和
示 n×n 卷积；DilatedConv 表示扩张卷积；⊕ 表 MLP 捕获图像的整体语义信息，反映出更全面
示特征连接。的上下文关系。两者的结合使得模型既能精准
2）全局上下文特征提取。通过全局平均池关注局部细节，又具备对全局背景的理解，从而
化（global average pooling，GAP）来聚合整个特显著提升特征表达的完整性与判别力，为小目
征图的全局信息，生成全局特征向量。该特征标对象检测提供更为精确的支持。
向量捕获了输入图像中每个通道的平均响应， 3）上下文信息融合。将提取的全局上下文
随后通过 MLP 进一步处理。 MLP 能够学习特与联合特征加权，这个操作相当于将全局上下
征间的复杂非线性关系，进一步细化得到最终文信息作为权重，在通道级别重新标定联合特
的全局上下文特征。全局上下文特征提取可表征，强调有用的特征部分，抑制不重要的特征
示为：部分。在此基础上，将上下文信息与输入的特

F global = MLP( GAP( X ) ) （7）征相加融合，得到分类和回归预测的特征图。
式中，F global 为全局上下文特征。该特征图融合了局部特征、周围上下文特征以
联合特征与全局上下文特征在特征表达上及全局上下文信息，帮助模型更准确地定位和
具有互补性。联合特征通过整合局部特征与其识别小目标人员。上下文信息融合可表示为：
周围的上下文信息，能够捕捉目标对象及其邻 F context = F global ⋅ F joint + X （8）
近环境的细节，适合用于小目标对象的局部特式中，F context 为上下文信息融合后的特征。

图 3 上下文感知模块
Fig. 3 Context-Aware Module

2 实验案例分析测试集 2 243 张，共计 13 462 张图像。需要说明
的是，训练集和测试集的图像不存在重叠情况。
2.1 数据集构建
为了测试本文方法的泛化性和适用性，笔者
本文选择公开数据集 Manipal-UAV ［28］进行
团队在西南交通大学校园内不同场景和时间采
方法效果对比。该数据集包括从两架在不同高
集了无人机影像。场景类型包括教学楼、图书
度、位置和天气条件下飞行的无人机收集的数
馆、食堂、宿舍楼等人员密集的场景，确保本文方
据，可用于研究无人机影像人员检测，包含来自
法对不同场景的适用性。此外，考虑到天气的影
33 个视频的 13 462 张图像，具有 153 112 个目标，
其中约 70% 属于小目标（小目标定义为分辨率小响，分别在不同时间段采集图像，获取明暗程度
于 32×32 像素的目标）。该数据集划分为训练集各不相同的图像，以确保本文方法对于各种光线
和测试集，其中训练集 9 113 张，验证集 2 106 张，的场景均具有较好的泛化性。

54 55 56 57 58 59 60 61 62 63 64