Page 25 - 《武汉大学学报（信息科学版）》2025年第6期

P. 25

第 50 卷第 6 期甄杰等：面向应急通信选址的增强卷积神经网络山顶点快速提取方法 1047

增强 Faster R-CNN 算法对 Faster R-CNN 算式中， k 0 为基准值，设为 5 表示原图大小使用第 5
法进行的改进如下：层特征； ω 和 h 分别是 ROI 的长和宽； 256 是数据
1）特征提取网络选用 ResNeSt。特征提取网集图片输入尺寸。假设 ROI 大小为 100×100，
络有传统的视觉几何组［17］（visual geometry int( P k)=5− 1=4，表示此 ROI 应该使用第 4 层
group，VGG）和残差网络［18］（residual network，特征。
ResNet）等，而受 ResNeXt、SENet 和 SKNet 的启 3）锚框大小确定。原始 RPN 网络设置 9 个
发，分离注意力网络（split-attention networks，锚框为初始检测框，锚框大小分别为 128、256、
［19］
ResNeSt）使用分离注意力模块将特征图分离为 512，长宽比分别为 1∶1、1∶2、2∶1，初始大小设置
几个组，每组的特征通过分离表示的加权组合确不能完全符合不同的特征数据集，因此本文使用
定和表示，通过多个模块组合从而形成网络。本二阶聚类对特征数据集中的锚框进行聚类分析。
文的地形特征数据集为多通道数据，并且含有大二阶聚类能够对大样本的连续变量和分类变量
量代表地形特征的信息，通道信息之间相互影进行聚类，能够自动确定类别数量，避免欧氏距
响，ResNeSt 网络保留学习深度并且能够实现跨离对于离散点敏感造成聚类效果不理想的问题，
通道特征交流，比 VGG 和 ResNet 网络更能深层最后将聚类结果作为锚框初始参数设置。
次挖掘地形特征。 4）IoU。生成的锚框并不一定全部准确，因
2）特征提取网络融合。特征金字塔网络此需要引入 IoU 来对所有锚框进行筛选。IoU 参
［20］
（feature pyramid networks，FPN）是针对目标数设置将会对训练结果造成影响，本文使用
检测提出的一种检测多尺度网络，在不提升计算 IoU> 0.7 标记为正样本锚框，IoU< 0.3 标记为负
量的前提下，增加检测小目标的能力。本文数据样本锚框，介于两者之间的样本为难例，为了提
集存在大量尺寸为 10×10 的山顶区域，小目标所高模型质量，不参与训练。IoU 值计算式如下：
包含的特征信息较少，易被特征提取网络忽略。 A anchor ∩ B anchor
I IoU= （2）
在特征提取网络 ResNeSt 中融合 FPN，FPN 将所 A anchor ∪ B anchor
有层的特征保留，将特征由上至下进行侧边连式中， A anchor 为预测锚框面积； B anchor 为实际锚框
接，同时进行横向连接，将高层的特征进行上采面积。
样内插值，使各层特征大小相同，再将其与前一 5）NMS。NMS 的思想是找到局部置信度的
层特征进行连接，保证所有尺度的特征都具有良极大值，筛选局部周围的多余锚框，从而获得清

好的几何信息和语义信息。网络结构如图 6 晰的目标位置。在本数据集中的作用是寻找同
所示。一区域内相同类别的区域，保留置信度更高的区
域，如果 NMS 设置的较高，相邻的区域将会只有
一个保留下来。随后再次对锚框进行回归计算，
计算锚框坐标与真实锚框坐标的偏移量，对锚框
位置进行微调，如图 7 所示。

图 6 FPN 模型结构
Fig. 6 Structure of FPN Model
图 7 非极大值抑制
由于使用的特征图由单层变成了多层，结合 Fig. 7 Non-Maximum Suppression
ResNeSt 网络中的感兴趣区域（region of interest，
6）预训练权重与冻结训练提高模型泛化能
ROI）Pooling 层就需要相应变化，对不同层的特
力。将预训练权重主要参数结构进行网络结构
征使用不同的 ROI 尺度。大尺度 ROI 使用深层
相应修改，使用冻结训练和解冻训练进行预训
特征作为输入，小尺度 ROI 使用浅层特征作为输
练，先冻结不修改权重参数学习特征，再解冻进
入，定义 P k 系数作为判断依据，计算式为：
é ( ) ù 行参数微调，获得属于本文特征数据集的训练权
int( P k) = k 0 + log 2 ωh 256 （1）［21］
ë û 重。预训练结束后进行特征数据集的正式训

20 21 22 23 24 25 26 27 28 29 30