Page 115 - 《武汉大学学报（信息科学版）》2025年第9期

P. 115

第 50 卷第 9 期虞欣等：遥感影像场景识别的贝叶斯共轭批次归一化方法 1843

像，总计 60 000 张图像，图像大小不固定。考虑
到 ImageNet 数据集规模庞大，约 100 GB，对普通
研究员或开发者而言，训练对硬件要求较高，通
常需要多个高端显卡并行训练，即使如此，训练
仍需数天时间，因此 Mini-ImageNet 数据集的制
作有效降低了使用门槛。
实验过程中，除了公开数据集自身已经划分
好的训练集和测试集之外，本文实验过程中对其
他数据集进行随机划分，训练样本和测试样本的
划分比例为 6∶4，即 60% 的样本用于训练，40%
的样本用于测试，并评定分类精度［50］。
2.2 网络设置
在本文的实验中，采用 ResNet18 的网络结构
用于遥感场景的分类。在网络初始化方面，采用
文献［15］的方法对所有的网络参数进行初始化。
对于所有的归一化方法都采用了仿射变换，进一
步增强网络表征特征的能力，其尺度参数的初始
值设置为 1，平移参数的初始值设置为 0。使用随
机梯度下降算法对所有的模型进行优化，基础学
习率设置为 0.1，权重衰减因子为 1×10 ，动量值
−4
为 0.9。在训练过程中，采用文献［28］的方法进
行数据增强，同时轮数设置为 100。测试过程中，
影像输入为中心裁剪为 224×224 像素大小的影
像块。实验最终结果取最后 10 次随机实验 Top1
图 1 5 种数据集样本示例测试分类精度的平均值和标准差（即波动大小）。
Fig. 1 Examples of Five Experimental Datasets 其他设置细节与文献［27］保持一致。此外，本文
实验的主要目的在于验证本文所提出方法的有
表 1 5 种数据集的基本情况
效性，仅比较不同的归一化方法之间的差异性，
Table 1 Basic Information of Five Datasets
而并不追求该方法达到的最优分类结果。
数据集场景数总样本数影像大小/像素
实验中的参考基准是用 BABN 训练
NWPU-RESISC45 45 31 500 256×256
ResNet18 模型。为了与其他归一化方法比较，实
AID 30 10 000 600×600
EuroSAT 10 27 000 64×64 验中 BABN 方法依次被其他归一化方法替换，而
SAT-6 6 405 000 28×28 模型中的其他超参数都保持不变。此外，为了更
Mini-ImageNet 100 60 000 不固定
好地分析 BS 对不同归一化方法的影响，批次的
样本容量分别设置为 2、4、8、16、32。
大陆的共 330 000 个场景组成，图像由红色、绿 2.3 实验结果与分析
色、蓝色和近红外 4 个波段组成，每个样本图像大 2.3.1 不同归一化方法 Top1 测试分类精度比较
小为 28×28 像素。为了保持整个数据集固有的首先，按照 BN 方法对批次的样本容量的常
高方差，从多个场景中采样 1 500 个图像块，这些规设置，设置为 32。考虑到在场景的类别数和每
场景覆盖了不同的景观，如农村地区、城市地区、个场景的样本数量等方面都相对较大，实验中选
茂密的森林、山区以及覆盖整个加利福尼亚州的用 NWPU-RESISC45 数据集。经过 100 次迭代，
水体、农业区等。所有归一化方法均已收敛，5 种归一化方法的分
5）Mini-ImageNet 数据集由 Google 于 2016 类精度见表 2，其中精度表示 Top1 测试分类精
年从 ImageNet 数据集中抽取一小部分制作而成，度；标准差表示最后 10 次随机实验结果精度的标
约 3 GB，共有 100 个类别，每个类别有 600 张图准差； Δ 表示测试方法与 BN 方法的精度差值。

110 111 112 113 114 115 116 117 118 119 120