Page 115 - 《武汉大学学报(信息科学版)》2025年第9期
P. 115
第 50 卷第 9 期 虞 欣等:遥感影像场景识别的贝叶斯共轭批次归一化方法 1843
像,总计 60 000 张图像,图像大小不固定。考虑
到 ImageNet 数据集规模庞大,约 100 GB,对普通
研究员或开发者而言,训练对硬件要求较高,通
常需要多个高端显卡并行训练,即使如此,训练
仍需数天时间,因此 Mini-ImageNet 数据集的制
作有效降低了使用门槛。
实验过程中,除了公开数据集自身已经划分
好的训练集和测试集之外,本文实验过程中对其
他数据集进行随机划分,训练样本和测试样本的
划分比例为 6∶4,即 60% 的样本用于训练,40%
的样本用于测试,并评定分类精度 [50] 。
2.2 网络设置
在本文的实验中,采用 ResNet18 的网络结构
用于遥感场景的分类。在网络初始化方面,采用
文献[15]的方法对所有的网络参数进行初始化。
对于所有的归一化方法都采用了仿射变换,进一
步增强网络表征特征的能力,其尺度参数的初始
值设置为 1,平移参数的初始值设置为 0。使用随
机梯度下降算法对所有的模型进行优化,基础学
习率设置为 0.1,权重衰减因子为 1×10 ,动量值
−4
为 0.9。在训练过程中,采用文献[28]的方法进
行数据增强,同时轮数设置为 100。测试过程中,
影像输入为中心裁剪为 224×224 像素大小的影
像块。实验最终结果取最后 10 次随机实验 Top1
图 1 5 种数据集样本示例 测试分类精度的平均值和标准差(即波动大小)。
Fig. 1 Examples of Five Experimental Datasets 其他设置细节与文献[27]保持一致。此外,本文
实验的主要目的在于验证本文所提出方法的有
表 1 5 种数据集的基本情况
效性,仅比较不同的归一化方法之间的差异性,
Table 1 Basic Information of Five Datasets
而并不追求该方法达到的最优分类结果。
数据集 场景数 总样本数 影像大小/像素
实 验 中 的 参 考 基 准 是 用 BABN 训 练
NWPU-RESISC45 45 31 500 256×256
ResNet18 模型。为了与其他归一化方法比较,实
AID 30 10 000 600×600
EuroSAT 10 27 000 64×64 验中 BABN 方法依次被其他归一化方法替换,而
SAT-6 6 405 000 28×28 模型中的其他超参数都保持不变。此外,为了更
Mini-ImageNet 100 60 000 不固定
好地分析 BS 对不同归一化方法的影响,批次的
样本容量分别设置为 2、4、8、16、32。
大 陆 的 共 330 000 个 场 景 组 成 ,图 像 由 红 色 、绿 2.3 实验结果与分析
色、蓝色和近红外 4 个波段组成,每个样本图像大 2.3.1 不同归一化方法 Top1 测试分类精度比较
小为 28×28 像素。为了保持整个数据集固有的 首先,按照 BN 方法对批次的样本容量的常
高方差,从多个场景中采样 1 500 个图像块,这些 规设置,设置为 32。考虑到在场景的类别数和每
场景覆盖了不同的景观,如农村地区、城市地区、 个场景的样本数量等方面都相对较大,实验中选
茂密的森林、山区以及覆盖整个加利福尼亚州的 用 NWPU-RESISC45 数据集。经过 100 次迭代,
水体、农业区等。 所有归一化方法均已收敛,5 种归一化方法的分
5)Mini-ImageNet 数 据 集 由 Google 于 2016 类 精 度 见 表 2,其 中 精 度 表 示 Top1 测 试 分 类 精
年从 ImageNet 数据集中抽取一小部分制作而成, 度;标准差表示最后 10 次随机实验结果精度的标
约 3 GB,共 有 100 个 类 别 ,每 个 类 别 有 600 张 图 准差; Δ 表示测试方法与 BN 方法的精度差值。

