Page 115 - 《武汉大学学报(信息科学版)》2025年第9期
P. 115

第 50 卷第 9 期            虞   欣等:遥感影像场景识别的贝叶斯共轭批次归一化方法                                  1843


                                                                像,总计 60 000 张图像,图像大小不固定。考虑
                                                                到 ImageNet 数据集规模庞大,约 100 GB,对普通
                                                                研究员或开发者而言,训练对硬件要求较高,通
                                                                常需要多个高端显卡并行训练,即使如此,训练
                                                                仍需数天时间,因此 Mini-ImageNet 数据集的制
                                                                作有效降低了使用门槛。
                                                                    实验过程中,除了公开数据集自身已经划分
                                                                好的训练集和测试集之外,本文实验过程中对其
                                                                他数据集进行随机划分,训练样本和测试样本的
                                                                划分比例为 6∶4,即 60% 的样本用于训练,40%
                                                                的样本用于测试,并评定分类精度               [50] 。
                                                                2.2 网络设置
                                                                    在本文的实验中,采用 ResNet18 的网络结构
                                                                用于遥感场景的分类。在网络初始化方面,采用
                                                                文献[15]的方法对所有的网络参数进行初始化。
                                                                对于所有的归一化方法都采用了仿射变换,进一
                                                                步增强网络表征特征的能力,其尺度参数的初始
                                                                值设置为 1,平移参数的初始值设置为 0。使用随
                                                                机梯度下降算法对所有的模型进行优化,基础学
                                                                习率设置为 0.1,权重衰减因子为 1×10 ,动量值
                                                                                                   −4
                                                                为 0.9。在训练过程中,采用文献[28]的方法进
                                                                行数据增强,同时轮数设置为 100。测试过程中,
                                                                影像输入为中心裁剪为 224×224 像素大小的影
                                                                像块。实验最终结果取最后 10 次随机实验 Top1
                            图 1 5 种数据集样本示例                      测试分类精度的平均值和标准差(即波动大小)。
                   Fig.  1 Examples of Five Experimental Datasets  其他设置细节与文献[27]保持一致。此外,本文
                                                                实验的主要目的在于验证本文所提出方法的有
                           表 1 5 种数据集的基本情况
                                                                效性,仅比较不同的归一化方法之间的差异性,
                     Table 1 Basic Information of Five Datasets
                                                                而并不追求该方法达到的最优分类结果。
                      数据集        场景数    总样本数    影像大小/像素
                                                                    实 验 中 的 参 考 基 准 是 用 BABN 训 练
                  NWPU-RESISC45    45    31 500   256×256
                                                                ResNet18 模型。为了与其他归一化方法比较,实
                       AID         30    10 000   600×600
                     EuroSAT       10    27 000    64×64        验中 BABN 方法依次被其他归一化方法替换,而
                      SAT-6         6    405 000   28×28        模型中的其他超参数都保持不变。此外,为了更
                   Mini-ImageNet   100   60 000    不固定
                                                                好地分析 BS 对不同归一化方法的影响,批次的
                                                                样本容量分别设置为 2、4、8、16、32。
                大 陆 的 共 330 000 个 场 景 组 成 ,图 像 由 红 色 、绿         2.3 实验结果与分析
                色、蓝色和近红外 4 个波段组成,每个样本图像大                        2.3.1 不同归一化方法 Top1 测试分类精度比较
                小为 28×28 像素。为了保持整个数据集固有的                            首先,按照 BN 方法对批次的样本容量的常
                高方差,从多个场景中采样 1 500 个图像块,这些                      规设置,设置为 32。考虑到在场景的类别数和每
                场景覆盖了不同的景观,如农村地区、城市地区、                          个场景的样本数量等方面都相对较大,实验中选
                茂密的森林、山区以及覆盖整个加利福尼亚州的                           用 NWPU-RESISC45 数据集。经过 100 次迭代,
                水体、农业区等。                                        所有归一化方法均已收敛,5 种归一化方法的分
                    5)Mini-ImageNet 数 据 集 由 Google 于 2016       类 精 度 见 表 2,其 中 精 度 表 示 Top1 测 试 分 类 精
                年从 ImageNet 数据集中抽取一小部分制作而成,                     度;标准差表示最后 10 次随机实验结果精度的标
                约 3 GB,共 有 100 个 类 别 ,每 个 类 别 有 600 张 图         准差; Δ 表示测试方法与 BN 方法的精度差值。
   110   111   112   113   114   115   116   117   118   119   120