Page 114 - 《武汉大学学报(信息科学版)》2025年第9期
P. 114

1842                            武 汉 大 学 学 报  (信 息 科 学 版)                        2025 年 9 月

                而相比于 LN、IN 和 GN 方法等,虽然可以从其他                      本方差,依据式(10)计算得到该批次下第 i 个特
                角度对批次的 BS 进行弥补,但其效果的改善仍                          征的最终样本方差 σ 1i;
                                                                                   2
                然存在一定的局限性。总的来说,这些方法仅仅                                            x i - μ 1i
                                                                     5)依 据 x ̂ =         计 算 得 到 贝 叶 斯 正 则
                                                                             i
                利 用 了 样 本 信 息 ,却 忽 略 了 总 体 信 息 和 先 验 信                            σ 1i + ε
                                                                                   2
                息。本文利用贝叶斯统计理论的优势,充分发挥                            化后的特征;
                总体信息和先验信息,将这两种信息与原有的样                                6)依据 y i ← γx ̂ + β ≡ f γβ ( x i ),加入平移和缩
                                                                                  i
                本信息进行了有机的融合,克服了 BS 较小的缺                          放参数,得到最终的贝叶斯正则化结果;
                陷,并达到了较高的估计精度。在大样本容量的                                7)重复上述步骤,依次对该批次下所有的特
                条件下,正态分布的均值和方差的共轭分布也是                            征进行贝叶斯正则化处理。
                正态分布,则其样本均值和方差的估算公式分别
                同式(9)和式(10)。                                     2 实验与分析
                     对于 BABN 方法,集合 S i 定义为:
                                                                     本文实验基于 PyTorch 深度学习框架,实验
                               S i = { k|k M = i M }   (13)
                                                                 平台搭载 Ubuntu 18.04.6 LTS 操作系统,配置 In⁃
                     为 区 别 于 批 次 样 本 N,本 文 用 M 来 表 示 总
                                                                 tel(R)Core  i5-10400F  @2.90  GHz  6 核 12 线 程
                体。类似于 BN 方法,BABN 对于每个波段计算
                                                                 CPU 处理器,32 GB RAM 和 NVDIA RTX 3060
                样本均值和方差 (( M + N )× H × W )。
                                                                 显卡,显存为 12 GB。
                     由于深度学习模型在训练时通常数据量很
                                                                 2.1 数据集
                大,样本容量少则上万,甚至上百万,如 ImageNet
                                                                     近年来,遥感领域利用深度学习技术支持场
                数据集,其样本容量约为 1.28 MB。因而,在现有
                                                                 景理解、地物目标检测与土地覆盖分类等任务。
                的深度学习模型框架下,如 PyTorch、Caffe、Ten⁃
                                                                 随着遥感影像样本数据集的不断增加,其多样性
                sorFlow 等,一般采用指数滑动平均法去进行近
                                                                 的特点也日益显现,在尺度、传感器、时相等方面
                似计算,其优点是不占内存,计算方便。但是其
                                                                 存 在 较 大 差 异  [43-45] 。 本 文 实 验 使 用 NWPU-RE⁃
                结果必然不如使用整个训练集计算得到的样本
                                                                 SISC45 [16] 、AID [46] 、EuroSAT [47] 和 SAT-6 [48] 4 种
                均值和方差那么准确。然而,贝叶斯方法提供了
                                                                 公开的遥感场景分类数据集和一种公开的自然
                一种可以分批进行计算整个训练集的均值和方
                                                                 场 景 分 类 数 据 集 Mini-ImageNet  [49] ,对 BABN 方
                差的方法,既不受限于内存的大小,又保证了估
                                                                 法进行验证和比较分析。5 种数据集的部分样本
                计的均值和方差的估算精度,在一定程度上也能
                                                                 示例如图 1 所示,基本情况对比见表 1。
                够增加模型的鲁棒性,减少过拟合的可能性。
                                                                     1)NWPU-RESISC45 数 据 集 是 西 北 工 业 大
                1.4 核心算法流程
                                                                 学发布的一个用于遥感图像场景分类的大规模
                     由于 PyTorch 等深度学习框架提供了自动求
                                                                 公开数据集。该数据集包含 45 个场景类别,每个
                解梯度的功能,BABN 比较容易实现。实际上,
                                                                 类别有 700 张图像,总计 31 500 张图像,每张图像
                BABN 与 BN 方法的主要不同之处在于样本均值
                                                                 的分辨率为 256×256 像素。
                和方差的计算。输入总体均值 μ 0 和总体方差 σ 0 ,
                                                           2
                                                                     2)AID 数据集是一个大规模航拍图像数据
                某一批次的特征集合 Β = { X 1,X 2,⋯,X m },其中
                                                                 集,来自 Google Earth 影像,由武汉大学和华中科
                m 为该批次中的样本容量,可学习的尺度参数 γ
                                                                 技大学于 2017 年共同发布。该数据集包含 30 种
                和平移参数 β;输出 { y i = f γβ ( x i ) }。具体的算法
                                                                 航空场景类型,每个场景类别约有 220~420 张图
                流程如下:                                            像,总计约 10 000 张图像,每张图像的大小约为
                     1)依据该批次的样本和式(2),计算得到第 i                     600×600 像素。
                个特征的样本均值 μ si;                                       3)EuroSAT 数据集由哥白尼地球观测计划
                     2)依据该批次的样本和式(3),计算得到第 i                     提供的 Sentinel-2 卫星拍摄,覆盖 13 个光谱波段,
                                   2
                个特征的样本方差 σ si;                                   包 含 10 类 场 景 共 计 27 000 张 图 像 ,图 像 大 小 为
                     3)根据总体均值、总体方差、样本均值和样                        64×64 像素,空间分辨率达到 10~30 m。本文实
                本方差,依据式(9)计算得到该批次下第 i 个特征                        验仅使用该数据集的可见光波段影像数据。
                的最终样本均值 μ 1i;                                        4)SAT-6 数据集的图像是从美国国家农业
                     4)根据总体均值、总体方差、样本均值和样                        影像计划数据集中提取的,该数据集由跨越美国
   109   110   111   112   113   114   115   116   117   118   119