Page 114 - 《武汉大学学报(信息科学版)》2025年第9期
P. 114
1842 武 汉 大 学 学 报 (信 息 科 学 版) 2025 年 9 月
而相比于 LN、IN 和 GN 方法等,虽然可以从其他 本方差,依据式(10)计算得到该批次下第 i 个特
角度对批次的 BS 进行弥补,但其效果的改善仍 征的最终样本方差 σ 1i;
2
然存在一定的局限性。总的来说,这些方法仅仅 x i - μ 1i
5)依 据 x ̂ = 计 算 得 到 贝 叶 斯 正 则
i
利 用 了 样 本 信 息 ,却 忽 略 了 总 体 信 息 和 先 验 信 σ 1i + ε
2
息。本文利用贝叶斯统计理论的优势,充分发挥 化后的特征;
总体信息和先验信息,将这两种信息与原有的样 6)依据 y i ← γx ̂ + β ≡ f γβ ( x i ),加入平移和缩
i
本信息进行了有机的融合,克服了 BS 较小的缺 放参数,得到最终的贝叶斯正则化结果;
陷,并达到了较高的估计精度。在大样本容量的 7)重复上述步骤,依次对该批次下所有的特
条件下,正态分布的均值和方差的共轭分布也是 征进行贝叶斯正则化处理。
正态分布,则其样本均值和方差的估算公式分别
同式(9)和式(10)。 2 实验与分析
对于 BABN 方法,集合 S i 定义为:
本文实验基于 PyTorch 深度学习框架,实验
S i = { k|k M = i M } (13)
平台搭载 Ubuntu 18.04.6 LTS 操作系统,配置 In⁃
为 区 别 于 批 次 样 本 N,本 文 用 M 来 表 示 总
tel(R)Core i5-10400F @2.90 GHz 6 核 12 线 程
体。类似于 BN 方法,BABN 对于每个波段计算
CPU 处理器,32 GB RAM 和 NVDIA RTX 3060
样本均值和方差 (( M + N )× H × W )。
显卡,显存为 12 GB。
由于深度学习模型在训练时通常数据量很
2.1 数据集
大,样本容量少则上万,甚至上百万,如 ImageNet
近年来,遥感领域利用深度学习技术支持场
数据集,其样本容量约为 1.28 MB。因而,在现有
景理解、地物目标检测与土地覆盖分类等任务。
的深度学习模型框架下,如 PyTorch、Caffe、Ten⁃
随着遥感影像样本数据集的不断增加,其多样性
sorFlow 等,一般采用指数滑动平均法去进行近
的特点也日益显现,在尺度、传感器、时相等方面
似计算,其优点是不占内存,计算方便。但是其
存 在 较 大 差 异 [43-45] 。 本 文 实 验 使 用 NWPU-RE⁃
结果必然不如使用整个训练集计算得到的样本
SISC45 [16] 、AID [46] 、EuroSAT [47] 和 SAT-6 [48] 4 种
均值和方差那么准确。然而,贝叶斯方法提供了
公开的遥感场景分类数据集和一种公开的自然
一种可以分批进行计算整个训练集的均值和方
场 景 分 类 数 据 集 Mini-ImageNet [49] ,对 BABN 方
差的方法,既不受限于内存的大小,又保证了估
法进行验证和比较分析。5 种数据集的部分样本
计的均值和方差的估算精度,在一定程度上也能
示例如图 1 所示,基本情况对比见表 1。
够增加模型的鲁棒性,减少过拟合的可能性。
1)NWPU-RESISC45 数 据 集 是 西 北 工 业 大
1.4 核心算法流程
学发布的一个用于遥感图像场景分类的大规模
由于 PyTorch 等深度学习框架提供了自动求
公开数据集。该数据集包含 45 个场景类别,每个
解梯度的功能,BABN 比较容易实现。实际上,
类别有 700 张图像,总计 31 500 张图像,每张图像
BABN 与 BN 方法的主要不同之处在于样本均值
的分辨率为 256×256 像素。
和方差的计算。输入总体均值 μ 0 和总体方差 σ 0 ,
2
2)AID 数据集是一个大规模航拍图像数据
某一批次的特征集合 Β = { X 1,X 2,⋯,X m },其中
集,来自 Google Earth 影像,由武汉大学和华中科
m 为该批次中的样本容量,可学习的尺度参数 γ
技大学于 2017 年共同发布。该数据集包含 30 种
和平移参数 β;输出 { y i = f γβ ( x i ) }。具体的算法
航空场景类型,每个场景类别约有 220~420 张图
流程如下: 像,总计约 10 000 张图像,每张图像的大小约为
1)依据该批次的样本和式(2),计算得到第 i 600×600 像素。
个特征的样本均值 μ si; 3)EuroSAT 数据集由哥白尼地球观测计划
2)依据该批次的样本和式(3),计算得到第 i 提供的 Sentinel-2 卫星拍摄,覆盖 13 个光谱波段,
2
个特征的样本方差 σ si; 包 含 10 类 场 景 共 计 27 000 张 图 像 ,图 像 大 小 为
3)根据总体均值、总体方差、样本均值和样 64×64 像素,空间分辨率达到 10~30 m。本文实
本方差,依据式(9)计算得到该批次下第 i 个特征 验仅使用该数据集的可见光波段影像数据。
的最终样本均值 μ 1i; 4)SAT-6 数据集的图像是从美国国家农业
4)根据总体均值、总体方差、样本均值和样 影像计划数据集中提取的,该数据集由跨越美国

