Page 89 - 《武汉大学学报（信息科学版）》2025年第9期

P. 89

第 50 卷第 9 期郭浩然等：基于样本迁移的无监督植被遥感制图方法 1817

代表生成的单高斯模型，则对于第 n i ( n i ≤ N i ) 个近红外（near infrared，NIR）和短波红外波段
X i 而言，有隶属于 GM j 的后验概率 γ ( n i ，j ) 。（SWIR1、SWIR2） 5 个波段，构建 22 年逐年最小
样本 s n i
EM 算法计算高斯混合模型分为两个部分，首先云量合成图，计算 NDVI 和 NBR，计算式分别为：
执行 E 步骤，通过当前的混合成分参数 I NDVI = R NIR - R Red （3）
X i 属于 GM i 的后验概率 γ ( n i ，j ) ；然 R NIR + R Red
{ α j，μ j，Σ j }，计算 s n i
R NIR - R SWIR2
后将 E 步骤的后验概率作为权重，采用最大似然 I NBR = （4）
R NIR + R SWIR2
法估算新的混合参数 α j、均值向量 u j 以及协方差
式中， R Red、 R NIR 和 R SWIR2 分别表示红光波段、近红
向量 Σ j，完成算法的 M 步骤。通过 E 步骤和 M 步外和短波红外第二波段的表层反射率。
骤的不断迭代更新，直到 M 步骤的似然函数的变本文采用 LandTrendr 算法检测研究区内植
化率小于设定阈值，即可得到优化后的样本集。被的变化，并划分植被变化增益、变化损失以及
全局高斯混合模型分析的总时间复杂度为不变区域。LandTrendr 是一种时间分割算法，能
O ( KNd )，其中 K 为类别标签数。够捕捉研究区 22 年间剧烈的短期变化或者渐进
2.3 多时相植被变化检测与样本迁移的变化，其核心为构建研究区每个像元的时序谱
利用 GEE（Google Earth Engine）中 2000— 线，从而监测其变化。每个像素的输入是一个光
2022 年的 Landsat TM/ETM/OLI 的遥感影像数谱指数或者波段的时间序列［24］。通过实验分析，
据构建时序数据集［31］。选取每年 6 月 10 日至 8 月设定相关参数来保证研究区变化检测的质量，输
30 日的 Landsat 影像对应的绿（Green）、红（Red）、入参数如表 1 所示。

表 1 LandTrendr 算法参数
Table 1 Parameters of LandTrendr Algorithm
参数名称参数描述参数值
MaxSegments 分割单元的最大数目 4
SpikeThreshold 如果相邻两个时间点值的差异百分比小于该值，那么该值会被认为是异常值，须剔除 0.9
VertexCountOvershoot 在初始阶段的潜在节点回归中可以超过的节点数 3
PreventOneYearRecovery 阻止一年后恢复的情况否 TRUE
RecoveryThreshold 如果某个分割段的恢复率大于该值的倒数，那么这个分割段将会被移除 0.25
PvalThreshold 回归分析中 F 检验的 P 值，超过该值，则认为该像元没有发生变化 0.05
BestModelProportion 简单模型的选择规则，如果超过该值，则被选中 0.75
MinObservationsNeeded 拟合中需要的最少观测数 6

2.4 自然植被分层分类数的平方根。
RF 分类模型是一种常用的机器学习分类算本文使用混淆矩阵对分类精度进行评价，包
法，其通过构建多个决策树来运行［32］。与其他机括总体精度（overall accuracy，OA）和 Kappa 系
器学习算法相比，RF 算法具有计算精度高、模型数。OA 是分类结果正确分类像元数与总像元数
训练时间少、能够确定变量在模型中的重要性等的比值，常用于快速评估分类结果的整体精度；
优势，因此被广泛应用于分类研究中［33-34］。在 Kappa 系数是一种用于统计分类结果准确性和随
GEE 中调用 RF 分类模型，该模型参数较少，决策机性的指标。
树数量和变量数量是影响其结果的参数。研究
3 数据结果处理与分析
采用的植被分类方法对每一层进行分类［35-36］。分
层分类结构如图 4 所示，共 3 层，其中第一层为森针对大标签中国植被分类图样本，以 2000 年
林、灌丛、草地分类，第二层为植被型分类，第三 8 月 Landsat 遥感影像为主，计算植被指数、土壤
层为植被群系分类。在计算可以负荷的情况下，指数、纹理特征，并结合光谱特征、气象数据、
针对每一层对特征重要性进行排序，并进行特征 DEM 及其衍生数据构建特征集合，采用局部-全
优选，选择精度最高时的决策树数量。研究采用局的大标签样本降噪方法构建优化后的样本集
的 RF 决策树数量第 1 层是 200，第 2 层是 150，第合，总计 3 563 个样本，样本空间分辨率为 30 m。
3 层是 200，且变量数量默认为输入的特征变量总实验中，基于 Python 3.7.3 的局部-全局大标

84 85 86 87 88 89 90 91 92 93 94