Page 89 - 《武汉大学学报(信息科学版)》2025年第9期
P. 89
第 50 卷第 9 期 郭浩然等:基于样本迁移的无监督植被遥感制图方法 1817
代表生成的单高斯模型,则对于第 n i ( n i ≤ N i ) 个 近 红 外(near infrared,NIR)和 短 波 红 外 波 段
X i 而 言 ,有 隶 属 于 GM j 的 后 验 概 率 γ ( n i ,j ) 。 (SWIR1、SWIR2) 5 个波段,构建 22 年逐年最小
样 本 s n i
EM 算法计算高斯混合模型分为两个部分,首先 云量合成图,计算 NDVI 和 NBR,计算式分别为:
执 行 E 步 骤 ,通 过 当 前 的 混 合 成 分 参 数 I NDVI = R NIR - R Red (3)
X i 属于 GM i 的后验概率 γ ( n i ,j ) ;然 R NIR + R Red
{ α j,μ j,Σ j },计算 s n i
R NIR - R SWIR2
后将 E 步骤的后验概率作为权重,采用最大似然 I NBR = (4)
R NIR + R SWIR2
法估算新的混合参数 α j、均值向量 u j 以及协方差
式中, R Red、 R NIR 和 R SWIR2 分别表示红光波段、近红
向量 Σ j,完成算法的 M 步骤。通过 E 步骤和 M 步 外和短波红外第二波段的表层反射率。
骤的不断迭代更新,直到 M 步骤的似然函数的变 本文采用 LandTrendr 算法检测研究区内植
化率小于设定阈值,即可得到优化后的样本集。 被的变化,并划分植被变化增益、变化损失以及
全 局 高 斯 混 合 模 型 分 析 的 总 时 间 复 杂 度 为 不变区域。LandTrendr 是一种时间分割算法,能
O ( KNd ),其中 K 为类别标签数。 够捕捉研究区 22 年间剧烈的短期变化或者渐进
2.3 多时相植被变化检测与样本迁移 的变化,其核心为构建研究区每个像元的时序谱
利 用 GEE(Google Earth Engine)中 2000— 线,从而监测其变化。每个像素的输入是一个光
2022 年的 Landsat TM/ETM/OLI 的遥感影像数 谱指数或者波段的时间序列 [24] 。通过实验分析,
据构建时序数据集 [31] 。选取每年 6 月 10 日至 8 月 设定相关参数来保证研究区变化检测的质量,输
30 日的 Landsat 影像对应的绿(Green)、红(Red)、 入参数如表 1 所示。
表 1 LandTrendr 算法参数
Table 1 Parameters of LandTrendr Algorithm
参数名称 参数描述 参数值
MaxSegments 分割单元的最大数目 4
SpikeThreshold 如果相邻两个时间点值的差异百分比小于该值,那么该值会被认为是异常值,须剔除 0.9
VertexCountOvershoot 在初始阶段的潜在节点回归中可以超过的节点数 3
PreventOneYearRecovery 阻止一年后恢复的情况否 TRUE
RecoveryThreshold 如果某个分割段的恢复率大于该值的倒数,那么这个分割段将会被移除 0.25
PvalThreshold 回归分析中 F 检验的 P 值,超过该值,则认为该像元没有发生变化 0.05
BestModelProportion 简单模型的选择规则,如果超过该值,则被选中 0.75
MinObservationsNeeded 拟合中需要的最少观测数 6
2.4 自然植被分层分类 数的平方根。
RF 分类模型是一种常用的机器学习分类算 本文使用混淆矩阵对分类精度进行评价,包
法,其通过构建多个决策树来运行 [32] 。与其他机 括 总 体 精 度(overall accuracy,OA)和 Kappa 系
器学习算法相比,RF 算法具有计算精度高、模型 数。OA 是分类结果正确分类像元数与总像元数
训练时间少、能够确定变量在模型中的重要性等 的比值,常用于快速评估分类结果的整体精度;
优 势 ,因 此 被 广 泛 应 用 于 分 类 研 究 中 [33-34] 。 在 Kappa 系数是一种用于统计分类结果准确性和随
GEE 中调用 RF 分类模型,该模型参数较少,决策 机性的指标。
树数量和变量数量是影响其结果的参数。研究
3 数据结果处理与分析
采用的植被分类方法对每一层进行分类 [35-36] 。分
层分类结构如图 4 所示,共 3 层,其中第一层为森 针对大标签中国植被分类图样本,以 2000 年
林、灌丛、草地分类,第二层为植被型分类,第三 8 月 Landsat 遥感影像为主,计算植被指数、土壤
层为植被群系分类。在计算可以负荷的情况下, 指 数 、纹 理 特 征 ,并 结 合 光 谱 特 征 、气 象 数 据 、
针对每一层对特征重要性进行排序,并进行特征 DEM 及其衍生数据构建特征集合,采用局部-全
优选,选择精度最高时的决策树数量。研究采用 局的大标签样本降噪方法构建优化后的样本集
的 RF 决策树数量第 1 层是 200,第 2 层是 150,第 合,总计 3 563 个样本,样本空间分辨率为 30 m。
3 层是 200,且变量数量默认为输入的特征变量总 实验中,基于 Python 3.7.3 的局部-全局大标

