Page 89 - 《武汉大学学报(信息科学版)》2025年第9期
P. 89

第 50 卷第 9 期               郭浩然等:基于样本迁移的无监督植被遥感制图方法                                    1817


                代表生成的单高斯模型,则对于第 n i ( n i ≤ N i ) 个             近 红 外(near  infrared,NIR)和 短 波 红 外 波 段
                     X i  而 言 ,有 隶 属 于 GM j 的 后 验 概 率 γ ( n i ,j ) 。  (SWIR1、SWIR2) 5 个波段,构建 22 年逐年最小
                样 本 s n i
                EM 算法计算高斯混合模型分为两个部分,首先                          云量合成图,计算 NDVI 和 NBR,计算式分别为:
                执 行 E 步 骤 ,通 过 当 前 的 混 合 成 分 参 数                              I NDVI =  R NIR - R Red   (3)
                               X i  属于 GM i 的后验概率 γ ( n i ,j ) ;然                    R NIR + R Red
                { α j,μ j,Σ j },计算 s n i
                                                                                   R NIR - R SWIR2
                后将 E 步骤的后验概率作为权重,采用最大似然                                      I NBR =                    (4)
                                                                                   R NIR + R SWIR2
                法估算新的混合参数 α j、均值向量 u j 以及协方差
                                                                式中, R Red、 R NIR 和 R SWIR2 分别表示红光波段、近红
                向量 Σ j,完成算法的 M 步骤。通过 E 步骤和 M 步                  外和短波红外第二波段的表层反射率。
                骤的不断迭代更新,直到 M 步骤的似然函数的变                             本文采用 LandTrendr 算法检测研究区内植
                化率小于设定阈值,即可得到优化后的样本集。                           被的变化,并划分植被变化增益、变化损失以及
                全 局 高 斯 混 合 模 型 分 析 的 总 时 间 复 杂 度 为             不变区域。LandTrendr 是一种时间分割算法,能
                O ( KNd ),其中 K 为类别标签数。                          够捕捉研究区 22 年间剧烈的短期变化或者渐进
                2.3 多时相植被变化检测与样本迁移                              的变化,其核心为构建研究区每个像元的时序谱
                    利 用 GEE(Google  Earth  Engine)中 2000—       线,从而监测其变化。每个像素的输入是一个光
                2022 年的 Landsat TM/ETM/OLI 的遥感影像数               谱指数或者波段的时间序列              [24] 。通过实验分析,
                据构建时序数据集        [31] 。选取每年 6 月 10 日至 8 月        设定相关参数来保证研究区变化检测的质量,输
                30 日的 Landsat 影像对应的绿(Green)、红(Red)、             入参数如表 1 所示。

                                                   表 1 LandTrendr 算法参数
                                            Table 1 Parameters of LandTrendr Algorithm
                        参数名称                                     参数描述                                参数值
                       MaxSegments                           分割单元的最大数目                                 4
                      SpikeThreshold    如果相邻两个时间点值的差异百分比小于该值,那么该值会被认为是异常值,须剔除                         0.9
                    VertexCountOvershoot            在初始阶段的潜在节点回归中可以超过的节点数                              3
                   PreventOneYearRecovery                   阻止一年后恢复的情况否                              TRUE
                     RecoveryThreshold      如果某个分割段的恢复率大于该值的倒数,那么这个分割段将会被移除                           0.25
                       PvalThreshold          回归分析中 F 检验的 P 值,超过该值,则认为该像元没有发生变化                       0.05
                    BestModelProportion              简单模型的选择规则,如果超过该值,则被选中                            0.75
                   MinObservationsNeeded                    拟合中需要的最少观测数                                6

                2.4 自然植被分层分类                                    数的平方根。
                    RF 分类模型是一种常用的机器学习分类算                            本文使用混淆矩阵对分类精度进行评价,包
                法,其通过构建多个决策树来运行               [32] 。与其他机        括 总 体 精 度(overall  accuracy,OA)和 Kappa 系
                器学习算法相比,RF 算法具有计算精度高、模型                         数。OA 是分类结果正确分类像元数与总像元数
                训练时间少、能够确定变量在模型中的重要性等                           的比值,常用于快速评估分类结果的整体精度;
                优 势 ,因 此 被 广 泛 应 用 于 分 类 研 究 中     [33-34] 。 在  Kappa 系数是一种用于统计分类结果准确性和随
                GEE 中调用 RF 分类模型,该模型参数较少,决策                      机性的指标。
                树数量和变量数量是影响其结果的参数。研究
                                                                3 数据结果处理与分析
                采用的植被分类方法对每一层进行分类                  [35-36] 。分
                层分类结构如图 4 所示,共 3 层,其中第一层为森                          针对大标签中国植被分类图样本,以 2000 年
                林、灌丛、草地分类,第二层为植被型分类,第三                          8 月 Landsat 遥感影像为主,计算植被指数、土壤
                层为植被群系分类。在计算可以负荷的情况下,                           指 数 、纹 理 特 征 ,并 结 合 光 谱 特 征 、气 象 数 据 、
                针对每一层对特征重要性进行排序,并进行特征                           DEM 及其衍生数据构建特征集合,采用局部-全
                优选,选择精度最高时的决策树数量。研究采用                           局的大标签样本降噪方法构建优化后的样本集
                的 RF 决策树数量第 1 层是 200,第 2 层是 150,第               合,总计 3 563 个样本,样本空间分辨率为 30 m。
                3 层是 200,且变量数量默认为输入的特征变量总                           实验中,基于 Python 3.7.3 的局部-全局大标
   84   85   86   87   88   89   90   91   92   93   94