Page 77 - 《武汉大学学报(信息科学版)》2025年第9期
P. 77
第 50 卷第 9 期 刘逸娴等:融合颜色特征的随机森林特征优选的黄河三角洲植被信息分类 1805
可用于分类训练和精度验证。首先将地物分为 100 个,样本数据质量可用 J-M(Jerries-Matusita)
植被区域与非植被区域,根据研究区典型地物类 距离进行分离程度的判定。本文选取的样本点 J-
别将植被分为互花米草、柽柳、碱蓬与芦苇,其解 M 距离在 1.9 以上,说明质量优秀,其中 70% 用于
译标志如图 2 所示。研究区每种样本点数不低于 随机森林分类的训练,30% 用于精度验证。
图 2 植被类型目视解译标志
Fig. 2 Visual Interpretation of Vegetation Types
2 研究方法 取纹理特征信息。其中第一主成分累计贡献率
为 69.95%,第二主成分累计贡献率为 99.34%,因
2.1 特征提取 此取前两个主成分来提取纹理特征。通过多次
本文选取光谱特征、指数特征、颜色特征与 对比实验分析,设置滑动窗口大小为 3,步长为 1,
纹理特征构建特征集,具体内容如下: 利用 GLCM 提取了 5 个参数,共 10 个纹理特征。
1)光 谱 特 征 选 择 影 像 的 蓝(B)、绿(G)、红 4)颜色指数本是主要用于 24 位彩色图像,需
(R)、近红外(near infrared,NIR)4 个波段数据归 要计算每个像素点的红色、绿色、蓝色的分量 [20] 。
一化后的像元值。 将 RGB 通道数据分别除以图像像素的最大值以
2)指数特征选择遥感领域常见的归一化植 进行归一化处理。首先,对于 8 位 RGB 通道,选
被 指 数(normalized difference vegetation index, 择其最大值为 255;然后进行色彩空间归一化处
NDVI)、比 值 植 被 指 数(ratio vegetation index, 理 ,得 到 光 谱 r、g、b 色 彩 分 量 ;最 后 生 成 颜 色 指
RVI)、土 壤 调 节 植 被 指 数(soil adjusted vegeta⁃ [21]
数。但颜色指数也能通过其他方式生成 ,如对
tion index,SAVI)、归 一 化 水 体 指 数(normalized
于多光谱图像而言,图像采集相机硬件不同,其
difference water index,NDWI)、差 值 植 被 指 数
RGB 颜色通道的值发生改变,部分学者直接将其
(difference vegetation index,DVI)等 5 种指数。
用于颜色指数的计算,但有研究表明,利用归一
3)纹理特征是遥感影像的一种重要特征,包
化色彩通道的指数可能更具有鲁棒性 [22] 。根据
含着每种地物呈现自己特定纹理信息及其与环
解译标志可知,黄河三角洲植被的色彩具有明显
境的相互关系。合理利用纹理信息,可以很大程
差距,首先仿照处理 24 位彩色图像的方法对可见
度提高遥感影像分类的精度。利用 ENVI 5.6 影
光谱进行了归一化处理,然后进行色彩空间归一
像纹理特征提取工具,基于灰度共生矩阵(gray-
化,得到 3 个色彩分量后生成颜色特征,用以提高
level co-occurrence matrix, GLCM)提取影像的纹
分类精度。色彩空间归一化计算式为:
理特征 [19] 。在进行纹理分析时,选取 5 个冗余度
ì R
较小的二阶统计量对影像进行定量分析,包括角 ï R + G + B
ï ï r =
ï
ï
二阶矩、相关性、对比度、熵和方差,分别简写为 ï G
ï ï
í g = (1)
GLCM_A、GLCM_Cor、GLCM_Con、GLCM_E ï ï R + G + B
ï
和 GLCM_V。通常计算 GLCM 的参数时,为了 ï B
ï
ïb =
î
避免得到冗余繁多的纹理特征,会将 0°、45°、90°、 ï ï R + G + B
135° 4 个方向的特征值的平均值作为最终的参数 本 文 选 取 的 颜 色 特 征 有 超 绿 指 数(excess
[23]
特征。为了避免对影像进行纹理分析时产生的统 green index,ExG) 、超红指数(excess red index,
[25]
[24]
计分量过多,造成数据冗余,增加计算难度与提取 ExR) 、超蓝指数(excess blue index,ExB) 、绿-
[26]
难度,因此对原始影像进行主成分分析之后再获 红差值指数(green-red difference index,GRDI) 、

