Page 125 - 《武汉大学学报(信息科学版)》2025年第9期
P. 125

第 50 卷第 9 期             毛正君等:基于数据融合的梯田型黄土滑坡隐患监测预警                                    1853


                一个组别内的事物之间有高相似度,而不同组别
                之间有较大的差异性。聚类分析旨在使用聚类
                算法来发现数据集的未知分组或隐含的结构信
                息 [37] ,其分析步骤如下:对原始数据进行标准化
                处理;采用平方欧氏距离算法确定数据两两间距
                离,构造距离矩阵;将距离最近的两类聚成一个
                新类,其他数据仍各自为一类,继续计算新类与
                当前各类的距离,进行聚类并重复以上步骤,直
                至将所有数据聚成一类;绘制聚类谱系图,按照                                        图 3 BP 神经网络结构
                不同的分类标准或原则得出不同的分类结果,并                                   Fig. 3 BP Neural Network Structure
                对 类 做 出 解 释  [38] 。 平 方 欧 氏 距 离 算 法 的 计 算                           m
                式为:                                                          c j = f ( ∑  v ij x i - a j )  (17)
                                    n
                                   ∑( x i - y i)  2                                 i = 1
                               2
                             d x,y =                   (12)                        (  n        )
                                   i = 1                                     y k = f  ∑  ω jk x j - a k  (18)
                       2
                式中, d x,y 为数据之间的平方欧式距离; x i、 y i 为数                                 j = 1
                据集中的两个数据;n 表示数据集的属性数。                           式中, a j、 a k 分别为输入层与隐含层、隐含层与输
                    逐步回归的实质是建立最优的多元线性回                          出层的阈值;f 为激活函数。
                归方程   [39] ,计算式为:
                                  ( )      ( )                  3 结果与讨论
                                           L
                                   L
                             y ͂ = b 0 +  ∑  b j x j   (13)
                                      j ∈( )
                                        L
                                                                3.1 监测数据预处理
                                ( )    ( )  r yy
                                       L
                                 L
                               b j = b′    j           (14)     3.1.1 粗差剔除
                                          r jj
                             b′   j = r jy     ,j ∈( L)  (15)       本文以挂马沟梯田型黄土滑坡隐患裂缝计
                               ( )
                                    ( ) l
                               L
                                                                的数据为例进行粗差剔除,裂缝计原始累积位移-
                              ( )          ( )
                                           L
                               L
                             b 0 = y ˉ -  ∑  b j x ˉ j  (16)
                                       j ∈{ } j                 时间序列、监测数据异常和粗差剔除结果如图 4
                                           ( )
                                           L
                式中,L 为挑出的变量组合; b 0 为变量组合 L 对                    所示。由图 4(a)可以看出,累积位移随时间逐渐
                                     ( )
                                     L
                应的回归方程常数项; b j 为变量组合 L 对应的变                     增大,在 2021⁃02⁃08 前后出现数据异常值。在数
                                                                据采集的过程中会因为传感器故障、环境因素、
                量系数;x j 为变量组合 L 对应的变量; r yy 为变量组
                                                                人为干扰等原因导致数据出现异常值,如图 4(b)
                合 L 对应的增广矩阵中第 y 列的第 y 个值; r jj 为变
                                                                所示;依据拉依达准则,利用 Matlab 软件进行监
                                                          ( ) l
                量组合 L 对应的增广矩阵中第 j 列的第 j 个值; r jy
                                                                测数据粗差剔除,粗差剔除后的裂缝计累积位移
                为变量组合 L 对应的增广矩阵中第 y 列的第 j 个
                                                                监测数据如图 4(c)所示。
                值; y ˉ 为因变量 y 的平均值; x ˉ j 为变量组合 L 对应
                                                                3.1.2 数据插补
                的变量的平均值。
                                                                    本文以挂马沟梯田型黄土滑坡隐患的 GNSS
                2.2.3 决策级融合
                                                                地表位移监测站 2 的水平位移数据为例进行数据
                    本文采用反向传播(back propagation,BP)神
                                                                插补。依据分段三次 Hermite 插值法,利用 Mat⁃
                经网络方法进行决策级数据融合。BP 神经网络
                                                                lab 软件对 GNSS 地表位移监测站 2 的水平位移
                通过调整权值来训练更新模型,调整后的权值再
                                                                数据进行数据插补,数据插补后的水平位移监测
                次训练更新模型,循环往复直到满足精度要求。
                                                                数据如图 5 所示。
                BP 神经网络结构如图 3 所示,其中输入层为 X =
                                                                3.1.3 数据平滑
                ( x 1,x 2,⋯,x i,⋯,x m),隐 含 层 C=(c 1, c 2,… ,c j,
                                                                    本文以§3.1.2 数据为例进行数据平滑。依据
                …,c n ),输出层为 Y=(y 1, y 2,…,y k,…,y l ), v ij、 ω jk  S⁃G 平滑法,利用 Matlab 软件进行数据平滑,数
                分别为输入层与隐含层、隐含层与输出层之间的                           据平滑后的水平位移监测数据如图 6 所示。
                对应权值    [40] 。                                      对于 S⁃G 平滑法的效果,一般采用均方根误
                    隐含层内的第 j 个神经元 c j 和输出层内的第                   差(root mean square error, RMSE)和平滑度两个
                k 个神经元 y k 满足:                                  指标进行评价。RMSE 体现了原始数据与平滑
   120   121   122   123   124   125   126   127   128   129   130