Page 52 - 《中国电力》2026年第5期
P. 52

2026  年 第 59 卷



              时间尺度的长时间序列的数据集,将本文提出的                             分位数损失函数         [30] 。对于给定的分位数        τ ∈ (0,1),
              混合模型与其他常用循环神经网络预测模型进行                             分位数损失函数        ρ τ (e)定义为
              结果对比,验证所提方法的有效性。                                                               ,e≥0
                                                                                  τe

                                                                                                        (3)
                                                                            ρ τ (e) = 
                                                                                   (1−τ)(−e) ,e<0
                                                                                  
              1    研究方法                                             式(3)可写成

                                                                                ρ τ (e) = e(τ−1 e<0 )    (4)
              1.1    LASSO  算法
                  LASSO  算法  [29]  是一种线性回归的扩展方法,                式中:    1 e<0 的含义为:当     e < 0时为   1,否则为     0。

              它通过加入      L1  正则化项进行特征选择和模型参数                    1.3    GSNP  模型
              压缩。LASSO     算法的优化目标函数为                               GSNP  模型是由带门控神经元            σ i 构成的系统,
                                                              其结构如图        所示,在每个时刻,神经元都有一
                                            p                               1
                              n ∑         ∑    
                                               
                                     2             (1)
                          min    (y i − ˆy i ) +π  |β j |    个外部输入,每一个神经元根据当前的外部输入
                                               
                                               
                              i=1          j=1
                                                                和上一个时刻的状态来计算当前的输出。GSNP
              式 中 : n  为 样 本 数 量 ; p  为 特 征 数 量 ; y 为 实 际       可以看作是一个有向图,每一个节点都是一个带
                                                    i
              值;   ˆ y i为预测值;  β j 为第  j 个特征模型的参数(系             门控的神经元,每条边表示两个神经元之间的突
              数);    π为  L1 正则化项的权重。                            触连接。

              1.2    分位数回归损失                                        在脉冲规则       T/a m(r)  → a f(r) 下,其脉冲条件可
                  在常见的预测模型中,为了使实际值与预测                           以表示为     u i (t −1)≥T ,其中:T  为脉冲阈值;       u i (t−
              值之间误差的平方和最小化,通常使用均方误差                             1)为 规 则 所 在 的 门 控 神 经 元      σ i 在 时 间  t −1的 状
              (mean squared error,MSE)作为损失函数,MSE          为     态;a   为脉冲信号;m(r)、f(r) 分别为消耗函数和
                                      1  n ∑  2                 生 成 函 数 。 如 果    u i (t −1)≥T 在  t −1时 成 立 , 那 么
                              E MS (β) =   e i         (2)
                                      n                         σ i 就会触发。因此       m(r)脉冲被消耗,       f(r)脉冲被生
                                        i=1
              式中:e 为第      i 个样本实际值与预测值之间的误                     成并传递给下一个神经元。其状态方程表示为
                      i
                                                                        
                          T
              差,   e i = y i − x β;  x i 为第  i 个样本的特征向量;   β            g 1 (r)u i (t −1)−g 2 (r)m(r)+a, σ i 触发
                                                                        
                          i                                                                              (5)
                                                                  u i (t) = 
                                                                         u i (t −1)+a,          σ i 不触发
              为模型参数矩阵;          E MS (β)为模型参数为      β时的均
              方误差。                                              式中:    r = u i (t −1)+ x i (t), x i (t)为时间  t的外部输入;
                  为了实现分位数预测,将上述损失函数改为                           g 1 (r)、 g 2 (r)分别为复位门和消耗门控制着神经元

                                                              y(t)
                                      g 2       ×            f
                                                                           τ (1) ,τ (2) ,τ (3) ,…τ (99)
                                                −     u(t)
                                                                             输出层
                                     g 1        ×                         分位数损失函数
                            u(t−1)
                                                                            超参数设置
                                                              x(t)         激活函数tanh
                                           y i (t)
                                     W y
                                                          W y  y(1)  W y  y(2)  W y  y(3)  W y  y(t)
                                      σ i                       u(1)      u(2)      u(t−1)
                                                 展开   u(0)
                                         u i
                                                            σ 1       σ 2       σ 3         σ t
                                     T/a m(u) →a  f(u)
                                                              x(1)     x(2)      x(3)         x(t)
                                                          W x       W x       W x         W x
                                           x i (t)
                                      W x

                                                       图 1   GSNP  的结构
                                                    Fig. 1    Structure of GSNP
               48
   47   48   49   50   51   52   53   54   55   56   57