Page 52 - 《中国电力》2026年第5期

P. 52

2026 年第 59 卷

时间尺度的长时间序列的数据集，将本文提出的分位数损失函数 [30] 。对于给定的分位数 τ ∈ (0,1)，
混合模型与其他常用循环神经网络预测模型进行分位数损失函数 ρ τ (e)定义为
结果对比，验证所提方法的有效性。  ,e≥0
τe

 （3）
ρ τ (e) = 
(1−τ)(−e) ,e＜0

1 研究方法式（3）可写成

ρ τ (e) = e(τ−1 e＜0 ) （4）
1.1 LASSO 算法
LASSO 算法 [29] 是一种线性回归的扩展方法，式中： 1 e＜0 的含义为：当 e ＜ 0时为 1，否则为 0。

它通过加入 L1 正则化项进行特征选择和模型参数 1.3 GSNP 模型
压缩。LASSO 算法的优化目标函数为 GSNP 模型是由带门控神经元 σ i 构成的系统，
  其结构如图所示，在每个时刻，神经元都有一
p 1
 n ∑ ∑ 
 
  2   （1）
min   (y i − ˆy i ) +π |β j |   个外部输入，每一个神经元根据当前的外部输入
 
 
i=1 j=1
和上一个时刻的状态来计算当前的输出。GSNP
式中： n 为样本数量； p 为特征数量； y 为实际可以看作是一个有向图，每一个节点都是一个带
i
值； ˆ y i为预测值； β j 为第 j 个特征模型的参数（系门控的神经元，每条边表示两个神经元之间的突
数）； π为 L1 正则化项的权重。触连接。

1.2 分位数回归损失在脉冲规则 T/a m(r) → a f(r) 下，其脉冲条件可
在常见的预测模型中，为了使实际值与预测以表示为 u i (t −1)≥T ，其中：T 为脉冲阈值； u i (t−
值之间误差的平方和最小化，通常使用均方误差 1)为规则所在的门控神经元 σ i 在时间 t −1的状
（mean squared error，MSE）作为损失函数，MSE 为态；a 为脉冲信号；m(r)、f(r) 分别为消耗函数和
1 n ∑ 2 生成函数。如果 u i (t −1)≥T 在 t −1时成立，那么
E MS (β) = e i （2）
n σ i 就会触发。因此 m(r)脉冲被消耗， f(r)脉冲被生
i=1
式中：e 为第 i 个样本实际值与预测值之间的误成并传递给下一个神经元。其状态方程表示为
i

T
差， e i = y i − x β； x i 为第 i 个样本的特征向量； β g 1 (r)u i (t −1)−g 2 (r)m(r)+a, σ i 触发

i （5）
u i (t) = 
 u i (t −1)+a, σ i 不触发
为模型参数矩阵； E MS (β)为模型参数为 β时的均
方误差。式中： r = u i (t −1)+ x i (t)， x i (t)为时间 t的外部输入；
为了实现分位数预测，将上述损失函数改为 g 1 (r)、 g 2 (r)分别为复位门和消耗门控制着神经元

y(t)
g 2 × f
τ (1) ,τ (2) ,τ (3) ,…τ (99)
− u(t)
输出层
g 1 × 分位数损失函数
u(t−1)
超参数设置
x(t) 激活函数tanh
y i (t)
W y
W y y(1) W y y(2) W y y(3) W y y(t)
σ i u(1) u(2) u(t−1)
展开 u(0)
u i
σ 1 σ 2 σ 3 σ t
T/a m(u) →a f(u)
x(1) x(2) x(3) x(t)
W x W x W x W x
x i (t)
W x

图 1 GSNP 的结构
Fig. 1 Structure of GSNP
48

47 48 49 50 51 52 53 54 55 56 57