Page 52 - 《中国电力》2026年第5期
P. 52
2026 年 第 59 卷
时间尺度的长时间序列的数据集,将本文提出的 分位数损失函数 [30] 。对于给定的分位数 τ ∈ (0,1),
混合模型与其他常用循环神经网络预测模型进行 分位数损失函数 ρ τ (e)定义为
结果对比,验证所提方法的有效性。 ,e≥0
τe
(3)
ρ τ (e) =
(1−τ)(−e) ,e<0
1 研究方法 式(3)可写成
ρ τ (e) = e(τ−1 e<0 ) (4)
1.1 LASSO 算法
LASSO 算法 [29] 是一种线性回归的扩展方法, 式中: 1 e<0 的含义为:当 e < 0时为 1,否则为 0。
它通过加入 L1 正则化项进行特征选择和模型参数 1.3 GSNP 模型
压缩。LASSO 算法的优化目标函数为 GSNP 模型是由带门控神经元 σ i 构成的系统,
其结构如图 所示,在每个时刻,神经元都有一
p 1
n ∑ ∑
2 (1)
min (y i − ˆy i ) +π |β j | 个外部输入,每一个神经元根据当前的外部输入
i=1 j=1
和上一个时刻的状态来计算当前的输出。GSNP
式 中 : n 为 样 本 数 量 ; p 为 特 征 数 量 ; y 为 实 际 可以看作是一个有向图,每一个节点都是一个带
i
值; ˆ y i为预测值; β j 为第 j 个特征模型的参数(系 门控的神经元,每条边表示两个神经元之间的突
数); π为 L1 正则化项的权重。 触连接。
1.2 分位数回归损失 在脉冲规则 T/a m(r) → a f(r) 下,其脉冲条件可
在常见的预测模型中,为了使实际值与预测 以表示为 u i (t −1)≥T ,其中:T 为脉冲阈值; u i (t−
值之间误差的平方和最小化,通常使用均方误差 1)为 规 则 所 在 的 门 控 神 经 元 σ i 在 时 间 t −1的 状
(mean squared error,MSE)作为损失函数,MSE 为 态;a 为脉冲信号;m(r)、f(r) 分别为消耗函数和
1 n ∑ 2 生 成 函 数 。 如 果 u i (t −1)≥T 在 t −1时 成 立 , 那 么
E MS (β) = e i (2)
n σ i 就会触发。因此 m(r)脉冲被消耗, f(r)脉冲被生
i=1
式中:e 为第 i 个样本实际值与预测值之间的误 成并传递给下一个神经元。其状态方程表示为
i
T
差, e i = y i − x β; x i 为第 i 个样本的特征向量; β g 1 (r)u i (t −1)−g 2 (r)m(r)+a, σ i 触发
i (5)
u i (t) =
u i (t −1)+a, σ i 不触发
为模型参数矩阵; E MS (β)为模型参数为 β时的均
方误差。 式中: r = u i (t −1)+ x i (t), x i (t)为时间 t的外部输入;
为了实现分位数预测,将上述损失函数改为 g 1 (r)、 g 2 (r)分别为复位门和消耗门控制着神经元
y(t)
g 2 × f
τ (1) ,τ (2) ,τ (3) ,…τ (99)
− u(t)
输出层
g 1 × 分位数损失函数
u(t−1)
超参数设置
x(t) 激活函数tanh
y i (t)
W y
W y y(1) W y y(2) W y y(3) W y y(t)
σ i u(1) u(2) u(t−1)
展开 u(0)
u i
σ 1 σ 2 σ 3 σ t
T/a m(u) →a f(u)
x(1) x(2) x(3) x(t)
W x W x W x W x
x i (t)
W x
图 1 GSNP 的结构
Fig. 1 Structure of GSNP
48

