Page 53 - 《中国电力》2026年第5期
P. 53
随泽远等:基于门控脉冲神经 P 系统模型的概率负荷预测 2026 年第 5 期
状态的更新,2 个门控函数都是非线性的。 方法通过构造多棵决策树对缺失值进行预测,使
输出方程表示为 填补的数据具有随机性和不确定性,更能反映未
y(t) = f(r) = f(u i (t −1)+ x i (t)) (6) 知数据的真实分布。其计算式为
在长时间序列负荷预测中,GSNP 系统只考 1 N ∑
ˆ y = y e (12)
虑一个神经元,记作 σ,并且预测中考虑 2 个特 N e=1
殊假设:1) T = −∞,即任何时间都可以触发神
ˆ y
式中: 为预测结果;N 为决策树的数量; y e 为第
经元;2) m ≡ f ,即让消耗函数与生成函数相等。 e 棵决策树的预测结果。
由于系统中只考虑一个神经元,因此状态方 此外,数据中的特征具有不同的量级,这会
程(5)和输出方程(6)可改写为 导 致 模 型 预 测 精 度 会 下 降 。 为 此 进 行 归 一 化 处
u(t) = g 1 (u)u(t −1)−g 2 (u) f(u(t −1)+ x(t))
(7) 理,将特征缩放到 0-1 的区间内,其计算式为
y(t) = f(u(t −1)+ x(t)) X − X min
X s = (13)
神经元的状态由两个门控机制 g 1 (u)和 g 2 (u)共 X max − X min
同更新,因此 GSNP 模型适用于长时间序列的负 式中:X 为待缩放的特征;X mi n 为数据中该特征
荷预测问题。 的最小值;X ma x 为数据中该特征的最大值;X 为
s
为了更加通用,将模型扩展到多维,输入、 缩放后的特征。
输出和状态分别记作 x(t)、 y(t)和 u(t),则输出方程 2.2 LASSO-QRGSNP 模型
和状态方程改写为 对预处理后的最低温度、最高温度、平均温
y(t) = W y f(W u u(t −1)+W x x(t)+ b) 度 、 平 均 湿 度 和 降 雨 量 等 外 部 特 征 数 据 进 行
( ′ ′ ′ )
u(t) = g 1 (t)u(t −1)−g 2 (t) f W u(t −1)+W x(t)+ b LASSO 特征选取。L1 正则化项在优化过程中将模
u
x
(8)
型中的一些参数变为 0,从而实现特征选择。π 值
式中: W y 、 W u 、 W x 、 W 和 W 为权重矩阵; b 和 越大,越多的系数被压缩为零,所选特征越少。
′
′
′
u
x
b为偏置向量。
反之,较小的 π 值会保留更多的特征。本文将 L1
此外,复位门和消耗门方程的分别为
正则化的权重 π 设置为 0.001。设负荷预测序列为
p
g 1 (t) = ρ(W r x(t)+U r u(t −1)+ b r ) (9) Y = [Y 1 Y 2 ··· Y n ], 特 征 序 列 为 X c = [X X ··· X c ],
1
2
c c
i
g 2 (t) = ρ(W c x(t)+U c u(t −1)+ b c ) (10) 其中 X 表示预测目标 c的第 i(i=1, ···, p)个特征,
c
式中: W r 、 U r 、 W c 和 U c 为权重矩阵; b r 和 b c 为偏 p 为特征数量,本文中 p取 5。对应的 LASSO 模型
可表示为
置向量; ρ为非线性激活函数。
1 2 5 ∑
min β ||Y − X c β|| +π |β j | (14)
2
2 预测模型 2 j=1
将选取的当前时刻外部特征信息与前一时刻
2.1 数据的预处理
的负荷值一同输入到 GSNP 模型中训练,输出为
数据中存在缺失值以及异常值,首先利用四
当前时刻的负荷预测值。模型采用单步滚动预测
分 位 距 ( interquartile range, IQR) 方 法 筛 选 异 常
策 略 , 一 次 预 测 的 最 大 提 前 时 间 为 1 个 采 样 间
值,将数据排序后划分出 3 个分位数点。分位数
隔 , 在 不 同 案 例 研 究 中 分 别 为 60 min 和 30 min,
点 分 别 为 第 25 分 位 数 、 中 位 数 和 第 75 分 位 数 ,
因此本文所研究类型为短期概率负荷预测。其中
记作 Q 、Q 和 2 Q ,则四分位距 R 可表示为 GSNP 是在循环神经网络(recurrent neural network,
3
1
(11)
R = Q 3 − Q 1 RNN)的框架下实现的,所以 GSNP 也可以看做
由 此 可 以 确 定 正 常 值 的 范 围 为 [Q 1 −1.5×R, 一种引入了神经元脉冲机制的循环神经网络,其
Q 3 −1.5×R]。当数据不在此范围内时,标记为缺 有 2 个控制门,作用是控制门控神经元状态的更
失值,并与原有缺失值一同进行填补。 新,在长时间的负荷预测中能够选择性地保留或
缺失值通过随机森林回归方法进行填补,该 遗忘信息。此外,相较于以往的循环神经网络的
49

