Page 123 - 《中国电力》2026年第5期
P. 123
周专等:基于动态权重混合专家模型的超短期电力负荷预测 2026 年第 5 期
较于单一模型及传统混合方法,DW-MoE 模型在超短期 受限。
电力负荷预测精度和收敛速度上均表现出明显优势,尤 负荷异常检测是提升预测鲁棒性的关键,但
其在异常负荷场景中预测误差降低显著,验证了模型对
传统方法(如 3σ 法则、孤立森林)依赖人工阈
突变负荷模式的鲁棒性。
值,难以适应非平稳数据 [18-20] 。生成对抗网络(gen-
关 键 词 : 超 短 期 负 荷 预 测 ; 混 合 专 家 模 型 ; 动 态 权 重 ;
erative adversarial network,GAN)通过学习正常负荷
在线更新
分布,为异常量化提供了数据驱动方案。文献 [21]
DOI:10.11930/j.issn.1004-9649.202506007
将带梯度惩罚的 Wasserstein 生成对抗网络(WGAN-
1 引言 GP)用于光伏功率异常检测,通过判别器置信度
识别离群点,但在负荷预测中存在局限:仅关注
随着智能电网与可再生能源的快速发展,电 单一时序维度,忽略气象-负荷的耦合异常(如高
力系统对负荷预测的实时性与精度提出了更高要 温+负荷骤降的非典型场景) [22] 。此外,现有研
求。超短期负荷预测作为电网调度、需求响应和 究多将异常检测作为独立模块,未与预测模型深
储能管理的关键环节,须精准捕捉负荷频率波动 度耦合。文献 [23] 在工业负荷预测中发现,异常
特性 [1-6] 。例如,工业负荷的启停、居民用电的峰 修正仅降低 5% 误差,远低于理论预期,根源在
谷变化,以及极端天气下空调负荷的激增,均会 于权重调整与预测过程的割裂。
导致负荷序列呈现复杂的非线性特征。传统单一 动态权重的核心是建立权重与数据特征/模型
模型(如自回归积分滑动平均模型(autoregressive 表现的动态映射,但现有方法存在显著缺陷。误
integrated moving average model,ARIMA)、长短期 差 反 馈 法 , 如 指 数 加 权 移 动 平 均 ( exponentially
记忆网络(long short-term memory,LSTM))难以 weighted moving average, EWMA) 依 赖 固 定 窗 口
同时处理多源异构数据(如历史负荷、气象信息、 统计,对突发异常响应滞后 [24] ,文献 [25] 在超短
日历特征),而静态混合模型(如固定权重融合) 期负荷预测中发现,窗口长度须手动调整,否则
无法适应数据分布的动态变化(如季节更替、用 平均绝对误差增加 12%。贝叶斯推理虽能量化不
户行为模式调整) [7-9] 。因此,如何设计一种兼具 确定性,但计算复杂度高,难以满足在线预测的
多模态融合能力与动态适应性的预测模型,成为 实时性要求 [26-29] 。强化学习通过奖励信号优化权
当前研究的热点。 重,但需大量标注数据,且易陷入局部最优 [30-34] 。
针对电力负荷的强时序性(表现为显著的时 此外,现有动态权重多针对单一模态数据设计,
间周期性,如日内峰谷交替、周内工作日 / 周末 文献 [35] 在气象-负荷融合中采用固定权重分配,
差异、季节性波动,且当前负荷与历史负荷存在 未考虑不同模态数据的时效性差异(如气象预报
强连续相关性,呈现 15 min 级高频波动特性)与 更新频率低于负荷数据)。
多 模 态 特 征 , 混 合 专 家 模 型 ( mixture of experts, 综上所述,现有模型和方法在实现超短期负
MoE) 因 其 “ 分 治 协 同 ” 特 性 被 广 泛 探 索 。 文 荷预测时仍存在一定不足。1)现有 MoE 模型缺
献 [10] 提出层次化 MoE 框架,结合多阶段、多任 乏动态门控机制与多模态数据融合能力,难以兼
务联合训练,实现了层次化的信息共享模式,但 顾负荷预测的实时性与多维度特征耦合关系;2)异
静态门控机制(如固定阈值路由)难以捕捉负荷 常检测与负荷预测模型的深度耦合机制缺失,导
的实时波动,导致专家分工僵化 [11-13] 。稀疏门控 致异常场景下的预测修正效果有限,缺乏基于多
MoE 虽通过动态激活降低计算成本 [14] ,但在负荷 源数据的协同异常建模能力;3)动态权重机制
预测中面临专家负载失衡问题,即某时段专家可 缺乏多模态数据驱动的实时调整能力,难以在计
能因过度激活引发过拟合。文献 [15] 在工业负荷 算效率与适应性之间取得平衡,无法满足超短期
预测中发现,门控网络对节假日负荷突变的响应 负荷预测的高频动态需求。针对现有模型在动态
滞后达 30 min 以上。此外,现有电力领域 MoE 多 适应性、多模态融合与异常修正效率方面的挑战,
依赖单一数据源(如仅历史数据或气象),忽略 本 文 提 出 一 种 动 态 权 重 混 合 专 家 模 型 ( dynamic
多维度信息的协同建模 [16-17] ,导致模型泛化能力 weight-mixture of experts,DW-MoE)。该模型通过
119

