Page 123 - 《中国电力》2026年第5期

P. 123

周专等：基于动态权重混合专家模型的超短期电力负荷预测 2026 年第 5 期

较于单一模型及传统混合方法，DW-MoE 模型在超短期受限。
电力负荷预测精度和收敛速度上均表现出明显优势，尤负荷异常检测是提升预测鲁棒性的关键，但
其在异常负荷场景中预测误差降低显著，验证了模型对
传统方法（如 3σ 法则、孤立森林）依赖人工阈
突变负荷模式的鲁棒性。
值，难以适应非平稳数据 [18-20] 。生成对抗网络（gen-
关键词：超短期负荷预测；混合专家模型；动态权重；
erative adversarial network，GAN）通过学习正常负荷
在线更新
分布，为异常量化提供了数据驱动方案。文献 [21]
DOI：10.11930/j.issn.1004-9649.202506007

将带梯度惩罚的 Wasserstein 生成对抗网络（WGAN-
1 引言 GP）用于光伏功率异常检测，通过判别器置信度
识别离群点，但在负荷预测中存在局限：仅关注

随着智能电网与可再生能源的快速发展，电单一时序维度，忽略气象-负荷的耦合异常（如高
力系统对负荷预测的实时性与精度提出了更高要温+负荷骤降的非典型场景） [22] 。此外，现有研
求。超短期负荷预测作为电网调度、需求响应和究多将异常检测作为独立模块，未与预测模型深
储能管理的关键环节，须精准捕捉负荷频率波动度耦合。文献 [23] 在工业负荷预测中发现，异常
特性 [1-6] 。例如，工业负荷的启停、居民用电的峰修正仅降低 5% 误差，远低于理论预期，根源在
谷变化，以及极端天气下空调负荷的激增，均会于权重调整与预测过程的割裂。
导致负荷序列呈现复杂的非线性特征。传统单一动态权重的核心是建立权重与数据特征/模型
模型（如自回归积分滑动平均模型（autoregressive 表现的动态映射，但现有方法存在显著缺陷。误
integrated moving average model，ARIMA）、长短期差反馈法，如指数加权移动平均（ exponentially
记忆网络（long short-term memory，LSTM））难以 weighted moving average， EWMA）依赖固定窗口
同时处理多源异构数据（如历史负荷、气象信息、统计，对突发异常响应滞后 [24] ，文献 [25] 在超短
日历特征），而静态混合模型（如固定权重融合）期负荷预测中发现，窗口长度须手动调整，否则
无法适应数据分布的动态变化（如季节更替、用平均绝对误差增加 12%。贝叶斯推理虽能量化不
户行为模式调整） [7-9] 。因此，如何设计一种兼具确定性，但计算复杂度高，难以满足在线预测的
多模态融合能力与动态适应性的预测模型，成为实时性要求 [26-29] 。强化学习通过奖励信号优化权
当前研究的热点。重，但需大量标注数据，且易陷入局部最优 [30-34] 。
针对电力负荷的强时序性（表现为显著的时此外，现有动态权重多针对单一模态数据设计，
间周期性，如日内峰谷交替、周内工作日 / 周末文献 [35] 在气象-负荷融合中采用固定权重分配，
差异、季节性波动，且当前负荷与历史负荷存在未考虑不同模态数据的时效性差异（如气象预报
强连续相关性，呈现 15 min 级高频波动特性）与更新频率低于负荷数据）。
多模态特征，混合专家模型（ mixture of experts，综上所述，现有模型和方法在实现超短期负
MoE）因其 “ 分治协同 ” 特性被广泛探索。文荷预测时仍存在一定不足。1）现有 MoE 模型缺
献 [10] 提出层次化 MoE 框架，结合多阶段、多任乏动态门控机制与多模态数据融合能力，难以兼
务联合训练，实现了层次化的信息共享模式，但顾负荷预测的实时性与多维度特征耦合关系；2）异
静态门控机制（如固定阈值路由）难以捕捉负荷常检测与负荷预测模型的深度耦合机制缺失，导
的实时波动，导致专家分工僵化 [11-13] 。稀疏门控致异常场景下的预测修正效果有限，缺乏基于多
MoE 虽通过动态激活降低计算成本 [14] ，但在负荷源数据的协同异常建模能力；3）动态权重机制
预测中面临专家负载失衡问题，即某时段专家可缺乏多模态数据驱动的实时调整能力，难以在计
能因过度激活引发过拟合。文献 [15] 在工业负荷算效率与适应性之间取得平衡，无法满足超短期
预测中发现，门控网络对节假日负荷突变的响应负荷预测的高频动态需求。针对现有模型在动态
滞后达 30 min 以上。此外，现有电力领域 MoE 多适应性、多模态融合与异常修正效率方面的挑战，
依赖单一数据源（如仅历史数据或气象），忽略本文提出一种动态权重混合专家模型（ dynamic
多维度信息的协同建模 [16-17] ，导致模型泛化能力 weight-mixture of experts，DW-MoE）。该模型通过

119

118 119 120 121 122 123 124 125 126 127 128