Page 132 - 《中国电力》2026年第5期
P. 132
2026 年 第 59 卷
5) 模 型 五 为 BiLSTM+XGBoost+GAN 动 态 权 重模型 RMSE 降低 2.97 MW,但日均训练耗时增
重融合模型(无在线更新)。该模型在 BiLSTM+ 加 14.3 min,推理耗时基本持平(仅增加 1 ms)。
XGBoost+GAN 静态融合模型的基础上,引入动态 这一结果表明在线更新机制通过分周期增量学习
权重机制。 (而非全量重训)控制了推理阶段的额外开销,
6) 模 型 六 为 DW-MoE 全 周 期 在 线 更 新 模 型 实现了长期适应性与实时性的平衡,尽管训练成
( 动 态 权 重 +异 常 检 测 +在 线 更 新 ) 。 完 整 集 成 本有所增加,但避免了模型性能随时间的衰减。
DW-MoE 的核心模块(各专家模型、动态权重机 综上,各模块的引入均存在精度提升与计算
制、分周期在线更新)。 成本的权衡。GAN 与动态权重机制主要增加推理
对比结果如表 5 所示。表 5 的消融实验结果 阶 段 开 销 , 在 线 更 新 机 制 主 要 增 加 训 练 阶 段 开
揭示了各模块的必要性及计算成本变化规律。 销,但通过模块化设计与增量学习策略,模型整
体仍能满足超短期负荷预测的实时性要求,同时
表 5 消融实验对比
Table 5 Comparison of ablation experiments 显著提升预测精度与鲁棒性。
RMSE/ MAE/ MAPE/ 日均训练 单次推理 3.4.4 参数敏感性分析
模型
MW MW % 耗时/min 耗时/ms 为验证异常修正系数 α 与异常得分阈值 β 的
一 58.22 44.59 5.72 25.3 22
最 优 取 值 , 本 节 通 过 控 制 变 量 法 开 展 敏 感 性 实
二 56.32 43.47 5.59 22.1 18
验 , 结 合 RMSE、 MAE、 MAPE 及 正 常 样 本 识 别
三 42.37 31.25 3.36 28.6 35
准确率 A 等指标综合评估模型性能。其中正常样
c
四 38.91 28.46 2.98 42.3 42
本识别准确率定义为模型正确判定为“正常”的
五 35.69 25.74 2.46 42.5 58
样本数占实际正常样本总数的比例,反映模型对
六 32.72 23.73 2.28 56.8 59 常规负荷模式的稳定识别能力,即
1)多专家协同建模的必要性与成本平衡。单一 A c = N truth ×100% (33)
N all
时序模型(BiLSTM)与单一非线性模型(XGBoost)
计算成本较低,但预测误差显著高于融合模型。 式 中 : N trut h 为 实 际 正 常 且 模 型 判 定 正 常 的 样 本
l
BiLSTM+XGBoost 静态融合模型通过协同建模将 数;N 为实际正常样本总数。
al
RMSE 降低 13.95 MW~15.85 MW,但训练耗时增加 α 用于动态调整异常场景下专家权重的修正
3.3 min~6.5 min,推理耗时增加 13 ms~17 ms,表明 幅度,其取值直接影响模型对异常负荷的响应强
多源特征融合须以适度计算成本为代价。 度。实验设计 α 的取值范围为 0.10~0.30,步长为
2)异常检测模块(GAN)的成本与收益。对 0.05,在测试集上对比不同 α 值下模型在异常场
比 BiLSTM+XGBoost 静态融合模型与 MoE 固定权重 景下的预测性能,结果如表 6 所示。
融合模型(加入 GAN),后者 RMSE 降低 3.46 MW, 结 果 显 示 , α=0.20 时 异 常 场 景 的 RMSE
但日均训练耗时增加 13.7 min,推理耗时增加 7 ms。 (32.72 MW)、MAE(23.73 MW)及 MAPE(2.28%)
这一结果验证了 GAN 对鲁棒性的提升价值,同 均为最低。当 α<0.20 时,权重修正不足,异常
时表明异常检测模块会引入一定计算开销。 场景下常规专家(BiLSTM/XGBoost)的误差占比
3)动态权重机制的实时性权衡。MoE 固定权 表 6 不同 α 值的异常场景预测性能对比
重融合模型虽通过 GAN 降低误差,但固定权重 Table 6 Comparison of abnormal scenario prediction
performances with different α values
无法适配动态场景;DW-MoE 动态权重融合模型
(无在线更新)通过滑动窗口误差反馈进一步降 α 值 RMSE/MW MAE/MW MAPE/%
低 RMSE 3.22 MW,但推理耗时增加 16 ms。这说 0.10 36.89 27.42 2.61
明动态权重机制在提升精度的同时,会增加推理 0.15 34.52 25.17 2.43
时间。 0.20 32.72 23.73 2.28
0.25 33.15 24.09 2.32
4)在线更新机制的长期成本与适应性。DW-
MoE 全周期在线更新模型较无在线更新的动态权 0.30 35.27 26.31 2.53
128

