Page 132 - 《中国电力》2026年第5期
P. 132

2026  年 第 59 卷



                  5) 模 型 五 为   BiLSTM+XGBoost+GAN 动 态 权         重模型 RMSE 降低 2.97 MW,但日均训练耗时增
              重融合模型(无在线更新)。该模型在 BiLSTM+                         加 14.3 min,推理耗时基本持平(仅增加 1 ms)。
              XGBoost+GAN 静态融合模型的基础上,引入动态                       这一结果表明在线更新机制通过分周期增量学习
              权重机制。                                             (而非全量重训)控制了推理阶段的额外开销,
                  6) 模 型 六 为   DW-MoE 全 周 期 在 线 更 新 模 型         实现了长期适应性与实时性的平衡,尽管训练成
              ( 动 态 权 重 +异 常 检 测 +在 线 更 新 ) 。 完 整 集 成           本有所增加,但避免了模型性能随时间的衰减。
              DW-MoE 的核心模块(各专家模型、动态权重机                              综上,各模块的引入均存在精度提升与计算
              制、分周期在线更新)。                                       成本的权衡。GAN         与动态权重机制主要增加推理
                  对比结果如表        5  所示。表    5  的消融实验结果           阶 段 开 销 , 在 线 更 新 机 制 主 要 增 加 训 练 阶 段 开
              揭示了各模块的必要性及计算成本变化规律。                              销,但通过模块化设计与增量学习策略,模型整
                                                                体仍能满足超短期负荷预测的实时性要求,同时
                             表 5   消融实验对比
                   Table 5   Comparison of ablation experiments  显著提升预测精度与鲁棒性。

                     RMSE/   MAE/   MAPE/  日均训练     单次推理        3.4.4    参数敏感性分析
               模型
                      MW     MW      %     耗时/min    耗时/ms          为验证异常修正系数            α  与异常得分阈值        β 的
                一     58.22  44.59   5.72    25.3      22
                                                                最 优 取 值 , 本 节 通 过 控 制 变 量 法 开 展 敏 感 性 实
                二     56.32  43.47   5.59    22.1      18
                                                                验 , 结 合   RMSE、 MAE、 MAPE     及 正 常 样 本 识 别
                三     42.37  31.25   3.36    28.6      35
                                                                准确率    A 等指标综合评估模型性能。其中正常样
                                                                        c
                四     38.91  28.46   2.98    42.3      42
                                                                本识别准确率定义为模型正确判定为“正常”的
                五     35.69  25.74   2.46    42.5      58
                                                                样本数占实际正常样本总数的比例,反映模型对
                六     32.72  23.73   2.28    56.8      59       常规负荷模式的稳定识别能力,即

                  1)多专家协同建模的必要性与成本平衡。单一                                        A c =  N truth  ×100%    (33)
                                                                                     N all
              时序模型(BiLSTM)与单一非线性模型(XGBoost)
              计算成本较低,但预测误差显著高于融合模型。                             式 中 : N trut h  为 实 际 正 常 且 模 型 判 定 正 常 的 样 本
                                                                       l
              BiLSTM+XGBoost 静态融合模型通过协同建模将                      数;N 为实际正常样本总数。
                                                                      al
              RMSE 降低    13.95 MW~15.85 MW,但训练耗时增加                  α  用于动态调整异常场景下专家权重的修正
              3.3 min~6.5 min,推理耗时增加       13 ms~17 ms,表明       幅度,其取值直接影响模型对异常负荷的响应强
              多源特征融合须以适度计算成本为代价。                                度。实验设计        α  的取值范围为       0.10~0.30,步长为
                  2)异常检测模块(GAN)的成本与收益。对                         0.05,在测试集上对比不同             α  值下模型在异常场
              比 BiLSTM+XGBoost 静态融合模型与 MoE 固定权重                 景下的预测性能,结果如表              6  所示。
              融合模型(加入 GAN),后者 RMSE 降低 3.46 MW,                      结 果 显 示 , α=0.20    时 异 常 场 景 的      RMSE
              但日均训练耗时增加 13.7 min,推理耗时增加 7 ms。                   (32.72 MW)、MAE(23.73 MW)及        MAPE(2.28%)
              这一结果验证了 GAN 对鲁棒性的提升价值,同                           均为最低。当        α<0.20  时,权重修正不足,异常
              时表明异常检测模块会引入一定计算开销。                               场景下常规专家(BiLSTM/XGBoost)的误差占比
                  3)动态权重机制的实时性权衡。MoE 固定权                               表 6   不同  α  值的异常场景预测性能对比
              重融合模型虽通过 GAN 降低误差,但固定权重                             Table 6   Comparison of abnormal scenario prediction
                                                                         performances with different α values
              无法适配动态场景;DW-MoE 动态权重融合模型
              (无在线更新)通过滑动窗口误差反馈进一步降                                α 值     RMSE/MW       MAE/MW      MAPE/%
              低 RMSE 3.22 MW,但推理耗时增加 16 ms。这说                      0.10       36.89       27.42        2.61
              明动态权重机制在提升精度的同时,会增加推理                                0.15       34.52       25.17        2.43
              时间。                                                  0.20       32.72       23.73        2.28
                                                                   0.25       33.15       24.09        2.32
                  4)在线更新机制的长期成本与适应性。DW-
              MoE 全周期在线更新模型较无在线更新的动态权                              0.30       35.27       26.31        2.53

              128
   127   128   129   130   131   132   133   134   135   136   137