Page 150 - 《中国电力》2026年第5期
P. 150

2026  年 第 59 卷




                          表 1   PTER 模型超参数配置                    项性能指标均最优。与基础                PatchTST  模型相比,
                Table 1   PTER Model Hyperparameter Configuration
                                                                E M A  降 低  10.9%、 E RM S  降 低  13.2%、 R 提 升  3.2%、
                                                                                                   2
                          超参数                     取值            C 提升    1.6%。与性能次优的        Autoformer 模型相比,
                                                                  r
                                                                 o
                          块长度                     8, 16         E M A  降低  16.3%、E RM S  降低  18.6%,充分证明引入
                          步长                       8            DER++增量学习机制后,模型对光伏功率序列的
                        注意力头数                      4            拟合能力与预测精度显著提升。
                        编码器层数                      3
                         训练轮次                     30                   表 3   不同模型在测试集上的预测性能对比
                                                                 Table 3   Comparison of predictive performance of differ-
                          批大小                     16
                                                                             ent models on the test set
                        早停耐心值                      3
                                                                     模型         E MA    E RMS    R 2     C or
                          学习率                    0.000 1
                                                                   Transformer  0.118   0.156   0.823   0.907
                       输入序列长度                     120
                                                                    Informer   0.105    0.138   0.857   0.925
                     经验回放缓冲区大小                   1 000
                                                                   Autoformer  0.098    0.129   0.872   0.934
                      训练数据子集数                      3
                                                                   PatchTST    0.092    0.121   0.885   0.941
                                                                     PTER      0.082    0.105   0.913   0.956
                      表 2   各对比模型核心最优超参数配置
               Table 2   Core optimal hyperparameter configurations of
                           each comparative model               3.2    增量更新稳定性实验结果
                     模型            学习率          编码器层数               增量更新稳定性实验旨在验证                 PTER  模型在
                  Transformer      0.000 1          3           数据流时序更新过程中对历史知识的保留能力,
                   Informer        0.000 2          2           通过模拟     3  个训练子集的逐次更新过程。子集                 1:
                  Autoformer       0.000 1          2           2023  年  7 — 9  月 , 子 集  2: 2023  年  10 —12  月 , 子
                   PatchTST        0.000 1          3           集  3:2024  年  1—4  月,计算各模型在每轮更新后
                    PTER           0.000 1          3           对前序子集的预测精度衰减率,定义为更新后精
                                                                度/更新前精度×100%,衰减率越低表示遗忘程度
              验:基础性能对比实验验证模型预测精度、增量
                                                                越轻,结果如表         4  所示,模型精度衰减趋势如图             1
              更新稳定性实验验证灾难性遗忘缓解效果、极端
                                                                所示。
              天气适应性实验验证模型鲁棒性。实验数据来源于                                由表   4  可知,传统全量更新方式            Transformer、
              山西某    100 MW  集中式光伏电站        2023  年  7  月  1  日—  基础  PatchTST  在增量更新过程中存在严重的灾难
              2024  年  7  月  31  日的运行数据,数据预处理后,按                性遗忘。经过两轮更新后,Transformer 对初始子
              时间序列划分为训练集(2023            年  7  月—2024  年  4  月,  集  1  的  MAE  精 度 累 计 衰 减  51.1%, 基 础  PatchTST
              占比   70%)、验证集(2024        年  5  月,占比   15%)、      累计衰减      43.6%,这是因为全量更新时模型参数
              测试集(2024 年      6  月—7  月,占比     15%),其中          被 新 数 据 主 导 , 导 致 历 史 知 识 被 覆 盖 。 引 入 基
              训练集进一步拆分为           3  个连续子集以模拟数据流                础  ER  的  PatchTST  模型虽能缓解遗忘,累计衰减
              的时序更新过程。所有对比模型(PatchTST、Trans-                         表 4   不同模型在增量更新过程中的精度衰减率
              former、Informer、Autoformer)均采用相同的数据                Table 4   Accuracy degradation rate of different models
                                                                         during incremental update process
              输入格式、评价指标与超参数优化策略,网格搜
                                                                                                       单位:%
              索+早停机制,确保实验的公平性与可比性。
                                                                                   子集1—     子集2—
                                                                       模型                            累计衰减率
              3.1    基础性能对比结果                                                      2衰减率     3衰减率
                  基础性能对比实验以测试集的                MAE、RMSE、          Transformer全量更新    78.3    62.5      48.9
              R 、Cor 为评价指标,量化分析             PTER  模型与主流            PatchTST全量更新      82.1    68.7      56.4
               2
              深度学习模型的预测精度差异,结果如表                     3  所示。          PatchTSTER      85.6    75.2      64.3
              由表   3  可知,在   5  类对比模型中,PTER         模型的各            PTERDER++        92.4    88.6      81.9

              146
   145   146   147   148   149   150   151   152   153   154   155