Page 148 - 《中国电力》2026年第5期
P. 148

2026  年 第 59 卷



              而削弱模型对灾难性遗忘的抑制能力。与之不同,                            集  1  为输入进行初步训练,得到基准模型;2)将
              深度经验回放++(deep experience replay,DER++)            子集   1  训练得到的模型参数作为迁移学习中训练
              算法在存储历史样本的同时,还保留了原始光伏                             子集   2  的初始参数;3)子集         2  优化后的模型参数
              预测模型在历史训练过程中习得的响应行为。通                             同样作为训练子集          3  的初始参数。
              过回放标签       y 与模型响应,即使面对数据波动,                         这 种 链 式 迁 移 机 制 通 过 参 数 继 承 与 迭 代 优
              模型仍可有效解决灾难性遗忘问题。在这种双重                             化,模拟了实时数据流更新下的模型演化过程。
              知识保留机制下,模型对光伏功率的预测能力得                             验证集用于评估每个阶段模型的性能,预测集则
              到进一步提升。针对在线时间序列预测任务,本                             作为最终模型的独立测试基准。
              研究将    PatchTST  模型与  DER++算法相结合,以快                   在预测阶段,采用滚动预测机制。模型通过
              速适应光照条件变化对光伏发电系统的影响。                              加入最新实际值并剔除最早历史数据点来更新滚
                  本研究提出一种融合深度学习与增量学习的                           动窗口,从而实现对下一个时间点数值的预测。
              在 线 多 变 量 时 间 序 列 预 测 模 型 , 即      PTER  模 型 。    该机制可动态更新时间输入窗口,避免预测误差
              该模型将     DER++增量学习算法融入基于              PatchTST    累积,适用于需实时更新预测结果的场景。

              的时间序列预测框架中。具体而言,在每个时间
              步,模型接收新观测到的气象时间序列数据,并                             2    数据处理与模型配置
              通过   PatchTST  架构进行预测。将新的气象数据及
              其对应的模型输出与实际发电功率值存储到固定                             2.1    数据预处理
              大小的内存缓冲区中。在后续训练迭代过程中,                                 在光伏数据的采集、传输与存储过程中,易
              DER++算法从内存缓冲区中随机采样历史光伏功                           出现数据缺失、异常值及噪声干扰等问题。这些
              率数据批次,与当前任务数据融合后在                     PatchTST    异 常 数 据 会 导 致 模 型 从 历 史 数 据 中 学 习 错 误 信
              网络中进行联合训练。损失函数由当前预测损失                             息,进而造成光伏功率预测结果偏差,最终对现
              与历史样本的重构损失组成,形成混合优化目标。                            场调度人员的决策判断产生不利影响。因此,在
              通过在   PatchTST  训练循环中融入      DER++算法,PTER         进行功率预测前,对原始数据集进行预处理,以

              模型实现了可塑性与稳定性的平衡,提升了动态                             确保输入数据的完整性与可靠性。
              环境下光伏功率长期预测的精度。                                       本研究使用的数据来源于山西某光伏电站,
                  为模拟光伏电站的在线模型更新过程,本研                           采 集 时 间 范 围 为    2023  年  7  月  1  日 —2024  年  7  月
              究 提 出 一 种 分 阶 段 迁 移 学 习 方 法 以 还 原 真 实 场           31  日,共包含     570 240  条数据样本,采样间隔设
              景。将原始数据集按时间顺序划分为训练集、验                             为  1 min。
              证集与预测集        3  个独立数据集,其中训练集进一                       本研究按照以下数据预处理流程对光伏发电
              步划分为     3  个连续子集:子集        1、子集    2、子集    3。    时间序列数据进行处理。首先,将原始                      1 min  采
              各子集数据量占比依据季节周期特征设定:子集                             样间隔的高频数据重采样为               15 min  间隔,以降低
              1(2023  年  7—9  月,夏季)包含        82  天数据,占训         数据冗余度与计算复杂度;其次,采用基于滑动
              练集总数据量的        30%;子集     2(2023  年  10—12  月,    窗口的异常检测机制,滑动窗口大小设为                      48  个连
              冬 季 ) 包 含    92  天 数 据 , 占 训 练 集 总 数 据 量 的        续观测值,对应         12 h  跨度,通过四分位距(inter-
              35%;子集     3(2024  年  1—4  月,春季)包含        90  天   quartile range,IQR)法计算每个窗口的第           25  百分
              数 据 , 占 训 练 集 总 数 据 量 的      35%。 参 数 初 始 化       位数与第     75  百分位数,将超出特定范围的观测值
              时,以子集      1  训练得到的模型所有可训练参数作                     判定为异常值,并采用线性插值法对检测出的异
              为子集    2  训练的初始参数;子集           3  训练则继承子          常值进行替换,以保证数据的时间连续性。针对
              集  2 优化后的最终参数,且每个子集训练时均保                          缺失数据,采用相邻两个有效观测值的算术平均
              留上一子集的经验回放缓冲区数据,仅在缓冲区                             值对缺失值进行填充。通过上述多步骤数据处理
              容量达到上限时,按样本重要性替换低贡献度样本。                           流程,显著提升了数据质量,为后续建模与分析
                  采用迁移学习策略的训练步骤为:1)以子                           奠定了可靠基础。

              144
   143   144   145   146   147   148   149   150   151   152   153