Page 182 - 《中国电力》2026年第5期
P. 182
2026 年 第 59 卷
迭代组合数学符号与表达式,平衡预测精度与模 短期记忆网络的权重组合,得到数据驱动预测功
型复杂度 [31] ,最终确定能表征数据内在规律的最 率 P ;3)采用符号回归算法,融合物理驱动与
2
优方程。与传统回归方法(如线性回归)不同, 数据驱动结果,得到预测功率 P 。
3
符号回归通过遗传算法动态构建方程,并通过选 所提融合方法充分发挥了两种方法的优势。
择、交叉、变异和评估等操作进行迭代。 经参数优化后的经验尾流模型能准确捕捉尾流亏
1)交叉:交换父方程之间的子树,以生成混 损特性,而聚类加权网络增强的数据驱动模型可
合表达式,从而扩展搜索空间。 提升对风电数据时间特征的识别能力,两者结合
2)变异:随机修改运算符、常数或变量,以 旨在实现更精准、可靠的功率预测。
逃离局部最优解。
3) 选 择 : 优 先 选 择 均 方 误 差 ( mean squared 3 不同风电场功率预测方法的性能评估
error,MSE)较低且复杂度较低的方程进行保留,
确保迭代优化向帕累托最优解收敛。 本研究以山西某风电场为验证对象,其布局
由于符号回归无需预设模型形式,可直接从 示意图如图 3 所示。该风电场的 50 台风电机组沿
观测数据中自动挖掘内在函数关系,是多范式融 从西北向东南的方向呈线性排布,布局规整且具
合研究的重要工具,能将理论推导得到的关键特 有明显的方向性,激光雷达位于风电机组阵列的
征 [32] 与机器学习数据驱动方法相结合,得到泛化 中 部 区 域 ( 横 坐 标 X 约 为 3 km, 纵 坐 标 Y 约 为
能力强且具备物理可解释性的显式函数模型。
8 km 处)。提取的数据包括实测风速、风向、温
因 预 测 数 据 与 原 始 数 据 存 在 较 强 线 性 相 关 度 和 功 率 , 采 样 分 辨 率 为 15 分 钟 。 训 练 集 共
性,直接构建特征矩阵 [33] 易导致过拟合。为此,
672 个数据点,测试集共 192 个数据点。训练集与
本研究通过平衡预测值之间的差值、乘积及平方 测试集的原始风速、风向及温度数据如图 4 所示。
差等来构建特征,采用数据自适应原则,将物理
驱动预测功率 P 与数据驱动预测功率 P 的衍生 12
1
2
特征 P –P 、P *P 、(P –P ) 等作为融合模型的初 10 N
2
1
1
2
2
2
1
始输入特征。随后通过遗传算法的选择操作,以
8
均方误差最小化为目标,自动筛选对融合结果贡
献度高的特征。通过不同组合将数值数据转化为 Y/km 6
多个符号表达式,从海量候选公式中筛选出最优 4
方程,作为融合模型的预测表达式。
2 风电机组;
物理与数据融合的风电场功率预测流程如图 2 LiDAR
所示。具体方法为:1)结合历史风速数据,通 0
0 3 6 9 12 15
过 改 进 高 斯 尾 流 模 型 , 得 到 物 理 驱 动 预 测 功 率 X/km
P ;2)对历史风电数据进行聚类和分解,结合长 图 3 风电场机位
1
Fig. 3 Wind farm turbine layout
K-means +
EMD + LSTM
为了评估模型预期性能,本研究采用均方根
长短期记忆
功率数据 并行权重网络 误差(root mean square error,RMSE)和平均绝对
物理驱动
误 差 ( mean absolute error, MAE) 两 种 指 标 [34-35] ,
数据驱动
最优参数辨识 对不同方法的有效性进行评估与比较。基于训练
风资源数据
Gaussian尾流 集和参数优化方法,对尾流膨胀系数进行优化,
模型 + PSO
以改进流场计算结果,提升物理驱动方法的功率
物理知识 PySR 融合功率预测模型 PySR 经验数据
预测性能。采用 K 均值聚类算法对训练集进行聚
图 2 物理数据融合功率预测 类,分析不同聚类数对应的轮廓系数,发现当 K=
Fig. 2 Power prediction via physical data fusion 2 时,轮廓系数达到最大值 0.809,表明风电数据
178

