Page 103 - 《中国电力》2026年第3期
P. 103
郑峰等:基于混合博弈强化学习的虚拟电厂市场交易策略 2026 年第 3 期
80 VPP运营商1; 响应后负荷; 电价 500 20 1.0
VPP运营商2; 响应前负荷;
400 10 能量市场 0.8
有功功率/MW 60 300 电价/(元·MWh −1 ) 有功功率/MW 0 储能放电功率; 0.6 储能装置荷电状态
储能充电功率;
40
200
0.4
储能充电功率;
20 −10 辅助服务市场
100 储能放电功率 0.2
0 0 −20 0
00:00 04:00 08:00 12:00 16:00 20:00 24:00 00:00 04:00 08:00 12:00 16:00 20:00 24:00
时刻 时刻
a) VPP运营商1
图 5 调度结果
20 1.0
Fig. 5 Scheduling results
能量市场
10 储能充电功率; 0.8
40 燃气轮机出力; 实际光伏出力; 储能放电功率;
实际风电出力; 储能放电; 0.6
30 储能充电; 有功功率/MW 0 储能装置荷电状态
总出力 辅助服务市场 0.4
有功功率/MW 10 0 −10 储能充电功率; 0.2
20
储能放电功率
−20
0
时刻
−10 00:00 04:00 08:00 12:00 16:00 20:00 24:00
b) VPP运营商2
−20
00:00 04:00 08:00 12:00 16:00 20:00 24:00
时刻 图 7 能源供应商的储能出力情况
a) VPP运营商1 Fig. 7 Energy storage output of VPP operator
40 燃气轮机出力; 实际光伏出力; 储能充电;
实际风电出力; 储能放电; 总出力 20 风电+光伏消纳量;
30 风电+光伏预测出力
有功功率/MW 10 0 有功功率/MW 15
20
10
−10 5
−20 0
00:00 04:00 08:00 12:00 16:00 20:00 24:00
00:00 04:00 08:00 12:00 16:00 20:00 24:00
时刻 时刻
b) VPP运营商2 a) VPP运营商1
图 6 能源供应商出力情况 30
风电+光伏消纳量;
Fig. 6 Output Status of VPP operator 25 风电+光伏预测出力
各 运 营 商 的 储 能 装 置 荷 电 状 态 如 图 7 所 示 , 20
在时段 01:00—02:00 储能装置处于放电状态,在 有功功率/MW 15
10
时段 02:00 达到荷电状态最小值 0.1,在光伏出力
5
较大时段 09:00—12:00 储能装置进行充电,达到
0
00:00 04:00 08:00 12:00 16:00 20:00 24:00
荷电状态最大值 0.9 时停止充电。为了保证初始和 时刻
最终的荷电状态相等,在时段 23:00—24:00 进行 b) VPP运营商2
放 电 。 由 于 时 段 01:00 —02:00 和 23:00 —24:00 图 8 能源供应商的风光消纳情况
储 能 装 置 进 行 了 放 电 , 同 时 该 时 段 负 荷 处 于 低 Fig. 8 Wind and solar power consumption situation of
VPP operator
谷,因此产生了弃风现象,如图 8 所示。
为了对比不同算法对交易结果的影响,本节 和遗传算法对模型进行求解时,结果基本相同,
分别采用粒子群算法、KKT 条件、遗传算法和混 采用 KKT 条件所需求解时长较短,但转化过程较
合强化学习算法对所提交易策略进行求解。 为繁琐。相比于以上 3 种算法,基于混合强化学
优化结果如表 2 所示,采用粒子群算法时整 习算法的 VPP 市场交易模型求解时长较为合理,
体社会效益最低和求解时间最长。采用 KKT 条件 以及社会效益最大。
99

