Page 130 - 《中国电力》2026年第3期
P. 130
2026 年 第 59 卷
距离准则优化初始聚类中心选取,最大化初始中心间异 划分侧重于考虑数据点的分布密度,主要有通过点
质 性 以 提 升 聚 类 稳 定 性 ; 其 次 , 引 入 核 函 数 映 射 机 制 , 排序识别聚类结构算法(ordering points to identify
映射负荷曲线至高维空间聚类,实现高维特征的显式解
the clustering structure,OPTICS)。
耦 与 聚 类 分 析 。 仿 真 结 果 表 明 , 在 特 征 提 取 能 力 方 面 ,
迭代式自组织数据分析算法(iterative self org-
改进算法生成的主成分分析(principal component analysis,
anizing data analysis techniques algorithm,ISODATA)
PCA)特征空间中变电站四季负荷特征呈现显著差异性,
通过动态调整聚类数目实现数据分类 [15] ,与固定
能更好地获取负荷高维特征;在算法性能方面,改进算
法使执行时间减少 32.8%,聚类评价指标戴维斯-布尔丁指 类别数的 K-means 算法相比,ISODATA 通过设置
数 ( davies-bouldin index, DBI) 降 低 了 29.1%, 邓 恩 指 数 阈值参数实现了更灵活的无监督学习过程 [16] 。该
(dunn index,DI)提高了 42.9%,验证了所提算法的有效 动态调节机制使算法能够根据数据分布特征自主
性和优越性。 调整聚类结构,既避免了 K-means 算法固定类别
关键词:变电站;负荷聚类;聚类效果指标 数的局限性,又有效提升了聚类结果对复杂数据
DOI:10.11930/j.issn.1004-9649.202505079
分布的适应能力 [17] 。
然而,传统 ISODATA 算法的纯数据驱动聚类
0 引言 存在双重局限性:1)其结果与电力系统领域知
识(如用户类型标签、典型用电行为模式)存在
在新型电力系统的背景下,能源结构转型导
割 裂 , 导 致 聚 类 结 果 难 以 支 撑 实 际 调 度 决 策 ;
致分布式能源与非线性负荷大规模渗透,使电力
2)算法性能高度依赖初始聚类中心设置,不当
数据呈现高维度、大体量的复杂特性,大幅提升
初始化将引发局部最优解与收敛时间激增问题 [18] 。
负荷特性解析难度 [1-4] 。另外,当前电动汽车(electric
尤其值得关注的是,其对负荷曲线时序特征的提
vehicle, EV) 渗 透 率 不 断 增 长 , 且 大 规 模 EV 无
取能力薄弱,欧氏距离度量难以捕捉相位偏移与
序接入电网,将带来负荷增长、电能质量下降、
形态波动等关键信息,致使相似用电模式被误分
电网运行控制难度增加等负面影响 [5-10] ,因此亟
类,严重制约聚类结果的工程可用性。
须充分了解变电站不同负荷特性,利用负荷曲线 为解决上述问题,文献 [19] 提出了基于此算
峰谷变化特征,做好负荷形态分类。变电站负荷 法 的 改 进 ISODATA 算 法 , 提 升 了 算 法 鲁 棒 性 。
聚类作为解析上述负荷特性的关键方法,不仅能 文献 [20] 将原始净负荷数据映射到合适的高维空
为电网规划与设计提供精准的负荷分布依据,助 间。文献 [21] 将 ISODATA 算法与同步回代消除技
力变电站合理配置容量,还能支撑需求侧管理策 术相结合,从聚类结果中筛选出最具代表性的典
略制定,实现错峰用电与柔性负荷调控,同时为 型 场 景 集 , 从 而 实 现 对 原 始 复 杂 场 景 的 有 效 约
市场细分与电力营销提供数据支撑,推动电力服 简,该方法既能保留原始场景的主要特征,又显
务精准化,为多场景应用奠定坚实基础。 著提高了计算效率。文献 [22] 创新性地构建了一
聚类分析是数据分析领域的重要研究方法, 种 融 合 ISODATA 与 蚁 群 算 法 的 智 能 分 类 模 型 ,
被广泛应用于电力负荷分析、负荷及新能源出力 有效克服了传统方法易陷入局部极值的问题。传
预测、用电行为分析等领域 [11-14] 。目前聚类算法 统 ISODATA 聚类算法尽管有效解决了 K-means 算
主要分为依据距离、依据密度和依据相似度等不 法需预先设定聚类数量的问题,但仍存在一定局
同角度进行划分。依据距离的划分主要有欧式距 限性:1)由于初始聚类中心是随机选取的,这
离和曼哈顿距离,其中使用欧氏距离的聚类算法 不 仅 可 能 使 得 聚 类 算 法 收 敛 速 度 缓 慢 、 效 果 欠
包括平衡迭代削减聚类法(balanced iterative reducing 佳,还会让聚类结果具有偶然性;2)在原始负
and clustering using hierarchies, BIRCH) 和 代 表 点 荷曲线的输入空间里,采用欧式距离作为距离度
聚 类 算 法 ( clustering using representatives, CURE) 量方式,无法捕捉到负荷曲线中的高维特征。
等,使用曼哈顿距离的算法包括具有噪声的基于 为克服上述传统 ISODATA 的缺陷,本文主要
密度的空间聚类算法(density-based spatial clustering 优化了初始聚类中心的选取方式以缩短聚类时间,
of applications with noise,DBSCAN)。基于密度的 采用核方法来获取数据的高维特征,提出了一种
126

