梁海峰;曹大卫;刘博;刘子兴;郑灿;李鹏
【摘 要】提出一种风电场出力概率分布模型建立与误差分析的方法.基于典型日的历史风速和对应的风机无限制出力情况下的功率数据,拟舍得到风机等效功率特性曲线,进而得到整个风电场无限制出力情况下的实际可发出力.利用高斯混合模型对风电场出力概率分布进行建模,采用序列运算理论,制定最佳离散化步长的选取规则,提高了概率密度函数拟合的精确性.提出基于误差范围的概率密度函数可靠性指标,利用随机抽样方法,对概率密度函数进行误差分析.通过与核密度估计方法进行对比,证明了高斯混合模型的优越性.所建模型能够较好地描述风电场出力的概率特性,为运行人员在风电调度运行方面提供有价值参考依据.%In this paper,a method for establishing a model of wind farm output probability distribution and error analysis is proposed.Based on recorded wind speed data and the corresponding wind turbine output data without limitation in typical days,the equivalent power characteristic curve of wind turbine is obtained.And then the actual available output of the whole wind farm without limitation is got.The output probability distribution model of wind farm is established by using Gaussian mixture model.Through the
sequence operation theory and the selection of optimal discretization step size,the accuracy of probability density function fitting is improved.The reliability index of probability density function basing on error range is proposed and the error of the probability density function is analyzed by using the random sampling method.The superiority of Gaussian mixture model is proved by comparing with kernel density estimation method.The
model established in this paper well described the probabilistic characteristics of wind farm output,and provide valuable reference for operation personnel in wind power dispatching and operation. 【期刊名称】《华北电力大学学报(自然科学版)》 【年(卷),期】2017(044)003 【总页数】7页(P8-14)
【关键词】风电功率;概率分布;高斯混合模型;序列运算理论;随机抽样 【作 者】梁海峰;曹大卫;刘博;刘子兴;郑灿;李鹏
【作者单位】华北电力大学电气与电子工程学院,河北保定071003;华北电力大学电气与电子工程学院,河北保定071003;华北电力大学电气与电子工程学院,河北保定071003;国网安新县供电公司,河北安新071600;华北电力大学电气与电子工程学院,河北保定071003;华北电力大学电气与电子工程学院,河北保定071003 【正文语种】中 文 【中图分类】TM614
近年来新能源发电特别是风力发电在国内外得到了迅速发展。风电具有随机性和波动性,大规模风电接入电网对电力系统带来的影响日益突出。对风电场出力特性进行研究,建立准确的风电场出力模型,能够为电力系统规划与经济调度提供有价值的依据,具有重要的实际意义[1,2]。
风电场出力模型的研究,目前主要分为两类。一种是建立确定性的模型,得到风电场功率的具体输出,这种模型的建立需要考虑的因素多,难度大,其结果一般误差也较大,不能保证为电力系统提供可靠的依据。另一种是建立概率分布模型,得到
风电出力的概率密度函数。与确定性模型相比,由于风电功率本身的不确定性,概率分布模型的建立更加具有实际意义,同时能够得到概率密度函数存在的误差,可信度更高,应用范围更加广泛[3,4]。
近年来已经有一些对风电场出力概率分布模型的相关研究。文献中,采用正态分布、t location-scale分布以及广义极值分布等单一分布函数模型来拟合风电功率概率密度分布曲线,但拟合效果均不是很理想[5-7]。文献[8]采用核密度估计方法,对风电场的实测出力数据直接进行处理,得到了风电场出力的概率分布,但是概率密度函数的表达式与每个样本值都有关,不能像参数估计方法一样,对变量的概率密度值进行直接描述。文献[9]提出纵向时间序列分析法,得到不同时刻的风电出力概率分布情况。以上文献均直接采用风电场的实测历史数据进行建模,没有考虑风机限制出力的情况,其结果不够准确。文献[10]基于风速服从威布尔分布以及风机的功率特性得到了风电功率的概率分布模型,但是拟合得到的风速威布尔分布函数与实际分布之间存在的误差以及风机实际出力特性与给定功率特性之间存在的差异,都会对风电出力概率分布函数产生影响。
本文从风电场实测历史风速数据入手,提出风机等效功率特性曲线,进而得到整个风电场无限制出力情况下的实际可发出力。然后利用高斯混合模型对风电场出力概率分布进行描述,为了提高函数拟合的准确性,采用序列运算理论将风电场出力离散化,并制定了最佳离散化步长的选取规则。提出了与一般误差分析指标相比,更能够体现拟合概率密度函数与风电出力实际分布之间误差的随机抽样分析方法。通过与核密度估计方法对比,验证了高斯混合模型在风电出力概率模型建模中的优越性,能够为电力系统的运行提供有价值的参考。
本文采用基于历史风速数据与风机等效功率特性、由风速到功率的方法,得到风电场的功率输出及其概率分布模型。图1是风电场功率输出概率分布模型研究的流程图。
1.1 风机功率特性分析
风力发电机组在出厂时具有给定的功率特性曲线,其功率输出理论上与风速一一对应,但是在实际情况下,由于风机分布位置不同,其所处环境中的风速时延、风速变化速率以及风向改变等情况均有所不同,所以风机实际输出功率与风速的关系并不完全与风机的功率特性曲线吻合。
直接采用给定的风机功率特性曲线计算功率输出存在一定的误差。由于风电机组的出力与多种因素有关,要通过详细分析这些因素从而得到精确的风电机组功率输出模型,计算量和难度都很大。因此,本文直接从数学统计的角度,提出风机等效功率特性曲线的概念,进而可由历史风速数据得到准确的风机输出功率。 1.2 风机等效功率特性
对于风电场中某台确定的风机来说,如果风机所处地理位置的风向、风速变化速率等因素不同,即使其处在同一测量风速下,出力也可能不同。而对于整个风电场来说,由于每台风机所处情况都略有差别,如果把整个风电场的功率输出看成是多个具有相同功率特性的风电机组的功率输出的总和,那么这种差别就会相互抵消。这种情况下风机的功率特性曲线与出厂时给定的不同,可以看做是风机在特定风电场中的等效功率特性曲线。考虑到风机出力受电网侧限制出力影响,其历史功率输出数据无法真实反映风机应有的实际可发出力,因此,本文选用多个典型日下的多组风速与对应的风机无限制出力情况下的功率输出数据进行拟合。风机等效功率特性公式为
式中:vc,vN和v0分别为风机的切入风速,额定风速和切出风速;a0,a1,a2,a3为风机等效功率特性公式的系数;P(v)为风机理论出力值;PN为风机额定功率。 在进行风机等效功率特性拟合之前,首先要将测风点处的风速转换为风机轮毂处的风速,具体转换公式如下[11]:
式中:Hh为风机轮毂高度,对应风速为Vh;Ha为测量风速处高度,对应风速为
Va;αP为高度修正系数,与地表粗糙程度等因素有关,通常取0.13到0.14之间,本文计算中取0.134。
然后根据得到的风机轮毂处风速数据与对应的无限制出力情况下的功率输出数据,对风机等效功率特性公式中的系数a0,a1,a2,a3进行最小二乘拟合,目标函数为
式中:Pw为风机无限制出力情况下的实际出力数据;P(v)为风机拟合出力值。 2.1 核密度估计
在得到风机等效功率特性后,由不同测风点实际测得的历史风速数据,采用由单机到整个风电场的功率输出模型,得到整个风电场无限制出力情况下的实际可发出力。 对于风电场出力概率分布的求取,常采用核密度估计(Kernel Density Estimation,KDE)的方法。核密度估计是一种非参数检验方法,该方法不需要分布的先验知识,从数据样本出发即可获取变量的分布特征。设x1,x2,……,xn为随机变量x的样本,设随机变量概率密度函数为φ(x),则φ(x)的核密度估计为[8] 式中:n为样本容量;h为带宽,也称平滑系数;K(·)为核函数。
已有研究结果表明,φh(x)会继承核函数K(·)的连续性和可微性,K(·)一般选取以0为中心的对称单峰函数,如高斯函数。但是,核密度估计方法得到的变量概率分布,其分布函数公式与每个样本值都有关,不能对变量的概率密度值进行直接描述,会对后面的研究带来一定的困难。此外,核密度估计效果受带宽取值的影响,如果带宽选取不合适,会出现拟合不足或者过拟合的情况[12]。 2.2 高斯混合模型
为方便后续相关研究,得到一种准确的风电出力概率分布参数模型具有重要意义。本文借鉴图像灰度处理的方法,采用高斯混合模型(Gaussian Mixture Model,GMM)对风电场出力概率分布进行建模,并与核密度估计方法对比,进行误差分析。高斯混合模型主要用于灰度图像的处理建模,图像灰度模型反映的是图像中某
个水平下灰度值出现的概率,与风电场出力概率分布问题类似。 高斯混合模型的数学表达式为[7]
式中:ai,bi,ci为模型的分布参数,可通过对变量的概率值进行拟合得到。 由于模型维数太高会使分布函数过于复杂,因此本文采用二维高斯混合模型对风电场出力进行建模。在采用高斯混合模型对风电出力概率分布进行拟合时,首先要利用序列运算理论对风电场出力值进行处理,得到拟合所需的概率性序列。序列运算理论利用概率性序列表示随机变量的概率分布。对于某连续性随机变量X,设其概率密度函数为g(x),取序列离散化步长为q,则该随机变量的概率性序列G(i)为[13]
式中:NF =[Q/q]是不超过Q/q的最大整数,为该随机变量的序列长度;Q为该随机变量的最大取值。
与核密度估计结果受带宽影响类似,采用高斯混合模型对概率分布函数拟合的效果与离散化序列的步长有直接关系。步长过小,会增加某些数据对变量概率分布函数的影响;步长过大,无法完全体现变量的概率分布特征。根据文献[13]中的相关研究结果,本文中对随机变量的概率分布函数进行拟合时,最佳离散化步长的选取按照以下步骤进行:
(a)选取初始离散化步长q=0.001,将随机变量离散化,得到概率性序列G(i); (b)令i=1,对第i个与第i+2个序列的数据做插值,并利用插值函数求出第i+1个序列的值G(i+1)′,从而得到第i+1个序列值的平滑系数:
(c) 依次令i=2,3,4,……,N-2,按照步骤(b)中的方法分别求取对应序列值的平滑系数,从而得到概率性序列整体平滑系数:
(d) 令 q=q+Δq,其中Δq=0.001,在满足q能够整除1的条件下,按照步骤(b)和(c)依次求取对应概率性序列的整体平滑系数,至q=0.1结束;
(e) 确定概率性序列整体平滑系数阈值为0.3,选取小于该阈值的最小q值为最佳
离散化步长。
通过统计风电场无限制出力情况下实际可发出力值在相应序列区间的频率,可以得到高斯混合模型拟合所需的概率性序列,然后利用高斯混合模型拟合得到风电场出力概率分布函数。
对于概率密度函数的拟合效果,一般利用误差平方和、均方根误差、确定系数和校正确定系数等指标来进行评价[7]。这些指标的计算结果与概率密度函数拟合所使用的概率性序列值有关,概率性序列在离散化时选择的步长不同,对应的误差指标结果也就不同。此外,拟合所用的概率性序列值并不能完全反映风电场出力的实际概率分布,利用其进行误差分析,不能完全反映拟合得到的概率密度函数与实际概率分布之间存在的误差。
因此,本文提出基于误差范围的概率密度函数可靠性指标,采用随机抽样方法,对风电场出力概率密度函数的误差进行分析。误差范围为δ时的概率密度函数可靠性σ是指:风电场出力拟合概率密度函数与实际概率分布相比,其σ·100%的范围在误差δ以内,可靠性越高,说明概率密度函数拟合效果越好。 误差分析的具体步骤如下:
(a)在区间 (0, 1)(标幺值)内进行n次均匀随机抽样,作为风电场出力概率性序列的中点;
(b)在得到概率性序列中点的情况下,对每个概率性序列的步长在[a, b](a>0)内进行均匀随机抽样,从而得到n个步长和位置都不同的概率性序列;
(c)统计风电场实际可发出力值在各随机抽样所得的概率性序列区间中出现的频率,得到概率密度函数误差分析所需的概率性序列值,记为Ci(x)(i=1, 2,……, n); (d)计算风电场出力概率密度函数f(x)在抽样所得的概率性序列对应区间的概率,记为fi(x)(i=1, 2,……, n);
(e)给定概率密度函数的误差范围δ,统计随机抽样得到的n个概率性序列Ci(x)在
区间 [fi(x)·(1-δ),fi(x)·(1+δ)]范围内的频率σ,σ即为风电场出力概率密度函数在误差范围δ下的可靠性。
需要注意的是,步骤(b)中,a为大于0的一个值。这是因为,如果随机抽样得到的概率性序列步长过小,可能出现该区间内计算得到的风电场实际可发出力值数量相对过多或者过少的情况,则该随机抽样序列值不具有对概率密度函数误差进行分析的意义。
4.1 风机等效功率特性拟合
采用某装机容量为48 MW风电场的历史数据对本文提出的方法进行验证。风机容量均为3 MW,使用数据包括2011~2013三年的各测风点风速与风机对应的出力数据(采样间隔15 min)。
首先,根据典型日的风速与风机无限制出力情况下对应的出力数据,利用最小二乘法对风机的等效功率特性进行拟合。图2为风机功率特性曲线,式(9)为拟合得到的风机等效功率特性表达式。由图2可以看出,由于风机在实际运行过程中,受地理位置、风速时延和风速变化速率等因素的影响,风机的等效功率特性曲线与给定的功率特性曲线存在一定的差别,与前文理论分析相符。利用风机等效功率特性曲线,可以得到风电场无限制出力情况下的实际可发出力。 4.2 风电出力概率分布与误差分析
由风电场历史风速数据,根据风机等效功率特性曲线,得到风机无限制出力情况下的实际可发出力,进而得到整个风电场的出力。利用序列运算理论将计算得到的风电场实际可发出力离散化,根据2.2节中提出的最佳离散化步长选取方法,可得本算例中的q=0.02,得到风电场出力的概率性序列。然后分别利用二维高斯混合模型和核密度估计方法对风电场出力概率分布进行拟合。GMM的概率密度函数如式(10)所示。
风电场出力的概率密度与累积概率密度图如图3和图4所示。表1给出了对拟合
函数进行评价的一般指标值,包括误差平方和(SSE)、均方根误差(RMSE)、确定系数(R-square)以及校正确定系数(Adjusted R-square)。由表1可以看出,高斯混合模型与核密度估计方法均能对风电场出力的概率分布进行较好的拟合,两者在拟合效果上高斯混合模型稍好于核密度估计。
对两种概率分布函数按照本文提出的方法进行误差分析。首先进行整体性误差分析,对概率性序列的中点在区间(0, 1)进行10 000次均匀随机抽样,然后对每个序列的步长在区间[0.01, 0.04]进行随机抽样,进而可以得到随机抽样以及概率密度函数对应的概率性序列值。
图5为两种概率密度函数的15%误差范围图,图6为对应的概率性序列随机抽样结果。由两图可知,在15%误差范围下,大多数拟合概率密度函数所使用的概率性序列值和随机抽样得到的概率性序列值都在该误差范围之内,同时,两者的分布情况相似。图6中某些随机抽样序列值与误差范围边界相比过大或者过小,这主要是由随机抽样得到的概率性序列步长较小,同时该区间范围内出力值数量相对过多或者过少造成的。对概率性序列进行多次随机抽样,可以忽略这种情况对概率密度函数误差分析结果的影响。
将概率密度函数的误差范围每次增加1%,按照所提误差分析方法,可以得到概率密度函数可靠性随误差范围变化的趋势,如图7中左侧两条曲线所示。可以看出,高斯混合模型与核密度估计得到的概率密度函数可靠性随着误差范围的增大,均呈现上升趋势,符合理论分析。为了直观地体现出两者的可靠性大小,对图7中左侧两条曲线进行进一步拟合,得到右侧两条曲线。表2给出了不同误差范围下两者的具体可靠性。例如,高斯混合模型概率密度函数在误差范围为30%时对应的可靠性为0.905 9,表示风电场出力概率密度函数90.59%范围内的拟合误差在30%以内。
可以看出,在整体上,高斯混合模型比核密度估计得到的概率密度函数可靠性更高,
高斯混合模型的拟合效果更好,与表1拟合效果指标显示的结果一致,说明了本文所提方法的有效性。
分析风电场出力概率密度函数在不同区间范围的误差,即分析概率密度函数拟合效果较差区间。将风电场的出力范围等分为5个区间,以30%误差范围为例,按照概率密度函数整体性误差分析的方法,分别计算各区间的可靠性,结果如表3所示。可以看出,两种概率密度分布在[0, 0.2]和(0.8, 1]区间范围内的可靠性较小,是影响概率密度函数误差的主要区间;而在 (0.2, 0.4] 与 (0.4, 0.6] 区间范围内的可靠性较高,说明概率密度函数在这两个区间拟合较好,能够为电力系统的规划与运行提供比较可靠的依据。高斯混合模型与核密度估计比较,概率密度函数可靠性整体上好于核密度估计,在某些区间上两者基本相当。考虑到高斯混合模型概率分布函数更利于表达,因此,高斯混合模型更具有优势。
此外,本文提出的误差分析方法能够对风电场出力概率密度函数进行更加全面的评价,为相关运行人员提供更有价值的参考。
本文建立了风电场出力概率分布的模型,提出了概率分布函数误差分析的方法,并以某风电场为例进行了验证。具体成果如下:
(1)基于历史功率数据的风电功率概率分布特性研究,由于风机出力受电网侧限制出力影响,得到的结果具有一定误差。从历史风速数据入手,通过拟合风机等效功率特性曲线,得到风电场无限制出力情况下的实际可发出力,进而建立风电场出力概率分布模型更为合理。
(2)风电场出力概率分布可以使用二维高斯混合模型进行描述,通过与核密度估计方法比较,证明了高斯混合模型具有一定的优越性。
(3)提出基于误差范围的概率密度函数可靠性指标,并利用随机抽样的方法对模型误差进行分析,能够更加体现拟合概率密度函数与风电场实际出力概率分布之间的
误差,为运行人员在风电的调度运行方面提供有价值的参考。
【相关文献】
[1] 张晋华.风电场内机组优化调度研究 [D].北京:华北电力大学,2014.
[2] 牛晨光,游晓科,刘观起,等.组合模型在风电场发电功率短期预测中的应用 [J].电力科学与工程,2012,28(3):13-16.
[3] 边巧燕,徐开,孙黎滢,等.考虑风电功率概率分布不确定性的输电系统规划 [J].电力系统自动化,2015,39(20):60-65.
[4] 刘永前,高小力,韩爽,等.基于修正风速的风电场等效功率特性模型研究 [J].华北电力大学学报(自然科学版),2014,41(3):49-54.
[5] 刘燕华,李伟花,刘冲,等.短期风电功率预测误差的混合偏态分布模型 [J].中国电机工程学报,2015,35(10):2375-2382.
[6] 林卫星,文劲宇,艾小猛,等.风电功率波动特性的概率分布研究 [J].中国电机工程学报,2012,32(1):38-46+20.
[7] 崔杨,杨海威,李鸿博.基于高斯混合模型的风电场群功率波动概率密度分布函数研究 [J].电网技术,2016,40(4):1107-1112.
[8] 赵继超,袁越,傅质馨,等.基于Copula理论的风光互补发电系统可靠性评估 [J].电力自动化设备,2013,33(1):124-129.
[9] 吕晓禄,梁军,贠志皓,等.风电场出力的纵向时刻概率分布特性 [J].电力自动化设备,2014,34(5):40-45.
[10] 黄海煜,于文娟.考虑风电出力概率分布的电力系统可靠性评估 [J].电网技术,2013,37(9):2585-2591.
[11] 张义斌,王伟胜.风电场输出功率的概率分布及其应用 [J].电力设备,2004,5(8):38-40. [12] 徐玉琴,陈坤,李俊卿,等.Copula函数与核估计理论相结合分析风电场出力相关性的一种新方法 [J]. 电工技术学报,2016,31(13):92-100.
[13] 康重庆,夏清,徐玮.电力系统不确定性分析 [M].北京:科学出版社,2011.
因篇幅问题不能全部显示,请点此查看更多更全内容