搜索
您的当前位置:首页正文

基于联邦学习的区域光伏功率概率预测方法及其协同调控系统[发明专利]

来源:二三娱乐
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 111626506 A(43)申请公布日 2020.09.04

(21)申请号 202010458444.5(22)申请日 2020.05.27

(71)申请人 华北电力大学

地址 102206 北京市昌平区朱辛庄北农路2

号(72)发明人 房方 张效宁 刘亚娟 魏乐 

刘吉臻 (74)专利代理机构 北京君有知识产权代理事务

所(普通合伙) 11630

代理人 夏娟娟(51)Int.Cl.

G06Q 10/04(2012.01)G06Q 50/06(2012.01)G06N 3/04(2006.01)G06N 3/08(2006.01)

权利要求书2页 说明书9页 附图3页

G06N 20/00(2019.01)

CN 111626506 A(54)发明名称

基于联邦学习的区域光伏功率概率预测方法及其协同调控系统(57)摘要

一种基于联邦学习的区域光伏功率概率预测方法,主要包括如下步骤:明确区域内各个参

收集与联邦学习框架进行概率预测的光伏电站,

一段时间内信息以及对应的光伏功率变量,并按时间顺序采集上述变量构成样本数据集;对上述步骤获得的样本数据集进行缺失值与异常值处理;对光伏电站的样本数据集进行分割,按照一定比例分割为训练集与测试集;分别对训练集和测试集进行归一化;步骤,构建联邦学习框架;根据中心服务器根据预测要求,建立全局预测模型,定义训练误差函数与精度要求,并将网络结构以及初始化参数分发至各个光伏电站。

CN 111626506 A

权 利 要 求 书

1/2页

1.基于联邦学习的区域光伏功率概率预测方法,包括如下步骤:

步骤1.明确区域内各个参与联邦学习框架进行概率预测的光伏电站,收集一段时间内气象信息以及对应的光伏功率变量,并按时间顺序采集上述变量构成样本数据集;

步骤2.对步骤1获得的样本数据集进行预处理;

步骤3.对步骤2中的光伏电站的样本数据集进行分割,按照一定比例分割为训练集与测试集;

步骤4.分别对步骤3中训练集和测试集进行归一化;步骤5.构建联邦学习框架;

步骤6.中心服务器根据预测要求,建立全局预测模型;

步骤7.定义步骤6中建立的全局预测模型的训练误差函数、优化器与学习率,并将网络结构以及初始化参数分发至各个光伏电站;

步骤8.中心服务器根据与各个光伏电站的通信状态,选择若干光伏电站进行预测模型训练与反馈;

步骤9.对步骤8中被选择的各个光伏站点,使用步骤4中准备好的本地训练集和测试集分别进行模型训练与测试,并更新本地预测模型;

步骤10.各个光伏电站进行光伏功率概率预测;

步骤11.中心服务器接收步骤9中通过测试的本地预测模型,并更新全局预测模型;步骤12.中心服务器向所有光伏电站分发更新后的全局模型;步骤13.重复步骤8至步骤12,进行全局模型的滚动更新。

2.根据权利要求1所述的基于联邦学习的区域光伏功率概率预测方法,其特征为:所述气象信息包括总辐照度、直接辐照度、散射辐照度数据,气温、气压、风速、风向、相对湿度。

3.根据权利要求1所述的基于联邦学习的区域光伏功率概率预测方法,其特征为:所述步骤2进一步包括:对于数据集中的数据,如果存在数据明显偏离近期测量数据范围,则很可能是异常值。此时可采取平均法进行处理,即使用近期数据的平均值进行替代;若出现连续异常值,则使用历史同期该时段数据进行替换;

对于小于0的总辐照度、直接辐照度、散射辐照度数据、光伏功率数据,使用0替代;对于时间信息,取其小时数以及星期数进行独热编码处理,处理方式如下:使用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位为1。

4.根据权利要求1所述的基于联邦学习的区域光伏功率概率预测方法,其特征为:所述步骤3进一步包括:所述样本数据集进行分割是按照8:2或7:3的比例不打乱顺序地分割为训练集与测试集。

5.根据权利要求1所述的基于联邦学习的区域光伏功率概率预测方法,其特征为:所述步骤4中归一化过程使得除时间信息外的不同量纲数据转化为值域为[0,1]的无量纲数,变化方式如下

其中,xi为原始数值,x′μσi为归一化后数据,A为变量A的均值,A为该变量的标准差。6.根据权利要求1所述的基于联邦学习的区域光伏功率概率预测方法,其特征为:所述

2

CN 111626506 A

权 利 要 求 书

2/2页

步骤5进一步包括:所述联邦学习框架包含中心服务器与各个光伏电站,中心服务器负责统筹预测模型训练过程,各个光伏电站则参与模型更新与计算预测值。

7.根据权利要求1所述的基于联邦学习的区域光伏功率概率预测方法,其特征为:所述步骤6进一步包括:采用贝叶斯长短期记忆神经网络模型来计算某一光伏电站功率预测值,该神经网络模型主要包含长短期记忆网络结构以及贝叶斯变分推断结构;变分推断结构使用蒙特卡洛Dropout技术实现;最终考虑不确定性的预测结果通过多次进行前向训练得到不同的结果的方差进行表征。

8.根据权利要求7所述的基于联邦学习的区域光伏功率概率预测方法,其特征为:所述步骤7进一步包括:所述模型训练误差函数选择为均方误差(MSE),如下:

其中,yi和分别表示数据集中第i个实际光伏功率与对应的贝叶斯长短期记忆神经网络预测值,K为使用的数据的条数。

9.根据权利要求1所述的基于联邦学习的区域光伏功率概率预测方法,其特征为:所述步骤9进一步包括:若所述模型测试结果误差小于设定阈值则使用该训练模型进行预测,反之则使用上一轮次的全局模型进行预测。

10.一种针对区域能源协同调控系统,其特征为:包括如权利要求1-9任一所述的基于联邦学习的区域光伏功率概率预测方法。

3

CN 111626506 A

说 明 书

1/9页

基于联邦学习的区域光伏功率概率预测方法及其协同调控

系统

技术领域

[0001]本发明属于光伏电站发电量预测技术领域,涉及一种针对区域能源协同调控系统以及基于联邦学习框架的区域光伏功率概率预测方法。

背景技术

[0002]可再生能源“消纳”难题一直制约着中国能源电力行业的转型发展。近年来,通过政府政策引导、深入挖掘如火电、水电和抽水蓄能等各类电源调峰潜力、加强市场调节能力等措施,使消纳问题逐步得到改善,但是一些瓶颈问题依然存在:[0003]1.中国灵活性电源相对匮乏,如东北、华北和西北地区抽水蓄能、燃气电站等灵活调节电源比重不足2%,特别是供暖季节,热电联产机组受“以热定电”运行模式的约束,加剧了电力系统调峰压力,严重挤占了可再生能源消纳空间;[0004]2.已实施的热电联产机组灵活性调节技术中蓄热罐、电锅炉等存在效率问题,低压缸零出力和蒸汽流程改造等存在适配性问题;

[0005]3.在利用电热综合调控手段提高电力及供暖灵活性、促进可再生能源消纳方面还缺少必要的技术储备。[0006]围绕北方冬季“清洁供暖”和“可再生能源消纳”两大环境和能源发展需求,构建区域能源协同调控体系,破解传统热电联产机组有限调节能力与可再生能源消纳之间的矛盾,提升热电联合系统运行灵活性,实现供热与环保的协调联动具有重要现实意义。以电、热综合能效最优为目标的含有电热泵的区域能源协同调控体系,离不开对区域内可再生能源例如光伏发电功率的准确预测,来动态调节各种能源出力情况。[0007]太阳能是一种源自自然的清洁、可持续能源,其总量丰富,具有广阔的应用前景。随着新能源发电系统规模的不断增长,其接入对电力系统的影响不断提高,促使对高效预测工具的需求更加迫切。仅对某个光伏电站的小规模预测模型已经不能够满足需求,能够处理大跨度地理区域的预测模型将成为未来电力生产的重要支撑。

[0008]目前对光伏功率预测的研究主要关注的是确定性预测(点预测),即预测出某一确定位置在未来某一时刻时的输出功率。而光伏功率容易受到天气变化等影响,存在较强的随机性与不确定性,特别是天气状况频繁波动与大范围波动时,点预测常与实际值存在显著的差异,精度难以满足电力系统运行调度的需求。此外,点预测虽然给出了最关键的预测信息,但其所包含的信息量相较于概率预测较小,无法反映光伏功率不确定性带来的运行风险,不利于电网运行的备用决策,在大规模光伏发电接入的形势下难以适应电力系统安全、稳定、经济运行的需要。

[0009]实际测得的气象数据与辐照度数据常分散在不同的机构,形成了一个个“数据孤岛”,即便一个机构内部,数据壁垒也不易打通,缺乏有效的互通和协作。而将散落在各地、各机构的数据合并集中则存在着数据隐私与泄露保护问题。由于隐私、安全或法律限制,数据所有者常无法直接共享其原始数据以进行模型训练,以上严重制约人工智能发展。

4

CN 111626506 A

说 明 书

2/9页

发明内容

[0010]针对上述问题,本发明提出一种基于联邦学习的区域光伏功率概率预测方法。该方法利用联邦学习框架以及贝叶斯长短期记忆神经网络,以在保护数据隐私的前提下综合考虑不确定性提高短期区域光伏功率预测精度,并给出不同置信水平下的概率预测结果。在联邦学习框架下,实现本地化的数据存储与模型训练,全局化模型优化与更新。技术方案如下:

[0011]基于联邦学习的区域光伏功率概率预测方法,包括如下步骤:

[0012]步骤1.明确区域内各个参与联邦学习框架进行概率预测的光伏电站,收集一段时间内气象信息以及对应的光伏功率变量,并按时间顺序采集上述变量构成样本数据集;[0013]步骤2.对步骤1获得的样本数据集进行预处理;

[0014]步骤3.对步骤2中的光伏电站的样本数据集进行分割,按照一定比例分割为训练集与测试集;

[0015]步骤4.分别对步骤3中训练集和测试集进行归一化;[0016]步骤5.构建联邦学习框架;

[0017]步骤6中心服务器根据预测要求,建立全局预测模型;

[0018]步骤7.定义步骤6中建立的全局预测模型的训练误差函数、优化器与学习率,并将网络结构以及初始化参数分发至各个光伏电站;

[0019]步骤8.中心服务器根据与各个光伏电站的通信状态,选择若干光伏电站进行预测模型训练与反馈;

[0020]步骤9.对步骤8中被选择的各个站点,使用步骤4中准备好的本地训练集和测试集分别进行模型训练与测试,并更新本地预测模型;

[0021]步骤10.各个光伏电站进行光伏功率概率预测;

[0022]步骤11.中心服务器接收步骤9中通过测试的本地预测模型,并更新全局预测模型;

[0023]步骤12.中心服务器向所有光伏电站分发更新后的全局模型;[0024]步骤13.重复步骤8至步骤12,进行全局模型的滚动更新。[0025]此外,本发明还公开一种针对区域能源协同调控系统,包括上述所述的基于联邦学习的区域光伏功率概率预测方法。[0026]有益效果:本发明基于联邦学习框架以及变分贝叶斯长短期记忆神经网络,在保护数据隐私的前提下综合考虑建模与数据观测中的不确定性,以提高短期区域光伏功率预测精度,并给出不同置信水平下的概率预测结果。凭借联邦学习框架,实现本地化的数据存储与模型训练,全局化模型优化与更新,开拓数据共享新途径,提供更多信息辅助综合能源系统实时优化调度决策。

附图说明

[0027]图1:本发明基于联邦学习的区域光伏功率概率预测方法及其系统具体结构框图。[0028]图2:本发明基于联邦学习的区域光伏功率概率预测方法及其系统流程图。[0029]图3:本发明在宁夏采集的2006年7月至2018年11月的气象数据与光伏功率数据进行了日前概率预测测试曲线图。其中,站点A与站点B为两距离1km的光伏电站,其设施配置

5

CN 111626506 A

说 明 书

3/9页

与采集数据完全相同,并与中心服务器共同构成联邦学习框架。

具体实施方式

[0030]以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。[0031]实施例1

[0032]基于联邦学习的区域光伏功率概率预测方法,包括如下步骤:

[0033]步骤1.明确区域内各个参与联邦学习框架进行概率预测的光伏电站,其包括但不限于分布式光伏电站,集群式光伏电站。收集一段时间内上述电站所处环境的气象信息以及对应的光伏功率,并按时间顺序将上述观测量构成样本数据集;所述气象信息包括总辐照度、直接辐照度、散射辐照度数据,气温、气压、风速、风向、相对湿度以及采集上述量的日期与时间;

[0034]步骤2.对步骤1获得的样本数据集进行预处理。实施方式如下:[0035]对于数据集中的数据,如果存在数据明显偏离近期测量数据范围,则很可能是异常值。此时可采取平均法进行处理,即使用近期数据的平均值进行替代。若出现连续异常值(例如异常值持续时长超过15分钟),则使用历史同期该时段数据进行替换。[0036]对于小于0的总辐照度、直接辐照度、散射辐照度数据、光伏功率数据,使用0替代。[0037]对于时间信息,取其小时数以及星期数进行独热编码处理,处理方式如下:[0038]使用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位为1。例如[0039]自然状态码为:000,001,010,011,100,101[0040]独热编码为:000001,000010,000100,001000,010000,100000[0041]步骤3.对步骤2中的光伏电站的样本数据集进行分割,按照8:2或7:3的比例不打乱地分割为训练集与测试集。

[0042]步骤4.分别对步骤3中训练集和测试集进行归一化。归一化针对数据集中的有量纲数据对其度量单位的依赖性问题,定义某种规则进行变换,使之落入某一较小的区间范围,以消除不同量纲对于建模过程的影响。常用的零均值归一化过程使得不同量纲的数据转化为无量纲数,并可解决实际值可能突破历史最大最小值的问题,该变换f可表示如下:[0043]f:xi→x'i,x'i∈[-1,1][0044]其变换方式为:

[0045]

其中,xi为原始数值,x'i为归一化后数据,μσA为变量A的均值,A为变量A的标准差。

[0047]步骤5.构建联邦学习框架:图1为本发明的系统架构示意图。如图1所示,中心服务器与光伏电站可以通过有线或无线的方式进行通信连接。其中,中心服务器节点可为单个网络服务器、多个网络服务器组成的服务器组或基于云计算的由大量计算机或网络服务器构成的云;光伏电站则包含气象数据与光伏功率数据采集、记录、存储设备、本地计算资源以及网络通信设备。

6

[0046]

CN 111626506 A[0048]

说 明 书

4/9页

步骤6.中心服务器根据预测要求,建立全局预测模型;

[0049]所述全局预测模型建立方法:

[0050]采用变分贝叶斯长短期记忆网络模型获取某一光伏电站功率时域特征,该神经网络模型主要包含长短期记忆网络结构以及变分贝叶斯推断结构。[0051]所述长短期记忆网络结构建立方法:[0052]长短期记忆网络结构包含输入层,长短期记忆网络层LSTM#1,长短期记忆网络层 LSTM#2,全连接层Dense#1,全连接层Dense#2。所有LSTM层中使用sigmoid函数作为激活函数。所述的LSTM层具体表示为:[0053]it=σ(Wiixt+bii+Whih(t-1)+bhi)[0054]ft=σ(Wifxt+bif+Whfh(t-1)+bhf)[0055]gt=tanh(Wigxt+big+Whgh(t-1)+bhg)[0056]ot=σ(Wioxt+bio+Whoh(t-1)+bho)[0057]ct=ft*c(t-1)+it*gt[0058]ht=ot*tanh(ct)[0059]其中,xt为t时刻LSTM层的输入,it表示t时刻LSTM神经元的输入门,ft表示t时刻LSTM神经元的遗忘门,gt表示t时刻LSTM神经元的细胞门,ot表示t时刻LSTM神经元的输出门;ct表示t时刻LSTM神经元的细胞状态,ht表示t时刻LSTM神经元的隐藏状态; Wii表示xt进入输入门的权重,Whi表示上一时刻隐藏状态的输出到这一时刻输入门的权重; Wif表示xt进入遗忘门的权重,Whf表示上一时刻隐藏状态的输出到这一时刻输入门的权重; Wig表示xt进入细胞门的权重,Whg表示上一时刻隐藏状态的输出到这一时刻细胞门的权重; Wio表示xt进入输出门的权重,Who表示上一时刻隐藏状态的输出到这一时刻输出门的权重; bii表示输入门处的偏置项,bhi表示由上一时刻隐藏状态到输入门的偏置项;bif表示输入门到遗忘门的偏置项,bhf表示由上一时刻隐藏状态到遗忘门的偏置项;big表示由输入门到细胞门的偏置项,bhg表示由上一时刻隐藏状态到细胞门的偏置项;bio表示由输入门到输出门的偏置项,bho表示由上一时刻隐藏状态到输出门的偏置项。*表示Hadamard乘法;σ与 tanh分别代表sigmoid与双切正切激活函数。为方便起见,构建的神经网络中全部权重与偏置的集合记作W。

[0060][0061]

所述变分贝叶斯推断结构建立方法:

[0063]变分贝叶斯推断结构具体选用蒙特卡洛Dropout结构。变分推断结构即构建一含参的近似分布去替换传统贝叶斯神经网络中难以计算的后验分布,通过不断调整近似分布的参数,近似分布近似于后验分布分布,解决后验分布计算问题,实现神经网络模型中参数概率化,以评估数据输入与建模过程中的不确定性。蒙特卡洛Dropout是实现变分推断的一种高效的近似形式。该方法通过重复进行多次前向传播进而得到一系列结果,通过计算这些结果的协方差以表示不确定性。该方法可在不加剧计算复杂性或牺牲精度的前提下,较为便利地运用深度神经网络来实现预测及其不确定性估计,而无需对网络结构进行重大变

7

[0062]

CN 111626506 A

说 明 书

5/9页

动。

首先初始化上述构建的长短期记忆网络中各个权重与偏置的先验分布P(W)。一般

地,可使用独立高斯分布进行权重与偏置W的初始化,即W~N(0,I),其中I为单位矩阵。[0065]基于包含N条数据的训练集,其中气象数据表示为X={xi|i=1,...,N},对应光伏功率 Y={yi|i=1,...,N},当输入步骤1中新采集到的气象数据x*以及对应的光伏功率y*后,可以得到当输入新训练数据后的光伏功率数据预测值的概率密度函数:[0066]p(y*|x*,X,Y)=∫p(y*|x*,W)p(W|X,Y)dW[0067]对应的预测光伏功率分布标准差为:

[0068]Var(y*|x*)=Var[E(y*|W,x*)]+E[Var(y*|W,x*)][0069]其中等式右侧第一项为建模不确定性,第二项为气象数据测量不确定性。

[0070]光伏功率数据预测值的概率密度函数中后验分布p(W|X,Y)可根据贝叶斯方法计算:

[0071][0064]

但在实践中,由于神经网络参数冗杂,该后验分布p(W|X,Y)通常难以计算。故须使

用变分推断方式来近似计算后验分布。设立分布q(W)来近似拟合后验分布p(W|X,Y)。[0073]q(W)定义如下:

22[0074]q(W)=pN(m,σ)+(1-p)N(0,σ)

[0075]其中p∈[0,1]为不进行Dropout的概率,例如0.2或0.3;m则为其中的变分参数,用

2

于调整分布均值;在此应用中,设定近似分布的方差σ为0。

[0076]定义Kullback-Leibler(KL)散度来衡量后验分布p(W|X,Y)和设定的近似分布q(W) 间的距离,当KL散度越小,则可认为两个分布越接近。两分布的KL散度为:[0077]KL(p(W|X,Y)||q(W))=-∫q(W)log p(yi,xi,W)dW+KL(q(W)||p(W))[0078]其中xi∈X,yi∈Y,为训练集中X,Y中每一条样本。[0079]基于对q(W)的定义,求取KL(p(W|X,Y)||q(W))最小值问题可近似为关于变分参数m的L2规范化问题。[0080]进一步地,上式中等号右侧第一项可化为:

[0081][0082]

[0072]

其中,-∫q(W)logp(yn|xn,W)dW可采用蒙特卡洛积分近似计算,使用估计的后验分

积分形式转换为用求和的形式,得到

布采样获得神经网络权重与偏置的采样值

的无偏估计,进而求得-∫q(W)logp(Y|X,W)dW。

[0083][0084][0085]

此时两分布的KL散度可表示为:

对于KL(q(W)||p(W)),当神经网络中参数数目十分巨大时,有:

8

CN 111626506 A[0086][0087][0088]

说 明 书

6/9页

综上,步骤6构建的全局预测模型的目标函数即:

对于近似分布q(W),当输入新的气象数据x*时,神经网络输出的预测值y*的概率密

度函数q(y*|x*)为:[0090]q(y*|x*)=∫p(y*|x*,W)q(W)dW[0091]当进行多次前向过程时,由于Dropout在每次前向过程中随机改变神经元连通情况,每次实际的网络结构都不尽相同,相同的输入会得到不同的输出预测值。设第i次神经网络的关于输入气象数据与输出的预测值的数学表达式为:

[0089][0092][0093]

当使用蒙特克罗Dropout技术对步骤6建立的神经网络进行T次前向过程时,此时

预测值的期望近似可认为是T次神经网络输出预测值的平均值,即:

[0094][0095][0096][0097][0098][0099][0100][0101][0102][0103][0104]

2

所以光伏功率预测的不确定性σ可近似为:

所以当输入新的气象信息x*时,预测光伏功率可近似为:

当进行T次随机前向过程时,建模过程中的不确定性可表示为:

训练数据X和Y在数据采集中由于仪器误差等造成的不确定性可表示为:

则在不同置信水平下的对应的置信区间为:

其中α为置信水平对应的分位数,zα/2为相应的标准分数,可由查表获得。常用置信

水平有99%,95%、90%与50%。

[0106]步骤7.定义步骤6中建立的全局预测模型的训练误差函数、优化器与学习率,并将网络结构以及初始化参数分发至各个光伏电站;[0107]所述训练误差函数选择均方误差(MSE):

[0105]

9

CN 111626506 A[0108][0109]

说 明 书

7/9页

其中,yi和分别表示数据集中第i个实际光伏功率与对应的神经网络预测值,K为

使用的数据的条数。

[0110]所述优化器与学习率选择方式如下:[0111]为配合联邦学习框架,神经网络训练的优化器使用随机梯度下降(SGD),学习率可设定为0.01、0.001或0.1。单次输入训练批次大小可选择128或64,特别地该批次大小可根据光伏电站配备的计算设备的运行内存或显存大小进行调整,最小为1。[0112]步骤8.中心服务器根据与各个光伏电站的通信状态,选择若干光伏电站进行预测模型训练与反馈;

[0113]所述选择参与训练与反馈的光伏电站的方式如下:[0114]中心服务器根据与各个光伏电站的通信状态,选择若干光伏电站进行预测模型训练与反馈。例如中心服务器根据各个节点的ping值进行选择,选择ping值小于500ms的光伏电站参与训练;也可根据与各个节点的上传下载速度进行选择,具体速度阈值设定需根据中心服务器与各个光伏电站连接方式进行设定(例如下载光伏电站预测模型的速度大于 300kb/s)。未被选择的光伏电站则继续使用本地现有预测模型。[0115]步骤9.对步骤8中被选择的各个站点,使用步骤4中准备好的本地训练集和测试集分别进行模型训练与测试,并更新本地预测模型;[0116]所述更新本地模型的方式为:

[0117]若测试结果满足设定阈值则通过测试,则保存本地模型并将本地模型上报中心服务器。若不满足,则放弃上传,继续使用上一轮次下载的全局模型。设定阈值可设定为测试误差MSE小于最大值的5%至15%,该取值随着提前预测的时间尺度的提高而提高,通常提前5至60分钟的超短期与短期预测可选用5%至10%,日前预测可放宽至15%。[0118]步骤10.各个光伏电站进行光伏功率概率预测;全部站点将待预测时刻之前时段的采集到的气象数据按照步骤2所述方法进行处理后,作为现有本地预测模型的输入,可获得不同置信水平下待预测时刻指定站点的光伏功率预测值。常用置信水平有99%,95%、90%与50%。

[0119]步骤11.中心服务器接收步骤9中通过测试的本地预测模型,并更新全局预测模型。

[0120]所述中心服务器接收本地预测模型的一种优化策略为:[0121]为了避免中心服务器长时间的等待工作节点反馈,降低模型的训练速度,服务器节点仅接收在预设时段内反馈的本地模型。例如服务器节点可以在下发待训练模型之后开启定时器,在预设时间到达之后,可以拒绝再继续接收本地模型,或者可以直接丢弃在预设时间到达之后接收到的本地模型。在预设时间段内,中心服务器接收步骤6中选定的多个光伏电站反馈的本地模型。根据预测提前时间的不同,等待反馈预设时段可设定为:超短期 2至3分钟;短期为10至20分钟;日前为30至50分钟。根据通信链路带宽不同可进行适当调整,保证能够收到足够的反馈样本并预留足够的全局模型更新时间与模型分发时间。[0122]所述更新全局预测模型的方法为:

10

CN 111626506 A[0123]

说 明 书

8/9页

根据多个反馈的光伏电站本地模型以及对应的权重系数,对待训练模型进行更

新。根据如下公式对待训练模型进行更新:

[0124]

其中G’为更新后的全局模型,G为更新前的全局模型,Gi为第i个本地模型,α为更新前全局模型权重,可根据需要选择0至1,n为反馈的本地模型数量。[0126]步骤12.中心服务器向所有光伏电站分发更新后的全局模型。对于分发失败的光伏电站则进行重试,重试次数达到3至10次后则重试并进行记录报警。重试次数可根据链路情况与预测提前时间进行调整。

[0127]步骤13.重复步骤8至步骤12,进行全局模型的滚动更新。综上可使用光伏电站本地数据,借助联邦学习框架进行全局模型更新,步进实现一定区域内的光伏功率电站短期或超短期光伏功率概率预测,从而解决数据隐私与安全保护问题,并为电网运行提供更全面的未来光伏功率信息。[0128]实施例2

[0129]本发明应用在宁夏采集的2006年7月至2018年11月的气象数据与光伏功率数据进行了日前预测测试。测试中联邦学习框架内包含两个光伏电站与一个中心服务器。[0130]对于步骤1中,两光伏电站均参与联邦学习框架;所述每个光伏电站所采集记录的气象信息包括2m处气温(℃)、气压(hPa)、相对湿度(%)、10m高空风速、10m高空风向,以及总辐照度、散辐照度和直接辐照度。采集记录间隔为30分钟。[0131]步骤3所述的数据预处理过程中,两光伏电站未有连续异常值出现,故使用平均化替换数据集中的异常点;并使用0替换全部小于0的总辐照度、直接辐照度、散辐照度数据以及光伏功率数据;对于小时数据使用24位状态编码进行编码表示,对于星期数据使用 52位状态编码进行编码表示。

[0132]步骤6中建立的全局预测神经网络模型超参数设定如下:[0133]LSTM#1:128神经元,dropout=0.2[0134]LSTM#2:128神经元,dropout=0.2[0135]Dropout#1:0.2[0136]Dense#1:64神经元[0137]Dropout#2:0.2

[0138]Dense#2(输出层):32神经元;

[0139]使用独立高斯分布进行权重与偏置W的初始化;近似分布q(W)中p取值0.2;使用蒙特卡洛Dropout技术时,对上述全局预测神经网络模型进行T=10次前向过程,即可预测未来时刻光伏功率以及不确定性,进而获得某一置信水平下的光伏功率置信区间。[0140]步骤7中所述优化器与学习率选择如下:学习率使用0.01,单词输入训练批次大小选择64。

[0141]步骤8中所述参与训练与反馈的光伏电站的参数设定如下:选择下载光伏电站预测模型速度大于300kb/s的站点,本例中两光伏电站始终符合上述条件。[0142]步骤9中设定阈值为15%。

[0143]步骤10中设定置信水平为99%进行光伏功率概率预测。

11

[0125]

CN 111626506 A[0144]

说 明 书

9/9页

步骤11中所述的等待反馈预设时段为30分钟。更新全局预测模型中更新前全局模

型权重为0.2。

[0145]步骤12中心服务器向所有光伏电站分发更新后的全局模型中设定的重试次数为5次。

[0146]参照步骤13进行滚动预测获得预测结果如图3所示。从预测结果可知,对于站点两个不同的站点,在晴朗以及多云天气条件下,图中表示实际值的实线与表示预测值的短横线始终较为接近,并落在由上确界和下确界确定的预测置信区间内。当天气条件发生波动时,对应的预测区间范围变大,可提醒电网调度保留更多的旋转备用等调控措施;当天气条件相对平稳时,对应的预测区间范围较小,可适当下调旋转备用,提高整体经济性。经过计算两站点在该时段预测精度指标MSE为4.38%,能够满足日前预测的精度需求。[0147]以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是本发明的原理,在不脱离本发明精神和范围的前提下本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明的范围内。本发明要求的保护范围由所附的权利要求书及其等同物界定。

12

CN 111626506 A

说 明 书 附 图

1/3页

图1

13

CN 111626506 A

说 明 书 附 图

2/3页

图2

14

CN 111626506 A

说 明 书 附 图

3/3页

图3

15

因篇幅问题不能全部显示,请点此查看更多更全内容

Top