一种基于ICSO-SVM模型的光伏发电功率预测方法与流程

本发明属于新能源发电功率预测,具体涉及一种基于icso-svm模型的光伏发电功率预测方法。
背景技术:
1、“双碳”目标下,构建清洁能源占比逐渐提高的新型电力系统是未来电力行业发展的主要方向。光伏发电是最主要的新能源发电技术之一,已经得到迅猛发展。但是,其间歇性、多变性、随机性的特点又给新能源消纳和电网稳定性带来极大的挑战。光伏功率预测能够在一定程度上缓解新能源消纳的问题,降低弃光率,同时在电网管理和调度中发挥积极作用,进一步提供可靠的电力成本分析,提高经济效益。
2、现阶段对光伏发电功率预测的方法有很多,包括统计学方法、光伏性能模型、机器学习法以及混合模型等。由于机器学习模型可以实现端到端的映射,使用多种机器学习组合模型实现光伏出力的预测,不仅能够为模型提供多维度、高深度的数据信息,还可以进一步拓展模型本身的复杂度,提高模型学习特征间非线性关系的能力。
3、基于上述背景,基于深度学习建立一个高精度的预测模型进行短期光伏发电功率预测,对于帮助电力调度部门完善调度计划、提升光伏发电预测能力、提高光伏产业的经济收益,以及进行相关的理论研究等诸多方面都具备实用价值和指导意义。
技术实现思路
1、本发明是为了克服现有技术的不足,针对目前在复杂天气工况下光伏发电功率预测精度不高的问题,提出一种基于icso-svm模型的光伏发电功率预测方法,所提方法采用svm作为预测主模型,并利用改进竞争粒子群算法对其权重和偏置参数进行更新,从而弥补传统方法在面对天气波动较大场景下预测准确度不高、预测收敛速度较慢的缺点。
2、本发明所采用的技术方案为:一种基于icso-svm模型的光伏发电功率预测方法,包括如下步骤:
3、s1:获取原始数据并对数据进行预处理;
4、s2:对原始特征进行相关性分析并剔除相关性较低的特征;
5、s3:对标准竞争粒子群算法进行改进;
6、s4:基于改进cso算法对svm的超参数进行寻优,建立icso-svm预测模型对光伏发电功率进行预测;
7、s5:数据反归一化及模型预测效果评价。
8、具体的,所述步骤s1:获取原始数据并对数据进行预处理。原始数据集中可能存在因为数据采集设备或传感器异常导致的缺失值和异常值等不良数据,需要对数据进行预处理。在此基础上,对数据进行归一化处理,避免因量纲不同导致机器学习模型预测精度降低。该部分具体包括:
9、(1)缺失值填充。将数据表示为{x1,x2,…,xn},并将其分为观察数据和缺失数据,观察数据是未缺失的数值,观察数据可以表示为xobs={x1,x2,…,xp},缺失数据表示为xmiss={xp+1,xp+2,…,xn},p<n。采用em算法对缺失值进行填充,步骤如下:
10、1)初始化当前迭代次数k、收敛参数ε、迭代k次时的评价参量θ(k)、预测值xfill、观测值xobs、最大期望值e(xfill|xobs,θ(k));
11、2)执行最大期望步(e步),即计算迭代第k次时的填充数据期望值,计算公式如下:
12、e(xfill|xobs,θ(k))=θ(k-1) (1)
13、3)执行最大化步(m步),计算公式为:
14、
15、式中,xi为观察数据。
16、4)判断是否满足收敛条件,满足条件时转到下一步,否则执行k=k+1,转步骤3)。收敛条件为:
17、|e(xfill|xobs,θ(k))-e(xfill|xobs,θ(k-1))|<ε (3)
18、5)输出预测值xfill,将该值作为对本数据集所有缺失数据的填充值,计算公式为:
19、xfill=e(xfill|xobs,θ(k)) (4)
20、(2)使用箱线图法对异常数据进行检测并采用em算法填充。利用箱线图原理对原始数据进行异常值检测,随后将异常值视为缺失值,并采用em算法对缺失值进行填充。箱线图判断为异常值的条件为:
21、
22、式中,xa表示异常值;q1、q3分别表示箱线图的上四分位数和下四分位数;iqr表示四分位间距,即iqr=q1-q3;
23、(3)数据归一化处理。原始数据集中各时序数据量纲不同、数值差别较大,若直接用于模型训练,会使模型学习非线性特征的能力变弱,需要对数据进行归一化处理至[0,1]区间。采用min-max法对数据进行归一化,计算公式为:
24、
25、式中,xi(k)为特征i的第k个样本的原始值,xi,max、xi,min分别为特征i中最小值和最大值,xi′(k)为归一化值。
26、具体的,所述步骤s2:对原始特征进行相关性分析并剔除相关性系数较低的特征。光伏系统出力情况主要受气象因子的变化影响,例如太阳辐照度、气温、湿度、气压等。为在众多气象因素中筛选出影响光伏出力的主要特征,减少关联性小的因素对结果的负面影响,需要先对气象因素进行相关性分析。
27、斯皮尔曼相关系数法是一种有效的判断向量相似度的方式,与皮尔逊相关系数相比,斯皮尔曼相关系数不受离群值影响,适用于两个非线性向量的相关性计算,不需要关心数据如何变化、符合什么样的分布,只需要关心每个变量对应数值的位置,如果两个变量的对应值在各组内的排列顺位是相同或类似的(或者理解为一个变量是另外一个变量的严格单调函数),则具有显著的相关性,利用斯皮尔曼相关系数法对气象特征进行分析,提取关键特征作为模型训练的输入特征。
28、对于两个序列x和y的斯皮尔曼相关性系数计算公式为:
29、
30、式中,n为序列长度,xi和yi分别为序列x和y的第i个变量,和分别为序列x和y的平均值。s的取值范围为[-1,1],s越趋近于0,两个向量的相关性越低,越趋近于-1则成负相关,趋近于1成正相关。
31、具体的,所述步骤s3:对标准竞争粒子群算法进行改进。设种群大小为m,在解空间内随机地初始化种群,在每一次迭代过程中首先将种群随机均分为2组,两组粒子两两进行竞争比较,根据适应值的大小分别为胜利者(winner)与失败者(loser),胜利者直接进入下一次迭代,失败者根据下式向胜利者学习并更新自身位置和速度。
32、
33、式中,xlosser(t)、xwinner(t)分别表示失败者和胜利者的位置向量;vlosser(t)表示失败者的速度向量;t为迭代次数;r1(t)、r2(t)、r3(t)为3个[0,1]内的随机向量;为控制因子,控制对失败者位置更新的影响;有两种选择,一种表示所有粒子的平均位置,具有全局性,另外一种表示局部范围内所有粒子的平均位置,具有局部性,通常情况下,表示所有粒子的平均位置。
34、cso算法每次迭代只更新失败者的速度与位置,导致种群的收敛速度缓慢。另外,由于种群在全局空间的探索仅依赖失败者向胜利者的学习过程,使得种群的开发不足,因此采用以下方法对其进行改进。
35、(1)在标准cso算法中,种群的初始化是随机产生的,初始位置的散布程度及其在搜索空间中的位置是否均匀,将直接影响整个搜索过程的收敛速度和算法的寻优效率。利用混沌优化策略对粒子群进行初始化,tent映射具有较均匀的遍历性分布区间,能产生分布均匀的混沌序列,有效地保证了种群在解空间中的均匀分布,从而提高算法的搜索效率,数学表达式为:
36、
37、式中,xn为混沌变量,n混沌变量序号,n=1,2,…,m;β∈[0,1],可根据具体的情况选择合适的β值。
38、利用tent混沌映射生成初始化粒子群位置,步骤如下:
39、1)对于d维空间中的n个初始粒子位置,首先随机产生一个d维向量作为第一个混沌向量r1∈[0,1];
40、2)将r1的每一维利用tent混沌映射公式进行n-1次迭代,生成n-1个混沌向量,r2,r3,…,rn;
41、3)将产生的n个混沌向量按照下式映射到解的搜索空间。
42、
43、式中,xmax、xmin分别表示进搜索空间的上下限;xi即为第i个混沌初始化粒子位置信息。
44、(2)由于变异算子在提升算法收敛性能和种群多样性方面有着显著表现,因此引入t-分布扰动变异来增强种群的多样性,帮助粒子跳出局部最优位置,其数学本表达式为:
45、
46、式中,γ为变异步长,表达式为γ=0.01+0.49(t/tmax);tmax为最大迭代次数;t_distrub表示自由度参数,随着迭代次数的变化而变化;xj、xk表示随机两个粒子的位置;pm表示变异概率。
47、利用上式对粒子个体进行t-分布扰动,t-分布的自由度随着迭代次数的变化而变化,随自由度参数t值的增长,数值分布状态逐渐由柯西分布趋近于高斯分布,算法迭代前期,t-分布表现出的特征与柯西分布特征一致,帮助开采新的搜索空间,提高算法的全局搜索能力;在中后期时,t-分布表现出的特征与高斯分布特征一致,有助于算法在当前解邻域范围内进行搜索。
48、具体的,所述步骤s4:基于改进cso算法对svm的超参数进行寻优,建立icso-svm预测模型对光伏发电功率进行预测。
49、svm是一种基于统计学理论的机器学习方法,根据结构风险最小化原则提出,具有泛化能力强及计算速度快的特点。svm通过引入核函数实现非线性变化,目标函数为:
50、
51、式中,w、b表示权重和偏置;c为惩罚参数;xi为svm的输入量。
52、引入核函数k(xi,xj)后,上述目标函数转为了:
53、
54、核函数的选择直接影响了支持向量机的模型性能,径向基核函数具有处理简单、分析性好、径向对称性好、平滑性好等优点,因此选取径向基函数作为svm的核函数。核函数表达式为:
55、
56、式中,γ为径向基核函数的核参数。
57、svm中两个关键参数为惩罚参数c、核函数的核参数γ。利用改进icso算法对两个超参数进行寻优,进而构建icso-svm回归预测模型,寻优步骤如下:
58、1)将svm超参数与icso算法中的粒子位置进行一一对应,粒子的最佳位置即为最佳超参数值;
59、2)初始化算法的最大迭代次数、种群规模、变异步长等参数;
60、3)对粒子群初始位置进行tent混沌初始化;
61、4)根据svm的目标函数计算每个粒子的适应度值;
62、5)将种群随机进行两两竞争比较,根据适应度值的大小分为胜利者winner和失败者loser;
63、6)根据对应公式更新失败粒子和胜利粒子的速度以及位置,随后计算更新粒子的适应度值,并更新全局最优值和最优解;
64、7)达到最大迭代次数的时候,算法结束,转到步骤8),否则继续步骤5);
65、8)得到最优粒子位置,即得到最优的svm超参数值。
66、具体的,所述步骤s5:数据反归一化及模型预测效果评价。对预测得到的光伏发电功率数据进行反归一化处理,使其具有物理意义,计算公式为:
67、xi(k)=xi′(k)(xi,max-xi,min)+xi,min
68、并利用均方根误差(rmse)、平均绝对百分比误差(mape)对模型预测效果进行评价。将测试集输入训练好的最佳icso-svm模型中对光伏发电功率进行预测,采用rmse、mape对模型预测效果进行评估,并与多个对比算法进行比较分析,验证所提方法的有效性和优越性。rmse、mape具体计算表达式如下:
69、
70、式中,yi表示实际值,yi′表示预测值,为平均值,n表示预测样本数量。
71、本发明的有益效果:在光伏发电功率预测工作中,预测模型超参数设置需要依靠大量经验和人为设置,不同参数的模型的预测效果差距较大,预测精度不够高,在多种工况下模型预测效果不够稳定,为进一步提高模型预测效果,本发明提出一种基于icso-svm模型的光伏发电功率预测方法,利用icso对svm的超参数进行优化,经过算例验证,所提模型可以有效提升光伏发电功率预测的精度,且在非晴天工况下依然具有较高的预测稳定性。
技术研发人员:苗桂喜,李环召,元亮,张景超,王鑫,陈上吉,于昊正,朱全胜,席晟哲,郑晨,郑月松,崔哲芳,钟士华,杨磊,孙浩然,万迪明,马辉,薛飞,吴博,王振邦
技术所有人:国网河南省电力公司安阳供电公司
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
