本文已参与「新人创作礼」活动,一起开启掘金创作之路。
摘要
电力系统负荷(电力需求量,即有功功率)预测是指充分考虑历史的系统负荷、经济状况、气象条件和社会事件等因素的影响,对未来一段时间的系统负荷做出预测。负荷预测是电力系统规划与调度的一项重要内容。短期(两周以内)预测是电网内部机组启停、调度和运营计划制定的基础;中期(未来数月)预测可为保障企业生产和社会生活用电,合理安排电网的运营与检修决策提供支持;长期(未来数年)预测可为电网改造、扩建等计划的制定提供参考,以提高电力系统的经济效益和社会效益。复杂多变的气象条件和社会事件等不确定因素都会对电力系统负荷造成一定的影响,使得传统负荷预测模型的应用存在一定的局限性。同时,随着电力系统负荷结构的多元化,也使得模型应用的效果有所降低,因此电力系统负荷预测问题亟待进一步研究。
1 前言
1.1 研究背景
目前,人类的生活处处离不开电力,因此电力系统的运转状态,用电安全等至关重要,为了合理规划用电规则,保障企业生产和社会生活用电,提高电力系统的经济效益和社会效益,本文针对电力系统负荷进行预测。电力系统负荷(电力需求量,即有功功率)预测是指充分考虑历史的系统负荷、经济状况、气象条件和社会事件等因素的影响,对未来一段时间的系统负荷做出预测。负荷预测是电力系统规划与调度的一项重要内容。短期(两周以内)预测是电网内部机组启停、调度和运营计划制定的基础;中期(未来数月)预测可为保障企业生产和社会生活用电,合理安排电网的运营与检修决策提供支持;长期(未来数年)预测可为电网改造、扩建等计划的制定提供参考,以提高电力系统的经济效益和社会效益。
传统负荷预测模型已经被广泛的应用于电力系统负荷预测,复杂多变的气象条件和社会事件等不确定因素都会对电力系统负荷造成一定的影响,使得传统负荷预测模型的应用存在一定的局限性。同时,随着电力系统负荷结构的多元化,也使得模型应用的效果有所降低,因此电力系统负荷预测问题亟待进一步研究。
对不同行业的用电负荷进行中期预测分析,能够为电网运营与调度决策提供重要依据。特别是在新冠疫情、国家“双碳”目标等背景下,通过对大工业、非普工业、普通工业和商业等行业的用电负荷进行预测,有助于掌握各行业的生产和经营状况、复工复产和后续发展走势,进而指导和辅助行业的发展决策。
因此,本文使用Lstm,xgboost,arima等模型对用电负荷进行预测。
1.2 研究任务
利用传统负荷预测模型和深度学习算法解决以下两个任务:
地区负荷的中短期预测分析
基于某地区电网间隔15分钟的负荷数据,选择合适的机器学习或深度学习算法,建立负荷的中短期预测模型,预测未来10天间隔15分钟的预测结果,预测电网未来3个月日负荷的最大值和最小值预测结果,以及相应达到负荷最大值和最小值的时间,并分析两次预测的精度。
行业负荷的中期预测分析
基于各行业每天用电负荷相关数据,选择合适的算法来分析各行业用电负荷突变时间、原因,并预测未来3个月日负荷最大值和最小值的预测结果,分析预测精度,最后对各行业提出有针对性的建议。
2 地区负荷的中短期预测分析
2.1 数据预处理
附件中提供的某地区电网间隔15分钟的负荷数据
2.2 模型
建立中短期负荷预测模型
(1)给出该地区电网未来10天间隔15分钟的负荷预测结果,并分析其预测精度;
(2)给出该地区电网未来3个月日负荷的最大值和最小值预测结果,以及相应达到负荷最大值和最小值的时间,并分析其预测精度。
2.2.1 arima模型
平常的时间序列中,我们会看到其实很多序列在做了ACF以及PACF后并不能判断是什么样的序列,这时,我们就需要对这个模型进行一次差分,即后一项减去前一项来寻求序列之间的关系,从而找到合适的ARMA(p,q)进行拟合。
这个过程我们称作差分,整个过程就称作整合(integrated)ARMA模型即ARIMA(p,d,q)模型(其中d表示差分的次数)。
ARIMA(p,d,q)(P,D,Q)S模型
ARIMA(p,d,q)(P,D,Q)S是ARIMA(p,d,q)模型中增加了季节性因素所产生的模型。一般的,我们要对原有的序列进行分解,将季节部分与趋势部分进行分离,从而再分别用ARIMA(p,d,q)模型进行拟合。在实际操作过程中,需要进行反复比较。
分析方法与过程
附件1-区域15分钟负荷数据可视化的时序图如图1所示,图中显示出一个明显的循环趋势即几年内呈现出的周期性变化,符合时间序列的一个特点。
图1 对于时间序列数据,常用的预测方法有移动平均法、差分指数平滑法、平稳时间序列模型等,本文主要讨论了XGBoost、ARIMA以及LSTM模型在电力系统负荷预测分析上的效果。
针对问题一,需要预测未来十天的电力系统负荷,使用全部数据可能是没有必要的且可能导致模型的精度下降(数据大致上呈现周期性变化,往往只需要抓住一个周期的变化特征就可以得到一个不错的结果)。
ARIMA模型截取原数据的后9600个数据进行一个训练及测试(9600个样本包括了2021年8月31日以及前99天共计一百天的电力系统负荷数据),其中后百分之十的数据用作模型的测试集合(用作估计该地区电网未来10天间隔15分钟的负荷预测结果的泛化误差估计),截取后的数据分布如图2所示
图2
由于ARIMA模型对数据平稳性要求,如图3所示,对数据的差分进行平稳性分析,对原始数据、一阶差分和二阶差分作比较。从图中可以发现,数据的原始分布就已经可以达到ARIMA模型的平稳性要求,这里采用原始数据进行建模的分析。
图3
对训练数据进行自相关性以及偏自相关性检验的可视化情况如图4所示。根据图4的信息,我们采用p=25,d=0,q=25的ARIMA模型参数进行试验。试验结果的可视化如图5所示。
图4
图5
对模型的预测作检验,检测模型输出是否可信以及符合假定条件,其可视化结果如图6所示。图5的可视化结果显示模型的预测结果整体趋势得到拟合,但和实际情况还是有较大出入。
图6
ARIMA模型显示的效果较差
后续再更新lstm、卡尔曼滤波算法模型和xgboost模型