什么是时间序列? 建立了观察结果与时间变化的关系,能帮预测未来一段时间内的结果变化情况; 回归分析擅长的是多变量与目标结果之间的分析,即便是单一变量,也往往与时间无关; 时间序列可以帮助我们进行预测,快速统计模型的估计和推断; 时间预测一般有机器学习和深度学习两种方式: 机器学习模型:包括AR、MA、ARMA、ARIMA,一般用于 Auto Regressive,中文叫自回归模型 AR是线性时间序列分析模型中最简单的模型,通过前面部分的数据与后面部分的数据之间的相关关系来建立回归方程: Moving Average,中文叫做滑动平均模型 MA模型,通过前面通过将一段时间序列中白噪声序列进行加权和,可以得到移动平均方程: Auto Regressive Moving Average,中文叫做自回归滑动平均模型 AR模型和MA模型的混合,相比AR模型和MA模型,它有更准确的估计 Auto Regressive Integrated Moving Average模型,中文叫差分自回归滑动平均模型,也叫求合自回归滑动平均模型 相比于ARMA,ARIMA多了一个差分的过程,作用是对不平稳数据进行差分平稳,在差分平稳后再进行建模 ARIMA的原理和ARMA模型一样。相比于ARMA(p,q)的两个阶数,ARIMA是一个三元组的阶数(p,d,q),称为ARIMA(p,d,q)模型,其中d是差分阶数 AR,MA是ARMA的特殊形式,而ARMA是ARIMA的特殊形式 ARIMA模型步骤: Step1,观察时间序列数据,是否为平稳序列 Step2,对于非平稳时间序列要先进行d阶差分运算,化为平稳时间序列 Step3,使用ARIMA(p, d, q)模型进行训练拟合,找到最优的(p, d, q),及训练好的模型 Step4,使用训练好的ARIMA模型进行预测,并对差分进行还原 ARIMA 用差分将不平稳数据先变得平稳,再用ARMA模型
深度学习神经网络模型:一般用LSTM进行时间序列预测,拥有更多的神经源,可以更准确的进行预测; LSTM,Long Short-Term Memory,长短记忆网络 可以避免常规RNN的梯度消失,在工业界有广泛应用 引入了三个门函数:输入门(Input Gate)、遗忘门(Forget Gate)和输出门(Output Gate)来控制输入值、记忆值和输出值 输入门决定了当前时刻网络的状态有多少信息需要保存到内部状态中,遗忘门决定了过去的状态信息有多少需要丢弃 => 输入门和遗忘门是LSTM能够记忆长期依赖的关键 输出门决定当前时刻的内部状态有多少信息需要输出给外部状态。 tsa:Training Services Agency 原理 时间序列分析中的3个部分:trend趋势,seasonal季节性,residual残留(可以使用tsa.seasonal_decompose返进行分析) 趋势(trend):时间序列在长时期内呈现出来的某种持续上升或持续下降的变动,也称长期趋势; 季节性(seasonality):时间序列在一年内重复出现的周期波动。销售旺季,销售淡季,旅游旺季、旅游淡季季节,可以是任何一种周期性变化,不一定是一年中的四季含有季节成分的序列可能含有趋势,也可能不含有趋势; 周期性(cyclicity):通常是由经济环境的变化引起不同于趋势变动,不是朝着单一方向的持续运动,而是涨落相间的交替波动;