本文已参与「新人创作礼」活动,一起开启掘金创作之路!
一、时间序列预处理
1、平稳时间序列的统计特征
1.1-均值
E(xt)=μt , ∀t∈T
1.2-方差
DXt=γ(t,t)=γ(0),∀t∈T
1.3-延迟k自协方差函数
γ(k)=γ(t,t+k)
估计值:
γ^(0)=n−1∑t=1n(xt−x)2
1.4-延迟k自相关函数
ρk=DXt⋅DXt+kγ(t,t+k)=σx2γ(k)=γ(0)γ(k)
当k≪n时:
ρ^k≈∑t=1n(xt−x)2∑t=1n−k(xt−x)(xt+k−x) , ∀0≤k≤n
2、平稳性检验
2.1-图检验
(1)时序图
在一个常数附近随机波动,而且波动的范围有界,无明显趋势及周期特征
(2)自相关图
2倍标准差公式
- 如果样本自相关系数和样本偏自相关系数在最初的阶明显大于2倍标准差,而后几乎95%的系数都落在2倍标准差的范围内,且非零系数衰减为小值波动的过程非常突然,通常视为k阶截尾;
- 如果有超过5%的样本相关系数大于2倍标准差,或者非零系数衰减为小值波动的过程比较缓慢或连续,通常视为拖尾。
(3)偏自相关图
2.2-统计检验
(1)单位根检验
(2)平稳域检验
3、纯随机性检验(白噪声检验)
LB统计量
LB=n(n+2)i=1∑k(n−iρ^i2)
其中
n为序列观察期数;k为指定延迟期数
- P值显著大于显著性水平α,不能拒绝纯随机的假设。
二、AR模型
0-模型
AR(q)
⎩⎨⎧xt=ϕ0+ϕ1xt−1+...+ϕpxt−p+εtϕp=0E(εt)=0,Var(εt)=σε2,E(εtεs)=0,s=tE(xsεt)=0,∀s<t
中心化AR(q)
xt=ϕ1xt−1+...+ϕpxt−p+εt
引入延迟算子B
xt=ϕ1xt−1+...+ϕpxt−p+εt=ϕ1Bxt+...+ϕpBpxt+εt=Φ(B)εt
得到q阶自回归系数多项式:
Φ(B)=1−ϕ1B−ϕ2B2−...−ϕpBp
1-均值
μ=1−ϕ1−...−ϕpϕ0
2-Green函数
{G0=1Gj=∑k=1jϕk′Gj−k
其中:
ϕk′={ϕk,0,k≤pk>p
Green推导公式过程
xt=Φ(B)εt=G(B)εt
Φ(B)G(B)εt=εt
(1−k=1∑p(ϕkBk))(j=0∑∞(GjBj))εt=εt
(j=0∑∞GjBj−k=1∑pj=0∑∞ϕkBkGjBj)εt=εt
(G0+j=1∑∞(Gj−k=1∑jϕk′Gj−k)Bj)εt=εt
3-方差
Var(xt)=j=0∑∞Gj2Var(εt−j)=j=0∑∞Gj2σε2
或者
Var(xt)=γ0
4-延迟k协方差函数
AR(1)
γk=ϕ1k1−ϕ12σε2
AR(2)
⎩⎨⎧γ0=(1+ϕ2)(1−ϕ1−ϕ2)(1+ϕ1−ϕ2)1−ϕ2σε2γ1=1−ϕ2ϕ1γ0γk=ϕ1γk−1+ϕ2γk−2
5-延迟k自相关系数
AR(1)
ρk=γ0γk=ϕ1k
AR(2)
⎩⎨⎧ρ0=γ0γ0=1ρ1=γ0γ1=1−ϕ2ϕ1ρk=γ0γk=ϕ1ρk−1+ϕ2ρk−2
6-延迟k偏自相关系数
AR(1)
{ϕ11=ρ0ρ1ϕkk=0,∀k>1
AR(2)
⎩⎨⎧ϕ11=ρ0ρ1=1−ϕ2ϕ1ϕ22=ϕ2ϕkk=0,∀k>2
7-AR模型平稳性判别(特征根+平稳域)
AR(1)
xt=ϕ1xt−1+εt
特征方程λ−ϕ1=0
特征根λ=ϕ1
平稳充要条件:特征根在单位圆内,即∣ϕ1∣<1
平稳域为{ϕ1∣−1<ϕ1<1}
AR(2)
xt=ϕ1xt−1+ϕ2xt−2+εt
特征方程λ2−ϕ1λ−ϕ2=0
特征根λ1=2ϕ1+ϕ12+4ϕ2,λ2=2ϕ1−ϕ12+4ϕ2
平稳充要条件:特征根在单位圆内,即∣λ1∣<1且∣λ2∣<1
平稳域为{ϕ1,ϕ2∣∣ϕ2∣<1且ϕ2±ϕ1<1}
三、MA模型
0-模型
MA(q)
⎩⎨⎧xt=μ+εt−θ1εt−1−...−θqεt−qθq=0E(εt)=0,Var(εt)=σε2,E(εtεs)=0,s=t
中心化MA(q)
当μ=0时
xt=εt−θ1εt−1−...−θqεt−q
引入延迟算子B
xt=εt−θ1εt−1−...−θqεt−q=εt−θ1Bεt−...−θqBqεt=Θ(B)εt
得到q阶移动平均系数多项式:
Θ(B)=1−θ1B−θ2B2−...−θqBq
1-均值
E(xt)=μ
2-方差
Var(xt)=(1+θ12+...+θq2)σε2
3-延迟k自协方差函数
- MA(q)自协方差函数只与滞后阶数k有关,且q阶截尾
MA(q)
γk=⎩⎨⎧(1+θ12+...+θq2)σε2,k=0(−θk+∑i=1q−kθiθk+i)σε2,1≤k≤q0,k>q
4-延迟k自相关系数
MA(1)
ρk=γ0γk=⎩⎨⎧1,k=01+θ12−θ1,k=10,k≥2
MA(2)
ρk=γ0γk=⎩⎨⎧1,k=01+θ12+θ22−θk+θ1θ2,k=11+θ12+θ22−θ2,k=20,k≥3
MA(q)
ρk=γ0γk=⎩⎨⎧1,k=01+θ12+...+θq2−θk+∑i=1q−kθiθk+i,1≤k≤q0,k>q
5-延迟k偏自相关系数
- MA(q)模型的延迟k偏自相关系数ϕkk拖尾
6-验证模型可逆性
已知中心化MA(q)模型为xt=εt−θ1εt−1−...−θqεt−q
∴
xt=εt−θ1εt−1−...−θqεt−q=εt−θ1Bεt−...−θqBqεt=Θ(B)εt
∴得到移动平均系数多项式Θ(B)=1−θ1B−θ2B2−...−θqBq
设Θ(B)=0的根为λ,
∴1−θ1λ−θ2λ2−...−θqλq=0
求解得到λ1,λ2,...
当满足∣λ1∣>1且∣λ2∣>1且...时,MA(q)模型可逆。
7-逆函数递推公式
逆函数Ij
如果MA(q)xt=εt−θ1εt−1−...−θqεt−q可逆,有
{Θ(B)εt=xt,[1]εt=I(B)xt,[2]
其中
Θ(B)=1−θ1B−θ2B2−...−θqBq=1−i=1∑qθiBi
I(B)=I1+I1B+I2B2+...=i=0∑∞IiBi
将[2]代入[1]得到Θ(B)I(B)xt=xt,按照待定系数法求得
I0=1Il=i=1∑lθi′Il−i
其中
l≥1θi′={θi, i≤q0, i>q
四、ARMA模型
0-模型
ARMA(p,q)
⎩⎨⎧xt=ϕ0+ϕ1xt−1+...+ϕpxt−p+εt−θ1εt−1−...−θqεt−qϕp=0 , θq=0E(εt)=0 , Var(εt)=σε2 , E(εtεs)=0 , s=tE(xsεt)=0 , ∀s<t
中心化ARMA(p,q)
xt=ϕ1xt−1+...+ϕpxt−p+εt−θ1εt−1−...−θqεt−q
引入延迟算子B
Φ(B)xt=Θ(B)εt
1-均值
E(xt)=1−ϕ1−...−ϕpϕ0
2-方差
Var(xt)=σε2i=0∑∞Gi2
3-延迟k自协方差函数
γk=σε2i=0∑∞GiGi+k
4-延迟k自相关系数
ρk=γ0γk=∑i=0∞Gi2∑i=0∞GiGi+k
5-延迟k偏自相关系数
拖尾
6-比较
| 模型 |
ACF |
PACF |
| AR(p)←→ARMA(p,0) |
拖尾 |
p阶截尾 |
| MA(q)←→ARMA(0,q) |
q阶截尾 |
拖尾 |
| ARMA(p,q) |
拖尾 |
拖尾 |
7-平稳性与可逆性
ARMA(p,q):
Φ(B)xt=Θ(B)εt
平稳条件:Φ(B)=0的根都在单位圆外
可逆条件:Θ(B)=0的根都在单位圆外
8-传递形式与逆转形式
传递形式
对于一个平稳可逆ARMA(p,q)模型,它的传递形式为:
xt=Φ(B)Θ(B)εt=j=0∑∞Gjεt−j
其中Gj为Green函数,通过待定系数法可得它的递推公式:
{G0=1Gk=∑j=1kϕj′Gk−j−θk′,k≥1
其中
ϕj′={ϕj,1≤j≤p0,j>p θk′={θk,1≤k≤q0,k>q
逆转形式
对于一个平稳可逆ARMA(p,q)模型,它的逆转形式为:
εt=Θ(B)Φ(B)xt=j=0∑∞Ijxt−j
其中Ij为逆函数,通过待定系数法可得它的递推公式:
{I0=1Ij=∑j=1kθj′Ik−j−ϕk′,k≥1
其中
ϕj′={ϕj,1≤j≤p0,j>p θk′={θk,1≤k≤q0,k>q