arma模型平稳性和可逆性的条件_时间序列 | 第四章 模型识别
前边三章我们都是在研究给定参数已知时,AR模型、MA模型、ARMA模型的性质,这些包括它们的期望、方差、协方差、自相关函数,平稳性以及可逆性。但实际中我们拿到的只有时间序列数据,这些数据到底来自于什么样的模型,这个模型是不是平稳,是不是可逆,只有上帝知道。
怎样运用所学知识将拿到的数据尽量地拟合出一个能够恰当地描述这些数据的模型,就是我们接下来几章要考虑的问题了。
以下给出的判断方法我们只是承认并运用,没有了解这些定理方法是怎么证出来的。
构造模型的策略 (Model-building strategy)
- 模型识别
- 模型拟合
- 模型诊断
以上步骤是Box & Jenkins提出的。
具体到我们的时间序列课程,我们主要关注一系列平稳或者非平稳的参数模型——ARIMA(p,d,q)模型(其中d表示对 qq
在限定了研究范围之后,我们的任务是:
- 为模型定阶,也就是选择恰当的
- 估计参数,包括
- 审查我们的模型,看是否合适
自相关函数 (ACF)
上一章我们已经提到过,MA(q)模型的自相关函数具有q阶截尾(也就是q阶之后的自相关函数值为0)的性质,且这个性质是MA独有的。对于AR(p)以及ARMA(p,q)来说,它们的自相关函数会随着阶数的增加以指数方式递减至向0,但不具有截尾的性质。
于是,一个很自然的想法就出来了:我们可以看看实际数据自相关函数的值,如果它在q阶之后为0了,那么我们可以认为这些数据来自于一个MA(q)模型。可问题是,我们并不知道总体的自相关函数值呀——那就用样本自相关函数去估计它。
样本自相关函数:对一组观测值,样本自相关函数由下式给出:其中,
- 需要注意的是,我们并没有假设这组观测值是平稳的。
- 一般计算的话,我们只会算到
阶
定理:对于一个MA(q)模型来说,如果,那么,并且有当时,
那么,我们如何来识别q呢?
Bartlett's approximation: 对于来说,它的大致的95%置信区间为
- 上述的置信区间作为我们对于原假设
在置信水平为95%情形下的接受域。
- R 中,1.96用2来代替了
- 如果我们在观察了数据的样本自相关函数值之后,认为数据来自于一个AR模型,为了确定这个AR模型的阶q,我们将从
开始检验,根据Bartlett's approximation,如果我们拒绝了,那么接着检验是否为0,一直到我们无法拒绝某个为止,此时我们认为这个AR模型是阶的。
- 在R中,画出ACF图,判断q将会非常的直观
偏自相关函数 (PACF)
偏自相关函数:滞后k阶偏自相关函数,记为,是在移除了的影响之后,与之间的相关系数。即
显然,偏自相关函数的计算十分复杂。我们通常根据以下形式来计算:
可以看出偏自相关函数是根据自相关函数得出的。
但是,你还记得AR(p)的Yule-walker equation吗?它是用来计算AR(p)的前p个自相关函数值的。如果这个模型是一个AR(p),当
同样地,我们用样本的PACF来估计总体的PACF。
定理:对于AR(p)模型,
- 定阶方法: 在决定使用AR(p)模型来拟合之后,通过样本ACF计算样本PACF,逐个比较直到
落在区间内,则在95%显著性水平下我们认为数据来自于AR(k-1)
其它识别方法
对于ARMA(p,q)模型,它没有截尾的性质,我们一般用一些information criteria来帮助定阶
AIC(Akaike's information criterion): 寻找最小化的模型,其中为参数的个数。
- 对于ARMA(p,q),若有截距项,则k=p+q+1;若没有截距项,k=p+q
- 一般用R直接算不同p,q下模型的AIC,然后选择最小AIC的模型
- 应用中最常使用
BIC(Bayesian information criterion):寻找最小化的模型,同上。
- 一般用于理论
非平稳
ACF的定义要求模型是平稳的。对于一个非平稳的时间序列来说,样本ACF会随着滞后阶数的增加而decay,这是由于非平稳的时间序列会有漂移倾向决定的。所以我们看一个时间序列是否平稳,首先可以直接画出样本ACF图,如果样本ACF图decay,那我们直观上认为是不平稳的。不平稳的时间序列,我们可以进行差分,或者取对数。
如果一个时间序列本身就是平稳的,我们还对它进行差分,它仍然是一个平稳的时间序列,但这样就是过分差分了。过分差分后,我们又多了一个量来解释差分后的
样本ACF decay通常暗示着时间序列非平稳,暗示着我们要去做差分。如何来判断一个时间序列是不是满足本身不平稳但一阶差分之后平稳,也可以使用假设检验的方法。可我们怎么将问题用统计语言表达出来呢?
先考虑模型
等价于
在原假设正确的情况下,我们有
通常我们利用第二个式子来做检验。这里
我们课程的要求其实最重要的是会用,在利用ADF检验之后,如果发现p值很小,我们有充分理由拒绝原假设。
需要注意的是,如果我们没有拒绝原假设,则说明序列不平稳,如果我们拒绝了原假设,并不能说明序列一定是平稳的,还要结合ACF图以及其它方法来看。