时间序列分析自学笔记-06协整与误差修正模型
- 【Author】:Jack Zhang, SYSU
- 【Textbook】:Applied Econometric Time Series(4e), Walter Enders
- 【Original Slides】:https: //www.time-series.net/powerpoint_slides
Chapter 6:协整与误差修正模型
[!Tip] 本章学习目标
- 介绍协整的基本概念,展示它在各种经济模型中的应用。
- 介绍协整意味着将非静态变量的随机趋势联系起来。
- 考察协整变量的动态路径。由于协整变量的趋势是相联系的,所以,这些变量的动态路径一定与现在偏离均衡关系的离差具有联系。
- 阐述 Engle-Granger 协整检验。检验过程的计量经济学方法来源于齐次差分方程组的理论。
- Engle-Granger 方法需要用模拟数据说明。
- 用实际汇率说明 Engle-Granger 方法。
- 阐述 Johansen 完整信息极大似然协整检验。
- 介绍怎样限制协整向量。讨论含 I(1)和(2)变量模型的推论。
- 用模拟数据说明 Johansen 检验。
- 介绍怎样用非稳定变量估计 ADL 模型,研究 ADL 协整检验
- 用利率数据比较 Engle-Granger、Johansen、ADL 协整检验。
6.1 从单整到协整
6.1.1 单整
在 第 3 章 的最后,我们介绍了 【单整】 (Integration)的概念。我们不妨在此回顾一下:
如果序列在成为稳定序列之前必须经过 $d$ 次差分,则该序列被称为 $d$ 阶单整。记为 $I (d)$。换句话说,如果序列 $x_t$ 是非稳定序列,$\Delta^d x_t$ 是稳定序列,则是 $x_t$ 序列 $I (d)$。其中
$$
\Delta x_t = x_t - x_{t-1}, \quad \Delta^2 x_t = \Delta (\Delta x_t), \quad \Delta^d x_t = \Delta (\Delta^{d-1} x_t)
$$
- 单整的判别?
对于时间序列 $x_t$,建立下列方程:
$$
x_t = \rho x_{t-1} + \varepsilon_t \quad or \quad \Delta x_t = (\rho - 1) x_{t-1} + \varepsilon_t
$$
如果 $\rho-1$ 不显著为 0,则序列 $x_t$ 至少为 1 阶单整 $I (1)$。
那么,如何判断 $\rho-1$ 是否显著为 0?—— 第 3.4 节:样本平稳性检验(单位根检验)。
- 性质?
- I (0) 序列(平稳序列)对过去行为只有有限记忆,即发生在过去的扰动项对未来的影响随时间而衰减。因此,长期而言 0 阶单整有回到期望值的趋势(均值回复)。
- I (1) 序列对过去行为有无限长记忆,任何过去的冲击都将永久改变未来的整个序列。
- 对 $y_t$ 进行单位根检验后,如认为非平稳,要进一步判断其为 I (1) 或 I (2)。在经济变量中,I (0) 与 I (1) 最常见,I (2) 很少见。
6.1.2 协整
在多元时间序列情况下,我们不仅要考虑单个时间序列的平稳性,还要考虑变量组合的平稳性。那么,单整变量(非平稳)的线性组合一定非平稳吗?有可能是平稳的吗?
- 若多个 d 阶时间序列变量的线性组合的单整阶数 b 小于 d,则称这些变量具有 协整关系,记作 CI(d, d-b)。由线性组合系数组成的向量称作协整向量(cointegrating vector)。
- 注意:协整通常要求序列具有相同的单整阶数,并存在线性组合使其阶数降低。
现在,我们数学化地定义协整:
- 如果时间序列 $Y_{t1}, Y_{t2}, \ldots, Y_{tk}$ 都是 $d$ 阶单整的,存在向量 $\alpha = (\alpha_1, \alpha_2, \ldots, \alpha_k)$,使得
$$
Z_t = \alpha^T Y_t = \alpha_1 Y_{t1} + \alpha_2 Y_{t2} + \cdots + \alpha_k Y_{tk} \sim I(d-b), \quad d \geq b \geq 0
$$
则称序列 $Y_{t1}, Y_{t2}, \ldots, Y_{tk}$ 是 $(d,b)$ 阶协整,记为 $CI(d,b)$。
- 请注意:d 是原始序列单整阶数,b 是组合序列单整阶数。
- $CI (d, b)$ 的经济意义:虽然变量具有各自的长期波动规律,但是如果它们是 $(d, b)$ 阶协整的,则它们之间 存在着一个长期稳定的比例关系。 即使这些时间序列单独来看是非平稳的,也可以用经典的回归分析方法建立回归模型。
- 例如,居民收入时间序列 $Y_t$ 为 1 阶单整序列,居民消费时间序列 $C_t$ 也为 1 阶单整序列,如果二者的线性组合 $a_1 Y_t + a_2 C_t$ 构成的新序列为 0 阶单整序列,于是认为序列 $Y_t$ 与 $C_t$ 是(1,1)阶协整。
[!caution] 组成协整的单整阶数限制
注意:协整通常要求序列具有相同的单整阶数如果有两个序列分别为 $d$ 阶单整和 $e$ 阶单整,即 $$x_t \sim I (d), \quad y_t \sim I (e), \quad e > d$$ 则两个序列的线性组合是 $e$ 阶单整序列,即 $$z_t = \alpha x_t + \beta y_t \sim I (\max (d, e))$$
由于 $e > d$,这两个序列不存在协整关系,其线性组合需要经过 $\max (d, e)$ 次差分才能转化为平稳序列(而不能直接分析)。请思考:对于多个变量,协整阶数一定完全相等吗?——多重协整
- 若序列线性组合的单整阶数小于它们自身,但它们的阶数并不一定完全相等,则称它们具有多重协整(multi-cointegration)关系。
- 两个序列不可能出现 多重 协整!所以多重协整至少要三个序列。
- 举例: x 和 y 是 CI(2,1),记它们的一阶单整的线性组合为 xy;若 xy 又和 z 是 CI(1,1),则 x、y、z 三个变量的线性组合就可以是平稳的,即 线性组合阶数小于它们各自的阶数。
- 你可能已经意识到:多重协整并不容易实现。上面的例子是 两次协整 实现的效果。
6.2 协整的检验
进一步的疑问:有了数据怎么检验协整关系?有了协整关系又有什么用?
- 如果 k 个序列都是 d 阶单整的,可以建立回归方程,得到其残差序列,对残差序列进行平稳性检验,如果不存在单位根,则可以说明 k 个序列是协整关系。
- 在协整关系确定的基础上,再可以做格兰杰因果检验去判断“谁引起谁的变化”。
6.2.1 两变量 Engle-Granger 检验
我们首先解决第一个问题,我们的目标是:检验两变量 $y_t, x_t$ 是否协整。 一种常用的方法是:Engle 和 Granger(1987)提出的两步检验法。
这种方法的核心是: 对一阶残差进行平稳性检验,如果是平稳的时间序列则证明是协整的。
步骤一:协整回归计算非均衡误差
- 用 OLS 估计如下方程:$ y_t = \alpha x_t + \varepsilon_t $
- 得到估计的误差
$$
\hat{y_t} = \hat{\alpha} x_t \quad \to \quad e_t = y_t - \hat{y}_t = (\alpha- \hat{\alpha}) x_t+ \varepsilon_t
$$
步骤二: 检验 $e_t$ 的单整性(平稳性):
- 如果 $e_t$ 是平稳序列(即 0 阶单整),则 $y_t, x_t \sim CI (1,1)$,$x_t$ 与 $y_t$ 之间存在协整关系;
- 如果 $e_t$ 是非平稳的,则 $x_t$ 与 $y_t$ 之间不存在协整关系。
- 检验方法:DF 检验或 ADF 检验
- 拓展:这里的检验对象是协整回归计算出的误差项,并非真正的非均衡误差。由于 OLS 估计最小化残差平方和的原理,估计量 $\delta$ 是向下偏倚的,拒绝零假设的机会比实际大。因此对于 $e_t$ 的平稳性检验的 DF 与 ADF 临界值比正常的 DF 与 ADF 检验的临界值小。
- 也可进行协整回归 Durbin-Watson 检验,DW 检验常用于检验回归分析中残差一阶自相关性。DW 统计量:$DW=\dfrac{\sum_{i=2}^n\left(\boldsymbol{e}i-\boldsymbol{e}{i-1}\right)^2}{\sum_{i=1}^n\left(\boldsymbol{e}_i-\bar{e}\right)^2}$。DW 检验的原假设是 DW 统计量 = 0。若 H0 成立,则残差为随机游走,不存在协整,反之则存在协整。DW 检验只能检验一阶自相关,LM 检验 可以检验一阶或高阶自相关,但需要构建辅助回归模型。
6.2.2 误差修正模型
6.2.2.1 一般差分模型的问题
对于非平稳时间序列,可以通过差分的方法将其化为稳定序列。
$$
Y_t = \alpha_0 + \alpha_1 X_t + \mu_t \quad \to \quad \Delta Y_t = \alpha_1 \Delta X_t + v_t \quad (v_t = \mu_t - \mu_{t-1})
$$
但是这种做法会引起两个问题:
- 如果 $X$ 与 $Y$ 之间存在长期稳定的均衡关系,且误差项 $\mu_t$ 不存在序列相关性,则差分式中的 $v_t$ 是一阶移动平均时间序列,存在序列相关的问题。
- 如果采用差分形式进行估计,则关于变量水平值的重要信息将被忽略,这时的模型只表达了 $X$ 和 $Y$ 之间的短期关系,而没有揭示它们间的长期关系。
例如,当我们使用 $\Delta Y_t = \alpha_1 \Delta X_t + v_t$ 进行回归分析时,容易出现截距项显著不为 0 的情况,即我们得到的估计方程是
$$
\Delta Y_t = \hat{\alpha}_0 + \hat{\alpha}_1 \Delta X_t + \hat{v}_t,\quad \hat{\alpha}_0 \neq 0
$$
此时即使保持 $X$ 不变,$Y$ 也会出于长期的上升或下降的过程中,这意味着 $X$ 与 $Y$ 之间不存在静态均衡,与大多数具有长期均衡的经济理论假说不相符。
6.2.2.2 误差修正模型 ECM
如何克服一般差分的局限?——误差修正模型(Error Correction Model,ECM)
- 什么是误差修正模型呢?长期均衡的两个序列,短期的误差都会被修正。
- 注意:只有存在协整关系才可以做误差修正模型。
[!note] 需要修正的是什么误差?
- 假设 $X$ 与 $Y$ 之间的非均衡关系体现为如下(1,1)阶分布滞后模型的形式:
$$Y_t = \beta_0 + \beta_1 X_t + \beta_2 X_{t-1} + \delta Y_{t-1} + u_t,$$
该模型显示出 $t$ 期的 $Y$ 不仅与 $X$ 的变化有关,而且与 $t-1$ 期的 $X$ 与 $Y$ 的状态值有关。但由于变量可能具有非平稳性,因此不能直接进行 OLS 估计。- 差分变形得
$$\begin{split}\Delta Y_t =& \beta_0 + \beta_1 \Delta X_t + (\beta_1 + \beta_2) X_{t-1} - (1-\delta) Y_{t-1} + u_t \=& \beta_1 \Delta X_t - (1-\delta)\left(Y_{t-1} - \frac{\beta_0}{1-\delta} - \frac{\beta_1 + \beta_2}{1-\delta} X_{t-1}\right) + u_t \\triangleq& \beta_1 \Delta X_t - \lambda (Y_{t-1} - \alpha_0 - \alpha_1 X_{t-1}) + u_t\end{split}$$- 将上式中的误差项与一般差分模型差分方法的误差项对比:$$Y_t = \alpha_0 + \alpha_1 X_t + \mu_t \quad \to \quad \Delta Y_t = \beta_1 \Delta X_t + v_t$$
- 不难发现,二者的差别是多出了一项: $- \lambda (Y_{t-1} - \alpha_0 - \alpha_1 X_{t-1})$ 。
- 其中, $Y_{t-1} - \alpha_0 - \alpha_1 X_{t-1}=\mu_{t-1}$ ,正是 $t-1$ 期的非均衡误差项。
- 这表明 $Y$ 的短期变化 $\Delta Y_t$ 不仅受 $X$ 的短期变化 $\Delta X_t$ 影响,而且根据前一时期的非均衡程度进行相应的修正调整。
由此,我们得到了误差修正项 $ecm$:
$$
ecm_{t-1} = Y_{t-1} - (\alpha_0 + \alpha_1 X_{t-1})
$$
对于上述 (1, 1) 阶自回归分布滞后模型,在一般差分的基础上,我们纳入误差修正项,就得到 一阶误差修正模型 :
$$
\Delta Y_t = \beta_1 \Delta X_t - \lambda \cdot ecm_{t-1} + u_t
$$
-
由于 $\delta$ 反映了 $Y_t$ 与 $Y_{t-1}$ 的关系,一般情况下 $|\delta| < 1$,因此 $0 < \lambda=1-\delta < 1$。
-
据此分析 ECM 模型的修正作用:
- 若上期的实际值大于长期均衡值,即 $Y_{t-1} > \alpha_0 + \alpha_1 X_{t-1}$,则 $ecm$ 为正,当期的短期变动 $\Delta Y_t$ 减少;
- 若上期的实际值小于长期均衡值,即 $Y_{t-1} < \alpha_0 + \alpha_1 X_{t-1}$,则 $ecm$ 为负,当期的短期变动 $\Delta Y_t$ 增大。
-
是否变量间的关系都可以通过 ECM 来表述?——Granger 表述定理:如果变量 X 与 Y 是协整的,则它们间的短期非均衡关系总能由一个误差修正模型表述。
6.2.2.3 建立误差修正模型的步骤
- 总体思路
- 首先,对经济系统进行观察和分析,提出长期均衡关系假设。
- 然后,对变量进行协整分析,检验长期均衡关系假设,并构成误差修正项。
- 最后,建立短期模型,将误差修正项看作一个解释变量,连同其他反映短期波动的解释变量一起,建立短期模型,即误差修正模型。
- EG 两步法
- 第一步:利用 OLS 进行协整回归,检验变量间的协整关系,估计协整向量(长期均衡关系参数)
- 第二步:若协整性存在,则以 第一步求得的残差在滞后一期之后 作为非均衡误差项 ecm 加入到误差修正模型中,并用 OLS 估计相应参数
- 注意:第二步在确定 ECM 模型滞后项阶数 时,需要先对模型进行回归,之后检验 ECM 模型的残差是否具有自相关性,或者采用 Q 统计量检验残差是否为白噪声。如果接受了不具有自相关性的零假设,则说明 ECM 模型的滞后阶数选择正确,否则需重新调整参数。
[!tip] 通过 Stata 代码理解 EG 两步法
stata
Step 1:E-G两步法
(1)生成残差
reg y x //OLS回归
predict e, residual //生成残差
(2)对残差做单位根检验
tsset year //先将e设置成时间序列
dfuller e,nocons reg //进行单位根检验Step 2:如果1.2有协整关系,建立误差修正模型(ECM)
(1)生成残差的滞后项
gen ecm=l.e
(2)生成被解释变量的滞后项(注:dy、dx是Δy和Δx)
gen dy_lar=l.dy
(3)用OLS法估计误差修正模型的参数(加入了被解释变量和残差的滞后项)
reg dy dx dy_lar ecm
6.2.3 多变量协整关系的检验
Engle-Granger 检验通常用于检验两变量之间的协整关系,对于多变量之间的协整关系,通常使用 Johansen 协整检验来确定变量之间是否有协整关系,并由此估计模型。
- Johansen 协整检验分为两种,一个叫迹检验(trace test),有一个叫极大特征根检验(maximum eigenvalue test),这两个检验通常会给出一样的结论。
- 关于 Johansen 检验的原理,详见 链接
[!tip] 【了解】为什么多变量协整关系的检验比双变量复杂?
协整变量间可能存在多种稳定的线性组合。
例如:假设有 4 个 I(1)的变量 Z, X, Y, W,它们有如下的长期均衡关系:
$Z_t = \alpha_0 + \alpha_1W_t + \alpha_2X_t + \alpha_3Y_t + \mu_t,$
得到非均衡误差 $\mu_t$ 是 I(0)序列
$\mu_t = Z_t - \alpha_0 - \alpha_1W_t - \alpha_2X_t - \alpha_3Y_t \sim I(0).$
但存在另一种情况,假设 Z 与 W,X 与 Y 之间分别存在长期均衡关系
$Z_t = \beta_0 + \beta_1W_t + u_t,$
$X_t = \gamma_0 + \gamma_1Y_t + v_t,$
则非均衡误差项 $u_t$ 和 $v_t$ 一定平稳。它们的线性组合也一定是平稳序列,如:
$w_t = u_t + v_t = Z_t - \beta_0 - \gamma_0 - \beta_1W_t + X_t - \gamma_1Y_t \sim I(0).$
因此存在多组协整向量。
多变量的协整检验步骤:
- 与双变量基本相同,需要检验变量是否具有同阶单整性,以及是否存在稳定的线性组合。
- 在检验是否存在稳定的线性组合时,需要通过设置一个变量为被解释变量,其他变量为解释变量,进行 OLS 估计并检验残差序列是否为平稳序列。如果不平稳则需更换被解释变量,进行同样的 OLS 估计和相应的残差序列的平稳性检验。
- 当所有的变量都被作为被解释变量检验之后,仍不能得到平稳的残差项序列,则认为这些变量间不存在 ( 1 , 1 ) 阶协整。
6.2.4 小结
- 检验协整的一种方法是分析偏离长期均衡关系的残差。如果残差存在单位根,则变量间不是 (1,1) 阶协整的。(E-G 方法)
- 在 I(1) 变量中检验协整的另一种方法是估计 1 阶差分 VAR 模型,该模型包含变量的滞后值。Johansen 方法运用 $\lambda_{trace}$ 和 $\lambda_{max}$ 检验统计量来确定变量间是否是协整的和协整向量的数量。这些检验对包含在协整向量的确定性回归变量很敏感。协整向量和 (或) 速度调整系数的约束条件可以用 X 统计量进行检验。我们应该知道在协整框架下确定性回归变量所起的作用。为了确定是否存在确定性趋势、协整向量之外的漂移项或协整向量中出现的常数,Johansen (1994) 提出了如何进行检验的方法。
- 第三个检验协整的方法是估计误差修正模型。如果只有一个变量对偏离长期均衡的离差做出反应进行调整的话,则倾向于估计自回归分布滞后模型 ADL。用 OLS 估计模型,并进行协整向量系数的假设检验很直截了当。
- 对于更复杂的情况,附录 6.2 讨论了 Phillips-Hansen (1990) 单方程结构建模的方法。