时间序列分析自学笔记-06协整与误差修正模型

【Author】：Jack Zhang, SYSU
【Textbook】：Applied Econometric Time Series(4e), Walter Enders
【Original Slides】：https: //www.time-series.net/powerpoint_slides

Chapter 6：协整与误差修正模型

[!Tip] 本章学习目标

介绍协整的基本概念，展示它在各种经济模型中的应用。

介绍协整意味着将非静态变量的随机趋势联系起来。

考察协整变量的动态路径。由于协整变量的趋势是相联系的，所以，这些变量的动态路径一定与现在偏离均衡关系的离差具有联系。

阐述 Engle-Granger 协整检验。检验过程的计量经济学方法来源于齐次差分方程组的理论。

Engle-Granger 方法需要用模拟数据说明。

用实际汇率说明 Engle-Granger 方法。

阐述 Johansen 完整信息极大似然协整检验。

介绍怎样限制协整向量。讨论含 I(1)和(2)变量模型的推论。

用模拟数据说明 Johansen 检验。

介绍怎样用非稳定变量估计 ADL 模型，研究 ADL 协整检验

用利率数据比较 Engle-Granger、Johansen、ADL 协整检验。

6.1 从单整到协整

6.1.1 单整

在第 3 章的最后，我们介绍了 【单整】 （Integration）的概念。我们不妨在此回顾一下：

如果序列在成为稳定序列之前必须经过 $d$ 次差分，则该序列被称为 $d$ 阶单整。记为 $I (d)$。换句话说，如果序列 $x_t$ 是非稳定序列，$\Delta^d x_t$ 是稳定序列，则是 $x_t$ 序列 $I (d)$。其中

$$
\Delta x_t = x_t - x_{t-1}, \quad \Delta^2 x_t = \Delta (\Delta x_t), \quad \Delta^d x_t = \Delta (\Delta^{d-1} x_t)
$$

单整的判别？
对于时间序列 $x_t$，建立下列方程：

$$
x_t = \rho x_{t-1} + \varepsilon_t \quad or \quad \Delta x_t = (\rho - 1) x_{t-1} + \varepsilon_t
$$

如果 $\rho-1$ 不显著为 0，则序列 $x_t$ 至少为 1 阶单整 $I (1)$。

那么，如何判断 $\rho-1$ 是否显著为 0？—— 第 3.4 节：样本平稳性检验（单位根检验）。

性质？
- I (0) 序列（平稳序列）对过去行为只有有限记忆，即发生在过去的扰动项对未来的影响随时间而衰减。因此，长期而言 0 阶单整有回到期望值的趋势（均值回复）。
- I (1) 序列对过去行为有无限长记忆，任何过去的冲击都将永久改变未来的整个序列。
- 对 $y_t$ 进行单位根检验后，如认为非平稳，要进一步判断其为 I (1) 或 I (2)。在经济变量中，I (0) 与 I (1) 最常见，I (2) 很少见。

6.1.2 协整

在多元时间序列情况下，我们不仅要考虑单个时间序列的平稳性，还要考虑变量组合的平稳性。那么，单整变量（非平稳）的线性组合一定非平稳吗？有可能是平稳的吗？

若多个 d 阶时间序列变量的线性组合的单整阶数 b 小于 d，则称这些变量具有 协整关系，记作 CI(d, d-b)。由线性组合系数组成的向量称作协整向量（cointegrating vector）。
注意：协整通常要求序列具有相同的单整阶数，并存在线性组合使其阶数降低。

现在，我们数学化地定义协整：

如果时间序列 $Y_{t1}, Y_{t2}, \ldots, Y_{tk}$ 都是 $d$ 阶单整的，存在向量 $\alpha = (\alpha_1, \alpha_2, \ldots, \alpha_k)$，使得

$$
Z_t = \alpha^T Y_t = \alpha_1 Y_{t1} + \alpha_2 Y_{t2} + \cdots + \alpha_k Y_{tk} \sim I(d-b), \quad d \geq b \geq 0
$$

则称序列 $Y_{t1}, Y_{t2}, \ldots, Y_{tk}$ 是 $(d,b)$ 阶协整，记为 $CI(d,b)$。

请注意：d 是原始序列单整阶数，b 是组合序列单整阶数。
$CI (d, b)$ 的经济意义：虽然变量具有各自的长期波动规律，但是如果它们是 $(d, b)$ 阶协整的，则它们之间 存在着一个长期稳定的比例关系。即使这些时间序列单独来看是非平稳的，也可以用经典的回归分析方法建立回归模型。
例如，居民收入时间序列 $Y_t$ 为 1 阶单整序列，居民消费时间序列 $C_t$ 也为 1 阶单整序列，如果二者的线性组合 $a_1 Y_t + a_2 C_t$ 构成的新序列为 0 阶单整序列，于是认为序列 $Y_t$ 与 $C_t$ 是（1，1）阶协整。

[!caution] 组成协整的单整阶数限制
注意：协整通常要求序列具有相同的单整阶数

如果有两个序列分别为 $d$ 阶单整和 $e$ 阶单整，即 $$x_t \sim I (d), \quad y_t \sim I (e), \quad e > d$$ 则两个序列的线性组合是 $e$ 阶单整序列，即 $$z_t = \alpha x_t + \beta y_t \sim I (\max (d, e))$$
由于 $e > d$，这两个序列不存在协整关系，其线性组合需要经过 $\max (d, e)$ 次差分才能转化为平稳序列（而不能直接分析）。

请思考：对于多个变量，协整阶数一定完全相等吗？——多重协整

若序列线性组合的单整阶数小于它们自身，但它们的阶数并不一定完全相等，则称它们具有多重协整（multi-cointegration）关系。

两个序列不可能出现多重协整！所以多重协整至少要三个序列。

举例： x 和 y 是 CI(2,1)，记它们的一阶单整的线性组合为 xy；若 xy 又和 z 是 CI(1,1)，则 x、y、z 三个变量的线性组合就可以是平稳的，即 线性组合阶数小于它们各自的阶数。

你可能已经意识到：多重协整并不容易实现。上面的例子是 两次协整 实现的效果。

6.2 协整的检验

进一步的疑问：有了数据怎么检验协整关系？有了协整关系又有什么用？

如果 k 个序列都是 d 阶单整的，可以建立回归方程，得到其残差序列，对残差序列进行平稳性检验，如果不存在单位根，则可以说明 k 个序列是协整关系。
在协整关系确定的基础上，再可以做格兰杰因果检验去判断“谁引起谁的变化”。

6.2.1 两变量 Engle-Granger 检验

我们首先解决第一个问题，我们的目标是：检验两变量 $y_t, x_t$ 是否协整。 一种常用的方法是：Engle 和 Granger（1987）提出的两步检验法。

这种方法的核心是： 对一阶残差进行平稳性检验，如果是平稳的时间序列则证明是协整的。

步骤一：协整回归计算非均衡误差

用 OLS 估计如下方程：$ y_t = \alpha x_t + \varepsilon_t $
得到估计的误差

$$
\hat{y_t} = \hat{\alpha} x_t \quad \to \quad e_t = y_t - \hat{y}_t = (\alpha- \hat{\alpha}) x_t+ \varepsilon_t
$$

步骤二：检验 $e_t$ 的单整性（平稳性）：

如果 $e_t$ 是平稳序列（即 0 阶单整），则 $y_t, x_t \sim CI (1,1)$，$x_t$ 与 $y_t$ 之间存在协整关系；
如果 $e_t$ 是非平稳的，则 $x_t$ 与 $y_t$ 之间不存在协整关系。
检验方法：DF 检验或 ADF 检验
拓展：这里的检验对象是协整回归计算出的误差项，并非真正的非均衡误差。由于 OLS 估计最小化残差平方和的原理，估计量 $\delta$ 是向下偏倚的，拒绝零假设的机会比实际大。因此对于 $e_t$ 的平稳性检验的 DF 与 ADF 临界值比正常的 DF 与 ADF 检验的临界值小。
也可进行协整回归 Durbin-Watson 检验，DW 检验常用于检验回归分析中残差一阶自相关性。DW 统计量：$DW=\dfrac{\sum_{i=2}^n\left(\boldsymbol{e}i-\boldsymbol{e}{i-1}\right)^2}{\sum_{i=1}^n\left(\boldsymbol{e}_i-\bar{e}\right)^2}$。DW 检验的原假设是 DW 统计量 = 0。若 H0 成立，则残差为随机游走，不存在协整，反之则存在协整。DW 检验只能检验一阶自相关，LM 检验可以检验一阶或高阶自相关，但需要构建辅助回归模型。

6.2.2 误差修正模型

6.2.2.1 一般差分模型的问题

对于非平稳时间序列，可以通过差分的方法将其化为稳定序列。
$$
Y_t = \alpha_0 + \alpha_1 X_t + \mu_t \quad \to \quad \Delta Y_t = \alpha_1 \Delta X_t + v_t \quad (v_t = \mu_t - \mu_{t-1})
$$
但是这种做法会引起两个问题：

如果 $X$ 与 $Y$ 之间存在长期稳定的均衡关系，且误差项 $\mu_t$ 不存在序列相关性，则差分式中的 $v_t$ 是一阶移动平均时间序列，存在序列相关的问题。
如果采用差分形式进行估计，则关于变量水平值的重要信息将被忽略，这时的模型只表达了 $X$ 和 $Y$ 之间的短期关系，而没有揭示它们间的长期关系。

例如，当我们使用 $\Delta Y_t = \alpha_1 \Delta X_t + v_t$ 进行回归分析时，容易出现截距项显著不为 0 的情况，即我们得到的估计方程是

$$
\Delta Y_t = \hat{\alpha}_0 + \hat{\alpha}_1 \Delta X_t + \hat{v}_t,\quad \hat{\alpha}_0 \neq 0
$$

此时即使保持 $X$ 不变，$Y$ 也会出于长期的上升或下降的过程中，这意味着 $X$ 与 $Y$ 之间不存在静态均衡，与大多数具有长期均衡的经济理论假说不相符。

6.2.2.2 误差修正模型 ECM

如何克服一般差分的局限？——误差修正模型（Error Correction Model，ECM）

什么是误差修正模型呢？长期均衡的两个序列，短期的误差都会被修正。
注意：只有存在协整关系才可以做误差修正模型。

[!note] 需要修正的是什么误差？

假设 $X$ 与 $Y$ 之间的非均衡关系体现为如下（1,1）阶分布滞后模型的形式：
$$Y_t = \beta_0 + \beta_1 X_t + \beta_2 X_{t-1} + \delta Y_{t-1} + u_t,$$
该模型显示出 $t$ 期的 $Y$ 不仅与 $X$ 的变化有关，而且与 $t-1$ 期的 $X$ 与 $Y$ 的状态值有关。但由于变量可能具有非平稳性，因此不能直接进行 OLS 估计。

差分变形得
$$\begin{split}\Delta Y_t =& \beta_0 + \beta_1 \Delta X_t + (\beta_1 + \beta_2) X_{t-1} - (1-\delta) Y_{t-1} + u_t \=& \beta_1 \Delta X_t - (1-\delta)\left(Y_{t-1} - \frac{\beta_0}{1-\delta} - \frac{\beta_1 + \beta_2}{1-\delta} X_{t-1}\right) + u_t \\triangleq& \beta_1 \Delta X_t - \lambda (Y_{t-1} - \alpha_0 - \alpha_1 X_{t-1}) + u_t\end{split}$$

将上式中的误差项与一般差分模型差分方法的误差项对比：$$Y_t = \alpha_0 + \alpha_1 X_t + \mu_t \quad \to \quad \Delta Y_t = \beta_1 \Delta X_t + v_t$$

不难发现，二者的差别是多出了一项： $- \lambda (Y_{t-1} - \alpha_0 - \alpha_1 X_{t-1})$ 。

其中， $Y_{t-1} - \alpha_0 - \alpha_1 X_{t-1}=\mu_{t-1}$ ，正是 $t-1$ 期的非均衡误差项。

这表明 $Y$ 的短期变化 $\Delta Y_t$ 不仅受 $X$ 的短期变化 $\Delta X_t$ 影响，而且根据前一时期的非均衡程度进行相应的修正调整。

由此，我们得到了误差修正项 $ecm$：

$$
ecm_{t-1} = Y_{t-1} - (\alpha_0 + \alpha_1 X_{t-1})
$$

对于上述 (1, 1) 阶自回归分布滞后模型，在一般差分的基础上，我们纳入误差修正项，就得到一阶误差修正模型：

$$
\Delta Y_t = \beta_1 \Delta X_t - \lambda \cdot ecm_{t-1} + u_t
$$

由于 $\delta$ 反映了 $Y_t$ 与 $Y_{t-1}$ 的关系，一般情况下 $|\delta| < 1$，因此 $0 < \lambda=1-\delta < 1$。
据此分析 ECM 模型的修正作用：
- 若上期的实际值大于长期均衡值，即 $Y_{t-1} > \alpha_0 + \alpha_1 X_{t-1}$，则 $ecm$ 为正，当期的短期变动 $\Delta Y_t$ 减少；
- 若上期的实际值小于长期均衡值，即 $Y_{t-1} < \alpha_0 + \alpha_1 X_{t-1}$，则 $ecm$ 为负，当期的短期变动 $\Delta Y_t$ 增大。
是否变量间的关系都可以通过 ECM 来表述？——Granger 表述定理：如果变量 X 与 Y 是协整的，则它们间的短期非均衡关系总能由一个误差修正模型表述。

6.2.2.3 建立误差修正模型的步骤

总体思路
- 首先，对经济系统进行观察和分析，提出长期均衡关系假设。
- 然后，对变量进行协整分析，检验长期均衡关系假设，并构成误差修正项。
- 最后，建立短期模型，将误差修正项看作一个解释变量，连同其他反映短期波动的解释变量一起，建立短期模型，即误差修正模型。
EG 两步法
- 第一步：利用 OLS 进行协整回归，检验变量间的协整关系，估计协整向量（长期均衡关系参数）
- 第二步：若协整性存在，则以第一步求得的残差在滞后一期之后作为非均衡误差项 ecm 加入到误差修正模型中，并用 OLS 估计相应参数
- 注意：第二步在确定 ECM 模型滞后项阶数 时，需要先对模型进行回归，之后检验 ECM 模型的残差是否具有自相关性，或者采用 Q 统计量检验残差是否为白噪声。如果接受了不具有自相关性的零假设，则说明 ECM 模型的滞后阶数选择正确，否则需重新调整参数。

[!tip] 通过 Stata 代码理解 EG 两步法
stata
Step 1：E-G两步法
（1）生成残差
reg y x //OLS回归
predict e, residual //生成残差
（2）对残差做单位根检验
tsset year //先将e设置成时间序列
dfuller e，nocons reg //进行单位根检验

Step 2：如果1.2有协整关系，建立误差修正模型(ECM)
（1）生成残差的滞后项
gen ecm=l.e
（2）生成被解释变量的滞后项（注：dy、dx是Δy和Δx）
gen dy_lar=l.dy
（3）用OLS法估计误差修正模型的参数（加入了被解释变量和残差的滞后项）
reg dy dx dy_lar ecm

6.2.3 多变量协整关系的检验

Engle-Granger 检验通常用于检验两变量之间的协整关系，对于多变量之间的协整关系，通常使用 Johansen 协整检验来确定变量之间是否有协整关系，并由此估计模型。

Johansen 协整检验分为两种，一个叫迹检验（trace test），有一个叫极大特征根检验（maximum eigenvalue test），这两个检验通常会给出一样的结论。
关于 Johansen 检验的原理，详见链接

[!tip] 【了解】为什么多变量协整关系的检验比双变量复杂？
协整变量间可能存在多种稳定的线性组合。
例如：假设有 4 个 I(1)的变量 Z, X, Y, W，它们有如下的长期均衡关系：
$Z_t = \alpha_0 + \alpha_1W_t + \alpha_2X_t + \alpha_3Y_t + \mu_t,$
得到非均衡误差 $\mu_t$ 是 I(0)序列
$\mu_t = Z_t - \alpha_0 - \alpha_1W_t - \alpha_2X_t - \alpha_3Y_t \sim I(0).$
但存在另一种情况，假设 Z 与 W，X 与 Y 之间分别存在长期均衡关系
$Z_t = \beta_0 + \beta_1W_t + u_t,$
$X_t = \gamma_0 + \gamma_1Y_t + v_t,$
则非均衡误差项 $u_t$ 和 $v_t$ 一定平稳。它们的线性组合也一定是平稳序列，如：
$w_t = u_t + v_t = Z_t - \beta_0 - \gamma_0 - \beta_1W_t + X_t - \gamma_1Y_t \sim I(0).$
因此存在多组协整向量。

多变量的协整检验步骤：

与双变量基本相同，需要检验变量是否具有同阶单整性，以及是否存在稳定的线性组合。
在检验是否存在稳定的线性组合时，需要通过设置一个变量为被解释变量，其他变量为解释变量，进行 OLS 估计并检验残差序列是否为平稳序列。如果不平稳则需更换被解释变量，进行同样的 OLS 估计和相应的残差序列的平稳性检验。
当所有的变量都被作为被解释变量检验之后，仍不能得到平稳的残差项序列，则认为这些变量间不存在 ( 1 , 1 ) 阶协整。

6.2.4 小结

检验协整的一种方法是分析偏离长期均衡关系的残差。如果残差存在单位根，则变量间不是 (1,1) 阶协整的。（E-G 方法）
在 I(1) 变量中检验协整的另一种方法是估计 1 阶差分 VAR 模型，该模型包含变量的滞后值。Johansen 方法运用 $\lambda_{trace}$ 和 $\lambda_{max}$ 检验统计量来确定变量间是否是协整的和协整向量的数量。这些检验对包含在协整向量的确定性回归变量很敏感。协整向量和 (或) 速度调整系数的约束条件可以用 X 统计量进行检验。我们应该知道在协整框架下确定性回归变量所起的作用。为了确定是否存在确定性趋势、协整向量之外的漂移项或协整向量中出现的常数，Johansen (1994) 提出了如何进行检验的方法。
第三个检验协整的方法是估计误差修正模型。如果只有一个变量对偏离长期均衡的离差做出反应进行调整的话，则倾向于估计自回归分布滞后模型 ADL。用 OLS 估计模型，并进行协整向量系数的假设检验很直截了当。
对于更复杂的情况，附录 6.2 讨论了 Phillips-Hansen (1990) 单方程结构建模的方法。

#Notes

时间序列分析自学笔记-06协整与误差修正模型

https://zhangwj235.github.io/posts/caa796bb/

Author

Jack Zhang

Posted on

May 29, 2026

Licensed under

时间序列分析自学笔记-03包含趋势的模型 Previous

证明OLS最小方差性 Next