时间序列分析自学笔记-03包含趋势的模型

【Author】：Jack Zhang, SYSU
【Textbook】：Applied Econometric Time Series(4e), Walter Enders
【Original Slides】：https: //www.time-series.net/powerpoint_slides

Chapter 3: 包含趋势的模型

[!important] 本章学习目标

形式化均值依赖于时间的变量的简单模型。

比较确定性趋势和随机趋势。

阐述标准回归和时间序列模型中的单位根问题，

阐述蒙特卡洛试验和模拟法如何得出假设检验的临界值。

提出并阐述用于检验是否存在单位根的 DF 检验和 ADF 检验。

将 DF 检验应用到美国 GDP 和汇率的实例中。

阐述 DF 检验在序列相关性、MA 模型、多元单位根、季节性单位根中的应用。

考察存在结构性变化的单位根检验。

阐述标准 DF 检验的缺陷。

阐述广义最小二乘法对 DF 检验的提升。

阐述如何用面板单位根检验来促进 DF 检验

把包含趋势的序列分解为平稳和趋势两个部分。

3.1 趋势建模

在第 2 章，我们只讨论了平稳的时间序列。在本章，我们介绍 非平稳时间序列的处理方法。实际上，在自然界中绝大部分序列都是非平稳的，因而对非平稳序列的分析更普遍、更重要。

对于一个一般化的时间序列，最常用的确定性分析方法是确定性因素分解方法。

该方法把所有序列的变化都归结为 4 个因素的综合影响：
- 长期趋势 T。该因素的影响会导致序列呈现出明显的长期趋势 (递增、递减等)。
- 循环波动 C。该因素会导致序列呈现出从低到高再由高至低的反复循环波动。
- 季节性变化 S。该因素会导致序列呈现出和季节变化相关的稳定的周期波动。
- 随机波动 I。除了长期趋势、循环波动和季节性变化之外，序列还会受到各种其他因素的综合影响，而这些影响导致序列呈现出一定的随机波动。

人们在实际分析中进行了改进和简化，可以把序列分解为三大因素的综合影响：

长期趋势波动，它包括长期趋势和无固定周期的循环波动。
季节性变化，它包括所有具有稳定周期的循环波动。
随机波动，除了长期趋势波动和季节性变化之外，其他因素的综合影响归为随机波动。

通过乘法分解，我们可以将任何一个序列表示为各个因素的乘积；通过加法分解，我们可以将任何一个序列表示为各个因素的加总。

能否再进一步简化呢？当然是可以的。我们可以暂不具体划分确定性趋势，这样就得到：任何一个序列的波动都可以视为同时受到了确定性影响和随机性影响的综合作用。

要证明这一结论，就要涉及 Cramer 分解定理。对于 Cramer 分解定理的详细证明，可以参考中国人民大学统计学院王燕老师编著的《应用时间序列分析》，就不在此赘述了。
Cramer 分解定理扩展自我们在第 2.2.1 节介绍的 Wold 分解定理，它将 Wold 分解定理的分解思路扩展到了非平稳序列。
从 Cramer 分解定理的结论引申，我们可以得到：平稳序列要求确定性影响和随机性影响都是稳定的，序列非平稳的原因就是这两方面的影响至少有一方面不稳定。

在下面的分析中，我们先使用最简化的组成方式进行讨论。在进一步讨论之前，我们应当先认识下确定性趋势和随机趋势的表现形式：

确定性趋势：从某个时期开始到下一个时期，一个序列总是变化固定相同的量：

$$
\Delta y_t= a_0 \quad \Rightarrow \quad y_t=y_0+a_0t
$$

其中 $y_0$ 是第 0 期的初始值。
2. 随机趋势：从某个时期开始到下一个时期，序列的变化量是白噪声：

$$
\Delta y_t= \varepsilon_t \quad \Rightarrow \quad y_t=y_0+\sum_{i=1}^t\varepsilon_i
$$

这被称为 随机游走模型 （random walk），它在经济学和金融学中有着特殊的地位。一个非常典型的例子就是有效市场假设对股价随机游走的假定。

3.2 随机趋势

本节我们对随机游走进行进一步分析。对于随机游走的时间序列，$y_t$ 表示为白噪声项的累积和

$$
\Delta y_t= \varepsilon_t \quad \Rightarrow \quad y_t=y_0+\sum_{i=1}^t\varepsilon_i
$$

随机游走的均值
由于每个 $\varepsilon$ 的均值都为 0，$E(y_t)=y_0$
随机游走的方差
由于白噪声项 $\varepsilon_i$ 不相关且方差相同（设为 $\sigma^2$），根据方差叠加性质：

$$
\text{var}(y_t) = \text{var}(\varepsilon_1) + \text{var}(\varepsilon_2) + \cdots + \text{var}(\varepsilon_t) = t \cdot \sigma^2
$$

方差 $\text{var}(y_t)$ 随时间线性增长，表明随机游走序列是 非平稳时间序列。

随机游走的自相关系数（滞后 k 期）

$$
\rho_k(t) = \frac{\text{Cov}(y_t, y_{t-k})}{\sqrt{\text{Var}(y_t) \cdot \text{Var}(y_{t-k})}}
$$

由于方差 $\text{Var}(y_t) = t\sigma^2$，协方差 $\text{Cov}(y_t, y_{t-k}) = (t - k)\sigma^2$，代入得：

$$
\rho_k(t) = \frac{(t - k)\sigma^2}{\sqrt{t\sigma^2 \cdot (t - k)\sigma^2}} = \sqrt{1 - \frac{k}{t}}
$$

现在，我们将确定性趋势和随机趋势结合，得到 带漂移的随机游走模型

$$
\Delta y_t= a_0+\varepsilon_t \quad \Rightarrow \quad y_t=y_0+a_0t+\sum_{i=1}^t\varepsilon_i
$$

这里 $y_t$ 的表现受线性确定性趋势和随机趋势这两个非平稳成分的影响。
带漂移的随机游走模型是一个纯趋势模型。

更一般化地，我们可以再加入一个噪声项，得到：带噪声的趋势模型

$$
y_t=y_0+a_0t+\sum_{i=1}^t\varepsilon_i+\eta_t
$$

它是确定性趋势、随机趋势和白噪声之和。
噪声序列并不要求一定是白噪声过程。

3.3 确定性趋势

包含趋势的序列和平稳序列之间是有很大区别的。对平稳时间序列的冲击必然是短暂的，随时间推移，冲击的影响将消失，序列将回复到其长期均值水平。而对于包含趋势的序列，冲击后并不会回复到长期水平。因此，对于包含趋势的时间序列，我们需要去除趋势来转化为平稳的时间序列，进而使用第 2 章的方法进行分析。

去除趋势影响的常规方法是差分 (diferencing) 和 去除趋势 (detrending)。

去除趋势（detrending）操作必须作时间 $t$ 对变量 $y_t$ 的回归，并保留残差值。
一个包含单位根的序列可以通过差分（diferencing）变得平稳。

3.3.1 差分

首先，考查带漂移的随机游走模型

$$
y_t=y_0+a_0t+\sum_{i=1}^t\varepsilon_i
$$

取 1 阶差分，得到

$$
\Delta y_t= a_0+\varepsilon_t
$$

可以看出，$\Delta y_t$ 是平稳的时间序列，满足弱平稳的三大要求：

均值 $a_0$ 恒定：$E(\Delta y_t) = E(a_0 + \varepsilon_t) = a_0$
方差 $\sigma^2$ 恒定，$\text{Var}(\Delta y_t) = \text{Var}(\varepsilon_t) = \sigma^2$
协方差仅由时间间隔决定。如果成立，对于滞后 $s \neq 0$ 协方差，仅与滞后阶数 s 有关，与具体时间 t 无关：

$$
\text{cov}(\Delta y_t, \Delta y_{t-s}) = E[(\Delta y_t - a_0)(\Delta y_{t-s} - a_0)] = E(\varepsilon_t \varepsilon_{t-s}) = 0
$$

协方差为 0，与 $t$ 无关，表明序列无自相关（白噪声特性）。

我们可以将结论推广到带噪声的随机游走模型，如感兴趣可在教材 4.2.1 节查看具体证明。

3.3.2 去除趋势

所有非平稳模型都能够通过差分转化为平稳的吗？答案是否定的。考虑下面这个模型：

$$
y_t = y_0 + a_1 t + \varepsilon_t \quad \to \quad \Delta y_t = y_t - y_{t-1} = a_1 + \varepsilon_t - \varepsilon_{t-1}
$$

差分后序列 $\Delta y_t$ 的表达式 $a_1 + \varepsilon_t - \varepsilon_{t-1}$ 是 MA (1) 过程。
但其移动平均系数为 1，无法转换为 AR 形式，违背了可逆性条件。
关于可逆性，请回顾第 2.3.5.2 节关于可逆性的讨论。也就是，MA(1) 中 $\varepsilon_{t-1}$ 的系数应小于 1。

怎么办？—— 替代方法：回归去趋势。步骤：

估计趋势项：用回归模型拟合趋势，例如： $Y_t = a_0 + a_1 t + a_2 t^2 + \cdots + a_n t^n + e_t$
提取残差：计算残差序列 $e_t = y_t - \hat{y}_t$，其中 $\hat{y}_t$ 为趋势估计值。
分析平稳性：若残差序列 ${e_t}$ 平稳，可对其建立 ARMA 模型。
多项式恰当的阶数可以由标准 t 检验、F 检验和 AIC 或 SBC 统计量来确定。这一方法的优势是：避免差分导致的模型不可逆问题，直接分离趋势与平稳噪声。

上面案例中的时间序列正是一个带有 单位根 的序列。在第 2.3.3.1 节中，我们曾剧透过：

平稳时间序列 和 单位根非平稳时间序列 是值得研究的，而其他不平稳时间序列不常见也不值得研究。
我们在第 2 章已经介绍了平稳时间序列。什么是 单位根非平稳时间序列 呢？

[!Note] 什么是单位根？
带有 单位根 的序列，称为差分平稳 (difference stationary) 序列，可以通过差分转化为平稳序列。给定模型：

$$
r_t = \phi_0 + \phi_1 r_{t-1} + a_t \qquad a_t \sim i.i.d
$$

根据 $\phi_1$ 的取值，序列的平稳性可分为以下三类：

$|\phi_1| < 1$：平稳时间序列

平稳性条件：

特征方程 $1 - \phi_1 B = 0$ 的根 $B =\dfrac{1}{\phi_1}$ 在单位圆外（ $|\phi_1| < 1$，故 $|B| > 1$）。

统计特性：

均值收敛至 $\mu = \dfrac{\phi_0}{1 - \phi_1}$，

方差恒定：$\text{var}(r_t) = \dfrac{\sigma_a^2}{1 - \phi_1^2}$，

自相关系数（ACF）按几何速率衰减（如 $\rho_k = \phi_1^k$）。

示例：AR (1) 模型（如 $\phi_1 = 0.8$）。

$|\phi_1| = 1$：单位根非平稳时间序列

特性：

特征方程的根 $B =\dfrac{1}{\phi_1}$ 在单位圆上（因 $|\phi_1| = 1$），

方差随时间线性增长：$\text{var}(r_t) = t \sigma_a^2$，

自相关系数缓慢衰减（如 $\rho_k \approx \sqrt{1 - k/t}$）。

典型模型：随机游走 $r_t = r_{t-1} + a_t$（$\phi_1 = 1$）。

处理方法：通过一阶差分 $\Delta r_t = a_t$ 转为平稳序列。

$|\phi_1| > 1$：爆炸性非平稳时间序列

特性：

特征方程的根 $B =\dfrac{1}{\phi_1}$ 在单位圆内（因 $|\phi_1| > 1$），

方差随时间指数增长，序列值迅速发散，无实际应用意义。

示例：$\phi_1 = 1.2$ 时，序列呈爆炸性增长。

3.4 样本平稳性检验

当拿到一个时间序列后，应该如何对其进行平稳性的检验呢？目前，对时间序列的平稳性检验主要有两种方法：

- 一种是图像法，即根据时序图和自相关图进行直观判断，
另一种是构造检验统计量进行单位根检验，有 ADF 检验、PP 检验和 KPSS 检验等方法。

检验观测数据平稳性时，通常假设观测数据是单位根非平稳的，而备择假设是观测数据是平稳的，因此 平稳性检验是单侧检验。

3.4.1 图像法

在具体的假设检验之前，我们可以先将数据可视化，绘制时间序列的折线图，看曲线是否围绕某一数值上下波动（判断均值是否稳定）、曲线上下波动幅度变化大不大（判断方差是否稳定）、曲线不同时间段波动的频率变化大不大（判断协方差是否稳定），以此来判断时间序列是否平稳。

3.4.1.1 迹图

迹图是待检验样本的时间图。

第一幅图，我们可以清楚地看到，均值随时间而变化，呈现上升的趋势。因此，这是一个非平稳序列。平稳序列不应该呈现出随时间变化的趋势。
第二幅图，我们看不到序列的趋势，但序列的变化幅度是一个时间的函数。平稳序列的方差必须是一个常数。
第三幅图，随着时间的增加，序列传播后变得更近，这意味着协方差是时间的函数。
所以上述三个例子均是非平稳时间序列。
第四幅图，均值、方差和协方差都是常数，这就是平稳时间序列。

3.4.1.2 ACF 和 PACF 图

我们也可以绘制时间序列的自相关图和偏自相关图来了解序列平稳性。

平稳序列通常具有短期相关性，对于平稳的时间序列，自相关系数往往会迅速退化到零（滞后期越短相关性越高，滞后期为 0 时，相关性为 1）；
而对于非平稳的数据，退化会发生得更慢，或存在先减后增或者周期性的波动等变动。
白噪声的自相关系数很快就衰减到 0 附近，是明显的平稳序列。滞后期为 0 时自相关系数和偏自相关系数其实就是序列自己和自己的相关性，故为 1；滞后期为 1 时，自相关系数为 0，表示白噪声无自相关性。
随机游走，自相关系数下降非常缓慢，故为非平稳序列；另从偏自相关系数中可以看到随机游走只和前一项有关。
GDP 数据的自相关图中也可以看到存在一定的周期性，滞后 4、8、12 等自相关系数较大下降较慢，差分后下降多一些起到一定效果，认为差分后序列是平稳的。

3.4.1.3 伪相关

直观判断能让我们对数据有更直观的认识，但带有较强主观性。

在实践中，我们通常从探索数据开始，例如绘制并计算两个变量的相关性。
我们常常注意到变量之间的某些非常强的相关性。但是这些相关性可能是没有意义的。并没有因果关系来解释这些结果。这些都是虚假相关性。
具有潜在趋势的数据很可能产生虚假的相关性，例如碳排放量的上升和变暖的全球气温之间的相关性。
除了趋势之外，时间序列的其他一些共同特征也会引入虚假相关性。如：季节性：夏天热狗消费量和溺水死亡人数的相关性。
更多关于虚假相关性的例子，请见：虚假相关性的例子
因此，我们需要经济直觉，也需要一些更严谨的假设检验。

3.4.2 假设检验法

本节介绍平稳性的假设检验方法。一般认为现实中经济变量大多是趋势平稳过程或单位根过程，不太可能出现这种情形，因此，经济学家通常只考虑单位根检验，即检验序列中是否存在单位根，若存在，则为非平稳序列，不存在则为平稳序列。

3.4.2.1 DF 检验和 ADF 检验

ADF 检验（Augmented Dickey-Fuller Testing）是最常用的单位根检验方法之一，通过检验序列是否存在单位根来判断序列是否是平稳的。ADF 检验是 DF 检验的增强版，在介绍 ADF 之前，我们先来看一下 DF 检验。

DF 检验
- Dickey & Fuller(1979)提出的单位根检验方法
- 检验样本平稳性时，需要根据数据的本身的特征选择合适的形式。通常而言，单位根非平稳过程的表现形式有三种：
  - (1) 当序列基本走势呈现无规则上升或下降并反复时，将其归为无漂移项自回归过程 $y_t =\rho y_{t−1} + \varepsilon_t$；
  - (2) 当序列基本走势呈现明显的随时间递增或递减且趋势并不太陡峭时，将其归为带漂移项自回归过程 $y_t =\mu+ \rho y_{t−1} + \varepsilon_t$；
  - (3) 当序列基本走势随时间快速递增时，则将其归为带漂移项和趋势项的自回归过程 $y_t =\mu+\beta t+\rho y_{t−1} + \varepsilon_t$。
- 原假设 $H_0$ : $\rho = 1$ （存在单位根，时间序列是非平稳的）；备择假设 $H_0$ : $\rho <1$ （不存在单位根，时间序列是平稳的）
- 对于带漂移项和趋势项的自回归过程，OLS 估计结果与 DF 统计量：
  - 初始条件 $y_0 = 0$，OLS 估计量 $\hat{\rho}$ 的表达式：$ \hat{\rho} = \frac{\sum_{t=1}^T y_t y_{t-1}}{\sum_{t=1}^T y_{t-1}^2} $ 标准误 $se (\hat{\rho})$ 的表达式：（其中 $\hat{\sigma}$ 为残差标准差估计值。）$se (\hat{\rho}) = \frac{\hat{\sigma}}{\sqrt{\sum_{t=1}^T y_{t-1}^2}}$
  - 基于 OLS 结果构造的统计量： $T = \frac{\hat{\rho} - 1}{se (\hat{\rho})} = \frac{\sum_{t=1}^T \varepsilon_t y_{t-1}}{\hat{\sigma} \sqrt{\sum_{t=1}^T y_{t-1}^2}}$ 该统计量称为 Dickey-Fuller (DF) 统计量。
- DF 统计量 不服从渐近正态分布，其临界值需通过 蒙特卡罗模拟 获得，而非传统 t 分布或正态分布表。
- 在存在截距项的情况下，Dickey 和 Fuller 发现：
  - 90%置信的估计值，偏离 $\rho = 1$ 的标准误为 2.58。
  - 95%置信的估计值，偏离 $\rho = 1$ 的标准误为 2.89。
  - 99%置信的估计值，偏离 $\rho = 1$ 的标准误为 3.51。

[!note] 蒙特卡洛模拟
蒙特卡洛模拟是一种基于大数定理的数值计算方法，其核心思想是通过大量随机抽样逼近理论解。这样，我们无需解析解即可逼近真实分布。

1. 基本原理与步骤

大数定理：若生成独立同分布（i.i.d）的随机序列 ${v_i}$（均值为 $\mu$，方差为 $\sigma^2$），其样本均值 $\overline{v} = \frac{1}{T}\sum_{i=1}^T v_i$ 会随样本量 $T$ 增大而收敛于真实均值 $\mu$（如图可能显示 $\overline{v}$ 随 $T$ 增加逐渐稳定在 $\mu$ 附近）。

中心极限定理：当 $T$ 足够大时，$\overline{v}$ 的分布趋近于正态分布 $N (\mu, \sigma^2/T)$（钟形曲线）。

2. 应用场景

假设检验：DF 检验通过蒙特卡洛模拟生成临界值，判断时间序列是否存在单位根。

小样本分析：在有限数据下，蒙特卡洛模拟数据生成过程，研究统计量的分布特性。

更具体的操作过程，详见课本 4.4.3 部分。

ADF 检验
- DF 的检验公式为一阶自回归过程，要求扰动项 $\varepsilon_t$ 无自相关。但扰动项经常呈现出自相关特征。
- 为了能适用于高阶自回归过程的平稳性检验，Dickey & Fuller（1981）对 DF 检验进行了改进，引入了更高阶的滞后项来控制自相关特征。这就是 Augmented Dickey-Fuller 单位根检验，简称 ADF 检验。
- 给定适当的滞后期 p，使得 AR(p)的扰动项 $\varepsilon_t$ 为白噪声过程：
  - (i) 无漂移项自回归过程：$y_{t}=\rho y_{t-1}+\sum_{i=1}^{k} \gamma_i \Delta y_{t-i}+\varepsilon_{t}$
  - (ii) 带漂移项自回归过程：$y_{t}=\mu+\rho y_{t-1}+\sum_{i=1}^{k} \gamma_i \Delta y_{t-i}+\varepsilon_{t}$
  - (iii) 带漂移项和趋势项自回归过程：$y_{t}=\mu+\beta t+\rho y_{t-1}+\sum_{i=1}^{k} \gamma_i \Delta y_{t-i}+\varepsilon_{t}$
    其中 $\mu$ 是常数项，$\beta t$ 是时间趋势项，$\Delta y_{t-i}$ 是滞后差分项（lagged difference term）。$\varepsilon_{t}$ 为随机扰动项。
- Problem 1： 无论是三种过程中的哪一个，我们要检验 AR (p) 模型是否存在单位根，只需检验 $y_{t-1}$ 的系数是否为 1。假设条件同 DF 检验一致：
  - 原假设 $H_0 : \rho = 1$ （存在单位根，时间序列是非平稳的）
  - 备择假设 $H_1 : \rho < 1$ （不存在单位根，时间序列是平稳的）。
  - 使用 OLS 估计估计自回归过程，得到：$\hat{\rho}$ 和相应的 $t$ 统计量。 $t = \frac{\hat{\rho} - 1}{se(\hat{\rho})}$ 该 $t$ 值被称为 ADF 统计量。类似的，临界值通过蒙特卡罗模拟得到。
- Problem 2： 针对上述三种过程，不仅要确定数据序列是否存在单位根，即 $\hat{\rho}$ 是否显著异于 1，还要确定这三种过程哪种才是拟合数据生成过程的“最佳”形式。（即，考虑所用检验式是否应当包含时间趋势项、是否应当包含漂移项。）
  - 可以构造联合检验 F 统计量检验以选择模型 [\phi_i = \frac{(SSR(\text{约束}) - SSR(\text{无约束})) / r}{SSR(\text{无约束}) / (T - k)}] $SSR(\text{约束})$：约束模型的残差平方和；$SSR(\text{无约束})$：无约束模型的残差平方和； $r$：约束条件的数量；$T$：样本量；$k$：无约束模型中的参数个数。

[!note] ADF 单位根检验案例
检验目标：中国 1978-2003 年基本建设投资（lnI）参考来源：聂巧平和张晓峒，2007
1. 检验是否含时间趋势项（式 3）

回归方程：
$$\Delta \ln I_t = 2.0759 - 0.3643 \ln I_{t-1} + 0.0665 t + 0.3662 \Delta \ln I_{t-1}$$

ADF 统计量：$\gamma$ 的 $t$ 值为 $-3.00$，5%临界值为 $-3.61$。

单位根检验结论：$-3.00 > -3.61$，无法拒绝原假设（存在单位根）。

时间趋势项检验（$\delta = \gamma = 0$）：

统计量：$\phi_3 = 4.8305$，临界值 $CV = 7.1707$。临界值计算需通过响应面函数 $CV = a + b/T + c/T^2$ 调整样本容量影响（本例 $T = 26$）。

结论：$4.8305 < 7.1707$，不拒绝原假设，剔除时间趋势项。

2. 检验漂移项（式 2）

回归方程：

$$
\begin{split}\Delta \ln I_t =& 0.0709 - 0.0131 \ln I_{t-1} + 0.3401 \Delta \ln I_{t-1} + 0.0828 \Delta \ln I_{t-2} \&- 0.0562 \Delta \ln I_{t-3} - 0.4161 \Delta \ln I_{t-4}\end{split}
$$

ADF 统计量：$\gamma$ 的 $t$ 值为 $-0.61$，5%临界值为 $-3.01$。

单位根检验结论：$-0.61 > -3.01$，仍无法拒绝单位根原假设。

漂移项检验（$\alpha = \gamma = 0$）：

统计量：$\phi_1 = 5.6193$，临界值 $CV = 5.1537$。

结论：$5.6193 > 5.1537$，拒绝原假设，需保留漂移项。

最终结论：

检验式选择：采用检验式 2（含漂移项，无时间趋势项）。

单位根判断：$\gamma$ 的 $t$ 值为 $-0.61$，与标准正态分布临界值 $-1.96$（5%水平）比较。

结论：$-0.61 > -1.96$，无法拒绝 $\gamma = 0$，序列 $\ln I$ 为单位根过程。

检验逻辑：先检验高阶项（时间趋势），再逐步简化模型，避免过度参数化。

3.4.2.2 PP 检验

为了解决 DF 检验中残差项中潜在的序列相关和异方差问题，Phillips 和 Perron (1988) 提出一种非参数检验方法——Phillips-Perron 单位根检验（简称 PP 检验）。该方法使用 New-West 标准误对 DF 统计量进行修正：
原假设 $H_0 : \rho = 1$ （存在单位根，时间序列是非平稳的）备择假设 $H_1 : \rho < 1$ （不存在单位根，时间序列是平稳的）。
PP 检验的 $t$ 统计量渐近分布与 ADF 检验统计量相同，因而临界值也相同、也是左边单侧检验, 可作为 ADF 检验的补充。
PP 检验须指定用于计算 Newey-West 标准误的滞后阶数，默认值为 $4(\frac{T}{100})^\frac{2}{9}$。

3.4.2.3 KPSS 检验

另一种单位根检验是 Kwiatkowski, Phillips, and Shin 在 1992 年提出的 KPSS 检验。
与以上检验方法相比，最大的不同点： KPSS 检验的原假设是平稳序列或趋势平稳序列，而备择假设是存在单位根。
原假设：序列不存在单位根（时间序列是平稳的或趋势平稳的）
备择假设：序列存在单位根（时间序列是非平稳的）
假设时间序列 $y_t$ 可以分解为时间趋势、随机游走和平稳过程之和，即

$$
y_t = \delta t + u_t + \varepsilon_t \quad , \quad u_t = u_{t-1} + v_t \quad v_t \sim WN(0, \sigma_v^2)
$$

原假设 $H_0$：$\sigma_v^2 = 0$，即趋势平稳。备择假设 $H_1$：$\sigma_v^2 > 0$，即不平稳。

3.5 单位根检验的进阶方法

上一节介绍了一系列常见的单位根检验方法。这些检验中均不能 100%保证检验正确，请注意，ADF 检验的前提条件是没有异方差；PP 检验适用于异方差场合，可认为是 ADF 检验的补充；KPSS 检验不需要选择趋势类型，因而更具鲁棒性，同样也可和其他检验一同使用，当均认为是平稳或趋势平稳时方判定为平稳。

事实上，这些方法都是非季节性时间序列单位根检验方法，并不是全部方法。总体而言，单位根检验方法分为 5 类，即：

非季节性时间序列单位根检验：DF 检验、ADF 检验、WS 检验、RMA 检验、PP 检验、KPSS 检验、ERS 点检验、NP 检验。
季节时间序列的单位根检验：DHF 检验、HEGY 检验、Kunst 检验
退势单位根检验：GLS 退势检验、KGLS 退势检验、ROLS 退势检验。时间序列的退势是指从原时间序列中分离出确定性线性趋势项或周期性趋势项的处理过程。
结构突变序列的单位根检验：Perron 检验、Zivot-Andrews 方法、BLS 检验、递归检验、滚动检验、循序检验
面板数据的单位根检验：Quah 检验、LLC 检验、IPS 检验、崔仁检验、MW 检验、Bai-Ng 检验、 Hadri 检验、Breitung 检验。

关于平稳性检验的代码实现，请参考：Python 实现，R 实现，Stata 实现

3.5.1 有效性问题与退势单位根检验

3.5.1.1 有效性问题

通常一种检验的有效性 (power) 在于拒绝一个错误的原假设的可能性。当问题中的序列平稳时，一个有效的检验将会拒绝存在单位根的原假设。
蒙特卡洛试验已经证明，各种 DF 检验的有效性都较差。因此，这些检验往往显示序列存在单位根。而且它们在区分趋势平稳和漂移过程的时候有效性也很低。
怎么解决这个问题？有没有更好的办法？
一个重要的方法是对 DF 检验进行变形来提高有效性。下面我们就介绍两种【退势】的方法——LM 检验和 DF-GLS 检验（又叫 ERS 检验），经过去除趋势的操作，变形后的 DF 检验会更有效。

3.5.1.2 LM 检验

Schmidt 和 Phillips (1992) 提出了比 DF 检验更具有效性的 两步检验法——拉格朗日乘子 (Lagrange Multiplier，LM) 检验
LM 检验关键点是，不用持久性很强的解释变量 $y_{t-1}$ 的模型，估计趋势参数会更有效。如果能够有效地估计出趋势，那么就有可能剔除数据趋势，并在已剔除趋势的数据上进行单位根检验。
原假设：序列存在单位根；备择假设：时间序列是平稳的或趋势平稳的

[!note] LM 检验
LM 检验第一步：构建去除趋势的序列

与 DF 检验的设定不同，${y_t}$ 序列在原假设下是一个带漂移的随机游走过程，因此 $$ y_t = a_0 + a_2 t + \sum_{i=0}^{t-1} \varepsilon_{t-i} \quad \to \quad \Delta y_t = a_2 + \varepsilon_t$$

这种检验方法的思想在于使用回归方程 $\Delta y_t = a_2 + \varepsilon_t$ 估计趋势系数 $a_2$。因此，随机趋势 $\Sigma \varepsilon_i$ 的存在并不影响对 $a_2$ 的估计。

估计结果 $\hat{a}_2$ 是关于时间趋势斜率的估计。使用 $\hat{a}_2$ 构建去除趋势的序列： $$y^d_t = y_t - (y_1 - \hat{a}_2) - \hat{a}_2 t$$ 其中，$y_1$ 为序列 ${y_t}$ 初始值。请注意，当 $t=1$ 时，确定性部分为 $y_1 = a_0 + a_2$。

因此，被估计的趋势线的截距为 $(y_1 - \hat{a}_2)$，斜率为 $\hat{a}_2$。这样做保证了去除趋势的序列（即 $y^d_t$）的初始值为零。

LM 检验第二步：使用去趋势序列替代

在 DF 检验方程的 $y_{t-1}$ 处用去除趋势的序列 $y^d_{t-1}$ 替代，估计变形的 DF 检验方程 $$ \Delta y_t = c_0 + \gamma y^d_{t-1} + \epsilon_t $$

如果残差中存在序列相关，则估计方程 $$ \Delta y_t = c_0 + \gamma y^d_{t-1} + \sum_{i=1}^{p} \beta_i \Delta y^d_{t-i} + \epsilon_t $$

如果得到 $\gamma \neq 0$，则拒绝存在单位根的原假设。

3.5.1.3 DF-GLS 检验（ERS 检验）

DF-GLS 检验，是 Elliott, Rothenberg, and Stock 在 1996 年提出的一种单位根检验方法，全称 Dickey-Fuller Test with GLS Detredding，即“使用广义最小二乘法去除趋势的检验”；模拟试验证明 DF-GLS 检验有效性更强。
原假设：序列存在单位根（时间序列是非平稳的）
备择假设：序列不存在单位根（时间序列是平稳的或趋势平稳的）
DF-GLS 检验的做法
- 利用广义最小二乘法，首先对要检验的数据进行一次“准差分”，
- 然后利用准差分的数据对原序列进行去除趋势处理，
- 再利用 ADF 检验的模型形式对去除趋势后的数据进行单位根检验，但此时 ADF 检验模型中不再包含常数项或者时间趋势变量。

[!Note] DF-GLS 检验的做法

考虑趋势平稳(TS)模型： $y_t=a_0+a_2t+B(L)\varepsilon_t$

消除趋势
为消除 $y_t$ 的趋势，事先选择接近 1 的常数 $\alpha$ 进行近似差分变换

$$
\widetilde{y}t = y_t-\alpha y{t - 1} \quad (t = 2,\cdots,T) \quad \to \quad \widetilde{y}_t=(1 - \alpha)a_0+a_2[(1 - \alpha)t+\alpha]+e_t
$$

其中， $t = 1$ 时 $\widetilde{y}_1$ 设定等于 $y_1$。运行这一最小二乘估计，得到估计系数 $\hat{a}_0$ 和 $\hat{a}_2$ ，进而得到去除趋势的序列

$$
y_t^d=y_t-\hat{a}_0-\hat{a}_2t
$$

使用去趋势序列估计 DF 检验

使用去趋势数据估计基本 DF 检验回归方程

$$
\Delta y_t^d=\gamma y_{t - 1}^d+\varepsilon_t
$$

若残差存在序列相关，估计扩展形式

$$
\Delta y_t^d=\gamma y_{t - 1}^d+\sum_{i = 1}^{p}c_i\Delta y_{t - i}^d+\varepsilon_t
$$

滞后期 $p$ 的选择： ERS 的建议是使用 SBC 准则选取 p。

假设检验：根据 $\gamma$ 是否为 0 判断能否拒绝存在单位根的原假设。

临界值确定依据：检验临界值依赖于数据中是否含有趋势。

存在截距无趋势时，临界值取 DF 的 $\tau$ 检验对应值；存在趋势时，临界值取决于“近似差分”时 $\alpha$ 的选择值。

对于存在截距情形，$\alpha=(1-\frac{7}{T})$ ；存在截距和趋势情形，$\alpha=(1 - \frac{13.5}{T})$ 。样本容量 $T$ 增加时，$\alpha$ 趋于 1 ，$\widetilde{y}_t$ 近似于 $\Delta y_t$ 。

3.5.2 结构突变的 Perron 单位根检验

自从 DF 检验、ADF 检验以及 PP 检验被提出以来，有关单位根检验的各种方法和应用研究不断地刊登在主流学术期刊上。然而，经典的单位根分析框架中并没有考虑真实数据的外部因素或自我调整因素引起的结构性变化。
“佩伦现象” ：在进行单位根检验时，当存在结构性变化时，DF 检验将更倾向于接受存在单位根的原假设。（容易将具有结构突变的平稳过程误判为单位根过程）。相关综述
怎么解决“佩伦现象”？
1. 分样本 DF 检验
- 不足：每个回归部分的自由度减少了，并且可能并不知道断点何时出现
- 因此，对整个样本进行一次性的检验更恰当。
1. Perron 检验
- Perron(1989)扩展了用于在 $t=\tau+1$ 期存在结构性变化时检验单位根的方法。
- 需要考虑的核心问题：结构突变的影响？存在一次性跳跃
- 原假设： 序列存在单位根；$ y_t = \mu + y_{t-1} + \lambda_1 D_p + \varepsilon_t $
- 备择假设：序列趋势平稳（趋势项 0 时为平稳过程）$y_t = \mu + \beta t + \lambda_2 D_L + \varepsilon_t$
  - $D_p$ 是脉冲虚拟变量（Pulse）；当 $t=τ+1$ 时，$D_P$ = 1，否则为 0；
  - $D_L$ 是水平虚拟变量（Level）；当 $t≥τ+1$ 时，$D_L$ = 1，否则为 0。
  - 在原假设下，序列是一个单位根过程，并且在时期 $t=\tau+1$ 时，序列在原有水平上有一个一次性跳跃。
  - 在备择假设下，序列趋势平稳，截距项有一个一次性跳跃。

结构性突变的单位根检验

[!Tip] Perron 检验的步骤
在 $t=\tau+1$ 期存在结构性变化时，单位根 Perron 检验步骤：

第一步：构建回归方程并估计

将原假设（存在单位根且有结构性变化）与备择假设（趋势平稳且有结构性变化）结合为一个回归方程，常见形式为：$$ y_t = c_0 + \beta t +\rho y_{t-1} + \mu_1 D_p + \mu_2 D_L + \varepsilon_t $$

$D_{P}$ 为脉冲虚拟变量（$t = \tau + 1$ 时，$D_{P} = 1$，否则为 0）；

$D_{L}$ 为水平虚拟变量（$t > \tau$ 时，$D_{L} =1$，否则为 0）。

使用 OLS 估计该方程，得到残差 $\hat{\varepsilon_t}$。

第二步：对残差进行诊断性检验

对估计方程的残差进行诊断，检查是否存在序列相关。

怎么检验？请回顾 2.3.5.1 白噪声检验。实操可参考用 Stata 做白噪声检验

第三步：残差自回归估计

若不存在序列相关：使用 OLS 方法对残差项 $\hat{\varepsilon}_t$ 进行自回归估计。$ \hat{\varepsilon}t = \rho \hat{\varepsilon}{t-1} + v_t$

若存在序列相关，则需要消除序列相关。残差的序列相关本质上反映原方程遗漏了相关项，需从原方程层面进行调整。第一步的回归方程改为 $ y_{i} = c_0 + \beta t + \rho y_{i - 1} + \mu_{1}D_{p} + \mu_{2}D_{L} + \sum_{i = 1}^{p}\beta_{i}\Delta y_{t - i} + \varepsilon_{t}$

Perron 检验就是针对 $\rho$ 的检验。若原序列存在单位根，则应不显著异于 1。

第四步：计算统计量并检验

计算原假设 $\rho = 1$ 的 $t$ 统计量：$t_{\rho} = \frac{\rho - 1}{sd(\rho)}$

将该统计量与 Perron 计算的临界值比较。若 $|t_{a_1}|$ 大于临界值，拒绝原假设（序列是发生结构性变化的趋势平稳过程）；若小于临界值，接受原假设（序列是发生结构性变化的单位根过程）。

怎么获得临界值？

定义 $\lambda = \dfrac{\tau}{T}$，期中 $\tau$ 为冲击点前样本数，$T$ 为总样本数

若残差独立同分布，$\rho$ 的分布与 $\lambda$ 相关。Perron 根据不同 $\lambda$ 模拟了临界值，例如在 5% 显著水平下，不同 $\lambda$ 区间对应不同临界值。

【拓展】Perron（1989，ECMA）将序列受到冲击后发生的结构性变化分为三类：
- A：冲击前后序列的水平（序列均值）发生变化，但斜率不变；
- B：冲击前后序列的斜率发生变化，但水平未变化；
- C：冲击前后序列的水平和系列均发生了变化。
- 对于三种情况的分别讨论，请参考三类结构性变化的详细讨论。

关于 Perron 检验的代码，请参考 R 语言实现、Stata 实现。

3.5.3 面板数据的 IPS 单位根检验

当存在许多类似的时间序列变量（面板数据）时，Im，Pesaran 和 Shin (2002) 提出了一种构造单位根检验的方法，简称 IPS 检验。
假设我们有 n 个序列，每个序列包含 T 个观测样本值。对于每个序列构建 ADF 检验形式：

$$
\begin{split} y_{it} =& a_{i0} + \rho_i y_{it-1} + a_{i2} t + \sum_{j=1}^{p_i} \beta_{ij} \Delta y_{it-j} + \varepsilon_{it} \\Downarrow \ \Delta y_{it}= y_{it}-y_{it-1}=&a_{i0} + (\rho_i-1) y_{it-1} + a_{i2} t + \sum_{j=1}^{p_i} \beta_{ij} \Delta y_{it-j} + \varepsilon_{it}\ =&a_{i0} + \gamma_i y_{it-1} + a_{i2} t + \sum_{j=1}^{p_i} \beta_{ij} \Delta y_{it-j} + \varepsilon_{it}\end{split}
$$

其中 $\gamma_i=\rho_i-1$ 。在 Panel 单位根检验中，原假设应该是：

$H_0$：所有个体的时间序列都有单位根，即所有时间序列都是非平稳的。因此： $\rho_1=\rho_2=⋯=\rho_n=1 \to \gamma_1=\gamma_2=⋯=\gamma_n=0$
$H_1$：至少有一个个体的时间序列是平稳的，即不存在单位根。拒绝原假设意味着 $\gamma_i$ 中至少有一个不为零。
在单独序列检验时，我们只要估计 $\gamma$，就可得到每个序列的 $t$ 统计量。
请思考：推广到面板数据，应该怎么检验呢？
IPS 检验通过结合每个个体的 ADF 检验的 t 值来构造一个综合的统计量。
- 如果计算出的综合统计量对应的 p 值小于显著性水平（如 0.05），则拒绝原假设，认为至少有一个个体是平稳的。
- 反之，如果不能拒绝原假设，则认为所有个体都是非平稳的。
- 因此，可以通过把每个序列的 $t$ 统计量的取样本均值得到平均的 t 值 $\bar{t} = \left( \frac{1}{n} \right) \sum_{i=1}^{n} t_i$ 从而构造 Z 统计量检验 $Z_\bar{t} = \frac{\bar{t} - E(\bar{t})}{\sqrt{\dfrac{\text{var}(\bar{t})}{n}}} \sim Normal$ 式中，$E_i$ 和 $\text{var}(\bar{t})$ 表示 $\bar{t}$ 的理论均值和方差。如果各个检验的 $t_i$ 的 OLS 估计是无偏的，则 $E_i$ 的值为零。
- 为了修正事实存在的偏移，$E_i$ 和 $\text{var}(\bar{t})$ 的值可通过蒙特卡洛模拟计算。

[!tip] 面板单位根检验的局限性（了解）

原假设的模糊性与结果敏感性

原假设设定：IPS 检验的原假设为所有个体的自回归系数增量满足 $\gamma_1 = \gamma_2 = \cdots = \gamma_n = 0$（即 $\rho_i = 1$，存在单位根）。

IPS 检验中，可能因为 $\gamma_i$ 中一个或两个值不为零而拒绝原假设。但没有特殊的方法可以知道 $\gamma_i$ 中的哪些值不为零。可能因少数平稳序列的存在而得出整体拒绝原假设的结论，掩盖其他个体的非平稳性。

对小样本不准确

检验的渐近性质对时间维度（$T$）和截面维度（$n$）的增长方式敏感：例如，对于小 $T$ 和大 $n$，临界值依赖于滞后项系数（如 $\beta_{ij}$）。

误差项相关性与修正方法的不足

序列相关与周期相关：检验要求误差项 $\epsilon_{it}$ 无自相关和跨期相关，但：

滞后阶数 $p_i$ 的选择可能无法完全消除自相关（$E_{e_{it}} \neq 0$）。

截面相关性（个体间误差相关）会导致临界值失效。

修正方法的局限性：

减去共同时间效应（如时间虚拟变量）可部分修正，但无法彻底解决。

修正可能引入新的非平稳问题（如 $|\bar{\gamma}_i|$ 的非平稳性），影响检验可靠性。

3.6 ARIMA 模型与滤波器

3.6.1 ARIMA

前面我们已经学习了单位根过程和单位根的检验，事实上，单位根过程对应了 ARIMA(p, 1, q) 模型。

ARIMA (AutoRegressive Integrated Moving Average) 在 ARMA 的基础上引入差分（Integration），模型表示为 ARIMA(p, d, q)。其中 d 为 差分阶数（将非平稳序列转换为平稳序列所需的差分次数）
ARMA（自回归移动平均模型）和 ARIMA（差分自回归移动平均模型）的核心区别在于 是否处理非平稳数据。ARIMA 适用于非平稳时间序列（通过差分消除趋势或季节性，得到平稳序列，再使用 ARMA (p, q) 建模）。
如何使用 ARIMA 模型？
1. 检验平稳性：使用 ADF 检验或观察自相关图（ACF）。
  - 若平稳 → 直接使用 ARMA。
  - 若非平稳 → 使用 ARIMA，并通过差分转换为平稳序列。
2. 确定差分阶数 d：通常从 d = 1 开始，逐步增加直至序列平稳。
3. 参数调优：通过 AIC/BIC 准则选择最优的 p 和 q，估计去趋势后的 ARMA 模型。

3.6.2 Beveridge-Nelson 分解去趋势

为了将数据分解为随机趋势和平稳周期，我们可以采用 Beveridge-Nelson 分解法。

Beveridge-Nelson（1981）提出将 非平稳时间序列（如 ARIMA 模型）分解为 随机趋势成分（带漂移的随机游走）和 平稳成分（无规则波动）。
其核心是通过长期预测函数识别趋势，剩余部分即为平稳成分。
当采用这种技术时，我们需要指定与平稳部分有关的滞后期的数量。

[!note] Beveridge-Nelson 分解步骤（略）
步骤 1：估计 ARIMA 模型

对 ARIMA (p, 1, q)原始序列 $y_t$ 进行 1 阶差分，得到平稳的差分序列 $\Delta y_t$。

使用 Box-Jenkins 方法拟合最优 ARMA (p, q) 模型，例如：

$$
\Delta y_t = a_0 + \varepsilon_t + \beta_1 \varepsilon_{t-1} + \beta_2 \varepsilon_{t-2} + \cdots + \beta_q \varepsilon_{t-q}
$$

步骤 2：构造预测函数

计算多步预测值
对差分后的平稳序列 $\Delta y_t$（服从 ARMA (p, q)），在时刻 $t$ 预测未来 $s$ 步的差分值：

$$
E_t[\Delta y_{t+1}], , E_t[\Delta y_{t+2}], , \dots, , E_t[\Delta y_{t+s}]
$$

短期预测：前 $q$ 步预测受移动平均（MA）项影响。例如，对 $\Delta y_{t+1}$ 的预测为：

$$
E_t[\Delta y_{t+1}] = a_0 + \beta_1 \varepsilon_t + \beta_2 \varepsilon_{t-1} + \dots + \beta_q \varepsilon_{t-q+1}
$$

长期预测：当 $s > q$ 时，MA 项的影响消失，预测值仅由常数项 $a_0$ 主导：

$$
E_t[\Delta y_{t+s}] = a_0 \quad (s > q)
$$

预测值的长期极限

将未来 $s$ 步预测值累加，得到 $y_{t+s}$ 的预测：$E_t[y_{t+s}] = y_t + \sum_{k=1}^s E_t[\Delta y_{t+k}]$

当 $s \to \infty$ 时，累加和分解为两部分：

确定性趋势：由常数项 $a_0$ 的累积构成，即 $a_0 \cdot s$。

随机趋势：由历史冲击 ${\varepsilon_t, \varepsilon_{t-1}, \dots}$ 的长期影响构成，形式为： $ \mu_t = \psi(1) \sum_{j=0}^\infty \varepsilon_{t-j}$ 其中 $\psi(1) = 1 + \beta_1 + \beta_2 + \dots + \beta_q$ 是移动平均系数的累积效应。

随机趋势的显式构造
随机趋势 $\mu_t$ 是历史冲击的加权和，权重为 $\psi(1)$，反映了每个冲击的影响：$\mu_t = y_t + \sum_{j=0}^{q-1} \left( \sum_{i=j+1}^q \beta_i \right) \varepsilon_{t-j}$

示例：若 $\Delta y_t$ 是 MA (2) 过程，则：$ \mu_t = y_t + (\beta_1 + \beta_2)\varepsilon_t + \beta_2 \varepsilon_{t-1} $

B-N 分解的组成

确定性趋势：斜率 $a_0$ 的线性项 $a_0 \cdot t$，代表序列的长期增长趋势。

随机趋势：$\mu_t$ 是一个随机游走过程，增量受冲击 $\varepsilon_t$ 驱动，即： $ \mu_t = \mu_{t-1} + a_0 + \psi(1)\varepsilon_t $

平稳成分：原始序列与趋势的残差，即 $y_t - \mu_t$，为有限阶 MA 过程，例如 MA (q-1)。

步骤 3：分离平稳成分

平稳成分（无规则波动）为原始序列减去随机趋势：

$$
\text{平稳成分} = y_t - \mu_t = -\left ( \sum_{i=1}^\infty \beta_i \right) \varepsilon_t - \left ( \sum_{i=1}^\infty \beta_i \right) \varepsilon_{t-1} - \cdots $$ $$ Y_t - \mu_t = -(\beta_1 + \beta_2) \varepsilon_t - \beta_2 \varepsilon_{t-1}
$$

3.6.3 Hodrick-Prescott 去趋势

基本原理与步骤
HP 分解通过最小化目标函数，将时间序列 $y_t$ 分解为趋势成分 $\mu_t$ 和平稳成分 $y_t - \mu_t$：

$$
\min_ \left[ \frac{1}{T} \sum_{t=1}^T (y_t - \mu_t)^2 + \frac{\lambda}{T} \sum_{t=2}^{T-1} \left[ (\mu_{t+1} - \mu_t) - (\mu_t - \mu_{t-1}) \right]^2 \right]
$$

这个公式看上去很复杂！Hint：拉格朗日乘子法
第一项：衡量趋势对原始序列的拟合程度（残差平方和）。
第二项：惩罚趋势的二阶差分（即趋势的曲率），迫使趋势平滑。
参数 $\lambda$：控制平滑程度。它是主观确定的常量，反映趋势中包含波动的惩罚。
- $\lambda \to 0$：当 $y_t=\mu_t$ 平方和最小，趋势为序列本身。
- $\lambda \to \infty$：第二项更加重要，所以平方和最小时 $\mu_{t+1}-\mu_t=\mu_t-\mu_{t-1}$，这样，趋势变化恒定，退化为线性时间趋势。
- $0 < \lambda < \infty$：允许趋势缓慢变化，适应长期波动。

优点

操作简单：无需预先建模（如 ARIMA），直接通过优化问题求解。
多变量一致性：统一方法应用于多个变量，确保趋势同步（如经济周期模型）。
灵活调节：通过调整 $\lambda$，可适应不同平滑需求。

[!tip] 补充：HP 分解与 Beveridge-Nelson（BN）分解对比

维度 HP 分解 BN 分解

理论基础 基于优化平滑，无明确假设基于 ARIMA，区分确定性与随机趋势

趋势一致性 多变量共享同一趋势各变量独立分解，趋势可能不一致

参数依赖性 依赖 $\lambda$ 的选择依赖 ARIMA 模型阶数的选择

适用序列类型 适合 $I(2)$ 或需强平滑的序列适合 $I(1)$ 序列，需差分平稳

端点敏感性 较高较低（依赖模型预测）

什么是 I(1)、I(2)？这就是一阶和二阶单整。关于协整的内容，在课本第 6 章系统介绍。我们在此对协整做一个简单的介绍：

协整是指 两个非平稳序列的线性组合平稳的性质。

我们称平稳的时间序列为“零阶单整”(Integrated of order zero)，记为 I(0)。

如果时间序列的一阶差分为平稳过程，称为“一阶单整”，记为 I(1)。这就是“单位根过程”。

同理，二阶单整序列就是二阶差分具有平稳性的序列。

一般地，如果时间序列的 d 阶差分为平稳过程，称为“d 阶单整”，记为 I(d)。

性质？

I(0)序列（平稳序列）对过去行为只有有限记忆，即发生在过去的扰动项对未来的影响随时间而衰减。因此，长期而言 0 阶单整有回到期望值的趋势，即：“均值回复”(mean-reverting)。

I(1)序列则对过去行为有无限长的记忆，即任何过去的冲击都将永久地改变未来的整个序列。

对 $y_t$ 进行单位根检验后，如认为非平稳，要进一步判断其为 I(1)或 I(2)。在经济变量中，I(0)与 I(1)最常见，I(2)很少见。

维度	HP 分解	BN 分解
理论基础	基于优化平滑，无明确假设	基于 ARIMA，区分确定性与随机趋势
趋势一致性	多变量共享同一趋势	各变量独立分解，趋势可能不一致
参数依赖性	依赖 $\lambda$ 的选择	依赖 ARIMA 模型阶数的选择
适用序列类型	适合 $I(2)$ 或需强平滑的序列	适合 $I(1)$ 序列，需差分平稳
端点敏感性	较高	较低（依赖模型预测）
什么是 I(1)、I(2)？这就是一阶和二阶单整。关于协整的内容，在课本第 6 章系统介绍。我们在此对协整做一个简单的介绍：

#Notes

时间序列分析自学笔记-03包含趋势的模型

https://zhangwj235.github.io/posts/aa1814c1/

Author

Jack Zhang

Posted on

May 29, 2026

Licensed under

时间序列分析自学笔记-04波动率模型 Previous

时间序列分析自学笔记-06协整与误差修正模型 Next