本章将以预测为起点继续讨论时间序列回归中的其他专题。我们介绍了单变量的预测问题,但在实践中,你可能需要预测两个或多个变量,如预测GDP增长率和通货膨胀率。

向量自回归

在之前章节中介绍了对于GDP增长率的预测,但现实中的经济预测人员可能还要预测许多其他重要的宏观经济变量,如通货膨胀率、失业率和期限利差等。一种方法是对每一个变量都运用之前的方法建立一个独立的模型进行预测,另一种方法是只建立一个模型同时对所有变量进行预测,以得到各变量相互一致的预测值。一种利用一个模型同时预测多个变量的方法是建立向量自回归(VAR)模型,VAR模型将单个变量的自回归模型推广到多个时间序列变量的情形,即将单变量自回归推广到时间序列“向量”中。

VAR模型

包含两个时间序列变量\(Y_t\)和\(X_t\)的向量自回归(Vector Autoregression, VAR)模型由两个方程组成:一个方程的被解释变量是\(Y_t\);另一个方程的被解释变量是\(X_t\)。两个方程的解释变量都是\(Y_t\)和\(X_t\)的滞后变量。更一般地,包含k个时间序列变量的VAR模型由k个方程组成,每个变量对应一个方程,所有方程的解释变量均是全部变量的滞后项。VAR模型系数的估计值可通过使用OLS对每个方程进行估计得到。

向量自回归

一个向量自回归模型(VAR)包含k个回归方程,每个方程的解释变量为全部k个变量的滞后项。VAR将单变量自回归模型推广到多个时间序列变量或“向量”中。每一个方程的滞后期是相同的,均等于p,则所有方程组成的系统被称为VAR(p)。

当只包含\(Y_t\)和\(X_t\)两个变量时,VAR(p)由以下两个方程组成

\[X_t = \beta_{10} + \beta_{11} Y_{t-1} + ... + \beta_{1p} Y_{t-p} + \gamma_{11} X_{t-1} + ... + \gamma_{1p} X_{t-p} + u_{1t}\] \[Y_t = \beta_{20} + \beta_{21} Y_{t-1} + ... + \beta_{2p} Y_{t-p} + \gamma_{21} X_{t-1} + ... + \gamma_{2p} X_{t-p} + u_{2t}\]

其中,\(\beta\)和\(\gamma\)为未知系数;\(u_{1t}\)和\(u_{2t}\)为误差项。

VAR假设将时间序列回归假设应用到每个方程中。VAR模型系数的估计值可通过对每个方程进行OLS估计得到。

VARs的推断。在VAR模型的假设下,OLS估计量是一致的,且在大样本条件下服从联合正态分布。因此,可通过常用的方法进行统计推断。例如,系数的95%置信区间为系数的估计值\(\pm\)1.96倍标准差。

由于VAR模型是一个包含k个变量的k个方程所组成的集合或系统,因此它会涉及一些新的假设检验,如进行联合假设检验时可能会遇到约束条件涉及多个方程的情形。

例如,在上式所示的两变量VAR(p)中,你可能想要检验模型真实的滞后期长度为p还是p-1,即你需要检验两个方程中\(X_{t-p}\)和\(X_{t-p}\)的系数是否都为零。该假设检验的原假设为这些系数都为零,即

\[H_0: \beta_{1p} = 0, \beta_{2p} = 0, \gamma_{1p} = 0, \gamma_{2p} = 0\]

备择假设为这四个系数中至少有一个不为零,因此原假设涉及两个方程中的系数,每个方程涉及两个系数。

因为估计的系数在大样本下服从联合正态分布,所以可用F统计量检验这些系数的约束。由于F统计量的精确公式中包含对多个方程符号的处理,过程比较复杂,所以我们在此处忽略它。但在实践中,大多数统计软件都包含能自动进行这些假设检验的程序。

应该在VAR模型中加入多少个变量?VAR模型中的每一个方程包含的参数个数与变量个数有关。例如,在一个包含5个变量、4个滞后期的VAR模型中,每个方程都需要估计21个系数,则整个VAR模型需要估计105个系数。估计这么多系数会产生估计误差,这将导致精度下降。

在实践中,这暗示我们需要使模型中包含的变量个数尽可能少,特别地,需要确保模型中的变量都是互相关联的,从而保证在预测时每一个变量都是有用的。例如,从实证经验和经济理论出发,我们知道GDP增长率、期限利差和通货膨胀率是相互关联的,这意味着在用VAR模型进行预测时,每一个变量都是有用的。在VAR中加入一个无关变量会引入估计误差且不会增加预测信息,因此会降低预测精度。

确定VAR中的滞后阶数。可以利用F统计量和信息准则来确定VAR模型的滞后阶数。

为了定义信息准则,这里需要用到矩阵的相关知识,令\(\sum_u\)表示VAR模型中误差项的\(k \times k\)阶协方差矩阵,\(\hat{\sum}_u\)为协方差矩阵的估计量,其中第i行、第j列的元素为\(\frac{1}{T} \sum_{i=1}^T \hat{u}_{it} \hat{u}_{jt}\),\(\hat{u}_{it}\)为第i个方程的OLS残差,\(\hat{u}_{it}\)为第j个方程的OLS残差,则VAR模型的BIC准则取值为

\[BIC(p) = ln[det(\hat{\sum}_u)] + k(kp +1) \frac{ln(T)}{T}\]

其中,\(det(\hat{\sum}_u)\)为矩阵\(\hat{\sum}_u\)的行列式。将上式中的\(ln(T)\)改为2即可计算AIC。

上式拓展了单方程情形下的BIC表达式。当只有一个方程时,第一项简化为\(ln[SSR(P)/T]\)。上式中的第二项是加入对其他回归变量的惩罚;\(k(kp+1)\)为VAR中回归系数的总个数(有k个方程,其中每个方程包含一个截距项和k个时间序列变量中每个变量的p个滞后项)。

在VAR模型中,运用BIC准则对滞后阶数进行判断的准则同单方程情形类似,即在p的备选数值中,估计的滞后阶数\(\hat{p}\)是使BIC(p)最小的那个p值。

利用VAR进行因果关系分析。到目前为止,我们都着重讨论利用VAR进行预测。VAR模型的另一个用途就是分析经济时间序列之间的因果关系;事实上,宏观经济学家兼计量经济学家Christopher Sims提出VAR模型的初衷就在于此。将VAR模型用于研究变量之间的因果关系,便是我们熟知的结构VAR模型,之所以称之为“结构”VAR,是因为此时VAR模型被用来模拟潜在的经济结构。在结构VAR分析过程中,我们不仅需要运用本章介绍的与预测相关的知识,还需要一些其他的分析工具。但是,VAR预测和结构化建模在概念上的最大区别是:结构化建模需要一些具体的假设,即假设哪些变量是外生的,哪些变量不是外生的,而这些假设可根据经济理论和专业知识来得到。有关结构VAR的套路是在联立方程系统框架下进行的,超出了讨论范围。

多期预测

到目前为止,我们对预测的讨论都集中于超前一期的预测。但是,在实际中,预测者需要对变量未来更远时期进行预测。本节将介绍两种多期预测的方法。其中,常用的方法是构造“迭代”预测,即每一次预测向前迭代一期,本节将详细介绍这种方法。第二种方法是运用回归模型“直接”对变量进行预测,在该方法中,回归方程的被解释变量是我们想要预测的多期变量。正如本节结尾处所讨论的原因,在大部分的实际应用中,我们建议大家使用迭代预测方法而不是直接方法。

多期迭代预测

迭代预测的本质是利用预测模型做超前一期的预测,即使用截止第T期的数据来预测第T+1期的值,随后在预测T+2期的值时,将T+1期的预测值视为已知。因此,超前一期预测(又称超前一步预测)是超前两期预测的中间步骤。不断重复或迭代这一过程,直至计算出想要的第h期预测。

迭代AR预测方法:AR(1)。迭代AR(1)是利用AR(1)模型作为超前一期预测的模型。迭代AR(p)是迭代AR(1)方法的推广。

基于迭代VAR方法的多变量预测。利用VAR模型进行多变量的多期迭代预测的方法大致与利用AR模型进行但变量的多期迭代预测相同。主要区别在于:在多变量中,某一变量的超前两期(第T+2期)预测值取决于VAR中所有变量在T+1期的预测值。

多期直接预测

多期直接预测不需要进行迭代,其通过单个回归方程进行预测。模型的被解释变量为待预测变量的超前多期变量,解释变量为相关预测变量。之所以称这种方法为直接预测是因为可以直接利益该方法中的回归系数进行多期预测。

多期直接预测法。假设你想用截至第T期的数据来预测变量在第T+2期的值。多期直接预测法以ADL模型为出发点,但需要对解释变量进行更多期的滞后操作。例如,如果模型中使用了预测变量的两期滞后,则此时的被解释变量为\(Y_t\),而解释变量为\(Y_{t-2}, Y_{t-3}, X_{t-2}和X_{t-3}\)。此时,可以直接利用回归方程的系数估计量和\(Y_T, Y_{T-1}, X_T和X_{T-1}\)的数据来计算\(Y_{T+2}\)的预测值,不需要进行任何迭代。更一般地,在超前h期的直接预测回归中,为得到超前h期的预测,所有预测变量都需要滞后h期。

多期直接回归模型的标准误差。在多期直接回归模型中,被解释变量为相应变量在未来两期或三期的取值,所以多期回归模型中的误差项是序列相关的。如果误差项是序列相关的,则计算出的OLS标准误差就是不正确的,或更准确地说,在此基础上进行的统计推断是不可靠的。因此在多期直接预测中需要利用异方差和自相关一致(HAC)标准误。

你应该用哪个模型进行预测

大多数情形下,建议使用迭代法进行多期预测,有以下两个原因:第一,从理论上讲,如果超前一期预测模型的设定是正确的,则超前一期回归得到的参数估计量比超前多期直接回归的参数估计量更有效。第二,从实践角度看,预测人员需要预测的不仅仅是一期的预测值,还需要预测多期的预测值。由于迭代预测的所有预测值都是通过同一个模型计算出来的,因此迭代预测的时间路径比多期直接预测的时间路径稳定。由于多期直接预测在计算不同路径值时要利用不同的模型,因此参数估计的样本误差会增加多期直接预测值序列时间路径的随机波动。

但在某些情况下,直接预测优于迭代预测,一种情况是,当你确定超前一期预测模型的设定形式不正确时,直接预测优于迭代预测。第二种可能使直接预测比迭代预测更好的情况是:当我们使用很多预测变量来进行多变量预测时,由于纳入了所有变量,VAR模型的待估参数太多,从而导致VAR模型不可靠。

单整阶数和DF-GLS单位根检验

本节将围绕随机趋势深入讨论两方面的问题。第一,某些时间序列并不服从随机游走过程,我们对其进行拓展,并介绍此类序列的建模问题。第二,我们将继续讨论单位根检验,并介绍另一种检验单位根的方法:DF-GLS检验。

描述趋势的其他模型及单整阶数

回归随机游走模型,该模型将第t期的趋势设定为第t-1期的趋势加上一个随机误差项。若\(Y_t\)服从带漂移项\(\beta_0\)的随机游走过程,则

\[Y_t = \beta_0 + Y_{t-1} + u_t\]

其中,\(u_t\)是序列不相关的。若某序列服从随机游走过程,则它含有一个单位根。

虽然随机游走模型能够描述很多宏观经济时间序列的长期运动趋势,但有些经济时间序列中的趋势比上式中所描述的更平滑,即从本期到下一期的变化幅度并不大。此时,我们需要另一个模型来描述该趋势。

描述平滑趋势的模型之一是令时间序列变量的一阶差分服从随机游走过程,即

\[\Delta Y_t = \beta_0 + \Delta Y_{t-1} + u_t\]

其中,\(u_t\)是序列不相关的。因此,若\(Y_t\)的变化如上述所描述,则\(\Delta Y_t\)服从随机游走过程,即\(\Delta Y_t - \Delta Y_{t-1}\)是平稳的。一阶差分的差分\(\Delta Y_t - \Delta Y_{t-1}\)称为\(Y_t\)的二阶差分(second difference),记为\(\Delta^2 Y_t = \Delta Y_t - \Delta Y_{t-1}\)。由此可知,若\(Y_t\)变化如上式所描述,则\(Y_t\)是二阶差分平稳的,即序列\(Y_t\)的一阶差分序列含有单位根。

“单整阶数”。可以用新的术语对上述两种情况进行区分。如果一个序列服从随机游走过程,则称其为一阶单整(integrated of order one),记为I(1)。如果一个序列的变化量如上式所描述,则称其为二阶单整(integrated of order two),记为I(2)。不含随机趋势的序列,即为平稳序列,称为零阶单整(integrated of order zero),记为I(0)。

单整阶数(order of integration)是指为使一个序列平稳,需要对其进行差分的次数。

如何检验序列是I(2)还是I(1)。若\(Y_t\)为I(2),则\(\Delta Y_t\)为I(1),故\(\Delta Y_t\)含有单位根。但若\(Y_t\)为I(1),则\(\Delta Y_t\)是平稳的。因此,检验\(\Delta Y_t\)是否具有单位根,其所对应的原假设是\(Y_t\)为I(2),备择假设是\(Y_t\)为I(1)。若拒绝“\(\Delta Y_t\)具有单位根”的假设,则拒绝“\(Y_t\)为I(2)”的假设,即接受“\(Y_t\)为I(1)”的备择假设。

DF-GLS检验

本节继续讨论单位根检验方法。我们首先介绍另一种检验单位根的方法,即DF-GLS检验。

ADF检验是最早用来检验单位根的统计方法,也是实践中最常用的方法。在此之后学者们也相继提出了一些检验单位根的其他方法,这些检验方法的势大多数比ADF检验要高。若某个检验的势比ADF检验高,则当备择假设为真时,该检验更容易拒绝“存在单位根”原假设,而接受“序列是平稳的”备择假设。因此,当检验AR根是单位根或虽然小于1但接近1时,使用势比较高的检验方法是较好的选择。

DF-GLS检验的原假设是“\(Y_t\)服从随机游走过程”(可能存在漂移项),备择假设是“\(Y_t\)是含有线性时间趋势的平稳时间序列”。

DF-GLS检验的计算过程分为以下两步:第一步,利用广义最小二乘法(GLS)估计截距项和趋势项。第二步,利用DF检验方法来检验\(Y_t^d\)是否有单位根,其中DF检验的辅助回归中不含截距项或时间趋势项。

协整

在某些情况下,两个或多个序列具有相同的随机性趋势,我们将这种特殊情况称为协整。协整分析可以揭示出时间序列变量之间的长期均衡关系。

协整与误差修正

如果两个或多个包含随机性趋势的时间序列在长期内相伴而行,则它们包含共同的趋势成分,即它们有共同趋势(common trend)。

当两个或多个序列有共同的随机性趋势时,我们称它们是协整(cointegration)的。本节将介绍一个是否存在协整关系的检验方法,讨论协整变量的回归系数估计问题,并说明如何运用协整关系来进行预测。首先,我们着重讨论只有两个变量\(X_t\)和\(Y_t\)的情形。

协整

假设\(X_t\)和\(Y_t\)都是一阶单整的。若存在系数\(\theta\),\(Y_t - \theta X_t\)为零阶单整,则称\(X_t\)和\(Y_t\)是协整的,称系数\(\theta\)为协整系数(cointegrating coefficient)。

若\(X_t\)和\(Y_t\)协整,则它们具有相同或共同的随机性趋势。通过差分运算\(Y_t - \theta X_t\)能够消除这种共同的随机性趋势。

向量误差修正模型。到目前为止,我们都是通过计算一阶差分\(\Delta Y_t\)来消除I(1)变量\(Y_t\)中的随机趋势;在时间序列回归分析中,用\(\Delta Y_t\)代替\(Y_t\)可避免随机趋势所带来的问题。

事实上,如果\(X_t\)和\(Y_t\)是协整的,则可以将\(X_t\)和\(Y_t\)的一阶差分用于VAR建模,同时对此模型进行拓展,即将\(Y_t - \theta X_t\)作为额外解释变量加入模型,得到:

\[\Delta Y_t = \beta_{10} + \beta_{11} \Delta Y_{t-1} + ... + \beta_{1p} \Delta Y_{t-p} + \gamma_{11} \Delta X_{t-1} + ... + \gamma_{1p} \Delta X_{t-p} + \alpha_1 (Y_{t-1} - \theta X_{t-1}) + u_{1t}\] \[\Delta X_t = \beta_{20} + \beta_{21} \Delta Y_{t-1} + ... + \beta_{2p} \Delta Y_{t-p} + \gamma_{21} \Delta X_{t-1} + ... + \gamma_{2p} \Delta X_{t-p} + \alpha_2 (Y_{t-1} - \theta X_{t-1}) + u_{1t}\]

将\(Y_t - \theta X_t\)项称为误差修正项(error correction term),将上式组成的模型称为向量误差修正模型(vector error correction model,VECM)。在VECM中,\(Y_t - \theta X_t\)的过去值有助于预测\(\Delta Y_t\)和/或\(\)\Delta X_t$$的未来值。

如何判断两个变量是协整的

有三种方法可以确定两个变量是否存在协整关系:(1) 利用专业知识和经济理论; (2) 根据序列图判断是否有共同的随机性趋势; (3) 进行协整检验。

协整系数估计

推广到多个协变量的情形

波动集群性和自回归条件异方差

许多经济时间序列都会出现波动性时大时小的情况,即波动性出现集群现象。本节将介绍两个用于量化波动集群性(又称条件异方差)的模型。

波动集群

时间序列的这种波动性时高时低的特征被称为波动集群性(volatility clustering)。

波动集群性可被视为误差项的方差在时间上的集群:如果某个时期的误差项方差较小,则它在下一期的方差往往也较小。换言之,波动集群性意味着,误差项表现出具有时变特征的异方差性。

自回归条件异方差

前文提到刻画波动集群性的两个模型为自回归条件异方差(autoregressive conditional heteroskedasticity)模型和该模型的推广——广义ARCH模型。

ARCH。考虑ADL(1,1)回归模型

\[Y_t = \beta_0 + \beta_1 Y_{t-1} + \beta_2 X_{t-1} + u_t\]