一、引言
经济周期研究在计量经济学历史上占据着显著的地位。很大程度上,现代宏观经济学和计量经济学正是起源于1930年代由大萧条引发的经济周期波动研究(参见Morgan,1990,Part I)。在过去的70年间,关于经济周期的计量经济研究学术发展卓著,但至2008年国际金融危机为止,宏观计量模型仍未能对经济周期作出成功的预警。当然,失败也成为推动研究继续发展的动力。本文着重考察经济周期研究的计量经济方法在20世纪60年代至90年代,特别是1973年石油危机引发的大衰退驱动下的发展历程,以反思我们应当从历史中汲取的教训。“二战”结束后,关于经济周期研究的综述性文献有很多,包括Gordon(1949),Koopmans(1949),Roose(1952),Hickman(1972),Zarnowitz(1985;1992),Laidler(1992),Jacobs(1998),然而专门从计量经济学发展史角度进行梳理的文献还属空白。
为了便利读者,以下的第二节先对早期有关经济周期的计量经济研究作一概述,然后简述70年代前的相关研究。第三节主要介绍在1973年石油危机引发的全球经济衰退后学界由宏观经济学的理性预期研究所引起的对经济周期的计量模型方法反思的主要研究思路。第四节介绍1980年代由时间序列计量经济学的崛起所带动的对传统NBER经济周期测度方法的逐步规范化(formalisation)过程。第五节集中介绍专为预测经济周期的宏观计量经济模型研究方面的发展问题。第六节是对自60年代以来近30年的发展历史的总结回顾。
二、背景简述
在“二战”之前,有关经济周期的计量经济研究大致分为两派。一派主要源于Slutsky-Frisch的脉冲传播宏观理论模型(参见Frisch,1933;Slutsky,1937;Bjerkholt,2007;Louca,2007)。模型的基本思路是,经济周期是可由数个宏观经济变量(如GDP)的动态过程表出的。而这些变量的动态过程又可由其他若干变量(根据适当经济理论所选取)和随机冲击变量的共同作用来解释。Tinbergen的宏观动态模型,特别是关于美国经济分析的模型(1939),是对这类理论模型实际应用的首创。Tinbergen模型发表后所引起的有关计量经济方法的争论,为促成Haavelmo和Cowles Commission(CC)研究所对计量经济学理论体系的规范化扮演了极为重要的角色(参见Qin,1993)。就经济周期的计量经济研究而言,CC研究所的主要成员Koopmans(1949)曾基于Frisch(1937)的结构模型方法思路,对经济周期波动进行计量建模作了概述。Koopmans所述的方法论,将计量经济学者的主要职责定义在尽量获得由经济学家设定的脉冲传播理论模型中的结构方程参数的最优估计之上。理论模型参数一旦有了数据的最优拟合,模型就可用于对经济周期波动的解释和预测了。随着Haavelmo-CC的计量经济学规范化体系的步入主流,上述经济周期的计量经济模型方法也随之成为主流方法。
有关经济周期计量研究的另一派被通称为NBER派。NBER是美国国家经济研究局的简称,该局在Mitchell的领导下,从1920年代早期开始经济周期波动研究项目,到1940年代中期,已经形成了建立经济周期经验年表的一个相当成熟的过程(参见Burns和Mitchell,1946)①。首先,Burns和Mitchell对经济周期波动下了定义,即经济周期波动是总体经济活动的循环,其基本特征是定期重复出现,但节点、持续时间以及振幅并非周期变化②。基于此定义,他们认为,经济周期波动是不能由少数宏观经济指标直接观测的。这一观点与上述主流派截然不同。因此,要研究经济周期波动,就首先必须建立测度周期的统计体系。NBER的统计体系也通称为经济周期年表。该年表主要由下述几种测度值构成:(1)宏观总周期(aggregate cycles);(2)周期的转折点(turning points),长度,波谷,波峰;(3)周期效应的范围(extent)。GDP或GNP是提取宏观总周期测度最常用的指标。除此之外,还有一种惯例是使用“参考周期”(基准周期,reference cycles)测度,该测度是对一组“特定周期”(specific cycles)的某种平均指标,而这些特定周期都来自于特定即微观经济活动或部门的时间序列,这些序列中滤出了季节特征和可能存在的不规则趋势。周期的刻画是通过对转折点、波谷和波峰的定期来完成的。由于分析中涉及大量微观经济序列,因此需要建立扩散指数(diffusion indices)作为周期扩展性(extensiveness)的指标。指数是基于时间序列中上升指标和下降指标的比例而定。为达到预测目的,还要分析特定周期指标的相位差来识别“前导和滞后”序列(同上,第4章)。
Koopmans(1947)在对Burns和Mitchell(1946)作书评时批评NBER研究方法为“缺乏理论的测度”,这一论点受到了Vining的反击,他并不认同CC方法,认为该方法过于狭隘而无法寻求任何新的理论扩展和假设,这一争论也体现出CC和NBER在方法论上存在着显著差异。然而,随着CC方法成为计量经济学研究的主流方法,经济周期的计量经济研究在20世纪50年代至60年代大都采用联立方程组模型(SEM)形式,而且模型背后的宏观理论以比较静态经济理论居多。
同期,NBER的经济周期波动研究也在持续。其研究项目中,有一项对今后的计量经济学研究影响深远。这就是在1950年代末期,Morgenstern在普林斯顿大学的计量经济学研究项目下,对经济周期波动如何通过金融市场向全球传播的考察。Morgenstern(1959)使用NBER步骤分析了大量法国、德国、英国和美国的金融时间序列,区间为金本位时代(1870-1914)以及两次世界大战之间(1925-1938),数据频率大多为月度,Morgenstern特别关注跨境金融序列之间,以及各国家金融序列周期性波动与参考经济周期之间的协同变动关系(co-movement)(协方差)。他还用数据来检验了利率平价等理论,检验结果显示出数据和理论之间存在着相当大的差距。Morgenstern于是认为,就经济周期的国际传播问题而言,理论研究和计量经济学研究都需要在方法论上改进。理论应从“均衡”和“静态”的理念转向对市场参与者之间的博弈和策略的注重;计量经济学则需要引入“更为深入”的数据统计分析方法。
这种“更为深入”的数据统计分析方法看来就是谱分析(spectral analysis)③。根据自己对经济周期的研究经验,Morgenstern(1961)认为,Wald(1936)将经济时间序列分解为趋势、循环、季节和随机波动四种要素的研究方
法,要比Slutsky-Frisch的理论思路更有发展前景。为了加强这方面的计量研究,Morgenstern把Granger招入他的研究队伍。他们的最初合作是通过交叉谱分析对纽约周股票价格序列的考察(参见Granger和Morgenstern,1963)。该论文的主要结果是,股票价格序列中的“经济周期”因子不显著,表明股票价格对宏观经济周期波动的预警作用很弱,这对NBER传统方法得出的存在股票市场“特定周期”这一结论产生了质疑。然而,Granger的另一项利用交叉谱分析的应用研究结果要确证得多。这项研究对一系列NBER经济周期指标作了交叉谱分析,分析识别出的周期成分和使用NBER传统方法得到的大体相符,尽管平均的领先或滞后长度要显著长于由NBER方法得出的结果(参见Granger和Hatanaka,1964,Chapter 12)。
有趣的是,上述利用时间序列方法的探索性工作被Wold(1967)批评为“缺乏理论的经验主义”。Wold的主要理由是,谱分析采用的非参数方法不适合计量经济结构建模的参数估计要求。就经济周期波动而言,显然很难将使用谱分析单一方法识别出的周期等同于经济学家所认定的经济周期。然而,Granger(1969)相继提出的因果检验概念,使得Wold批评失去了意义。建立在一个二元VAR模型反馈机制基础上的Granger因果检验,也采用了谱分析法。而Granger采用的模型则被证明是与Wold的因果链建模方法在本质上等价的(参见Sims,1972)。Granger因果检验在计量经济学界影响极大,它标志着经济周期的计量研究进入一个新的时代——将时间序列工具融入结构计量经济建模方法中去(参见Granger和Newbold,1977)。
三、理论前导的时间序列改革
如前所述,主流计量经济学把宏观计量经济结构模型作为分析经济周期的主要工具。因此,要考察特定宏观计量经济模型对分析经济周期的适用性,就需要注重考察模型的动态性。最早进行这方面研究工作的是Adelman和Adelman(1959),他们利用动态模拟方法,对Klein所建的宏观计量经济模型之动态性能做了全面考察。1969年,NBER在哈佛大学主办了一次对宏观计量经济模型之动态性进行大规模考察的研讨会。被考察的模型包括Wharton模型和Brookings模型,参见Hickman(1972)④。大多数模型是在Slutsky-Frisch框架下建立的。有趣的是,从不同的模拟方法得出的结果中,引出了对经济周期来源问题的激烈争执。不少动态模拟的结果表明,对模型施加纯粹的随机冲击并不会生成被解释变量的周期波动。而这种周期波动要么来自对外生变量的某种假定扰动,要么来自对误差项的自相关性假定。这意味着结构模型本身不具有产生经济周期的性能。然而,由于被检验模拟的模型设定不可避免会存在失误,尤其是那些假定含有自回归误差项的模型,使得与会的经济学家们无法排除经济周期本来应是来源于结构模型内部的可能性,即正确设定的理论模型本身应是具有动态周期性的。
的确,从1960年代中期开始,宏观经济的研究便日益走向对包含动态周期性的理论模型的研究。其中的一类以包含预期变量的模型备受学界的青睐。该方面的研究最早始于Friedman和Phelps,随后由Lucas等人对其进行了扩展。其扩展的要点是在短期工资与价格间的短期非均衡动态关系上加入预期变量,如此被扩展的模型便具有生成经济周期的性能。于是,预期行为便成了经济周期的产生之源。1970年代相继兴起的理性预期理论,大大促进了宏观计量经济建模从比较静态均衡转向动态建模的研究。从理性预期理论的倡导者的角度来看,宏观计量经济模型在预测1970年代早期由石油冲击导致的经济危机时的不佳表现,是缺乏充分动态的结构模型所致(参见Lucas和Sargent,1978)。相应地,关于经济周期波动的计量经济学研究在1970年代后期逐渐分化为两种技术流派——一种试图降低对先验结构模型的依赖,而另一种则主张尽量减少计量估计,更多依赖于对理论模型的模拟。
第一种流派的最早起源是Sargent和Sims的一项合作的题为“经济周期建模不需要过多先验理论”的研究论文(1977)。日后计量经济学中的VAR(向量自回归)学派便是由这篇论文首出的⑤。Sargent和Sims(1977)主张通过适应“NBER型数量经济周期波动分析”来革新主流计量经济方法。他们首先通过对所关注问题建立“不可观测指标模型”,来检验NBER识别参考周期的方法。他们选择了14个1949-1971年样本期时间序列季度宏观指标,对它们做了消除趋势的处理⑥,然后使用因子分析方法从这14个变量中提取一个共因子,将其定义为这14个变量集的“参考周期”指标。Sargent和Sims随后考察了该指标对这14个变量动态共性的代表性,发现其代表性比预期的程度低得多。他们因此认为,NBER对经济周期波动所进行的“参考周期”测度方法存在不足。他们于是转向“可观测指标模型”方法,即对宏观变量进行建模的主流计量经济方法。这里,Sargent和Sims提议使用一般动态模型,即VAR,来代替传统使用的先验给定的结构模型。他们在文中建立了一个五变量VAR模型来模拟美国的经济周期⑦。为确定周期性变动的起源,他们采用Granger因果检验来识别交叉变量的顺序(先导和滞后)依存性;为计算随机冲击的影响大小,他们使用脉冲分析来模拟由结构化冲击引起的短期动态行为。这两种技术迅速成为VAR学派的支柱⑧。
然而,VAR学派的创立引致了多种怀疑和批评,这些质疑主要是批评VAR模型缺乏坚实的理论依据。相对而言,更具有理论依据的一种学派是实际经济周期(RBC)建模方法,该方法最早由Kydland和Prescott(1982)提出。他们不同意货币学派将货币扰动作为经济周期波动的来源的观点,建立了一个经济周期来源于技术冲击的模型(即一个冲击因素为“实际”因素而非名义因素)。在Kydland和Prescott的模型中,经济周期的特征被假定体现在实际产出(GDP)的自相关性及其与其他宏观变量(如总消费和固定投资)之间的协方差上。从方法上来说,他们选择在一般均衡系统下建立模型,且依据“可计算的一般均衡”(CGE)建模方法来标定结构参数。不同于现有的CGE模型,RBC模型所关注的是经济周期的动态随机传播路径,这类模型为CGE方法扩充了一个新的分支——动态随机一般均衡(DSGE)模型⑨。在RBC模型方法中,模型参数全是标定的,而
不是估计的,因此计量学方法用得极少。唯一用到计量学的地方是对单变量的简单时间序列特征的测度,例如Kydland-Prescott模型中实际产出的样本标准差,这些简单的统计量为调整模型模拟出的实际产出之动态特性提供了参考。
从DSGE学派的角度来看,计量经济学的作用就是为单变量提供时间序列属性方面的信息,这些属性是他们调测RBC模型模拟结果的目标和依据。也就是说,他们建模的目标是使模型模拟出的变量具有类同的属性。例如,Long和Plosser(1983)假设了一个多部门的RBC模型,此模型设定在标准经济理论上,并加设了生产者及消费者的随机行为,以实现通过部门冲击而产生经济周期的目的。根据计量学时间序列分析得出,产出变量具有显著自相关的属性,而且还与各部门产出之间具有较强的协同性。这两种属性便成为他们调测模型模拟结果的目标。更具体地,他们的模型模拟目标是包括农业、制造业和服务业在内六个部门的产出,即使这些模拟的产出变量尽量接近于其实际数据的时间序列特性。King和Plosser(1984)扩展了这一模型,允许包含货币和银行系统,以说明货币、通货膨胀与实际经济行为之间显著的协同性。他们所参照的变量属性是从对总产出增长值与货币和名义变量增长率之间的动态及静态回归估计中得出来的⑩。
从NBER的经济周期分析法的角度来看,DSGE方法继承了NBER法注重对微观部门对经济冲击作用分析的传统,并将这种部门分析进一步规范化。但是,DSGE方法采用参数校准法替代计量经济的估计法,从而摒弃了有关的模型检验准则。尽管Kydland和Prescott(1991)指责CC结构计量模型法对分析经济周期的无效,但是DSGE方法并没有完全否定计量经济学的作用。计量经济学至少在两方面是不可或缺的:一方面,现有计量经济研究中的参数估计结果,特别是在微观和部门方面模型的参数估计结果,这些结果是DSGE参数校准的基本参照信息。因此,其参数校准法本质上可以被看做一种估计法(参见Gregory和Smith,1990)。另一方面,使用计量经济法考察经济变量的时间序列特征,以此为标准来评价DSGE模型的现实拟合性。这一评价过程可以被规范化为一个统计检验的过程(参见Watson,1993),这反过来也大大促进了时间序列计量法的普及程度。
四、经济周期测度的时间序列规范化
1980年代是在经济周期测度中引入时间序列计量法的年代。在这一时期,经济变量的非平稳特征尤其受到了学界的广泛关注,特别是这种非平稳特征与那些表现出显著趋势性的变量关系密切。此前被大家普遍接受的观点是,趋势和周期是经济时间序列中两个相互独立的组成部分。尽管Burns-Mitchell的传统法中并未明确要求在测定特定周期时需要滤出有关指标的时间趋势成分,但他们并未忽略在识别周期成分前滤出长期趋势的好处,只是因为人力资源的局限而未能实现(1946)。另外,正如Romer(1994)所指出的,Mitchell在他1927年以前的早期工作中为美国经济周期定期时,使用的经济活动指标实际是已经去除了趋势的指标。
在NBER的研究历程中,首次对趋势滤波做明确要求和定义的是研究员Mintz(1969)。Mintz最初的研究项目是采用Burns-Mitchell法,为德国经济周期进行测定。由于所使用的时间序列指标含有高度趋势性,她的研究陷入了困境。这促使她引入趋势滤波法。具体地,她考察了两种方法,一种定义长期趋势为75个月(6-7年)时序指标的移动平均,并将经济周期设为围绕这一长期趋势上下摆动的曲线。她将这样设定的周期测度定义为“离差周期”(deviation cycles)。Mintz考察的另一种方法是直接采用(月度)增长率指标作为周期滤波的基础指标,并且定义这样取得的周期测度为“阶梯周期”(step cycles)。她发现,增长率数据指标呈现“高度锯齿状”,很难直接通过这种数据的峰和谷来“界定周期阶段”,因此从增长率指标提取阶梯周期十分困难,需要引入更多的复杂准则。于是,Mintz最终仅使用了离差周期作为选取德国经济周期测度的基础。此后,人们通常把基于未经趋势滤波的水平数据序列指标建立的周期测度称为“古典周期”(classical cycles),而把基于已经趋势滤波的数据序列指标所获得的周期测度称为“增长周期”(growth cycles)(11)。
Mintz的滤波研究再次表明经济周期测定方法与基础指标的趋势成分之分离法之间的密切相关关系。但在80年代之前,通用的趋势分离法始终停留在经验总结的层次上。Beveridge和Nelson(1981)是首先将趋势滤波与时序的非平稳性概念联系在一起的,从而将时间趋势规范地定义在统计学的基础之上。本质上,Beveridge-Nelson趋势滤波假定,所有用于测定经济周期的经济指标都是非平稳随机过程。由于非平稳(严格说法为“单整”)过程可以被分解为一个随机非平稳趋势和一个平稳过程两部分,Beveridge和Nelson主张将前者定义为所涉指标中的趋势成分,而采用对该趋势滤波后的平稳过程作为测定经济周期的基础指标。为了说服读者,他们将上述趋势滤波法与Friedman(1957)的经典分解法联系到一起(Friedman将收入分解为永久部分和瞬时部分的方法)。然而从方法论来看,Beveridge和Nelson的分解法是完全定义在统计学基础之上的,并不含任何经济学尺度。从技术上来讲,Beveridge-Nelson滤波法是定义在一个单变量I(1)(一阶单整)时序模型上的,即ARIMA(自回归单整移动平均)模型。
尽管学界对于如何最佳地为非平稳变量进行趋势滤波的争论仍未休止,但这一讨论使得大多数建模者在研究经济周期主动避免直接使用那些可能含非平稳性的时序指标。这样做的结果是,许多建模者都直接采用增长率数据指标,作为一个确保变量平稳性的捷径。这种做法通用于VAR模型,并且广泛用于识别经济周期转折点的建模方法研究中(见下文)。于是,“增长周期”逐渐成为测定周期的主要概念,Mintz对于“离差周期”和“阶梯周期”的区别讨论已被遗忘。甚至,一些研究者还将“阶梯周期”和“离差周期”的概念混淆在一起,错误地认为前者是对后者从某种程度上的简化(13)。
显然,在使用NBER测定周期方法来识别周期转折点时,首先需要确定特定周期的测度。因为转折点不过是这些特定周期曲线上的波峰和波谷点。具体的定点方法则涉及某些特定的&ldquo
;审查准则”,例如转折点的跨度应是中期的而不是短期的,而且其波动的振幅应足够大,与拐点相关的因素应有经济判断的支持,等等(14)。宏观经济的总转折点可以定义在微观特定部门的转折点之某种加权之上(Mintz,1969),也可以定义在宏观总参考周期曲线之上(Bry和Boschan,1971)。NBER方法中很重要的一个步骤是对从微观特定部门的周期曲线得出的转折点与从宏观总参考周期曲线得出的转折点进行比较。这种比较不仅可有助研究者对微观特定部门分类,即根据它们周期曲线拐点的时间差异将它们分为前导、同步和滞后三类。这样,研究者不但可以利用前导部门或滞后部门的有关时序信息对经济周期的走势做事前预测,同时也可以通过对这些微观拐点的事后预测来确认其对宏观总周期转折点之测度的准确性。若验证失败,则需要对宏观总转折点的测度进行修正,这种修正无疑使整个经济周期的测定过程成为了一项重复迭代的复杂过程(参见Klein和Moore,1985,pp.7-8)。
然而,对这一复杂过程利用计量学时序方法进行规范化的研究,却过窄注重于对周期拐点自动识别之上。从数理统计学的角度来看,NBER的拐点识别法由于缺乏概率论基础而不具统计学上的严密性。例如,Wecker(1979)指出,NBER的拐点测定过程是无法由统计模型来表述和规范化的。为了利用统计模型来预测经济周期的转折点,Neftci(1982)提出在单一时序模型中采用离散状态Markov过程设定形式。他以失业率为例,采用这种模型对失业率时序中周期成分的转折点做了模拟和预测(15)。
但是,这种解释加深了定义在时序概念上的“结构”与传统计量经济学定义在经济理论上的结构模型之间的鸿沟,前者是从形如方程(3)中的单一时序分解式的参数之时变性表出的,而后者所体现的参数却表现了多元经济变量之间的相互依存关系。此外,Hamilton模型大都被用于增长率时序变量上,而不是据NBER传统定义测定的周期序列上。增长率类的时序变量,特别是那些频率高于年度的增长率,其主含的动态信息是短期信息,而原水平变量中的长期信息和测度经济周期所集中关注的中期信息大都已被差分掉了。
随着建筑在统计时序模型法之上的经济周期的新测度技术和方法的推出,一个新的问题产生了:我们应该如何评价这些新技术和方法?这些新技术和方法的发明者的通常做法是,取一已有由NBER传统方法得出的周期测度作其发明技术的应用案例,通过验证按其技术所得测度与传统测定的近似来证明其发明的可靠性和优越性。这种做法实质上把由NBER传统方法得出的周期测度设定为唯一公认的准确测度,并且把如何最佳地拟合NBER的测度作为其发明的目的。但是,并不存在一种唯一的由官方公布的经济周期测度。任何新技术要想获得更有力的认可,就需要证明它们具有能超出NBER的测度,更准确及时地预测出主要宏观经济变量的未来周期动态走向的能力。
五、时序建模方法对经济周期的预测
判断经济衰退即将到来的一个通用标准是实际GNP或GDP连续两个季度的下滑。上节介绍的Neftci-Hamilton模型方法,为预测这一事件的发生及其概率提供了一简明的手段。然而,从不少事前预测结果来看,Neftci-Hamilton模型在预测GNP连续下滑事件上并不一定显著优于简单的自回归时序模型(参见Goodwin,1995)。为了预测目的而发明的基于统计学时序法上的模型多种多样,复杂程度各异,例如通过前导指示变量以及为预测值设定贝叶斯损失函数来扩展的自回归系统模型(参见Zellner et al.,1990),但是它们对经济衰退的预警效果都欠佳。
不少应用建模者认为,单变量时序模型是无法捕获到经济变量之间相互依存的信息的。一旦将经济周期的预测建立在多变量时序模型基础上,VAR模型便成为显而易见的首用方法。在采用VAR模型做定期宏观预测方面,位于明尼阿波利斯市的美国联邦储备银行属于开拓先驱,他们利用Doan(1984)开发的时变参数(time-varying parameter)以及贝叶斯VAR(BVAR)技术,建立了一个含46-方程的美国月度预测模型(参见Qin,2011)。同时为研究需要,该模型的主要建模者Litterman还做了一个含6-变量的季度BVAR模型(参见Litterman,1986)。他后来将该模型扩展至9个变量(16),试图增加模型对通货膨胀的预测能力。该模型后由Sims接管并做后续研究。为了增强模型对经济衰退的预测能力,Sims决定为BVAR技术附加更多的概率假设,如对含趋势的时序变量参数引入了均值非平稳的先验设定(nonstationary mean priors),并大幅放宽对于残差的传统假设——允许残差是条件异方差且是非正态分布的(1993)(17)。尽管如此,他所修订的模型仍未能成功预测到1990-1991年美国GNP增长率衰退的拐点。从模型的整体预测结果来看,其预测路径与实际的数据序列十分接近,但稍稍滞后于实际序列的走向,对模型的事后预测检验也未发现模型有明显误设的迹象(18)。
在80年代末期,Stock和Watson为多变量经济模型预测做了一个更具探索性的方法研究。他们从Sargent和Sims(1977)的论文中重新拾起因子分析法,试图用以重新表述NBER的“参考周期”测度,以使NBER的测度建立在具有概率模型尺度的基础上。Stock和Watson主张通过一个动态因子模型(DFM),从NBER的变量列表中滤出一个单一同步指标,作为替代NBER同步指标测度的新型同步指标(1989)(19)。他们和Hamilton一样,为避免时序中可能存在的非平稳趋势,对趋势序列采用了一阶差分处理。一个简单的DFM模型为如下形式:
实际上,Watson对冲击因素的重要性已早有意识。他和Blanchard(1986)共同完成的一项早期研究的主题,就是专门剖析冲击因素的统计性质的。这项合作研究发现,经济周期的来源可能是若干大小冲击的混合,而不是像Slutsky-Frisch脉冲传播模型所设的纯粹由来于小冲击。此外,冲击因素可能来自于财政或货币方面,也可能来自于实际部门的需求及供给方面。这一经济周期来源多头的发现促使Watson和Stock联手开发DFM方法。然而,他们1989年采用DFM方法的预测实验结果的不尽如人意,使得很多建模者对DFM方法持怀疑态度,特别是那些坚信经济理论结构模型方法的建模者。因为动态因子模型缺乏任何经济理论支撑。与此同时,时序建模研究者却在继续扩展和拓深其建模技术手段,例如将DFM和体制转换模型合并,使用概率模型来对所关注的转折点进行概率预测。另
外,那些由传统经济结构模型方法训练出来的建模者则努力试图开发动态性能更加强健的结构模型,力图使模型在现实经济呈现体制转换现象时仍保持良好功能。在这类研究中,最为著名的当属误差修正式模型了,该模型往往包含着长期协整关系,并扩展对经济衰退转折点的起源的解释,即其起源可能是由变量间的长期协整关系发生某种变动,而不仅仅是短期的冲击因素。但是,对于那些坚信理论的建模者,上述计量模型的理论说服力仍不够强。他们往往偏爱于更大规模的DSGE模型,认为这样的模型定能更好地描述来自于不同微观部门的冲击,并对整体经济系统的运作有理论清晰的概括,因此应能对经济周期做出较好的预测。于是,1990年代成为各种经济周期建模研究方法蓬勃发展的时代。尽管研究方法多种多样,且模型在内部一致性、技术复杂性以及尽量减少经验判断等方面取得了很大进展,然而,对经济衰退到来的及时预警目标仍显得遥不可及。
六、历史的反思
在两次世界大战后的40多年中,经济周期的计量经济研究经历了一个由Haavelmo-CC模式向其他模式扩展延伸的过程。建模者的注意力已从联立方程组结构模型转移到时序动态模型,从估计结构参数转移到研究动态模型模拟的冲击效应,以及发明更为严谨的统计测度来刻画经济周期现象,从关注理想经济中的长期动态均衡趋势转移到关注现实经济短期及中期非均衡的周期运动。另外,用于刻画周期的模型种类也扩展不少,既有传统的结构模型,又有以探索数据特征为主的动态因子模型,还有主体基于先验理论的实际经济周期模型。以Haavelmo-CC模式为主导模式的时代已经结束了。
然而仔细反思历史却不难发现,Haavelmo-CC模式从方法论的角度看并未过时,它在时序统计学方法的催化下,对NBER的传统研究方法进行了全面渗透,使NBER的经济周期测度与Haavelmo-CC计量法在技术上逐步融合。可以说,过去几十年的经济周期之计量经济研究主要集中在对NBER经验测度和步骤的不断模型化和规范化上,研究的主旨是对NBER经验测度和步骤的科学化,即按Haavelmo-CC计量法的原则,把这些测度和步骤建立在概率基础上,使内涵的一致严谨性最大化,外在的人为判断成分最小化。同时,这一科学化过程还伴随着一个研究课题的分割、细划和微缩的过程。例如,周期的测度是否应基于含趋势的时序指标还是经趋势滤波后的指标,周期的测度是否应呈现上下波动的非对称性,引发周期的冲击因素的规模应该是小还是大,应该是纯随机无常的还是具有自回归性的,是来自于实际经济部门还是货币部门,等等。当年Burns-Mitchell那种对经济周期各个方面做广泛和综合的考察分析方法早已被大多数学者遗弃。
计量经济研究对NBER经验测度和步骤的规范化无疑使经济周期的各种测度之科学性大大增强了,以往CC与NBER阵营的方法论之争也基本被遗忘。计量经济研究也从注重为先验理论模型附加数据方面的经验内容,扩展至探索数据特征和发明新的测度方法。这方面扩展程度之大以至于在学界引出了一轮计量经济模型法与DSGE阵营新的方法论之争,整个计量经济学方法在争论中被批判为“缺乏理论的测度”。
然而若从应用的角度来看,尤其是从事前对经济衰退到来的预警结果来看,计量经济研究对传统经验测度和步骤的规范化的意义便黯然失色了。最近的一次金融危机以及随后的经济衰退几乎未被任何计量模型的预警系统探测到。这意味着,学者们信奉和尽力追求的科学规范化所导致的研究效率显著偏离最佳的研究路径。其实,当一些计量经济学理论研究者执著追求将所有周期测度的估算模型化、自动化时,就不断有实证结果出现,表明不基于模型的人为判断在进行经济预测时扮演着不可或缺的角色,参见Turner(1990)和Clement(1995)。而且,把一组来自各方的预测做简单的平均,其预测精度往往会优于基于某种特定建模方法而得到的独立预测,参见Stock和Watson(1999)。这些事实提醒我们,任何模型,无论其数理统计基础如何严谨,在应用上都存在缺陷和不足;计量经济方法在用于分析和预测经济周期时表现出的局限性主要源于该方法受到的统计学局限。
具有讽刺意味的是,上述局限性在历史上不断有学者指出,而不断被主流学界忽略。对经济预测的可能性最早提出质疑的要数Morgenstern,他在1928年发表的《论经济预测方法论》一书要比Slutsky-Frisch模型体系的生成还早(20)。“二战”后,Wright发表了对CC方法和NBER方法的严重质疑,“我不相信任何一种计量模型或者任何数学公式,可以满足在任意时间段作出令人信服的经济预测。现实中总要出现新的社会元素”(1951;p.147)。在这之前不久,Gordon(1949)将CC和NBER两种方法归类于“统计方法”,把它与“历史方法”区分开来。他所指的历史方法是那些专注于使用所有类型的相关信息来解释特定的周期的研究。他认为,未来更有希望的研究方向是统计和历史两种方法融合的“数量-历史”方法,另请参见Roose(1952)。Burns在做了多年关于经济周期波动的统计研究后总结道,“无论是从理论上还是实践上,识别出经济组织的变化,以及那些使得每一个经济周期都成为独一无二事件的偶发随机因素都是至关重要的。对于经济变化的精湛理解往往来源于对历史和重大事件的熟知,而仅仅依靠统计数据和对数据的加工分析来的信息是远远不够的”(1969,p.85)。20年后,Zarnowitz对此问题再次重申,“不同时期的经济周期不可能是相同的,因为它们要受到历史变化以及经济结构和制度的影响。那么,试图将经济周期设定为单纯由某一类随机冲击生成的副产品的模型化企图,其失败也就不足为奇了”(1992,p.17)。
回顾历史,计量经济学对经济周期研究的规范化过程中,主要忽略掉的因素就是不同周期所具有的独特社会历史背景。Haavelmo-CC方法与NBER方法的融合使得“统计方法”更加远离“历史方法”。对科学方法优越性的广泛认同,使计量经济学界变为一个极力推崇数学严谨性和内部一致性的学界。通常,研究主题的选择以及研究的创新都以保证方法的严谨性为基本目标和准则,以至于对经济周期本身的研究已逐步退化为展示新技术和方法的应用案例了。从这个角度来看,概率模型化已使经济周期研究陷入盲目追求方法而忽略结果的
境地(21)。这类研究在现实中对解释和预测经济周期没有做出任何突破也就不足为奇了。
另一方面,科学的历史告诉我们,只有当一个现有研究体系中的所有道路都难以为继,一种新的研究体系才可能会产生。当经济周期的模型化和规范化的研究已远远超出现实中对与经济周期有关的大量多元因素综合分析预测的需要时,研究者们才可能会调整他们对于历史方法的长期忽视,意识到经济周期研究所需要的“艺术”一面的重要性。
本文基于作者“The Reformation of Econometrics:A Historical Perspective”书中的一章,该书正在创作过程中。
注释:
①此经典研究对法国、德国、英国、美国四个国家的1277个不同样本区间的独立时间序列进行特定周期分析频率包括月度、季度、年度。他们的早期工作给出了从经济周期中分解先导指示器的方法。(Mitchell和Burns,1938)
②NBER的完整定义的原文为:"Business cycles are a type of fluctuation found in the aggregate activity of nations that organize their work mainly in business enterprises: a cycle consists of expansions occurring at about the same time in many economic activities, followed by similarly general recessions, contractions, and revivals which merge into the expansion phase of the next cycles; this sequence of changes is recurrent but not periodic; in duration business cycles vary from more than one year or twelve years; they are not divisible into shorter cycles of similar character with amplitudes approximating their own."(Burns and Mitchell,1946,p. 3)
③在若干历史考察文献中,谱分析方法是von Neumann向Morgenstern介绍的(参见Cargill,1974;Phillips,1997)。
④关于此类模型的说明详见Bodkin,et al.(1991;PartⅡ)。
⑤有关计量经济学中VAR学派的历史,参见Qin(2011)。
⑥他们也对一些可供使用的月度序列进行了检验。
⑦变量包括:货币、失业率、价格和工资,以及由用来近似需求压力的耐用商品货运未交付订单。
⑧进一步的研究还包括Sims(1981;1983)对于货币经济周期的探索性工作。
⑨关于参数校准的争论主要围绕模型结构参数的可识别性。当结构模型越来越微观细化,越来越多的参数就不可识别,参见Mitra-Kahn(2008)对于CGE模型历史的介绍。
⑩Kydland和Prescott利用此估计来确定他们模拟的实际产出值的大小。
(11)Mintz(1969)在定义周期测度时引用了R. A. Gordon在参加1967年伦敦的一次会议上时的发言,该发言中将经济周期描述为围绕产出和就业的增长率上下波动的曲线,并称此周期为“增长周期”。
(13)例如,Klein和Moore(1985)将Mintz 1969年所做的工作视为从古典周期转向增长周期在方法上的转折点,而未提及“离差周期”和“阶梯周期”。
(14)参见Harding和Pagan(2002)对NBER方法的摘要。
(15)Neftci(1984)还尝试了用同样的模型设定来识别单一宏观变量的周期波动之非对称性。
(16)最初的六个变量为:实际GNP,GNP价格平减指数,实际商业固定投资,3月期国库券利率,失业率,货币供给;后增加的三个变量为:汇率,SP500股票价格指数,大宗商品价格指标。
(17)本文在1991年5月举行的NBER会议上演示。
(18)值得注意的是,通用的模型之事后预测检验是基于建模误差平均之上的,这类预测检验是无法鉴别模型对预测拐点能力的优劣的,参见Fair(1984)。
(19)这里应用了四个变量:工业生产增长率,个人收入,就业,生产及贸易销售。
(20)对此书的评述请参见Marget(1929)。
(21)更多内容参见Swann(2006),该书批评了在应用经济学中将计量经济分析作为“万能工具”的倾向。