这期推送简单谈一下我本人 对经济学实证论文写作排除干扰性因素、机制检验和异质性分析的一些不甚成熟的理解 。
论文的实证部分一般要回答两个问题,一是 核心解释变量 x 是否影响被解释变量 y ,二是 具体的影响机制,即 x 如何影响 y 。
为了回答第一个问题,论文在基准回归之后一般会设计一系列的识别条件检验和稳健性检验,包括对模型的特定假设进行检验(如 DID 的平行趋势检验),对模型可能存在的因果推断问题(内生性)进行讨论、检验和缓解,排除可能影响研究结论的其他干扰性因素,对 x 影响 y 的预期效应和滞后效应进行讨论等一系列的稳健性检验。某些情况下,对基准回归结果的识别条件检验和稳健性检验甚至需要占据实证部分篇幅的一半以上。
如此大费周章的原因或者说目的在于,一方面,回答好 x 是否影响 y 这个问题是进一步分析影响机制的基础,因此确保 x 对 y 的影响稳健可信是实证设计的基本要求;另一方面,我们要赶在读者或审稿人提出“灵魂拷问”之前把论文中可能存在的或大或小的问题都给考虑到,想读者之想,思审稿人之思,虽然不管我们怎么绞尽脑汁去发现和填补这些漏洞,审稿人总是能够提出一些“奇奇怪怪”的问题,但前期做足工作可以把这些问题被问到的可能性降到最低。
对第二个问题进行回答可以增加论文的科学性、故事性和丰满度。 x 对 y 存在一定的影响,并且这种影响是稳健的,在此基础上我们还想知道 x 对 y 的影响究竟是通过什么渠道实现的,即探讨“存在性”背后的“过程性”。对客观影响机制的探讨本质上就是对现实经济运行规律的一种总结与提炼,体现了社会科学研究的“科学”之所在。
如果怀疑变量 m 是 x 对 y 作用背后的机制,那么论文的理论分析部分就要对这一机制的基本逻辑进行较为清晰的分析说明,然后在实证部分对这一机制进行检验。机制检验没有一个固定的范式,一般需要结合论文的研究内容、理论、模型,甚至是所使用的数据进行设计,但是 经济学研究的机制检验应尽量避免使用中介效应模型 ,原因在于(引自 我在知乎的回答 ):
相比于管理学、心理学等学科领域,经济学更强调变量之间因果关系的推断,而恰恰由于中介效应模型没有考虑到中介变量可能存在的内生性,因此该模型可能符合管理学的研究范式,但不符合经济学研究范式。
中介效应模型可能存在的内生性在于:
参考连玉君老师的回答,中介效应模型存在的一个比较现实的问题是:我们大多数都是在和一个内生变量作斗争,而中介效应要求我们不仅要克服 的内生性问题还要克服 的内生性问题,着实有些苛刻。
排除干扰性因素是实证论文稳健性检验部分的基本步骤之一。
如, 陈登科(2020) 在研究中国加入WTO后贸易壁垒下降是否带来环境污染的改善时,怀疑加入WTO同时期中国实施的其他政策,特别是国有企业改制政策与鼓励外资进入政策,以及环境规制政策(如两控区、“十一五”污染控制政策)可能对结果造成潜在干扰。为排除这些干扰性因素,作者在回归方程中进一步加入国有经济比重与外贸经济比重来控制前两项政策的影响;对于环境规制政策,作者认为中国的环境规制政策大多是以行政区划为单位来实施的,因此在回归模型中进一步加入地区-年份固定效应来控制环境规制政策对结果的潜在影响。
如, 江静琳等(2018) 在研究农村成长经历对家庭股票市场参与的影响时,认为影响人类行为的因素十分复杂,因此怀疑农村成长经历对股票市场参与的作用可能受到社会互动、信任水平、金融知识、家庭社会经济地位和风险态度等因素的干扰。为了排除掉这些因素,作者做了一系列的稳健性检验,包括(以社会互动为例):
再如, 陆菁等(2021) 在研究绿色信贷政策的微观效应时,怀疑2008年国际金融危机以及同时期的环境规制政策(如清洁生产标准、“十一五”污染控制政策、区域限批政策等)可能对研究结论构成潜在干扰。对于前者,作者在基准模型的基础上额外控制了代表企业投融资需求的两个代理变量;对于后者,作者引入了若干虚拟变量并剔除了相关样本(具体请看原文)。
借鉴以上三篇文献,下面简单梳理一下排除干扰性因素的逻辑与实证思路。
由于被解释变量 y 的影响因素众多,基准模型中的控制变量也仅仅是根据一般常识与理论(即已有文献的做法)引入的,如果怀疑某个不同寻常的意外因素 z 对 y 存在一定程度的影响,即直觉上认为 z 是 y 的不可忽视的重要影响因素,并且在考虑 z 的情况下 x 对 y 的作用可能改变,那么为了检验结论的稳健性,可以把 z 当作控制变量引入基准模型中,如果核心解释变量 x 的系数与基准回归结果大体保持一致,就说明排除了 z 对研究结论的干扰。
此外,还可以使用反证法,即假设 z 对研究结论确实构成不可忽视的干扰,那么就存在如下推论:随着 z 的取值变化, x 对 y 的影响存在异质性,而我们的检验逻辑就是证明该推论不成立。为了证明这个推论不成立,有以下两种实证思路:一是按照 z 的取值大小对样本进行分组,进行分组检验,如果在不同分组下 x 的系数基本不变且与基准回归结果大体保持一致,就说明该推论不成立;二是使用调节效应模型,调节项为 x 与 z 的交互项,且两个单独项不可忽视,如果调节效应模型中的交互项不显著(单独项 x 是否与基准回归结果保持一致,甚至 x 显著与否都不重要,因为在调节模型中 x 的系数含义不同),就说明该推论不成立。
机制检验没有统一范式,一般根据研究内容而定,以佐证论文所讲的故事,比较常用的实证设计包括(引自我在知乎的回答):
戴鹏毅等(2021) 在研究“沪股通”对企业全要素生产率的作用机制时,认为提高股价信息含量和信息传递效率、矫正股票错误定价和改善信息披露质量是沪股通提升企业TFP的主要机制。在机制检验部分,首先实证检验了“沪股通”开通对这几个机制变量的影响,然后利用已有的权威文献在理论上讨论机制变量对企业全要素生产率的作用。
陈登科(2020)的机制检验思路与之类似,但在逻辑上与其自身的研究内容紧密联系。贸易自由化显著降低了企业 的排放强度,而 的排放强度等于 排放量除以工业总产值,为了讨论企业 的排放强度的降低究竟源于 排放量的减少还是工业总产值的提高,作者分别用贸易自由化分别对企业 排放量和工业总产值做回归,结果显示贸易自由化主要通过降低企业 排放量而非提升产出的方式来降低 排放强度。在这之后,一个新的疑问是:企业 排放量的下降是由生产过程中的 产生量下降引起,还是末端处理过程中的 处理量增加引起?为了回答该问题,作者用贸易自由化分别对 产生量和 去除量做回归,结果显示贸易自由化通过降低 产生量,而非增加 去除量来降低 排放。
这样的机制检验思路在逻辑上环环相扣,因此论文的故事性极强。除此之外,论文还对煤炭使用及技术进步这两个具体渠道分别进行了检验。
异质性分析一般可以分为两种:
这两种方法的主要区别在于:
事实上,异质性分析可以作为机制检验的一种辅助性手段,用以进一步增强论文的故事性。
如, 万攀兵等(2021) 在研究清洁生产行业标准对企业绿色转型时,在验证技术改造这一具体机制之后,认为技术改造受制于企业的技术改造需求和融资能力,基本逻辑如下:
依据以上逻辑,作者在基准模型中分别加入技术改造需求和融资能力与双重差分的交乘项(即构建三重差分模型 DDD )来捕捉可能的异质性效果。