此文内容为《高级计量经济学及STATA应用》的笔记,陈强老师著,高等教育出版社出版。
我只将个人会用到的知识作了笔记,并对教材较难理解的部分做了进一步阐述。为了更易于理解,我还对教材上的一些部分( 包括证明和正文 )做了修改。
目录
对于面板数据,如果被解释变量为虚拟变量,则称为 面板二值选择模型 (binary choice model for panel data)。对于二值选择行为,通常可以通过一个 潜变量 (latent variable)来概括该行为的净收益(收益减去成本)。如果净收益大于0,则选择做;否则选择不做。假设净收益为: 其中,净收益 为不可观测的潜变量, 为个体效应(individual effects),而解释变量 不含常数项。个体的选择规则为: 给定 , , ,则有: 其中, 为误差项 的累积分布函数(cdf),并假设 的密度函数关于原点对称。如果 则为 Probit 模型: 如果 服从逻辑分布,则为 Logit 模型: 面板二值选择模型主要估计方法包括:
在方程 中,如果 ,即没有个体效应,则为混合回归(pooled probit or pooled logit),可将此面板数据作为横截面数据处理(参考《高级计量16》),此时,只需要使用截面数据的相关 Stata 命令即可进行混合回归。然而,由于同一个体不同时期的扰动项可能存在自相关,故应使用以面板为聚类的聚类稳健标准误(cluster-robust standard error)。
更一般地,我们允许个体效应存在,即不同的个体拥有不同的 。如果 与所有解释变量 均不相关,则称为 随机效应模型 (Random Effect Model, RE, 见《高级计量16》);否则为 固定效应模型 (Fixed Effect Model, FE)。
首先考虑 RE 模型。对于线性面板的 RE 模型,一般使用广义最小二乘法(GLS)进行估计。但 非线性面板不便使用GLS ,故转而使用最大似然估计(MLE)。假设 ,记密度函数为 。以 Logit 模型为例,给定 ,则个体 的条件分布为(参考《高级计量14》): 然而,上式的 不可观测,为此,记 的联合密度为 ,并进行如下分解: 在 的联合密度重,将 积分去掉,即可得到 的边缘密度: 上面的积分没有解析解,可以通过数值求解的方法求解,这里就不再叙述了。
假设不同个体的观测值相互独立,则可以写出整个样本的似然函数。最大化此似然函数即得到 的 RE Logit 估计量 。如果将上述方程的逻辑分布 改为正态分 ,那么就是 RE Probit 估计量 。由于不同个体的观测值相互独立,故不同个体的扰动项也不相关,但由于 的存在,同一个体不同时期的扰动项之间仍存在相关:
如果 ,那么自相关系数为: 如果 越大,就表示复合扰动项 中个体效应 的部分比较大,不能忽视个体效应;极端地,如果 ,就表示复合扰动项中 ,个体效应接近没有,故应该使用混合回归模型。
在面板二值选择模型中,如果个体效应 与解释变量 相关,那么就是 FE 模型, 其中, 可以是 或者 。此时,如果使用 RE 模型或混合回归则得不到一致估计。
在线性面板模型中,可以通过组内变换或差分变换解决伴生参数问题,但对于固定效应的面板 Probit 模型,目前尚无法解决此类伴生参数问题。
对于固定效应的面板 Logit 模型,可以通过寻找 的 充分统计量 (sufficient statistic),然后在给定此充分统计量的条件下进行 条件最大似然估计 (conditional MLE)。
对于 Logit 模型,Chamberlain(1980)提出使用 作为 的充分统计量,并计算在给定 情况下的条件似然函数(根据充分统计量的性质,此似然函数不再依赖于 ),然后进行条件似然最大估计。然而,对于 Probit 模型,却找不到 的充分统计量。
以最简单的两期模型为例进行说明,即 。此时,对于个体 ,只有以下三种可能: 。下面分别考虑着三种情形:
,此时必然 ,从而 ,其对数似然函数为 ,故对整个样本的似然函数没有贡献。
直观来看,由于此条件似然函数的取值为常数,故此观测值不包含任何可以用于估计 的信息,因此,在进行条件似然估计时,是否包含这些观测值并不影响估计结果。
事实上,等于损失了这些样本的观测值。
,此时必然 ,从而 ,同理,这些观测值并不包含任何有助于估计 的信息,应该忽略
此时,或者 或者 ,分别计算其条件概率为: 假设给定 和 的条件下, 和 相互独立,则: 将表达式 和 代入 中,可得: 注意到, 在分子分母都有 项,于是被消除了。同理,将 和 代入 可得: 如果定义虚拟变量:如果 则 否则 ,那么就可以把 和 写在一起,并将个体 的条件对数似然函数写为: 其中 为示性函数,表示仅考虑 的观测值。上式对 加总,即可得到整个样本条件对数似然函数。
从 我们发现:
更一般地,对于 ,可以计算给定 或 的条件似然函数。固定效应模型的缺点是,将损失所有 或 的观测值,导致样本容量减少;并且由于 消去了,也无法估计个体效应 ,也无法预测 发生的概率或解释变量对 的边际效应。解决的方法是假设