横截面相关的面板数据分析
上QQ阅读APP看书,第一时间看更新

第二章 具有横截面相关性的非平衡面板数据模型的公共相关效应估计

第一节 引言

正如 Hsiao(2014)所讨论的,面板数据为计量经济学研究带来了更多的便利和可能性。相对于横截面数据,面板数据具有众多的优势,包括自由度的增加、多重共线性的缓解以及估计偏误的消除等。过去几十年,面板数据模型在实证和理论上都受到越来越多的关注,已经成为计量经济研究的一个重要领域。

在进行参数估计和统计推断时,几乎所有面板模型都要面临一个重要问题:不同个体之间可能相互依赖和相关。如何刻画和捕捉截面相关性(Cross-Sectional Dependence,CSD)极大地吸引了众多研究者的兴趣,参见Sarafidis和Wansbeek(2012)的文献综述。目前在文献中,主流的处理 CSD的方法包括空间计量模型和因子结构。前者利用空间距离信息来处理不同个体的相关性(Lee和Yu,2010),而后者利用低维因子向量结构。本书主要考虑后者,通常假设误差项包含有限个不能被观测的因子,这些因子通过影响个体特有的因子载荷来影响每个个体[例如,Bai(2009),Bai和Li(2012,2014),以及 Pesaran(2006)]。针对截面和时间维度都趋于无穷的大面板数据,因子结构法分化出三种主要方法,即 Bai(2009)的主成分方法、Bai和Li(2012,2014)的极大似然估计法(Maximum Likelihood Estimation,MLE)和Pesaran(2006)的公共相关效应法(Common Correlated Effects,CCE)。前两种方法需要估计公共因子和因子载荷,而 CCE 只需用观测值的截面均值来近似未知的共同因子,从而估计斜率系数。此外,因为研究者们(特别是微观计量经济学家)面对的通常是个体数N很大,时间段T较小的面板。例如,调查数据通常包含很多人或家庭较短年限的观测值(如NLS和PSID 数据集)。当时间段较短或固定时,具有CSD的面板模型处理起来更加困难。对于平衡面板的处理,最近的研究可以参考 Ahn等(2013),Juodis和Sarafidis(2018),Hayakawa(2012),Bai(2013),以及 Hayakawa(2014)。前三篇文章用的GMM(Generalized Moment Method),后两篇用的MLE。

在实证分析中,面板数据模型面临的另一个问题是数据结构的不平衡。有许多原因可能导致非平衡面板的出现,例如,由于一些预先指定的政策,某个变量在一定时间段内不可观测,或者一开始参与面板的个体不愿或不能继续参与。因此,在估计面板模型时把非平衡的特征纳入考虑就非常重要了。更多关于非平衡面板的讨论,见 Baltagi和Chang(1994),Wansbeek和Kapteyn(1989),以及Baltagi和Song(2006)。注意到,几乎所有非平衡面板的文献讨论的都是不存在 CSD 特征的面板数据模型。

据我们所知,只有 Bai等(2015)考虑了当NT都很大时具有交互式固定效应的非平衡面板模型。他们采用结合了 EM(Expectation Maximum)算法、LS(Least Squares)方法和PCA的LS-EM-PCA 算法来估计参数。这种算法包含两个循环,内层循环运用 EM 算法,外层循环估计斜率系数。这种迭代算法可能会非常耗时,并且由于可能存在局部最优而不稳定。此外,他们只通过模拟来证明 EM-型的估计量一致,且当NT都很大(比如,NT≥50)时估计收敛得很快。由于一致性的证明和进一步的统计推断面临技术性难题,他们没有进行渐近分析。

本书中,我们考虑NT小时具有 CSD的非平衡面板模型的估计和推断。据我们所知,这是第一篇系统性研究非平衡面板的CCE 估计量的论文,同时我们也为小T的具有 CSD的面板文献做出了贡献。具体来说,我们修正了 Pesaran(2006)的CCE 估计量,使之能用于非平衡面板,并且提出了两种非平衡面板横截面均值作为因子的代理变量。出于效率的考虑,我们更多地关注对每一期所有可得的观测值取截面平均。和Pesaran(2006)一样,我们给出非平衡面板模型的CCE估计(以下简称CCE-UB),在一些正则条件下和NT小时,证明了CCE-UB估计量的一致性,且渐近服从正态分布。我们通过蒙特卡洛模拟来考察 CCE-UB 估计量的有限样本表现。从模拟的结果中,我们发现 CCE-UB 估计量具有非常良好的有限样本性质,在NT小时,确实适合估计具有CSD的非平衡面板数据模型。

接下来的行文安排如下。在第二节中,我们给出具有CSD的面板数据模型,并列出模型的主要假设。第三节介绍CCE-UB估计量,并推导它的渐近性质。第四节通过蒙特卡洛模拟来展现 CCE-UB 估计量在有限样本下的表现。第五节进行了简短的总结。

符号:本书中,C表示常数,它的具体取值视情况而定。“ IID”指 “独立同分布”。表示矩阵A的Frobenius范数。分别表示依概率和依分布收敛。