三、模型、方法和数据
(一)计量模型的设定和估计方法
本章的目的是讨论收入分配对产业结构升级(或产业结构高级化)的影响。我们运用1978—2010年的省级面板数据对这一问题进行实证分析。面板数据可以控制个体的异质性和非观测效应,缓解变量间的多重共线性问题,同时提供了更多与现实有关的信息,从而提高了参数估计的准确性。根据研究目的,本章采用了面板固定效应模型,原因是随机效应模型要求模型中可观测的解释变量与随机误差项中不随时间变化的非观测效应不相关,而固定效应没有这个假设。而本章所研究的收入分配变量与其他影响产业结构升级的不随时间变化的非观测效应很可能是相关的,由于固定效应模型可以通过差分去掉这部分非观测效应,这就减少了由于非观测效应可能与解释变量相关而导致的内生性问题,因此本章适合采用固定效应模型。我们将模型设定为如下形式:
其中i表示地区,t表示时间,NAGR表示非农产业增加值占地区生产总值的比重,LH为重工业总产值占工业总产值的比重,SI表示第三产业增加值与第二产业增加值之比,ID为收入分配的衡量指标,即城市家庭人均可支配收入与农村家庭人均纯收入之比。μ为独立同分布的随机误差项。αi为地区不可观测的个体效应。
然而,收入分配并不是影响产业结构升级的唯一因素,金融发展、劳动力结构、财政政策等因素都可以对产业结构变迁产生显著的影响,这些因素如此众多,以至于很难有一个科学的标准来选取本章的控制变量,因此,为了避免选择控制变量的随意性,本章仿照Frank(2005)在分析地区经济差距和经济增长关系时,Barro(1999)在分析收入分配和经济增长关系时所采用的将解释变量和被解释变量的交叉项作为控制变量的方法,将解释变量和被解释变量的乘积交叉项作为控制变量引入方程,这样做有两个原因:第一,因为残差中未能引入模型的因素,在同时与解释变量或被解释变量相关时才会产生内生性,因此,将交叉项引入模型,可以代替这些产生内生性的因素,起到了“代理”各种控制变量的作用;第二,可以据此估计出收入分配对产业结构升级的偏效应。基于此上述计量模型将变为:
对(4)式—(6)式分别进行差分,以消除个体效应,可得到以下差分方程:
由于差分方法会带来差分后随机扰动项的相关性问题,因此,本章在参数估计时将采用面板稳健性标准差。由于交叉项与残差项相关,因此,采用引入交叉项的方法会带来内生性问题,对此本章借鉴了Baum和Schaffer(2002)的方法,视所有解释变量为内生,并用其滞后项和差分项作为工具变量进行面板广义矩估计。采用这些滞后项作为工具变量的前提是其与残差项不相关,但是,当采取了这些滞后项作为工具变量时,会带来过度识别问题,也就是超过待估计内生变量个数的工具变量。Hansen(1982)采用有效矩估计方法,给出了J检验统计量对此进行识别,原假设是工具变量是有效的。本章将采取这种方式对过度识别问题进行检验。