第六节 数据和方法
一 数据来源
1.调查地
在我国大部分的农村地区,许多家庭因为受“多子多福”“重男轻女”“传宗接代”等传统生育观念的影响较深,存在男孩偏好的不合理思想。在国家政策要求只生育一个孩子的情况下,特别是当只生育一个女孩就不允许再生时,许多具有男孩偏好的农民家庭便难以接受。当数量和性别不可兼得时,在有可能产前确定性别时,治理对象会选择以较小的心理代价来选择自己子女的性别,而B超的广泛使用恰恰为性别选择提供了便利的条件。最终导致治理对象的生育意愿从“多子多福”转变为追求生男孩,产生了目前普遍的男孩偏好问题。
陕西省历史上就存在较为明显的男孩偏好的传统文化。由于全国范围内计划生育政策的实施对治理对象生育数量进行了限制,陕西省各地区逐渐出现了通过胎儿的性别鉴定技术进行人工流产等途径实现生育偏好的现象,而且近年来这一现象愈演愈烈,最终导致了陕西全省的性别比尤其是出生人口性别比的大幅上升,陕西省现已经成为全国较为明显的性别失衡省份。持续的性别失衡将给两性关系、婚姻家庭和社会稳定等各方面带来严重的影响。因此,陕西省的性别失衡问题除了在短期内会造成陕西女性孩童数量的减少和歧视女孩社会风气的加剧以外,还会在不久的将来造成男性婚姻市场的挤压、社会中女性角色的缺失以及与此相关的社会风险和社会危机,进而引发大规模的社会安全问题。陕西省人口性别比失衡所导致的社会秩序混乱将成为影响社会稳定的严重隐患,而且这些都将成为一种负面的动力,令犯罪率增加,使艾滋病和其他性病大规模爆发,从而不利于陕西省和谐社会的建立。
从统计数据来看,陕西省在1981年的出生人口性别比为109.17,比正常值的上限107还要高2.17个百分点。与全国同期相比较,实际上陕西省性别失衡问题从20世纪80年代就已经开始出现。同时,全国几次大型的人口普查和1%人口抽样调查数据显示,陕西省出生人口性别比依旧呈持续上升的趋势。具体来看,1989年出生人口性别比为112.3,1995年和2000年分别为123.23和125.15。2005年1%人口抽样调查数据显示,陕西出生人口性别比达到130.7,远远超出了正常值。其中的地域差异问题也十分突出,陕北最高达132.56,关中次之为128.33,陕南较低为113.82。相比较来说,陕北地区的性别比失衡现象更为严重。2007年人口抽样调查资料显示,陕西出生人口性别比为121.28,比2000年的125.15和2005年的130.7有所下降。2003年,陕西省参与了国家“关爱女孩行动”的试点县区开始对性别失衡问题进行治理。2006年,随着国家全面开展该项治理活动,陕西省的治理也以计生部门为主导顺利开展。通过近十年的治理工作,陕西省2010年六普数据为116.1,出生人口性别比大幅度下降,性别比治理工作初见成效。武功县作为陕西省性别失衡治理工作的标杆,获得了“陕西省计划生育工作先进县”的称号。
基于上述背景,笔者选取了陕西省的整体县区作为本研究实证数据分析的对象,选取陕西省武功县作为本研究案例分析的对象。陕西省的107个县区虽然在地域上分布广泛,但是基本可以划归为三类区域。第一类是陕北的延安和榆林。这类地区是所谓的陕北地区,当地近年来在经济上的发展势头强劲,其资源产业如石油、天然气和煤炭得到了充分开发,给当地经济和治理对象带来了巨大的财富回报。本地区处于高原高寒地区,自然环境相对平原地区较为恶劣,这样的环境导致其对于男孩偏好的传统观念根深蒂固。第二类是陕西中部地区,主要是关中平原地区,主要包括西安、咸阳、宝鸡、渭南等地。本地区的城市多为以工业发展为主的经济模式,而农村地区多为以传统农业为主的经济模式,本地治理对象的男孩偏好多集中在宗族势力等文化观念上。第三类是处于陕西南部山区的汉中、安康等陕南地区,也是以农业经济为主,本区的经济发展水平有限,加之在地理位置上间隔秦岭山,历史传统和习俗上都存在与关中和陕北不相似之处,因此在陕西全省性别比偏高问题研究中值得进行比较和观察。
另外,陕西省武功县属于关中地区,交通便利,具有悠久的文化,也是陕西省人口密度较高的县区之一。自从开展性别失衡治理工作以来,武功县的出生人口性别比从2009年开始逐步下降,稳定在107左右。武功县的治理工作获得了“国家人口和计划生育优质服务先进县”的称号,治理工作得到了上级政府部门的肯定,治理绩效显著。同时,武功县作为联合国人口基金推进性别平等的项目县区,具有较好的治理基础。因此,本研究选取了武功县为案例分析的对象。
具体的陕西调查地行政区域分布和编码如表1-1、表1-2和图1-2所示。此次调查地的71个县区包含了陕西省陕北、关中和陕南的部分县区,其中,关中地区的比例最高,占到了整个关中县区的72.72%;陕南县区的比例最低,占了一半;总体71个县区占到了全部县区的65.36%。
表1-1 调查样本行政区域分布
2.调查工具
调查是以结构化的县区问卷、工作人员问卷和治理对象问卷为主,同时辅以半结构化的访谈,具体的问卷调查内容如表1-3所示。除了结构化的问卷调查以外,笔者对武功县还进行了二手资料的收集以及小组的组访与个访。具体的访谈内容将在第六章进行详细的介绍。
3.抽样方法
表1-2 调查样本行政区域详细分布
图1-2 陕西省行政县区划分
表1-3 问卷调查的主要内容
续表
根据本研究依托的课题研究计划书,本次调查采用问卷调查和访谈调查同时进行,问卷调查采用多级整群抽样方法。本次调查选取陕西省所辖的全部107个县区,事先由陕西省政府的人口计生委向全省所有县区下发工作通知,要求认真填写问卷、限期完成。调查实施中以邮寄问卷的方式下发,县区问卷和工作人员问卷由各县区进行性别失衡治理的专门机构负责人及工作人员填写,随机抽取县区级参与出生人口性别比治理的工作人员,每个县区10~15名。其间以电话督导和自行的方式指导填写问卷,治理对象问卷由当地县区的工作人员按照课题组的抽样要求进行入户调查,即先确定县区内拟调查的乡镇,再确定拟调查的行政村。由当地工作人员协助将治理对象问卷进行随机发放,每个县区抽取10~15名群众。最终由各县区在指定时间(少数县区超出指定时间,在重新商定的时间内)将问卷邮寄给研究人员。在实地调查和数据录入过程中,笔者采取了一系列措施进行质量控制,包括自己的调查人员的现场监督和政府部门工作人员的督促。数据回收之后又对调查数据进行清洗,共获得有效的县区机构问卷71份,工作人员问卷701份,治理对象问卷共669份。具体情况如下。
县区机构问卷:共获得有效样本71份,其中关中县区数量为40份,陕北县区数量为17份,陕南县区数量为14份。
工作人员问卷:共获得有效样本701份,其中关中县区数量为389份,陕北县区数量为155份,陕南县区数量为157份。
治理对象问卷:107县共获得有效样本669份,其中关中县区数量为359份,陕北县区数量为138份,陕南县区数量为172份。
二 研究方法
本研究的具体技术方法包括定性数据的质性分析方法和定量数据分析方法。统计学的研究方法主要有常规统计分析方法和一些高级统计分析方法。常规统计方法包括频数分布,交叉表法。在具体研究中,笔者将管理学、社会学、人口学研究方法和统计学相结合,以定量研究为主,辅之以质性研究。
1.定量研究
总体来说,本研究对实地调查收集到的数据进行了整理、分析,通过文献整理的方法构建了我国性别失衡问题的治理结构、工具对治理绩效影响的分析框架,并主要采用统计分析方法对该分析框架进行实证检验。本研究进行了大规模的社会调查,采取了分步骤、多层次的设计方案采集样本,这也与本研究的研究问题相契合。要研究公共治理结构与工具对绩效的最终影响,会涉及将宏观层面和微观层面的数据相结合的问题。而近年来随着具有等级结构的实证数据的大量产生,很多学者就采用了多层模型的实证分析方法来构建多层次的因果模型。[34]
本书的实证研究根据研究问题的需要以及调查数据的特点也分为了宏观研究和微观研究两个部分,这两个部分均采用了定量的数据分析方法。
第一,在宏观层面,主要以县区的出生人口性别比和治理工作的过程绩效作为因变量,分别采用了Ordered Probit回归和OLS回归来分析治理因素自变量对于绩效的影响。
第二,在微观层面,根据所获得的调查数据,基于性别失衡治理问题的研究背景,该治理问题在进行实证分析时要考虑将宏观层面的治理和微观层面的绩效相结合。本研究所有的调查样本来自三个层面,即宏观的县区层面、工作人员层面以及微观的治理对象层面。而且性别失衡治理的绩效在各个层面也有不同的表现,具体表现在县区宏观层面的出生人口性别比以及微观层面的治理对象满意度和生育意愿。本研究要使这样的分析同时出现在实证分析的模型中,并且需要考察宏观治理结构和治理工具对于绩效的影响。在这种情况下,除了在宏观层面采用传统的回归模型进行验证,还应该在纳入微观治理绩效后采用多层模型,从而有助于考察县区层面变量的组间差异,这也正是笔者的研究重点所在,因此本研究有采用多层线性模型分析的必要性。进行多层线性模型的构建和分析,主要有以下几个要求:第一,样本量应该大于或等于30;第二,变量数和样本量之间的比例不能小于1∶10。从本研究所获得的数据样本量来看,基本符合多层线性模型分析的要求,因此具有采用多层统计模型的可行性。
在县区所属的治理层面,治理对象的政策满意度以及生育意愿Yi受到目标治理对象自身的年龄、受教育程度、婚姻状况等变量Xi的影响,每个目标治理对象都所属不同的县区、为了能验证在县区层面的治理因素Wi对治理对象满意度以及生育意愿产生的影响,本研究采用了多层线性模型的研究方法。就Xi和Yi的关系来说,每个治理对象都有自己的回归方程:Yij=β0i+β1jXij+Rij,其中,i是每个县区中目标治理对象的编号,j是县区编号。在每个县区中做同样的回归后,再分别把每个县区的回归中所估计出来的β0i和β1j作为因变量,以县区层面的变量Wi做自变量进行第二次回归,建立两个新的回归方程。这一尝试不仅在于取得具有理论和实际意义的结果,而且也有学习和推广先进分析方法的学术意义。主要的数据分析软件是HLM,同时也使用辅助软件工具,主要是SPSS和STATA。
具体的多层模型公式如下所示。
(1)分层线性随机截距模型。两层线性随机截距模型的基本构建公式如下:
第一层:Yij=β0j+β1jXij+Rij (1-1)
第二层:β0j=G00+G00Wj+U0j (1-2)
β1j=G10+U1j (1-3)
其中下标i代表第一层的样本;
下标j代表第二层的样本;
Rij是残差项或者随机项;
G00和G10分别是β0j和β1j的均值,并且它们在第二层组间是恒定不变的,是β0j和β1j的固定效应部分;
U0j和U1j分别是β0j和β1j的随机效应部分,也就是分别表示第二层方程的残差或随机项,说明了第二层组间的变异。
(2)分层Binary-logistic随机截距模型。两层Binary-logistic随机截距模型的基本构建公式如下:
第一层:P(Yij)=Pij (1-4)
logit[Pij/(1-Pij)]=β0j+β1jXij (1-5)
第二层:β0j=G00+G00Wj+U0j (1-6)
β1j=G10+G11W1j+U1j (1-7)
2.质性研究
通常意义上的社会学研究方法中的社会调查方法如结构性的问卷调查,采用上述实证模型分析的方法只能回答性别失衡治理绩效与治理工具和治理结构“是什么”的关系,却不能在更进一步的层面上回答“为什么”治理结构和治理工具会对性别失衡的治理结构产生影响。因此,为了更加清晰地反映和说明在我国性别失衡公共治理领域中治理结构和治理工具与治理绩效之间的关系及其作用机制,本研究还将运用陕西省武功县的具体案例对该性别失衡治理绩效的整体性框架进行验证和补充说明。案例分析部分采用质性研究的定性分析方法,与实证部分的定量研究相互补充、相互印证。本研究在案例分析部分进行的定性资料分析主要包括了个访、组访、实地观察、二手资料的文本分析等,通过扎根理论对收集到的二手材料进行概念化、范畴化的分析,再对分析结果进行范畴性质的总结。课题组成员在征得访谈对象同意的前提下,对访谈过程进行了录音,并在访谈结束后最短时间内整理了录音材料,充分保证了定性资料调查的真实性和有效性。