定性数据的统计分析
上QQ阅读APP看书,第一时间看更新

3 定序数据的独立性检验

χ2G2的独立性卡方检验要求数据是定类的,如果行或列变量是定序的时,则需要选择适合其层次的检验统计量。

3.1 线性趋势

当行变量Χ和列变量Y是定序的时,“趋势”关联是最常见的。趋势关联的含义是:当Χ的层次提高时,Y的值会在高层次上增加或者随着层次的降低减少。我们可以用单一参数来描述这种定序的趋势关联。最常用的方法是赋予变量各层次数值,然后量度线性趋势或相关的程度。

下面介绍应用皮尔森积矩相关系数,测量ΧY之间关系的正或负的线性趋势。令u1u2≤…≤uI表示各行的赋值,v1v2≤…≤vJ表示各列的赋值。赋值是单调的,即赋值与层次是一致的。赋值反映层次间的距离,距离越大,层次间的间隔越大。如果间距相等,则不同赋值组的效应是相同的。例如,赋值(1,2,3,4,5)和(1,3,5,7,9)的间距都是相等的,所以效应是相同的。

ijuivjnij表示ΧY的协变量,uivjnij的含义是赋值叉积uivj乘以权重nij(单元格频次)。在赋值确定时,ΧY的皮尔森积矩相关系数等于:

r的值域在-1和1之间,当真值为0时,两个变量相互独立。随着r的绝对值增大,两个变量之间的线性相关增强。

检验变量相关的统计量为:

M2为0时,支持H0(变量独立);反之,备择假设(变量相关)成立。公式1-3表明,当样本的皮尔森积矩相关系数r或样本量n增大时,统计量M2会增大。对于大样本,M2的分布近似于df=1的卡方分布。M2 大于0时,否定H0,所以与χ2G2 一样,它的p值是观测值的右尾概率。平方根具有标准正态零假设分布,并且可以表示层次之间相关的方向。

M2检验的变量是对称的,将I×J列联表的行和列及其赋值对调,新的J×I列联表的M2值不变。

3.2 定序检验统计量的优势

上文在谈到χ2G2的自由度时,笔者曾指出df=(I-1)(J-1)是由(IJ-1)-[(I-1)+(J-1)]得来的。其中,(IJ-1)是备择假设参数的数目,[(I-1)+(J-1)]是H0参数的数目。因此,df的值(I-1)(J-1)就是备择假设比H0多的参数数目。检测统计量例如χ2G2的设计都是为了找出这些多出的参数的效应。但是,这种设计使得检验统计量失去了检测个别参数效应的灵敏度。

当行和列的变量是定序的时,我们可以用一个参数来描述变量之间的相关。例如,统计量M2就只有一个参数r——线性趋势的相关量度。统计量只需一个参数就意味着它的df等于1。

如果变量之间确实具有正的或负的关联趋势,应用M2的检验就比基于χ2G2的检验具有更大的优势。原因是,卡方分布的均值是1χ2G2df=(I-1)(J-1)。因为(I-1)(J-1)≥1,所以除了2×2列联表,M2的卡方分布均值总是小于χ2G2的卡方分布均值。因此,当M2χ2G2的值相当时,M2p值更小。这意味着,当变量确实是线性相关的时,与χ2G2相比,M2更有可能否定变量独立的H0,即M2的灵敏度较高。

df较小的卡方检验的另一优势与近似卡方分布的程度有关。对于小或中等的样本量来说,df越小,抽样分布越接近卡方分布。当一些单元格频次很小时,与χ2G2相比,M2的近似卡方分布的程度要好得多。

本书为了说明定序变量的对数线性回归和对数概率比回归的特点,将介绍定序变量的模型和定序-定类变量混合的模型。为了比较各种模型拟合优劣的情况,就需要应用统一的检验量度。因此,只用于定序数据的M2不合适。虽然G2不如M2精确,但是可以用于定序和定类数据,符合本书的要求。所以本书的其他部分都用G2作为检验统计量。

3.3 赋值

对于大多数定序数据,只要层次的赋值是单调的,不管它们的形式如何,都不会影响估计值。例如,赋值的组合不同,但每一赋值组的间距一样,则rM2的值不变。例如,当赋值组为(0,1,2,3)、(2,4,6,8)或(10,20,30,40)时,其rM2的值与(1,2,3,4)的rM2值一样。

但是,如果数据非常不平衡,即某些单元格的观测频次特大,层次的赋值就会影响估计值。以表1-4为例,我们给行的间距取相等的赋值(1,2,3,4),检验统计量就变成M2=1.83,p=0.18,否定H0的力量变得更弱了。既然在某些情况下定序数据的赋值方法不妥,那么我们可以根据数据的排列位置,用它们的秩作为类别赋值。下面以表1-4为例,介绍赋予数据中位秩的方法。第一个家庭收入层次“下下”的边际频次为1106,中位秩(与中位数的计算方法一样)等于(1106+1)/2=553.5。第二个家庭收入层次“中下”的中位秩为1106+(1863+1)/2=2038,其他两行的中位秩照此计算。但M2对列联表的频次分布是有要求的,如果相邻的层次只有很少的观测值,则它们的中位秩必定近似。其结果是,各层次的中位秩距离可能相差悬殊,有的距离很小,有的距离很大,造成不合理的差距,M2也是不准确的。

以上两种定序数据的层次赋值方法,在个案频次分布倾斜时,结果不理想。读者在选择使用哪种方法时,要考虑赋值是否能正确反映层次的间距,可以选择间距不等的赋值。在不能确定时,要选择两种或三种方法,检验计算结果是否近似。一般来说,当层次不需要加以特殊考虑时,例如,按照家庭收入,可以分为下下、中下、中上、上上四个层次,给予它们等距赋值是可行的。

当变量ΧY都是定序的时,中位秩作为它们的赋值,M2可以灵敏地测出非参数相关的非零值。这种方法就是斯皮尔曼rho

3.4 I×2和2×J列联表的趋势检验

当变量Χ只有两个层次,Y的层次大于2,或者Y只有两个层次,X的层次大于2,且行变量Χ是解释变量,列变量Y是应变量时,计算M2要有不同考虑。

J列联表表示解释变量Χ是二点变量,我们用赋值u1=0,u2=1表示Χ的两个层次。这样,M2的基础——协变量∑ijuivjnij就简化为∑jvjn2j,这一算术式表示,第二行所有个案在Y上的赋值之和除以第二行的单元格数就得到该行的平均赋值。实际上,当变量Y是定序的、层次赋值为{vj}时,2×J列联表的M2就可以用来检测两行个案在Y上得分的均值之差。用M2检验独立性,小的p值支持行均值之差存在。

如果应变量Y的层次赋值取中位秩,2×J列联表的检验对于两行的均值之差很灵敏。这种检验就是威尔柯克森或曼-威特尼检验。大样本的非参数检验使用标准正态z统计量。在行取(0,1)赋值、列取中位秩时,z2等同于M2

2列联表表示应变量Y是二点变量,Χ是定序变量。Y的每一层次的概率在Χ各层次上的变化是研究的重点。Χ各行的赋值必须是单调的,Y的两个层次可取任意值,这时的M2主要用来检验概率的线性趋势。如果是检验独立性,小的p值支持线性趋势的斜率是非零的。2列联表的定序检验又被称为科克伦-阿米蒂奇趋势检验。

除了M2之外,其他I×J列联表的定序检验还有γτb量度法,统称为肯德尔τ。这些量度具有检验独立性的大样本标准正态分布,其检验统计量的平方是df=1的卡方。像M2一样,这些检验统计量由于只有一个参数而具有潜在优势。