1.4 非参数统计评述
本节我们试图区分参数统计(parametric statistics)与非参数统计(nonparametric statistics),尽管对于专业统计学家来说,这两者的不同之处也不能区分得很清楚。此外针对给定的数据,我们选择哪种统计方法更有利于解决这一问题,我们也将在本节给出一些指导。
1.4.1 使用优良方法
首先我们讨论假设检验和置信区间。本章已经指出假设检验要基于一个好的统计量,它对零假设和备择假设间的差别应是敏感的,并且在零假设下它的概率分布已知。置信区间是假设检验的逆推,因为置信区间是不能拒绝零假设的数据的集合。所以,一个好的(有效的)假设检验对应一个好的(短的)置信区间,反之亦然。
例如,样本均值对于检验总体均值μ是一个好的检验统计量,因为它对总体均值的不同很敏感。类似地,S和s对于推断总体标准差σ是好的检验统计量。但是,,S和s的概率分布取决于X的总体概率分布,通常是未知的。
1.4.2 参数方法
如果总体概率分布是正态分布,那么,或一些基于的统计量,可用于检验关于μ的假设,或估计μ的置信区间,因为零分布是已知的。同样地,如果分布是正态分布,基于S和s及样本标准差,我们可以检验关于总体标准差σ的假设和构造σ的置信区间。以上都称为参数方法(parametric method),因为它们都是在已知总体分布函数时有效。任何假设检验或置信区间都是基于这样的假设:总体分布函数已知或只带有一些未知参数,这称为参数方法。
但是我们如何才能确定总体的概率分布是正态分布,还是其他分布呢?很显然,我们不能。在基于正态分布做假设检验之前,我们可以先通过考察数据来判断它是否来自正态分布,或做一个考察数据非正态性的假设检验。
大多数参数方法都基于正态假设,因为检验背后的理论可以基于总体正态分布推出。对于正态分布的数据,一些方法和结果是有效的。其他的参数方法也是基于总体服从某一特定的分布,如指数分布、威布尔分布等。
1.4.3 稳健方法
没有任何一个总体会服从精确的正态分布或其他任何已知的分布。假如总体分布是近似正态的,那么通常(不总是)基于正态分布来使用这种方法是安全的,但是,如果数据看起来显然来自非正态分布,或不适合用参数方法,那么这时应当考虑非参数方法。尽管一种分析数据的方法背后的某个假设条件不成立,但只要它还是近似有效的,那么就认为这种方法对于这一假设条件是稳健的(robust)。一般来说,稳健是指基于正态假设的方法,而即使潜在的总体分布是非正态的,检验统计量也有近似相同的零分布。
一些参数检验,例如,单样本t检验或两样本t检验,特别是当样本量很大时,对于正态假设条件是稳健的,这就意味着检验统计量的零分布近似于正态总体所对应检验统计量的零分布,并且试验者可以将检验统计量的值与总体是正态时的精确的t分布表对应起来。即使总体是非正态的,我们也有信心认为表中的分位数,能够很好地近似检验统计量的真实的分位数。
然而,正因为方法是稳健的,所以不能确保当总体是非正态时,该方法一定像正态时那么有效。因此使用一种统计方法我们不禁要问,它稳健吗?还要问,它有效吗?统计方法当然应是稳健的,这样得到的显著性水平接近真实显著性水平。但它更应该是有效的,以便有效地处理和利用数据,以及拒绝错误的零假设。
1.4.4 非参数方法
非参数方法和参数方法都基于一些共同的假设,如假设样本是随机样本。但是,非参数方法不假定特定的总体概率分布,因此对于来自任何未知概率分布总体的数据,它都适用。
非参数方法对总体分布假设是非常稳健的,因为它们对所有的分布都同样有效。如果总体分布函数比正态分布轻尾,例如均匀分布,那么基于正态假设的参数方法一般会得到好的功效,且该功效等于或大于将在本书后面介绍的基于秩的非参数方法得到的功效。例如,意见调查数据是轻尾数据,问卷答案由1到5或1到7构成。尽管答案的分布是离散的,且可能是不对称的,从而显然是非正态的,但是由于它是轻尾的,所以在关于总体均值的假设检验中,从好的功效角度来讲,通常基于正态的参数方法比非参数方法更受欢迎。
另外,如果总体分布函数比正态分布重尾,例如指数分布、对数正态分布(数据的对数服从正态分布)、卡方分布(属于伽马分布族),以及许多其他合理总体模型中出现的分布,那么基于正态假设的参数方法的功效一般比基于秩的非参数方法的功效要低。
包含离群值(outlier)的数据是来自重尾分布的典型数据,离群值的观测值比样本中其他的观测都大很多或小很多。在这种情况下,考虑使用非参数方法来分析数据是非常重要的,例如后面介绍的秩方法,因为秩方法的功效比基于正态假设的参数方法的功效要高。
1.4.5 渐近分布自由
许多参数检验对于非正态假设条件是稳健的也是渐近分布自由的(asymptotically distribution-free)。这意味着随着样本容量的增加,方法变得更加稳健,对于无限样本容量的情形,方法是精确的且不依赖于总体分布。通常,基于样本均值渐近无分布的参数方法的理论基础是中心极限定理。本章1.2中在构造总体均值μ的渐近置信区间时,使用的就是上面的方法。
不应该只因为一种统计方法是非参数的、稳健的或渐近无分布的,我们就更偏好它。不论样本容量是多少,尽管方法是渐近分布自由的,参数检验的相对功效或置信区间的相对大小和非参数方法比起来,通常有好有坏。上面关于各种类型数据的统计方法偏好的讨论,不论样本容量的大小,都是适中的。
需要注意的是,我们考虑的绝大多数方法都是相合的,也就是说样本量的增大意味着绝对功效的变高。如果样本量足够大,使得用一功效较小的检验也能拒绝零假设,或用效率较低的方法得到的置信区间的长度,对试验者的要求来说已经足够短,那么仔细选择功效较大的方法就显得没有必要了。当然,在选择分析数据的统计方法时,试验者还要考虑许多的其他方面。
1.4.6 非参数的定义
我们将结合之前提到的知识给出如下比较有效的非参数的定义,即如果一种统计方法是非参数的,那么它至少满足下面的法则之一:
(1)该方法适用于分析名义尺度数据。
(2)该方法适用于分析次序尺度数据。
(3)该方法适用于分析区间或比率尺度数据,这里除了有无限多个未知参数外,由随机变量分布函数所产生的数据,要么是非特定的,要么是特定的。
例1.9中检验的数据是名义尺度数据(次品或非次品),所以由上面定义中的第一个法则可知,该检验是非参数的。例1.9中检验的数据是次序尺度数据,因此由第二个法则可知它也是非参数的。几乎所有的非参数假设检验都满足这两个法则之一。1.2中的点估计满足第三个法则,并且在后面提到的基于对称分布的方法也满足第三个法则。因此,我们认为它们是非参数的。
本书主要讨论的是假设检验和构造置信区间。不幸的是,这经常给试验者一种错觉,如果不做假设检验或构造置信区间,就好像不是在做统计分析。其他形式的统计分析也同样重要,如总体的描述、数据的解释、未知事件的预测以及点估计等。
这些其他形式的推断很大程度上依赖于试验者的经验和良好的判断力,而不是复杂的概率论证;所以我们认为它们太难,而不在本书中加以讨论。我们只把与假设检验和置信区间有关的一些复杂概率论证阐述清楚,以帮助那些已经具备足够经验和良好判断力的试验者。
解决其他几类问题的已有非参数统计方法在本书没有涉及,这些领域(和读者感兴趣的某些方向)包括生物鉴定(Miller,1973;Chmiel,1976)、生存曲线(Susarla和Van Ryzin,1976;Tarone和Ware,1977)与纵向研究数据(Ghosh,Grizzle和Sen,1973),以及多元方法、识别分析等。读者感兴趣的话,可查找相关书籍自行学习。