统计分析与数据解读
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第二节 推断统计和描述统计

为什么要很清楚地界定样本和总体这两个概念?因为本书的阅读者需要了解样本能够在多大程度上反映它背后所代表的总体。很明显,那些从去过心理健康服务机构人员中抽取的15岁青少年的抑郁症患病率可能和其他群体存在很大不同。例如,去过心理健康服务机构的青少年,可能比那些没去过的青少年的抑郁症更严重。同样,北京的青少年可能比杭州的青少年抑郁症更严重一些,因为相对慢节奏的生活和阳光沙滩会带给人们更多笑容。简言之,会有很多没有把青少年这个研究对象纳入研究者的研究总体中的情况,会导致选中的青少年群体的抑郁症患病率和其他未被选中的群体相应指标产生不一样的情况。当这种不一样存在的时候,我们就不能把从样本中得出的结论推至总体,尤其是当总体没有被特别界定的时候。

所以,这就是为什么不可以急于下结论。为了更详细地回答这个问题,我们需要介绍描述统计和推断统计之间的差别。描述统计仅适用于所收集的数据样本或者总体(如普查)。而推断统计则是通过样本数据得出某些结论,将适用于样本的某个特征描述,推广至样本背后所代表的总体。即便研究者有时候只关注对样本的某些特征进行描述,但是更多的情况下,我们更关心我们的样本是从哪个总体里被抽出来的。在抑郁症研究的例子里,研究者关注的并不是样本人群中抑郁症的患病率,而是总体人群中抑郁症的患病率。因此,样本是否对总体具有代表性,是提醒读者非常值得注意的问题。