统计分析与数据解读
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第二章 集中趋势的度量

不管以何种方式收集数据,最终都会得到一个或多个变量的值。如果将一个变量的取值按从低到高的顺序排列,则得到取值的分布。通常,研究者需要了解取值分布的特征,例如分布的形状、分布方式、出现频率最多的取值是什么等等。其中,数据分布的集中趋势通常是研究者会感兴趣的一个特征。通常测量这个特征的指标包括:均值、中位数和众数。

均值这个指标是社会科学研究中最常用到的统计指标。均值是计算每个取值的算术平均数。并且研究人员喜欢用这个指标,是因为它提供了一个简单的数字,可以粗略地概述分布的特征。值得注意的是,虽然均值提供了一个有用的数据信息,但是并没有提供关于取值是如何分布的信息,以及在这个分布中,有多少个取值是接近均值的。毕竟,分布在均值附近的值的数量较少的这种情况,也是有可能的。

中位数是标记分布第50个百分位数的取值。也就是说,取值分布中50%的值低于中位数,而50%高于中位数。中位数这个指标通常用于以下情境:当研究者希望将取值分布分为两个相等的组(中位数拆分),或者当取值分布的高端或低端有一些极端值时,可以选择中位数这个指标。更多内容将在后续章节进行详细讨论。

众数在测量集中趋势中用得最少,因为这个指标提供的信息量最少。众数仅提供出现频率最多的那个值。