第二节 集中趋势的度量
每一种集中趋势的测量方法都非常简单。通过借助计算器或统计软件,您可能将不再需要手动计算这些统计量。但是出于基础知识储备的考虑,如果您没有计算器、软件等辅助工具来计算这些统计量,那么您将需要了解以下信息。
以均值为例,计算均值需要使用加法运算,对数据分布涉及的所有值进行加总,然后除以值的个数。所以,如果在分布中有10个值,就需要把这10个值进行加总,然后除以10,计算方法见表2.1。
相比均值的计算,中位数的计算更加简单。要查找分布的中位数,首先从最小到最大按顺序排列分布中的所有取值,然后您只需要在分布中找到中间的那个值。如果分布中有奇数个值,那么中间的那个取值为中位数。例如:如果在分布中有11个从低到高排序的值,那么第六个值即是中位数,因为这个数的左边有5个值,右边也有5个值。但是如果分布中有偶数个值,那么中位数的值将不是取自一个值,而是取中间两个数值的平均值。例如:如果在分布中有10个从低到高排序的值,那么第五个和第六个值的平均值就是该分布的中位数。
众数即是出现频率最多的那个数。例如,如果你有10个学生的IQ测试结果如下:
86 90 95 100 100 100 110 110 115 120
在这个分布中,出现频率最多的是100,那么这个值即是众数。这个分布就是单峰分布。如果分布中有多个频数出现最多的值,则称这个分布为多峰分布。多峰分布的一个常见示例是双峰分布。当研究者面对有争议的问题时,研究者通常会得到双峰分布,这往往使问题答案出现两极分化。例如,如果我要问一个100人的样本,他们对死刑的感觉如何,我可能会得到如表2.2所示的结果。在此示例中,由于大多数人强烈反对或强烈支持死刑,最终答案呈现双峰值分布。在1-5的分值范围内,1分视为强烈反对死刑,5分视为强烈支持死刑。可以看到大家对死刑的看法呈现明显的两极化分布。强烈反对和强烈支持的人占比最大,中间分值的人数比例较小。
表2.2 响应频率(个)