统计分析与数据解读
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第五节 第二章术语列表

双峰:有两个众数(出现频率最高的值)的分布。

分布:样本中单个变量的值的集合或组。通常但并非必须,这些值按从最小到最大的顺序排列。

均值:分布中所有值的算术平均数。

中位数拆分:使用中位数作为除数,将值分布分为两个相等的组。中位数以上的值是“高值”组,而中位数以下的值是“低值”组。

中位数:表示分布中第50个百分位数的取值,即分布中有50%的值低于中位数,50%的值高于中位数。

众数:分布中最频繁出现的值。

多峰:当值的分布是具有两个或多个众数的分布。

负偏态分布:在偏态分布中,当大多数值聚集在分布的较高端,少数值在分布的较低端,形成长长的向左延伸的尾巴的分布。

正偏态分布:在偏态分布中,当大多数值聚集在分布的较低端,少数值在分布的较高端,形成长长的向右延伸的尾巴的分布。

参数:从总体中收集的数据得出关于总体特征的值,或从样本统计数据推断出总体特征的值。

总体:是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成,如由多个企业构成的集合,多个居民户构成的集合,多个人构成的集合等。

样本:是观测或调查的一部分个体。

统计:从样本收集的数据中得出的值。

:样本均值。

μ:总体均值。

:求和。

X:分布上的某一个值。

n:样本规模。

N:总体规模。