上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
第五节 第二章术语列表
双峰:有两个众数(出现频率最高的值)的分布。
分布:样本中单个变量的值的集合或组。通常但并非必须,这些值按从最小到最大的顺序排列。
均值:分布中所有值的算术平均数。
中位数拆分:使用中位数作为除数,将值分布分为两个相等的组。中位数以上的值是“高值”组,而中位数以下的值是“低值”组。
中位数:表示分布中第50个百分位数的取值,即分布中有50%的值低于中位数,50%的值高于中位数。
众数:分布中最频繁出现的值。
多峰:当值的分布是具有两个或多个众数的分布。
负偏态分布:在偏态分布中,当大多数值聚集在分布的较高端,少数值在分布的较低端,形成长长的向左延伸的尾巴的分布。
正偏态分布:在偏态分布中,当大多数值聚集在分布的较低端,少数值在分布的较高端,形成长长的向右延伸的尾巴的分布。
参数:从总体中收集的数据得出关于总体特征的值,或从样本统计数据推断出总体特征的值。
总体:是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成,如由多个企业构成的集合,多个居民户构成的集合,多个人构成的集合等。
样本:是观测或调查的一部分个体。
统计:从样本收集的数据中得出的值。
:样本均值。
μ:总体均值。
∑:求和。
X:分布上的某一个值。
n:样本规模。
N:总体规模。