统计学原理(第3版)
上QQ阅读APP看书,第一时间看更新

第四节 统计学中的基本概念

一、总体、样本与个体

总体是客观存在的,由性质相同的大量个体组成,是由统计研究目的决定的统计研究对象的全体。个体是组成总体的个别单位。例如,要研究某地区国有企业的生产经营状况,则该地区的全部国有企业构成总体,某个国有企业就是个体;某企业要检查某批产品的质量,则该批产品构成总体,该批产品中的某件产品就是个体。

样本是从总体中抽取出来的一部分个体组成的整体。抽样的目的是用样本的数据特征推断总体的数据特征。例如,为了研究某产品用户的满意度,从该产品的全部用户中随机抽取5%构成样本,用这部分用户的满意度来估计该产品用户的满意度。总体、样本与个体的关系如图1-5所示。

图1-5 总体、样本和个体

二、参数与统计量

参数是描述总体综合数量特征的概括性数字度量,是对总体中所有个体某一数量特征的综合。

统计量是描述样本综合数量特征的概括性数字度量,是对样本中所有个体某一数量特征的综合。计算统计量是为了估计参数。

不管是参数还是统计量,体现的都是对个体数量特征的综合,都用数字表示。例如,随机抽取5%的用户进行满意度调查,5%的用户的满意度得分是82分,这就是统计量;据此推算出全部用户的满意度得分为79~85分,这就是参数。

习惯上,也将总体的综合数量特征称为统计指标。

三、变量

变量用于描述个体特征,其具体取值称为变量值。习惯上,也将反映个体特征的变量称为标志。

1.按变量的表现形式分类

变量按其表现形式的不同,可分为品质变量和数值型变量。

(1)品质变量用文字表示,包括分类变量和顺序变量。分类变量是说明事物类别的一个名称,其取值是分类数据。例如,企业的“行业”属性是分类变量,其变量值表现为“IT业”“物流业”“旅游业”等不同类别的行业。顺序变量是说明事物有序类别的一个名称,其取值是顺序数据。如“服务等级”是顺序变量,其变量值表现为“优”“良”“中”“差”4个顺序等级。

(2)数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。例如,企业的“营业额”是数值型变量,变量值为具体的数值,如“20万元”“30万元”“40万元”等。

以商场的会员卡为例,每个会员的个体信息就是变量,如某会员的性别是一个分类变量,教育程度是一个顺序变量,购买金额是一个数值型变量。

2.按变量的取值不同分类

数值型变量根据变量的取值不同,分为离散型变量和连续型变量。

(1)离散型变量是只能取整数值的变量,一般用来反映以自然整数计量的数量表现,变量值之间以整数位断开。例如,企业从业人数1 000人只能用整数来计量,在999和1 000两个整数之间不可能有小数值。

(2)连续型变量是可以在一个或多个区间内取任意值的变量,其取值是连续不断的,不能一一列举。例如,销售收入20万元以货币单位计量,在顺序的两个“万元”之间可以有小数值,表示比万元更小的计量单位上的取值。

四、练习题

1.选择题

(1)利用统计方法认识研究对象包括的统计活动有( )。

A.解释数据

B.收集数据

C.分析数据

D.整理数据

(2)下列属于某一有序类别的非数值型数据的是( )。

A.支付方式(现金、支票、刷卡)

B.购物金额

C.企业规模(大、中、小)

D.年龄

(3)一个统计数据的构成要素有( )。

A.名称

B.数值

C.时间范围

D.计量单位

(4)在不同时间上收集到的数据是( )。

A.观测数据

B.实验数据

C.截面数据

D.时间序列数据

(5)下列用于描述总体特征值的是( )。

A.统计量

B.变量

C.参数

D.变量值

(6)下列属于离散型变量的是( )。

A.某企业职工总人数

B.城乡居民储蓄存款余额

C.职工的月收入

D.全国城镇居民家庭总户数

2.思考题

(1)什么是统计学?举出几个统计应用的例子。

(2)简述统计工作的流程。

(3)统计数据可分为哪几种?举例说明各类数据的特点。

3.综合应用题

(1)判断下列数据属于分类数据、顺序数据还是数值型数据:品牌、职业、产品的满意度(满意、较满意、一般、不太满意、不满意)、考试成绩、市场占有率、流动资金占用额、学历、购物方式、月收入。

(2)某市的城市抽样调查队随机抽取了 1 000 户居民作为固定样本,记录其每月的消费支出情况,连续记录了12个月,并对这1 000户居民12个月的每月消费总额及消费构成进行了汇总和分析,以此估计该市居民的消费支出情况。要求如下。

① 指出该调查的总体、样本、个体及参数、统计量、变量。

② 某户居民每月支出额是分类变量、顺序变量还是数值型变量?

③ 某户居民每月食品支出额是离散型变量还是连续型变量?

④ 某月1 000户居民的支出额和12个月1 000户居民的平均支出额中,哪个是时间序列数据?哪个是截面数据?

⑤ 上述数据是观测数据还是实验数据?

(3)某校组织了一次学生消费水平的调查。该校共有在校生5 000人,随机调查了800人。要求如下。

① 指出该项调查的总体、总体单位、样本、样本单位。

② 针对该项调查,设计调查内容,并举例说明什么是变量、统计量、参数,什么是离散型变量和连续型变量。