第一节 统计的内涵
“统计”一词有三种含义:统计学、统计工作和统计资料。统计学是一系列统计方法的理论阐述;统计工作是统计的具体实践活动;统计资料是统计工作各阶段的成果,也可称为统计数据。
一、统计学
统计学是收集、整理、分析和解释统计数据的科学,是一门方法论性质的学科。其目的是探索研究对象的数量特征和数据的内在规律。
统计学的这一定义包含了以下3个要点。
(1)统计学是研究“数据”的科学,离开了数据,统计学也就失去了它存在的意义,因此有人称统计学是“数据的科学”。
(2)统计学是方法论科学,是研究数据的“工具”,因此它适用于所有有数据存在的学科领域。
(3)统计学研究的不是抽象的数据,而是“有载体的统计数据”,因此利用统计方法得到的任何数据特征和数据规律都与某一研究对象紧密相连。
统计学的研究对象是现象总体的数量方面。统计学通过对总体中大量个体的差异化数据进行收集、整理和分析,获得研究对象总体的特征和规律。
英文“Statistics”一词包含了两层含义:一是作为一门学科的统计学,二是统计数据或统计资料。这也说明了统计学与统计数据之间密不可分的关系。
二、统计工作
一般将统计工作概括地分为4个阶段,即统计设计、数据收集、数据整理和数据分析,如图1-1所示。
图1-1 统计工作过程
1.统计设计
统计设计是根据统计研究的目的和研究对象的特点,对统计工作的各个方面及各个环节所做的通盘考虑与安排。其基本任务是制定各种统计工作方案,主要内容应包括统计指标体系、统计调查方案、统计汇总或整理方案以及统计分析方案等诸多方面。统计设计是统计工作实施的基本依据,是使统计工作协调、有序、顺利进行的必要条件。
2.数据收集
数据收集是根据统计设计的要求,采用科学的数据收集方法,收集总体中全部或部分个体数据资料的工作过程。数据收集是统计工作的基础环节,是认识事物的起点。原始数据质量的高低,直接影响到分析结论是否可靠。因此,数据收集阶段应尽可能地降低统计调查误差。
3.数据整理
数据整理是对收集来的统计数据进行科学的加工整理,使之系统化、条理化,把大量反映个体特征的零散资料转化为反映总体综合数量特征的统计资料的过程。数据整理是数据收集和数据分析之间承上启下的中间环节,其主要任务是对收集的数据进行分组、归类,并用合适的统计表或统计图展示整理的结果。
4.数据分析
数据分析是运用统计方法及与分析对象有关的知识,定量与定性地对研究对象总体进行分析,以揭示研究对象数量特征和数量规律的统计工作阶段。数据分析是统计工作的最后一环,也是关键的一步。统计分析报告是数据分析的结果,其质量既取决于数据本身的质量,又取决于统计分析人员对统计数据分析利用的程度。
一般来说,统计工作的 4 个阶段是依次进行的,任何一个阶段的工作失误都会影响到下一阶段的工作质量。在某些情况下,为保证统计工作整体取得好的效果,各阶段也会交叉进行。例如,统计人员在数据收集和整理阶段可以进行一些必要的分析,或者对原设计方案进行适当的改进;在数据分析阶段,如果现有资料不能满足分析的需要,可以做一些必要的补充调查、数据整理等工作。
三、统计数据
统计数据是对现象进行计量和分析的结果,是研究对象的特征表现。对个体而言,其特征既可以用数字表示,又可以用文字表示;对总体而言,其特征都是用数字表示的。
一个完整的统计数据应包括3个最基本的构成要素:数据名称、数值和数据的计量单位。在具体表述一个统计数据时,很多时候只有这3个要素是不够的,还应包含对数据其他方面的内涵规定,如数据所属的时间和空间范围等。
例如,“工业机器人95 351台”传递的信息是不完整的,如果改为“2017年前三季度,我国工业机器人有95 351台”,数据的内外边界就很清楚了。
统计数据从不同的角度有不同的分类,通常可以从以下3个角度进行分类,如图1-2所示。
图1-2 统计数据的分类
1.按计量尺度分类
按计量尺度的不同,统计数据分为分类数据、顺序数据和数值型数据。
(1)分类数据用文字来表述,表明事物的不同属性或类别。在进行统计处理时,我们用数字代码来表示分类数据的各个类别。例如,用“1”代表“男性”,用“2”代表“女性”,这里的“1”和“2”只表达了现象分属于两个类别这样一层含义。企业所属的不同行业、企业的不同所有制类型、不同职业等都属于分类数据。
(2)顺序数据用文字来表述,表明有顺序的不同类别。在进行统计处理时,我们同样可以用数字代码来表示。例如,用“1”“2”“3”“4”“5”分别代表考试成绩“不及格”“及格”“中”“良”“优”,这里的“1”“2”“3”“4”“5”不仅表明现象分属于不同的类别,而且表明这些类别的顺序。不同的教育程度、产品的不同等级等均属于顺序数据。
(3)数值型数据用数字来表现各种现象的数量特征,是使用自然或度量衡单位对事物进行计量的结果。一个企业的职工人数、产值、销售收入、市场占有率等都是用具体的数字来表示的。数值型数据不仅能表明现象数量上的不同和大小顺序,数据之间还能进行数量运算。大部分统计分析方法适用于数值型数据,统计处理的大多是数值型数据。
分类数据和顺序数据也称为品质数据或定性数据,数值型数据也称为数量数据或定量数据。
2.按数据来源分类
按来源不同,统计数据可分为观测数据和实验数据。
(1)观测数据是指通过直接调查或观察收集的数据。社会经济领域的统计数据基本上是观测数据。
(2)实验数据是通过对实验对象、实验环境及实验过程进行有效控制而获得的统计数据。这些数据主要用于考察变量之间的因果关系。
3.按与时间的关系分类
按与时间的关系不同,统计数据可分为截面数据、时间序列数据和面板数据。
(1)截面数据是指某一总体中的不同个体在相同或近似相同时间上的数据表现。
(2)时间序列数据是指将不同时间上的某一指标值列出所形成的按时间顺序排列的数据序列。
(3)面板数据是指总体中的不同个体在不同时间上的数据表现,是时间序列数据与截面数据的结合。