第三节 学好应用统计分析的方法
如何学好应用统计分析,不能一言以蔽之,但在学习中,需要掌握以下几点。
一、明确分析目的
研究目的是统计分析的目标和方向,决定了研究设计、研究对象、研究指标等,而研究的设计方案、分析指标是选择不同统计分析方法的决定因素。因此,正确的统计学分析一定要建立在明确的研究目的基础上,那些没有目的的统计分析,或者事先没有研究设计,事后找来一堆数据的统计分析都是不可取的。
二、建好分析数据库
一般来讲,统计分析需要借助统计分析软件计算,而统计分析软件都要有完整、符合要求的数据或数据库,所以建好分析数据库是统计分析的必要条件。此外,建好分析数据库还可以理清分析思路。在试验或调查研究中获取的数据有时多而零散,如果不能进行科学的整理汇总,就会杂乱无章,理不清头绪,抓不住要点,甚至无所适从,最后可能束之高阁、弃之不用,造成数据的极大浪费。相反,建好数据库,可以使观察对象的研究指标一目了然,使研究思路清晰明确。因此,建好数据库是正确统计分析的前提和基础。
三、分清楚变量类型
数据库中各个研究对象的每项观察指标都可以看作是一个分析的变量,变量的类型是统计分析中选择不同统计方法的依据,分清楚变量的类型是正确选择统计方法的基础和关键。变量分为数值变量和分类变量两类,其中分类变量按是否有序以及项数的多少,又分为二项无序、多项无序、二项有序、多项有序几种类型。实际应用中,常常将二项无序分类变量和二项有序分类变量合并为二项分类变量,详见第二章。
四、正确选用统计学方法
统计学分析可看作是变量与变量间的关系分析,当研究目的和设计方案确定以后,不同特征类型的变量组合决定了不同统计方法的选择。如,二项分类变量与二项分类变量关系的分析选用χ2检验,数值变量与二项分类变量关系的分析选用t检验,数值变量与多项无序分类变量关系的分析选用F检验,数值变量与数值变量关系的分析选用直线相关回归分析……。详见第三章以后各章节。
五、熟悉常用的统计分析软件
统计分析软件是统计分析的必备工具,目前有许多种(套)。常用的国际公认的统计分析软件有:统计分析系统(SAS)、社会学统计程序包(SPSS)。微软公司的电子表格系统Microsoft Office Excel也有广泛应用。
SAS(Statistics Analysis System)是统计分析系统的英文缩写,最早由北卡罗来纳大学的两位生物统计学研究生编制,1976年由SAS软件研究所正式推出。SAS完全针对专业用户进行设计,以编程为主。其最大特点是分析模块调用,功能强大,深浅皆宜,简短编程即可同时对多个数据文件进行分析。但对一般用户而言,人机界面不太友好,初学者编写、使用程序会存在各种难度。本书介绍的是SAS 9.2版本的程序。
SPSS(Statistical Package for the Social Science)是社会学统计程序包的英文缩称,20世纪60年代末由美国斯坦福大学的三位研究生研制,1975年由芝加哥SPSS总部推出。SPSS系统的最大特点是菜单操作,方法齐全,绘制图形、表格较为方便,输出结果比较直观。但其统计分析功能略显逊色,特别是难以同时分析处理多个数据文件。本书介绍的是SPSS 13.0版本的程序。
Microsoft Office Excel(简称Excel)是美国微软公司开发的电子表格系统,是目前应用最为广泛的办公室表格处理软件之一。Excel作为Office软件的一员被众多用户所熟知,具有数据处理、函数运算、数据库、图表制作等功能,进行统计分析时具有易得、快速、直观、简单、运算可视等优点,也是建立数据库、进行常用统计分析的好工具。
不同软件各有利弊、互有长短,用户可根据需要和使用习惯,选择一种或几种软件进行数据分析。本书仅介绍SAS、SPSS的计算方法和程序,Excel统计分析另书出版,其他不作阐述。