3.2.3 实验操作
下面以数据文件“3-2”为例,说明频数分析的具体操作过程。
1.实验数据描述
数据文件“3-2”显示了2008年我国各个地区制造业的就业人数,数据来源于《中国统计年鉴2008》。以该数据文件为例,利用频数分析对不同地区的就业情况进行分析,显示四分位数、均值和标准差,绘制频率分布直方图和正态曲线,并判断分布形态。
本数据文件的原始Excel文件如图3-13所示(单位:万)。
在SPSS的变量视图中,建立变量“地区”和“制造业”,如图3-14所示。
在SPSS活动数据文件中的数据视图中,把相关数据输入到各个变量中,输入后部分数据如图3-15所示。
图3-13 数据文件“3-2”的原始数据
图3-14 数据文件“3-2”的变量视图
图3-15 数据文件“3-2”的数据视图
2.实验操作步骤
具体的操作步骤如下:
打开数据文件“3-2”,进入SPSS Statistics数据编辑器窗口,然后在菜单栏中选择“分析”|“描述统计”|“频率”命令,打开“频率”对话框。
在源变量列表框中选中“制造业”作为频数分析的变量。
单击“统计”按钮,选中“四分位数”“平均值”“标准差”和“偏度”复选框,单击“继续”按钮。
单击“图表”按钮,选中“直方图”单选按钮与“在直方图中显示正态曲线”复选框,单击“继续”按钮。
单击“确定”按钮,执行频数分析。
3.输出结果分析
选定需要进行频数分析的变量和设置所需要得到的统计量后,单击“确定”按钮就可以得到频数分析的结果,输出结果如图3-16所示。
图3-16 频数分析输出结果
统计量表给出了平均工资的均值、标准差、百分位数等信息,从分析结果可以看出,各地区制造业就业的平均人数为110.783,标准差为105.2184,3个百分位数分别为39.334、72.708和143.037。表的右侧为频率分布直方图和正态曲线。偏度系数为1.579,由此可以看出,各地区的平均工资呈比较明显的偏态分布。