3.3.3 实验操作
下面以数据文件“3-3”为例,说明探索分析的具体操作过程。
1.实验数据描述
数据文件“3-3”记录了两个班级学生的数学成绩、语文成绩,以此数据文件为例,利用探索分析该数据文件中的数学和语文成绩的最大值、最小值、众数、平均数等,并检验样本数据的正态性。原始Excel数据文件如图3-22所示。
在SPSS的变量视图中建立变量“id”“Math”“CHINESE”和“SEX”,分别表示学生班级、数学成绩、语文成绩和性别,在“id”变量中将“一班”和“二班”分别赋值为“1”和“2”;在“SEX”变量中将“男”和“女”分别赋值为“1”和“0”,如图3-23所示。
图3-22 数据文件“3-3”的原始数据
在SPSS活动数据文件的数据视图中,把相关数据输入到各个变量中。输入后部分数据如图3-24所示。
图3-23 数据文件“3-3”的变量视图
图3-24 数据文件“3-3”的数据视图
2.实验操作步骤
打开数据文件“3-3”,进入SPSS Statistics数据编辑器窗口,然后在菜单栏中选择“分析”|“描述统计”|“探索”命令,打开“探索”对话框。
将变量“Math”选入“因变量列表”列表框,将“SEX”选入“因子列表”列表框,将“班级”选入“个案标注依据”列表框。
单击“统计”按钮,在弹出的“探索:统计”对话框中选中“描述”复选框;单击“图”按钮,在弹出的“探索:图”对话框中选中“箱图”选项组的“因子级别并置”单选按钮、“描述”选项组的“茎叶图”复选框以及“含检验的正态图”复选框。
在“探索”对话框中选中“输出”选项组的“两者”单选按钮,然后单击“确定”按钮就可以输出探索分析的结果。
3.实验结果及分析
单击“确定”按钮,SPSS Statistics查看器窗口的输出结果如图3-25~图3-31所示。
图3-25给出了探索分析中的变量样本数据的有效个数和百分比、缺失个数和百分比及总计个数和百分比。通过“个案处理摘要”可以看出本实验中无数据缺失。
图3-26给出了数学成绩按照性别分类的一些统计量,如均值、中值、方差、标准差等。通过该图可以看出女生数学成绩均值要比男生大,而女生数学成绩中值却小于男生的中值。
图3-27给出了因变量样本数据按照因子变量分类的正态性检验结果。列中“统计”表示检验统计量的值,“自由度”表示检验的自由度,“显著性”表示检验的显著水平。对本实验而言,正态检验的原假设是:数据服从正态分布。从“正态性检验”中柯尔莫戈洛夫-斯米诺夫统计量、夏皮洛-威尔克统计量可以看出,女生和男生的数学成绩的显著水平都大于5%,接受原假设,即都服从正态分布。
图3-25 个案处理摘要
图3-26 变量描述
图3-28给出了女生数学成绩的茎叶图。图中“频率”表示相应数据的频数,“Stem”即茎,“叶”即叶子,两者分别表示数据的整数部分和小数部分,“主干宽度”表示茎宽。
图3-27 正态性检验
图3-28 茎叶图
图3-29和图3-30分别给出了女生数学成绩的标准Q-Q图和趋降Q-Q图。标准Q-Q图中的观察点都分布在直线附近,趋降Q-Q图中的点除了极个别点外都分布在0值横线附近,因此显示样本数据服从正态分布,这个结论和正态性检验的结论一致。
图3-31给出了按因子变量性别区分的数学成绩的箱图,其中箱图两头的两条实线分别表示最大值和最小值,中间的黑色实线表示中位数,箱体的上下两端为四分位数。在本实验中女生数学成绩有一个编号为1的异常点或离群值。
图3-29 标准Q-Q图
图3-30 趋降标准Q-Q图
图3-31 箱图