2.7 数据的汇总
数据的汇总就是按指定的分类变量对观测量进行分组并计算各分组中某些变量的描述统计量。本节以按性别进行成绩统计为例,讲解数据的汇总操作,本例要求按性别分别输出数学和物理成绩的均值,以此分析不同性别的学生对知识的掌握程度。本例的原始数据如图2-66所示。
图2-66 未进行汇总的原始数据
数据的汇总的操作方法如下所示:
(1)在菜单栏中选择“数据”|“汇总”命令,打开如图2-67所示的“汇总数据”对话框。
(2)选择分类变量与汇总变量。选择分类变量,单击按钮将其选入“分界变量”列表框;选择要进行汇总的变量,单击按钮将其选入“变量摘要”列表框,本例将“性别”变量选入“分界变量”列表框,将“数学”和“物理”变量选入“变量摘要”列表框,如图2-68所示。
图2-67 “汇总数据”对话框
图2-68 分界变量与变量摘要的选择
(3)设置汇总变量。在“变量摘要”列表框中选中汇总变量,单击“函数”按钮,在弹出的“汇总数据:汇总函数”对话框(见图2-69)中选择汇总函数的类型;单击“名称与标签”按钮,在弹出的“汇总数据:变量名和标签”对话框(见图2-70)中设置汇总后产生的新变量的变量名称与变量标签。
图2-69 “汇总数据:汇总函数”对话框
图2-70 “汇总数据:变量名和标签”对话框
如果用户希望在新变量中显示每个类别中的观测量的个数,可以选中“个案数”复选框并在其后的“名称”文本框中输入相应变量的名称。
本例输出数学和物理变量的平均值,分别命名为“数学平均成绩”和“物理平均成绩”。
(4)进行相应的设置。
①“保存”选项组:该选项组用于设置汇总结果的保存方式。
“将汇总变量添加到活动数据集”单选按钮:表示系统会将汇总的结果保存到当前数据集。
“创建只包含汇总变量的新数据集”单选按钮:表示系统将创建一个新的、只包含汇总变量的数据集,用户可以在“数据集名称”文本框中输入新数据集名称。
“创建只包含汇总变量的新数据文件”单选按钮:表示系统会将汇总后的变量保存到一个新的数据文件。本例选中“将汇总变量添加到活动数据集”单选按钮。
②“用于大型数据集的选项”选项组:该选项组用于设置对于较大数据集的处理方式。
“文件已按分界变量进行排序”复选框:表示数据已经按照分组变量进行了排序,系统将不再进行排序操作。
“汇总前对文件进行排序”复选框:表示系统会在进行汇总前按照分组变量对数据进行排序。本例选中“文件已按分界变量进行排序”复选框。
(5)单击“确定”按钮,就可以进行汇总操作。
图2-71即为按性别汇总后的数据文件,SPSS分别给出了男生和女生的数学与物理成绩的均值,并作为新变量保存在数据文件中。
图2-71 汇总后的数据文件