现代心理与教育统计学

二、统计分组

字体:16+-

所谓统计分组(grouping),就是根据被研究对象的特征,将所得数据划分到各个组别中去。对研究中所获得的大量数据进行统计分组是对数据进行整理的重要步骤。

(一)统计分组前的准备

将数据进行分组前,先要对观测数据做进一步的核对和校验。校核数据的目的是为了尽可能地消除记录误差,以便使后续的统计分析建立在一个坚实的基础上。

在研究中,采用一定的观测手段会得到大量数据。但是这些数据在获得过程中,由于不同研究者掌握的观测标准不同,观测仪器的灵敏度不稳,以及观测时某些异常因素的影响,都可以使观测结果产生一些因过失而造成的误差。因此,在对数据进行分组之前,要进一步核实,如果有充分的理由证明某个数据是受到了这些过失影响,那就要将这些数据删除出去,以免它们影响对结果的分析。在这个过程中,切忌随心所欲地删除那些不符合自己主观假设的数据。如果那样做,不仅违背科学原则,还是缺乏科研道德的表现。

尤其在心理与教育科学实验中,常常会收集到一些变异性较大的实验数据。在进行整理时,如果没有充足的理由证明某数据是由实验中的过失所造成,就不应轻易将其排除。如果要删除它们,也应遵循三个标准差准则(简称3σ),即该数据是否落在平均数加减三个标准差之外,有关具体方法将在第四章介绍。对于不能解释其产生原因的异常数据,都应遵循这个准则取舍。

(二)统计分组应注意的问题

1.分组要以被研究对象的本质特性为基础

面对大量原始数据进行分组时,有时需要先做初步的分类,分类或分组一定是要选择与被研究现象的本质有关的特性为依据,才能确保分类或分组的正确。在心理学与教育学研究方面,专业知识的了解和熟悉对分组的正确进行有重要作用。例如在学业成绩研究中按学科性质分类,在整理智力测验结果时,按言语智力、操作智力和总的智力分数分类等。

2.分类标志要明确,要能包括所有的数据

对数据进行分组时,所依据的特性称为分组或分类的标志。整理数据时,分组标志要明确并且在整理数据的过程中前后一致。这就是说,关于被研究现象本质特性的概念要明确,不能既是这个又是那个。另外,所依据的标志必须能将全部数据包括进去,不能有遗漏,也不能中途改变。

(三)分组的标志

分类标志有各种各样。这些分类标志按形式大致可分为性质类别与数量类别两种。

1.性质类别

主要是根据事物的属性不同将被观测的事物加以划分,反映事物在组别、种类上的不同,不说明事物之间的数量差异。例如将一组被试分为男性与女性,按年龄将其分为老年、中年及青年等等,这些不同的类别之间不说明差别的数量。如果分类标志是成绩优劣,并分为优、良、中、差等,也是不同的性质类别。这里分类标志本身包含着好与坏,但不能直接比较其相差的多少。

性质类别可根据事物的性质及研究的需要分成不同的层次,每个层次又可分为不同数量的细目。在对观测数据按性质标志分组时,究竟分多少层次和细目,这要看研究的需要。如果要对分类的数据作进一步分析,就还要看统计方法所提供的可能性。

2.数量类别

这是以数据的取值大小为分类标志,把数据按数值大小以分组或不分组的形式排出一个顺序来。在这种排序中,项目本身就显示了分类的数量信息,这一点与性质类别明显不同。

对原始数据进行排序和分类以后,数量小的就可以直接计算,数量大时再做进一步分组,可制成次数分布表,它便于了解数据的总情况,并对于以后的统计分析或制定图表具有重要的意义。