现代心理与教育统计学

第四节 心理与教育统计基础概念

字体:16+-

一、数据类型

对研究数据进行分类,了解数据类型和水平,对选用恰当的统计方法至关重要。因为不同类型的数据,适用的统计方法不同,也就是说各种统计方法各有其适宜的数据水平。根据不同的分类标准,心理与教育科学研究中的数据可以区分为不同的类型。

(一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类

所谓计数数据(count data),是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,如人口数、学校数、男女数等等,一般都取整数形式。测量数据(measurement data)是指借助于一定的测量工具或一定的测量标准而获得的数据,如身高、体重、考试分数、智力测验分数、各种感觉阈值,等等。

(二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型

称名数据(nominal data)只说明某一事物与其他事物在属性上的不同或类别上的差异,它具有独立的分类单位,其数值一般都取整数形式,只计算个数,并不说明事物之间差异的大小,比如性别、颜色类别、人口数、学校数、被试对某一事物的态度(赞成、反对、没有意见)等等,它们只能用具有相同属性的个体数目来统计。在教育和心理类调查研究中,有关被试属性的调查资料,大多属于这类数据。

顺序数据(ordinal data)是指既无相等单位,也无绝对零的数据,是按事物某种属性的多少或大小,按次序将各个事物加以排列后获得的数据资料。如学生的等级评定、喜爱程度、品质等级、能力等级、兴趣等。这种数据不具有相等单位,也没有绝对零点,只能排出一个顺序,不能指出相互间的差别大小。如五名学生的身高分别为1.81m、1.79m、1.75m、1.70m、1.69m,由高到低对应的排名次序为1、2、3、4、5。在这个例子中,身高排名第1的学生与排名第2的学生,身高差距并不等于身高排名第2的学生与第3名学生之间的差距。也就是说,这类数据不能进行加减乘除运算。

等距数据(interval data)是有相等单位,但无绝对零的数据,如温度、各种能力分数、智商等。只能使用加减运算,不能使用乘除运算。例如在某一能力测验中,学生A得了80分,学生B得了75分,学生C得70分。鉴于这类数据的特点,在这个例子中,比较三个学生之间的能力分数时,可以说学生A分数高于学生B,学生B高于学生C,而且还可以说学生A分数与学生B分数之差等于学生B与学生C分数之差,因为等距数据在某个区间里具有相等单位。但由于这类数据不是从绝对零点算起的,所以不能认为在该能力测验中得零分的学生,他在这方面的知识、能力就为零。比较时只能用加减法,不能使用乘除法。在这个例子中,也就不能说学生A知识、能力是学生B的多少倍。

比率数据(ratio data)既表明量的大小,也有相等的单位,同时还具有绝对零点,如身高、体重、反应时、各种感觉阈值的物理量等都属于这种数据类型。例如,在一个家庭中,父亲的身高是1.80m,母亲的身高是1.65m,5岁儿子的身高是0.90m。在这个例子中,可以说父亲的身高是他儿子身高的两倍。

(三)按照数据是否具有连续性,把数据划分为离散数据和连续数据

离散数据 (discrete data)又称为不连续数据,如从事某一职业的人数、球赛比分、班级个数等。这类数据在任何两个数据点之间所取的数值的个数是有限的。连续数据(continuous data)指任意两个数据点之间都可以细分出无限多个大小不同的数值。如年龄、长度、重量、自信心分数等,至少在理论上从最高到最低之间都可以进一步细分。对于连续性数据的进一步细分,一是取决于测量技术所允许的精确程度,二是取决于测量值所需要的精确程度。而离散数据一般是取整数,两个单位之间不能再划分细小单位。在心理和教育调查研究、问卷研究、访谈研究等质性研究的实践操作中,这两种数据的区分非常明显。这两种数据的分布规律不同,相应的制表作图方法也不同,所使用的统计方法也有区别。另外,一般情况下计数数据大都是离散数据。