现代心理与教育统计学

二、标准分数

字体:16+-

标准分数(standard score),又称基分数或Z分数(Z-score),是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。离平均数有多远,即表示原始分数在平均数以上或以下几个标准差的位置,从而明确该分数在团体中的相对地位的量数。标准分数从分数对平均数的相对地位、该组分数的离中趋势两个方面来表示原始分数的地位。

(一)计算公式

式中:X代表原始数据;

s为标准差。

【例4-7】 某班平均成绩为90分,标准差为3分,甲生得94.2分,乙生得89.1分,求甲乙二学生的Z分数各是多少?

根据公式4-16

答:甲生的标准分数是1.4,乙生的标准分数是-0.3。

(二)标准分数的性质

1.Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。

3.一组原始数据中,各个Z分数的标准差为1,即sZ=1。根据Z分数的第二条性质和标准差公式可以推证。

4.若原始分数呈正态分布,则转换得到的所有Z分数值的均值为0,标准差为1的标准正态分布(standard normal distribution)。

了解标准分数的性质,对于标准分数的应用极为重要。

(三)标准分数的优点

1.可比性。标准分数以团体平均分作为比较的基准,以标准差为单位。因此不同性质的成绩,一经转换为标准分数(均值为零,标准差为1),相当于处在不同背景下的分数,放在同一背景下去考虑,具有可比性。

2.可加性。标准分数是一个不受原始分数单位影响的抽象化数值,能使不同性质的原始分数具有相同的参照点,因而可以相加。

3.明确性。知道了某一被试的标准分数,利用标准正态分布函数值表,可以知道该分数在全体分数中的位置,即百分等级,也就知道了该被试分数在全体被试分数中的地位。所以,标准分数较原始分数意义更为明确。

4.稳定性。原始分数转换为标准分数后,规定标准差为1,保证了不同性质的分数在总分数中的权重一样。在心理测验中,使用标准分数可以弥补由于测试题目难易程度不同,造成不同性质测试之间标准差相距甚远,使得各个测试对总分所起的作用不同,即无形中增大了某一测试的权重的不足,使分数能更稳定、更全面、更真实地反映被试的水平。这在学科测验和人事选拔中尤其重要,有利于录取的公正性。

(四)标准分数的应用

Z分数不仅能表明原始分数在分布中的地位,而且能在不同分布的各个原始分数之间进行比较,同时,还能用代数方法处理,因此,它被教育统计学家称为“多学科表示量数”,有着广泛的用途。

1.用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。

Z分数可以表明各个原始数据在该组数据分布中的相对位置,它无实际单位,这样便可对不同的观测值进行比较。这里所说的数据分布中相对位置包括两个意思,一个是表示某原始数据以平均数为中心以标准差为单位所处距离的远近与方向;另一个意思是表示某原始数据在该组数据分布中的位置,即在该数据以下或以上的数据各有多少。如果在一个正态分布(或至少是一个对称分布)中,这两个意思可合二为一。但在一个偏态分布中,这两个意思就不能统一。这一点在应用Z分数时要特别注意。例如有一人的身高是170厘米,体重是65千克(也可以是另一人的体重),究竟身高还是体重在各自的分布中较高?这是属于两种不同质的观测,不能直接比较。但若我们知道各自数据分布的平均数与标准差,这样我们可分别求出Z分数进行比较。设Z身高1.70=0.5,Z体重65=1.2,则可得出该人的体重离平均数的距离要比身高离平均数的距离远,即该人在某团体中身高稍微偏高,而体重更偏重些。如果该团体身高与体重的次数分布为正态,我们还可更确切地知道该人的身高与体重在次数分布的相对位置是多少,从而进行更确切(或更数量化)的比较。

在实际的教育与心理研究中,经常会遇到属于几种不同质的观测值,此时,不能对它们进行直接比较,但若知道各自数据分布的平均数与标准差,就可分别求出Z分数进行比较。

【例4-8】 某年高考理科数学全国平均成绩65分,标准差是12.5分,考生A、B、C三人的数学原始分数是50分、65分、85分,求他们的标准分数是多少?

答:考生A的数学标准分数是-1.2,B为0,C为1.60。

一个原始分数被转换为Z分数后,就可知道它在平均数以上或以下几个标准差的位置,从而知道它在分布中的相对地位。当原始分数的分布是正态分布时,只要求出分布中某一原始分数的Z分数,就可以通过查正态分布表得知此原始分数的百分等级,从而知道在它之下的分数个数占全部分数个数的百分之几,进一步明确此分数的相对地位。有关内容将在介绍正态分布时再做详细叙述。

2.计算不同质的观测值的总和或平均值,以表示在团体中的相对位置。

不同质的原始观测值因不等距,也没有一致的参照点,因此不能简单地相加或相减。在前面介绍算术平均数时,也讲到计算平均数时要求数据必须同质,否则会使平均数没有意义。但是,当研究要求合成不同质的数据时,如果已知这些不同质的观测值的次数分布为正态,这时可采用Z分数来计算不同质的观测值的总和或平均值。例如,已知高考的各科成绩分布是正态分布,但是由于各科的难易度不同,因此,各科成绩就属于不同质的数据。因此,在高考计分时,就改变了过去累加各科分数计算总分数或求平均分的方法,采用了Z分数求总分或平均分,使计分更加科学。类似这种情况也有期末成绩的总和等。一般情况,在学科测验中用Z分数合成成绩更加合理。

【例4-9】 A、B两个学生在三种考试中的分数见下表,试比较二人的分数是否有差别。

解:下面用表格形式列出已知条件、求解的结果

答:两个学生在三门功课中的成绩总分没有差异。

下面是另外一个类似的例子。

【例4-10】 下表是高等学校入学考试中两名考生甲与乙的成绩分数。试问根据考试成绩应该优先录取哪名考生?

解:表格的后几列列举出了计算的结果:

答:如果按总分录取则取乙生,若按标准分数录取则应取甲生。

在上例中,为何会出现这样悬殊的差别?这是由于不恰当地计算总和分数造成的,因为各科成绩难易度不同,分散程度也不同,各门学科的成绩分数不等价,亦即数据是不同质的,这时应用总和分数不够科学,故此出现这类问题,科学的方法应当用Z分数合成。从Z分数可知甲生多数成绩是在平均数以上,即使有两种成绩低于平均数,差别也小。总之成绩较稳定且在分布较高处,而乙生则不然。可见应用Z分数更趋合理。

3.表示标准测验分数。

经过标准化的教育和心理测验,如果其常模分数分布接近其正态分布,为了克服标准分数出现的小数、负数和不易为人们所接受等缺点,常常是将其转换成正态标准分数。转换公式为:

式中:Z′为经过转换后的标准正态分数;

a、b为常数;

标准分数经过这样的线性转换后,仍然保持着原始分数的分布形态,同时仍具有原来标准分数的一切优点。例如,早期的智力测验中是运用比率智商(IQ)作为智力测查的指标。

这种表示智力的方法有一定局限性,因为人到成年以后智力不再随年龄而增大,到了老年甚至智力有衰退,要用上面的公式表示则不好。因此,韦克斯勒在韦氏成人智力量表中使用离差智商这一概念表示一个人在同龄团体中的相对智力。

IQ=15Z+100

Z分数的用途非常广泛,但也有一些缺点,如计算相对比较繁杂,还有负值和零值,以标准差为单位,常常还会带有许多小数,在进行比较时还必须满足原始数据的分布形态相同这一条件。在实际研究中,由于各种原因,很难保证不同数据的理论分布形态相同。为了克服这些缺点,在教育与心理测量研究中,人们更多的是对Z分数进行线性转换,使之符合理论上的正态分布,这种分数通常叫做 “正态化的标准分数”,将在后面的章节中叙述。