现代心理与教育统计学

四、正态分布理论在测验中的应用

字体:16+-

如果研究资料隶属于正态分布,为了将其更好地数量化,得到较为符合实际的数量化结果,通常会利用正态分布的特性进行转化。

(一)化等级评定为测量数据

在心理与教育评价中,对有些心理量如爱好程度、意志强弱、能力大小等常用等级评定法赋予一定的评价分数或等级分数。应用这种方法在最后处理结果时,常会遇到以下两个问题:第一是不同评定者由于各自的标准不同,同一个心理量进行评定时可能给的等级分数不等,这时应如何综合每个评定者的结果?第二是等级分数界线宽,又不一定是等距尺度,要比较不同被评定的心理量的差异,应如何进行?上述两个问题的解决,都需要首先将等级评定转化为测量数据。

将等级评定转化为测量数据,首先要考虑被评定的心理量是否为正态分布,若为正态分布,可以转化为测量数据,即标准分数Z。若不是正态分布,则不能将等级评定转化为Z分数。将等级评定转化为测量数据的方法是用各等级中点的Z分数代表该等级分数。具体步骤如下:①根据各等级被评者的数目求各等级的人数比率;②求各等级比率值的中间值,作为该等级的中点;③求各等级中点以上(或以下)的累加比率;④用累加比率查正态表求Z值,该Z分数就是各等级代表性的测量值;⑤求被评者所得评定等级的测量数据的算术平均数,即为每个被评定者的综合评定分数。

【例6-2】 表6-2是3位教师对100名学生的学习能力所作等级评定的结果。表6-3是3名学生从3位老师那儿获得的评定等级,试将其转化为Z分数。

表6-2 3名教师对100名学生的评定结果

表6-3 各学生所获得的评定等级

解:此题涉及的是对学习能力的评定,学习能力的分布一般为正态,故可将等级评定转化为测量数据进行比较。此外,表面上看学生1与学生2的等级相同,都是两个A,一个B,学生3最差。但从表6-2分析,教师甲对A等评定较严,教师乙稍宽,教师丙更宽。因此,虽然等级相同,但其等级值并不等价,必须将等级评定转化为测量数据。表6-2中三名教师的评定结果,可图示如下:

图6-5 化等级评定为测量数据

根据表6-2的资料,用上述方法将各教师的等级评定转化为Z分数,见表6-4。

表6-4 化等级评定为Z分数

有了各位评定者所评等级的代表值Z分数,就可据此求3名学生的平均Z分数了。学生1的平均成绩为(0.94+1.65+1.28)/3=1.29,学生2的平均成绩为(1.96+0.84+1.28)/3=1.36,学生3的平均成绩为(-0.94+0-0.32)/3=-0.42。这三名学生的平均成绩表明,虽然学生1与2在评定的等级上相同,但二者的Z分数不同。

(二)确定测验题目的难易度

测验题目的难易度一般用答对者的百分数确定,但是百分数不是等距尺度,有时要比较不同难易度题目之间的难度距离,需要将难易百分数根据正态分布概率转换成难度分数。原理是假设一个测验中不同难易题目的分布是正态的,即一个测验中通过率较大和较小的题目很少,而通过率居中的题目较多。确定题目难度分数的具体步骤如下:①计算各题目的通过率,即答对人数与参加测验人数的比例,在正态表中它代表的是曲线下的面积;②用0.5减去通过率,不计正负号,获得正态分布表中的概率值,即表6-5中第三列的p值;③依照p值查正态表中相应的Z值,通过率大于50%的Z值计为负值,通过率小于50%的Z值计为正值;④将查表得到的Z分数加上5(假定正负5个标准差包括了全体)便可得到从0~10的十进制的难度分数值。这样就有理由认为难度分数是等距尺度,不同题目之间的难易差异就可直接比较。具体计算见表6-5。

表6-5 难度分数的计算

(三)在能力分组或等级评定时确定人数

假定能力是正态分布,这时若将能力分组,各组人数应是多少?或评定不同等级,各等级人数应是多少才能使分组或评定等级构成等距的尺度?依据正态分布理论确定各组或各等级的人数,具体方法如下:①将6个标准差(假定6个标准差包括了全体)除以分组的或等级的数目,做到Z分数等距;②查正态分布表,从Z求p,即各等级或各组在等距的情况下应有的比率;③将比率乘以欲分组的人数,便得到各等级或分组该有的人数。最后所计算的各组人数分布,应与总数相等。有时由于从Z查p有误差,使结果不能与总数相符,这时应将居中的那一组做适当的增加或减少,因为这样做,对百分比率的影响甚小。

【例6-3】 要把 100人在某一能力上分成5个等级,各等级应该有多少人,才能使等级评定做到等距?

解:6σ÷5=1.2σ,要使各等级等距,每一等级应占1.2个标准差的距离。确定各等级的Z分数界限,然后查表。具体计算见表6-6。

表6-6 能力分为5组时各组人数的分布

表6-6中C组按计算应为45,实际写44,是为了使各组人数之和与总数相等。

(四)测验分数的正态化

学生的学习成绩、能力或智力等教育或心理现象,一般都是正态分布,因而在研究中总是从理论上假设研究对象在总体上是呈正态分布的。但是,由于抽样误差或测试题目难度等偶然因素的影响,实际得到的原始分数分布往往不是正态分布。为了解决这类问题,可采用一定的统计方法将非正态的原始分数转换成正态分布。在编制测验时,也常会遇到已知某总体的分布为正态,但由于所取样本不是正态,这时也需要按其总体将样本分布正态化。这种将样本原始分数分布转换成为正态分布,称作次数分布的正态化。正态化的步骤是:当原始分数不服从正态分布时,先将原始分数的频数转化为相对累积频数(也就是百分等级),将它视为正态分布的概率,然后通过查正态分布表中概率值相对应的Z值,将其转换成Z分数,达到正态化的目的。正态化是利用改变次数的方法,将原来偏态分布中众数所偏的一边拉长,使之成为正态,这是一种非线性转换。一般情况,一组分数正态化后,其原始分数两端相应的Z分数绝对值比较接近,但没正态化时两端的原始分数对应的Z分数绝对值相差较大。正态化是建立正态标准分数的关键。但原始分数的正态化也有一定的前提条件,即研究对象的总体事实上应该是正态分布,否则就会歪曲事实,这是使用各种“正态化标准分数”所必须注意的。

图6-6 正态化示意图

T分数(T scores)是从Z分数经过转化而来的一种正态化的标准分数,它是麦克尔(W.A.McCall,1939)创用的方法。心理与教育测验常用它来建立常模。它是将标准分数扩大10倍,再加上50。公式如下:

式中:T表示T分数

Z表示标准分数

T分数的计算分两个步骤:第一步是先将原始分数正态化,第二步是把正态化的Z值代入T值公式加以直线转换。当原始分数不服从正态分布时,需要做第一步。当原始分数服从正态分布时,直接根据公式求出Z值,再将它代入T分数公式就可计算出T分数。由于T分数是由标准分数转换而来的,所以它不仅具备了标准分数的所有优点,而且克服了标准分数较难理解的不足。首先,它没有负数。同时,若出现小数时可以四舍五入为整数,而误差不会很大。其次,它的取值范围比较符合百分制的记分习惯,易于被人们接受。再次,如果可以从理论上假设某一测验的分数应该是正态分布,只是由于抽样误差等偶然因素导致了原始分数偏态分布,那么,运用T分数的方法可迫使其成为正态。

例如,某研究中随机抽取了180名学生的某一能力测验分数,由于这些能力分数不是正态,需要将其正态化。已有研究表明学生的总体能力分布为正态,因此可以用正态化原理和T分数公式将其正态化。步骤如下:①将原始数据整理成次数分布表;②计算各分组上限以下的累加次数cf;③计算每组中点的累加次数,即前一组上限以下的累加次数加上该组次数的一半;④各组中点以下的累加次数除以总数求累积比率;⑤将各组中点以下累积比率视为正态分布的概率,查正态表,将概率转化为Z分数,这一步是关键;⑥将正态化的Z值利用公式6-4加以直线转换:T=10Z+50。具体计算步骤和过程见表6-7。

表6-7 T分数与正态化的计算

T分数虽不等距,但T分数更接近总体的情况。转换后的T分数的平均数为50,标准差为10,平均数上下各五个标准差,正好包括了T分数从0~100。

在使用T分数时,应注意与前面所讲的Z′=10Z+50的线性变换形式区别开来。虽然二者都有相同的平均数和标准差,但T分数是经过正态化的分数,而前者是否服从正态分布还不清楚,它们将以原始分数的分布形态为转移。T分数可用于本来应是正态分布而实际呈偏态分布的各种测验的比较,而前者只能用于分布形态相同或相近的各种测验的比较。

【资料卡6-2】

中国高考标准分数制度

1987年,原国家教委颁布了《普通高等学校招生全国统一考试标准化实施细则》,并于当年开始在广东、海南试行高考标准分。1993~1995年开始建立全国及省、自治区、直辖市各类考生的标准分常模。1994年,陕西、河南两省用标准分数报告高考结果,并用考生标准分数的综合分录取新生。

高考属于常模参照性测试,它根据考生团体(常模团体)的平均分和标准差等标准来解释考生的分数。这些标准称为参照模(常模)。若考生团体是一个省,则称为省级常模参照性考试。这种考试的目的在于把个人成绩与他人作出比较,着眼于团体中考生成绩的区分,以明确个人在团体中的位置。

(一)省级常模量表分数

它是以全省考生作为常模团体,由原始分数转换为标准Z分数,再将Z分数经线性转换得出的导出分数。这个导出分数消除了Z分数的小数和正负,但它只改变了Z分数的表现形式而没有改变其实质。因此,具有标准分的所有特性,可比、可加、含义明确,能准确反映出考生在常模团体中的位置。

1994年陕西省高考应用的导出分数是CEEB分数(C分数),其转换式为:

C=100Z+500

这与美国CBBE、TOEFL考试是一样的。若取Z在正负4之间,最高分就为900,最低分就为100。习惯上称之为T分数。在高考当中,常常根据高等院校的性质,把分数转换的常模团体分为理工农医类常模团体和文史类、外语类常模团体几大类。

(二)省级常模量表的建立

1.单科成绩省级常模量表分数的转换步骤

(1)将所有考生的原始总分由大到小排序。

(2)计算每一分数以下的考生占考生总数的百分比,再乘100后取整,得百分等级。如果分数分段,计算百分等级的公式为:

其中R为全体分数按大小排列,某一给定原始分数所占的名次。N为总人数。如果分数分段,计算百分等级的公式为:

其中Xi为给定的原始分数,f为该分数所在分数段的频数,L为该分数所在分数段的下限,Fb为该分数所在分数段以下累积频数,i为分数段间距,N为总频数(总人数)。

(3)由查标准正态分布表得正态标准化分数Zi。

(4)由Ti=100Zi+500进行线性转换,得省级常模量表分数Ti。

2.总分的省级常模量表分数的转换步骤

(1)将每一考生各学科的Ti分数,按照规定的权重(1994年国家教委规定各科权重都为1)合成总分。

(2)将总分由大到小排序,对总分按前面(2)(3)(4)转换步骤得出综合分T。综合分是由各科总分Y求出对应的Z分数,再经线性变换得出的省级常模量表分数。它的平均分为500,标准差为100,取值范围在100~900之间,并不是各科标准分的简单相加。

(3)在报告分数时,同时公布每个考生的综合分数和百分等级,所以,考生可知道自己的综合分在全省同类考生中所处的位置。

(三)考生怎样由标准分换算自己的原始分

下面是陕西省某考生1994年高考成绩单(理工)

通知单中,每一科目下面有两个分数,前面的分数是该生的标准分,括号内的是百分等级。计算的公式如下:

这样,根据当年度各省考试管理机构公布的某科成绩的平均分和标准差,代入上面的公式,就能算出考生自己的近似原始分数。

——资料来源:陕西省考试管理中心主编,《标准分数及其应用》,西北工业大学出版社,1997年版。