现代心理与教育统计学

二、肯德尔等级相关

字体:16+-

肯德尔等级相关方法有许多种。有适合两列等级变量资料的交错系数(又称肯德尔τ相关,字母τ读作tau)和相容系数(常用符号ξ表示),它们的功用与斯皮尔曼等级相关相同,故从略。这里主要介绍适合多列等级变量资料的方法。

(一)肯德尔W系数

1.适用资料

肯德尔W系数,又称肯德尔和谐系数(Kendall coefficient of concordance),是表示多列等级变量相关程度的一种方法,适用于两列以上的等级变量。肯德尔和谐系数常用符号W表示。

计算肯德尔和谐系数,原始数据资料的获得一般采用等级评定法,即让K个被试(或称评价者)对N件事物或N种作品进行等级评定,每个评价者都能对N件事物(或作品)的好坏、优劣、喜好、大小、高低等排出一个等级顺序。因此,最小的等级序数为1,最大的等级系数为N,这样,K个评价者便可得到K列从1至N的等级变量资料,这是一种情况。另一种情况是一个评价者先后K次评价N件事物或N件作品,也是采用等级评定法,这样也可得到K列从1至N的等级变量资料。这类K列等级变量资料综合起来求相关,就用肯德尔W系数。

例如,有十个评价者,对红、橙、黄、绿、青、蓝、紫七种颜色进行评价,获得的数据见表5-11。假如所有的评价者都一致认为红色是最满意的,就给它的等级评为1,十个评价者对红色的评价等级总和就是10。同样,如果每个评价者对橙色评价的等级都是2,橙色得到的等级总和就是20。以此类推,到了最后一种紫色,大家都给它赋予最高的等级为7,紫色的等级总和就是70。换句话说,各种被评价的颜色各自获得的等级的总和表现出相当大的差异性。另一方面,如果说评价者意见有分歧,每种颜色的等级既有低的,也有高的,这样,各种颜色各自的等级总和可能会大致相等。因此,如果评价者之间爱好差异较大(随机性行为),各种颜色分别获得的等级总和差异就很小。肯德尔在推导这一统计量时使用了“等级总和的变异性”,他界定W是每一评价对象实际得到的等级总和的变异(variance of column totals)与被评价对象最大可能变化的等级总和的变异(maximum possible variance of column totals)的比值。因为,一般在进行评价时,原始资料为等级数据,最大可能的等级总和的变异是可以计算出的。在这个例子中,根据表5-11中的数据,十个评价者对七种不同颜色评价等级总和的变异实际上就是33,63,50,15,40,17,62这一组数据的方差值(386),理论上最大可能的等级总和的变异值为10,20,30,40,50,60,70这一组数据的方差值(466.67),这二者的比值为0.827,它就是肯德尔系数。

2.基本公式及计算

Ri代表评价对象获得的K个等级之和;

N代表被等级评定的对象的数目;

K代表等级评定者的数目。

W值介于0与1之间,计算值都为正值,若表示相关方向,可从实际资料中进行分析。如果K个评价者意见完全一致,则W=1;若K个评价者的意见存在一定的关系,但又不完全一致,则0<W<1;如果K个评价者的意见完全不一致,则W=0。

【例5-6】 有10人对红、橙、黄、绿、青、蓝、紫七种颜色按照其喜好程度进行等级评价。其中,最喜欢的等级为1,最不喜欢的等级为7。结果见表5-11。问这10人对颜色的爱好是否具有一致性?

表5-11 肯德尔和谐系数计算说明

把s代入公式5-10a得:

把s代入公式5-10b得:

答:从W值看,这十个人对颜色的喜爱具有较高的一致性,亦即这十人所喜爱的颜色比较一致。喜好的顺序可由Ri的大小给出大致情况,Ri大者等级序数大;小者等级序数小。十人对七种颜色由最喜欢到最不喜欢的顺序是:绿、蓝、红、青、黄、紫、橙。

类似本例应用肯德尔W系数的资料是很多的,如欲考察几位老师对多篇作文的评分标准是否一致(又称评分者信度),就应该使用肯德尔W系数。

从肯德尔和谐系数的定义看,它并不是一个标准的相关系数,它仅仅是根据熟悉的统计量做出的一种解释。它最大的优点就是取值范围在0和1之间。

3.有相同等级出现时W的计算

在进行等级评定时,常会遇到两个或两个以上事物的等级相同,如果遇到这种情况应该采用下面的修正公式:

n为相同等级的数目。

【例5-7】 五位评分者对七篇作文进行评价,评价等级为1-5,评价结果见表5-12,试问评分者之间对标准的掌握是否一致?

表5-12 有相同等级时肯德尔和谐系数的计算

答:从计算结果可知,五位评分者对七篇作文的评价标准比较一致,或者说评分者信度较高。

(二)肯德尔U系数

肯德尔U系数又称一致性系数,适用于对K个评价者的一致性进行统计分析。它与肯德尔W系数所处理的问题相同,但所处理的资料的获得方法不同,计算的结果也不一样。

1.适用资料

2.公式及计算

肯德尔U系数的计算公式如下:

式中:N为被评价事物的数目,即等级数;

K为评价者的数目;

rij为对偶比较记录表中i>j(或i<j)格中的择优分数(具体见表5-13)。

使用公式5-12之前,应先将资料加以整理:将被评价的事物用符号代表,分别横列与纵列,这样可画成N×N个格子。将每一对事物择优比较的结果按优者记1,非优者记0,难以判定记0.5的方法记分,将分数填到相应的格子中,这便是rij。两相同事物不用比较,因此在整个方格中,位于对角线位置的小格空着。在对角线以下每格的次数记为i>j,对角线以上的每格中的次数记为i<j。将整理后的资料,代入公式计算。

【例5-8】 表5-13是根据表5-11中10个评价者对7种颜色对偶选择分数整理而成。整理的方法为:如果第一个评价者对7种颜色评定的等级分别为绿色1、蓝色2、青色3……也就是说若用对偶比较,则当绿色与其他颜色比较时,都选择绿,因此在绿色这一行都记为1分;蓝色排第二,其意是当蓝色与其他6种颜色比较时,除绿色之外都选择蓝色……以此类推。试计算肯德尔U系数。

表5-13 肯德尔U系数计算说明

解:已知N=7,K=10,根据表5-13中对角以下的择优分数,

同一种资料,整理方式不同,一致性程度的计算公式也不同,得出的结果也有差异。一致性系数为0.66,而和谐系数则为0.827,见【例5-6】,等级评定的测量水平,要高于对偶比较的择优分数。