现代心理与教育统计学

一、斯皮尔曼等级相关

字体:16+-

(一)适用资料

积差相关是对两个变量之间相关强度的“标准测量”指标。斯皮尔曼等级相关(Spearman's correlation coefficient for ranked data)则是对皮尔逊相关系数的延伸。它是英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导出来的,因而有人认为斯皮尔曼等级相关是积差相关的一种特殊形式。

斯皮尔曼等级相关是等级相关(rank correlation)的一种,其相关系数常用符号rR或rS表示,有时候也把这一统计量称为斯皮尔曼ρ系数(Spearman's rho)。它适用于只有两列变量,而且是属于等级变量性质的具有线性关系的资料,主要用于解决称名数据和顺序数据的相关问题。对于属于等距或等比性质的连续变量数据,若按其取值大小,赋予等级顺序,转换为顺序变量数据,亦可计算等级相关,此时不必考虑分数分布是否是正态。因而,有些虽属等距或等比变量性质但其分布不是正态的资料,虽然不能用积差相关的方法求相关,但能计算等级相关。可见等级相关方法适用的范围要比积差相关大,又对数据总体分布不作要求,这是其优点所在。另外,当N<30时,计算也比较简便。等级相关的缺点是一组能计算积差相关的资料若改用等级相关计算,精确度要差于积差相关,因此,凡符合计算积差相关的资料,不要用等级相关计算。

(二)计算公式

1.等级差数法(N<30)

式中:N为等级个数;

D指二列成对变量的等级差数。

这是斯皮尔曼等级相关的基本计算公式。

2.等级序数法

如果不用等级差数,而直接用等级序数计算,可用下式:

式中:RX与RY为两列变量各自排列的等级序数。

公式5-7a与公式5-7b是等效的。上述计算等级相关的公式是由用原始分数计算积差相关的公式推导而来。因为等级变量为算术级数,其平均数、总和、平方和可用等级序数表示其固定关系。由此可见,等级相关亦属积差相关体系,是直线相关的一种。

下面举例说明公式5-7a、公式5-7b的应用。

【例5-3】 现有10人的视、听两种感觉通道的反应时(单位:毫秒),数据见下表。问视、听反应时是否具有一致性?

表5-7 等级相关系数计算说明

解:此题研究视觉和听觉反应时是否具有一致性,这两列变量都是同一组被试者测得的,是成对的数据,因此要用相关的统计方法。但此例中只有10对反应时数据,反应时数据的次数分布是否正态也无法确定,若用积差相关计算,条件稍欠满足,因此,选用等级相关计算则更为合适。

根据表中的计算,已知N=10,∑D2=48,∑RXRY=361

将N、∑D2代入公式5-7a,得:

将N与∑RXRY代入公式5-7b,得:

答:这10人的视听反应时的等级相关系数为0.71。

3.有相同等级时计算等级相关的方法

表5-8 不同数目相同等级的对平方和的影响

式中C称为校正数(即减少的差数),n为相同等级的数目,如表5-8中R2的相同数n=2,R3中n=3,R4中n=4,…

下面是出现相同等级时,计算等级相关系数的公式:

上面公式中大写N为成对数据的数目,小写n为各列变量相同等级数。具体应用,见下面的举例。

【例5-4】 表5-9是10名学生的数学和语文考试成绩,问数学与语文成绩是否相关?

解:一般情况学业成就测试因其考试性质和目的不同,考试成绩分布很难保证每次都为正态,该例中的考试性质不明确,难以确定其成绩是否为正态;另外,成对考试成绩数目较少。因此,虽属等距变量,但在此不能用积差相关计算,应该用等级相关计算相关系数。

表5-9 出现相同等级时计算等级相关系数的步骤表解

从表中数据得知,X(语文)有2个数据的等级相同,等级为4.5,Y(数学)数据中有2个数据的等级相同,等级为3.5,另外3个数据的等级相同,等级为8。两对偶等级差的平方和∑D2=26,数据对数为N=10。因此

答:数学与语文成绩有相关,相关系数为0.84。

表5-9中的数据若不用公式5-9计算,而用公式5-2计算,则得相关系数 r=0.829。

在心理与教育方面的研究中,经常采用等级评定量表的方法,对成绩或某些心理属性进行评定,评定量表中等级的分级越少,重复的等级数目就越多。这时若用等级相关法计算相关,就应该用有相同等级时计算相关的公式5-9计算。

【例5-5】 有12名学生的两门功课成绩评定分数,见表5-10。问该两门功课成绩是否具有一致性?

表5-10 有相同等级时等级相关系数的计算说明

解:从表中知N=12,∑D2=86.5,课程A的相同等级“优”为4个,“良”为5个,“中”为3个。课程B的相同等级“优”为5个,“良”为4个,“中”为3个。

答:因rRC较大,故可以说两门课程的成绩具有一致性。

类似问题,也可用列联相关方法计算相关程度,具体见本书后面的章节。