(一)适用资料
多列相关(multiserial correlation)适合处理两列正态变量资料,其中一列为等距或等比的测量数据,另一列被人为划分为多种类别,称为名义变量,如学习成绩被人为划分为优、良、中、差四类。如果某一正态变量被人为划分为三个类别,就称为三列相关,划分为四个类别的就称为四列相关……
多列相关多用于一列正态连续变量与另一列正态的称名变量之间的一致性分析,在测验中时常用于效度检验。亦可作为双列次数分布表求相关系数的一种方法。
(二)公式及计算
多列相关系数的计算公式是由皮尔逊积差相关系数公式推导而来(Jaspen ,1946):
式中:pi为每系列的次数比率;
yL为每一名义变量下限的正态曲线高度,由pi查正态表给出;
yH为每一名义变量上限的正态曲线高度,由pi查正态表给出;
st为连续变量的标准差。
多列相关系数介于-1.00和+1.00之间。相关系数绝对值越接近1,表示其相关程度越高。
【例5-12】 表5-16中的数据是140名学生学习能力测验分数与教师对该部分学生的评价等级(A、B、C、D)资料。计算能力测验与教师评价之间的一致性。
解:学生的学习能力可视为正态分布,由于教师评价等级为四等,因此,这是一个四系列相关问题。具体计算见下表。
表5-16 四系列相关的计算
注意表中yL-yH的计算,因为D等的下限为零,A等的上限为零。故0-0.292=-0.292,0.347-0=0.347,D等的上限亦为C等的下限,以此类推。
答:能力测验与教师评价具有一致性,相关系数为0.717。
如果实验结果能整理成双列次数分布表,可将横列连续变量的分组区间视为一种分类,用表5-16介绍的多系列相关计算方法,来计算两列连续变量的相关系数。