本章主要介绍了积差相关、各类等级相关和质量相关、品质相关的使用条件及计算方法。
1.相关分析就是用一个指标来反映变量之间相关关系的方向和密切程度的线性统计分析技术,它使用的指标就是相关系数。相关分析的方法主要有图示法和计算法。在实际的研究过程当中,相关分析有着重要的用途。
2.积差相关处理的是两列连续性的资料,两个变量都服从于正态分布,数据必须成对。对于两个连续性的数据资料,也可转换成等级资料计算等级相关系数。
3.等级相关处理的是两列等级资料,它根据等级资料处理变量间的相互关系。最常用的等级相关系数有斯皮尔曼等级相关和肯德尔和谐系数。肯德尔和谐系数又被称为评分者信度,在测验编制中使用非常广泛。肯德尔U系数更适合处理对偶评价数据资料。等级相关不涉及变量的分布形态和数据量的多少,是一种非参数分析技术。
4.各种质量相关的共同特点是处理的变量都与类别数据有关。点二列相关主要用于处理二分称名数据和一个连续数据之间的相关程度。二列相关处理的都是连续性数据资料,但其中一列变量被人为划分成了二分变量。多列相关是二列相关的一个发展,其中一列变量被划分成了两个以上的类别,如三个、四个类别。
5.四格相关处理的数据资料都是人为的二分变量,phi系数处理的则是两个真正的二分变量。列联系数处理的则是二因素的R×C列联表资料。不同的品质相关,它们之间最大的区别是适合处理的数据资料不同。
6.偏相关和部分相关是研究消除第三变量(或其他多个变量)影响后的两变量间相关程度的方法。
进一步阅读资料
1.(美)帕加诺(Robert R.Pagano).行为科学中的统计学入门(第6版)(影印版).北京:中国统计出版社,2002:99~128.
2.(美)古德芒德·R.埃维森(Gudmund R.Iversen),玛莉·格根(Mary Gergen).吴喜之,程博,柳林旭,仝莉萍译.统计学:基本概念和方法.北京:高等教育出版社,施普林格出版社,2000:196~215,251~261.
3.(美)戴维·弗里德曼(David Freedman),罗伯特·皮萨尼(Robert Pisani),罗杰·柏维斯(Roger Purves),安妮·阿德卡瑞(Ani Adhikari).魏宗舒,施锡铨,林举干,李毅,吕乃刚,范正绮译.统计学.北京:中国统计出版社,1997:133~177.
4.(美)理查德·鲁尼恩(Richard P.Runyon),凯·科尔曼(Kay A.Coleman),戴维·皮滕杰(David J.Pittenger).心理统计(第9版)(英文版).北京:人民邮电出版社,2004:161~198.
5.(美)阿瑟·艾伦(Arthur Aron),艾琳·N.艾伦(Elaine N.Aron),埃利奥特·库普斯(Elliot Coups).心理统计(影印版)(第4版),北京:世界图书出版公司,2006:443~479,628~629.
计算机统计技巧提示
在Excel中,与相关系数计算有关的函数有:CORREL(相关函数)、PEARSON(皮尔逊积差相关系数函数)、COVAR(协方差函数)、SUMSQ(平方和函数)、DEVSQ(离差平方和函数)、SUMPRODUCT(乘积和函数)、SUMXMY2(两组数据对应数值差的平方和函数)、SQRT (平方根函数)、RANK(等级赋值函数)。 计算相关的方法是:点击 “工具”→“数据分析”,点选“相关系数”,在对话框中输入变量,依据变量数目会得到相关系数值或相关系数矩阵。
在SPSS中,不同类型的相关,其分析方法也不同:①计算皮尔逊积差相关、肯德尔τ相关、斯皮尔曼等级相关。点击“Aanlyze”→“Correlate”→“Bivariate...”,出现Bivariate Correlation对话框,在Correlation Coefficients框中选择相关系数的类型。②调用Crosstabs过程,计算质量相关与列联表分析。点击“Data”→“Weight Cases...”对频数变量值进行加权处理。再点击“Aanlyze”→“Descriptive Statistics”→“Crosstabs...”,选择加权处理后的数据进入Row(s)框和Column(s)框。最后点击Statistics...按钮,弹出Crosstabs:Statistics对话框,根据变量数据类型和实际需要选择要计算的相关指标。③偏相关分析方法。点击“Aanlyze”→“Correlate”→“Partial...”,在Partial Correlations对话框中,从变量列表中选择有关变量进入Variables框,选择要控制的变量进入Controlling for框中,就可得到偏相关系数。
在线资源
相关分析,http://www.fjmu.edu.cn/news/spss/doc3/sp07.htm
相关分析,http://www.fjmu.edu.cn/news/stat/jbtj2.htm#g4
Crosstabs过程,http://www.fjmu.edu.cn/news/spss/doc3/sp04.htm#j4或http://www.cnpsy.net/ReadNews.asp?NewsID=4303
思考与练习题
1.解释相关系数时应注意什么?
2.假设两变量为线性关系,计算下列各种情况的相关时,应用什么方法?
(1)两列变量是等距或等比的数据且均为正态分布;
(2)两列变量是等距或等比的数据但不为正态分布;
(3)一变量为正态等距变量,另一列变量也为正态变量,但人为分为两类;
(4)一变量为正态等距变量,另一列变量也为正态变量,但人为分为多类;
(5)一变量为正态等距变量,另一列变量为二分名义变量;
(6)两变量均以等级表示。
3.如何区分点二列相关与二列相关?
4.品质相关有哪几种?各种品质相关的应用条件是什么?
5.欲考察甲乙丙丁四人对十件工艺美术品的等级评定是否具有一致性,用哪种相关方法?
6.下表是平时两次考试的成绩分数,假设其分布为正态,分别用积差相关与等级相关方法计算相关系数,并回答,就这份资料用哪种相关法更恰当?
7.下列两变量为非正态,选用恰当的方法计算相关。
8.问下表中成绩与性别是否有关?
9.第8题的性别若是改为另一种成绩A(正态分布)的及格、不及格两类,且知1、3、5、7、9被试的成绩A为及格,2、4、6、8、10被试的成绩A为不及格,请选用适当的方法计算相关,并解释之。
10.下表是某新编测验的分数与教师的评价等级,请问测验成绩与教师评定之间是否有一致性?
教师评定
11.下表是9名被试评价10名著名的天文学家的等级评定结果,问这9名被试的等级评定是否具有一致性?
12.将第11题的结果转化成对偶比较结果,并计算肯德尔一致性系数。