四分相关(tetrachoric correlation)适用于计算两个变量都是连续变量,且每一个变量的变化都被人为地分为两种类型这样的测量数据之间的相关。通常,计算四分相关的资料会整理成四格表。四格表是由两个因素,各有两项分类,做成的R×C表,因其只有四格,故名四格表。
(一)适用资料
四格表的二因素都是连续的正态变量,如学习能力,身体状态等,只是人为将其按一定标准划分为两个不同的类别,如“好”与“不好”,“对”与“错”等,即一因素划分为“A”与“非A”两项,另一因素划分为“B”与“非B”两项。这样便可将资料整理成四格表的形式。在四格表中,属于A项、B项交叉格内的实际计数为a,非A项、非B项交叉格内的实计数为d,非A项与B项交叉格内的实计数为b,非B项与A项交叉格内的实计数为c,边缘次数分别为a+b、c+d、a+c、b+d,N=a+b+c+d。
此外,这类四格表大都用于同一个被试样本中,分别调查两个不同因素两项分类的情况。
(二)计算公式
计算四格相关最常用的方法是皮尔逊余弦π法(近似计算法)。
这个公式还可写成下面的形式:
式中:a、b、c、d符号的意义同前。π为圆周率。
【例5-13】 下表所列数据是调查 377名学生两科测验成绩所得到的结果,假设两科成绩的分布为正态,只是人为地将其按一定标准划分为及格、不及格两类。
解:已知 a=124,b=68,c=85,d=100,a+b+c+d=377
将上面的结果代入公式5-16,得:
答:四格相关系数为0.2919。