(一)运用标准差与离均差的计算公式
式中:x、y为两个变量的离均差,x=X-,y=Y-;
N为成对数据的数目;
sX为X变量的标准差;
sY为Y变量的标准差。
式中x、y的含义同公式5-1a。这两个公式都需要计算离均差。
(二)运用标准分数计算相关系数的公式
当应用标准分数计算相关系数时,积差相关系数的公式如下所示:
式中:ZX为X变量的标准分;
ZY为Y变量的标准分。
图5-5 用标准分数计算相关系数图示
(三)原始观测值计算公式
如果直接运用原始数据计算皮尔逊积差相关系数,可由公式5-1a推演出下面的公式:
或者使用下面的公式:
公式5-3a、公式5-3b初看上去很复杂,但公式中各个变量的数据十分容易获得。
为了说明相关系数各计算公式的应用,我们看下面这道例题。
【例5-1】 表5-2是10名中学生身高与体重的测量结果,问身高与体重的关系如何?
表5-2 用原始分数计算相关系数的步骤
解:根据已有资料可知中学生身高与体重的分布都呈正态,且身高、体重都属测量数据并为线性相关,故本例可用积差相关公式计算相关系数值。
表5-2第4~6列已经列出了每一个被试的X2、Y2、XY的值,在最后一行列出了相应的∑X2、∑Y2、∑XY的值,从表中已知n=10,将这些值代入用原始分数计算相关系数的公式5-3a得:
答:这10名学生身高与体重的相关系数为0.7919。
通过上例,应用公式5-3a计算积差相关系数的步骤为:
(1)求每一个变量的总和,即∑X和∑Y的值;
(2)求每一个变量的平方和,即∑X2和∑Y2;
(3)求成对变量乘积之和、每个变量和的乘积,即∑XY和∑X∑Y的值;
(4)代入公式5-3a计算r。
这个例题中的数据,如果要用公式5-1a和公式5-1b来计算积差相关系数,具体步骤为:
(1)计算每一个变量的平均数,即和的值;
(2)计算每一个变量的标准差,即sX和sY的值;
(3)求每一个变量的离均差,即x和y的值;
(4)求每个变量离均差的平方和与两个变量离均差的乘积之和,即∑x2、∑y2和∑xy的值;
(5)代入公式5-1a或公式5-1b计算r。
如果用公式5-2计算相关系数,就要计算每一个变量的标准分数与两个变量标准分数的乘积之和,即ZX、ZY和∑ZXZY。
具体计算过程如下:
表5-3 用离均差、标准差和标准分数计算相关系数的步骤
将∑xy、N、sX、sY代入公式5-1a得:
将∑xy、∑x2、∑y2代入公式5-1b得:
将∑ZXZY、N代入公式5-2得:
可以发现用公式5-1a或公式5-1b计算的相关系数与用公式5-2 计算的相关系数值是相同的。
如果表5-3中身高与体重的单位用市制单位尺和斤来表示,无论平均数、标准差,还是离均差乘积之和,都与测量单位用公制单位厘米及千克表示的时候明显不同,如表5-4所示。同一组被试的身高与体重,由于测量单位不同,可得到不同的协方差值。因而两个变量的一致性程度无法直接用协方差表示,若把离均差换成标准分数表示,则可得到相同的结果。表5-4中是把表5-3中身高与体重的数据单位转换成了相应的尺和斤之后的数据,该例说明了必须将每个离均差转换成标准分数的道理。
表5-4 不同测量单位的数据计算相关系数比较
将∑xy、N、sX、sY代入公式5-1a得:
将∑xy、∑x2、∑y2代入公式5-1b得:
将∑ZXZY、N代入公式5-2得:
与表5-3中的数据比较,发现两种不同观测单位计算的标准分数ZX及ZY略有差异,这是由于在单位转换及计算中引进了计算误差所致。另外,也会看到,当两个变量的单位为厘米和千克时,协方差为22.85,当两个变量的单位转换为尺和斤时,协方差则为1.371。进一步验证了协方差因同一数据单位的不同而发生的差异,说明它是不稳定的。