现代心理与教育统计学

二、Φ系数

字体:16+-

当两个相互关联着的变量分布都是真正的二分变量,在两个分布中间都各有一个真正的缺口时,用phi系数(phi coefficient)解决此类“点分布”问题,因其系数用符号Φ表示,故而得名。它是指两个分布都只有两个点值或只是表示某些质的属性,如工作状态(有工作与无工作)、吸烟状况(吸烟者与非吸烟者)、婚姻状态、智能水平等。此时,可以运用列联表(contingency table)计算,因此它又称列联系数(contingency coefficient)。适用资料是除四分相关之外的四格表(计数)资料,是表示两因素两项分类资料相关程度最常用的一种相关系数。若直接用四格表内数据计算可用下式。

【例5-14】 下面是关于吸烟与患癌症之间的一组假设数据。吸烟状况(X)分为吸烟者与非吸烟者,用0、1表示,死亡原因(Y)分为因吸烟致癌死亡与其他原因死亡两种,用0、1表示。试求它们之间的相关。

X:0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1

Y:0 1 0 0 1 0 0 0 1 1 0 1 1 1 1 0 1 1 1 0

解:将上面的数据整理成下面的四格表:癌症(0)其他(1)吸烟者(0)

从表中可知a=6,b=4,c=3,d=7,代入公式5-17得:

答:吸烟与吸烟致癌死亡之间的相关系数为0.302。

Φ相关系数的大小,表示两因素之间的关联程度。当Φ值小于0.3时,表示相关较弱;当Φ值大于0.6时,表示相关较强。关于其相关方向,一般由表中的ad、bc的大小来说明。负值表明一次测量中的“是”多于另一次测量中的“非”。完全正相关时,全体个案落于四格表中a、d两格中;完全负相关时,全体个案会落于四格表中b、c两格中。零相关时,全体个案匀称地落于四格中。但在应用Φ相关时,一般不指出相关方向,只说明相关程度是否显著。

另外,对于四格表(独立样本)相关程度的描述,除常用Φ相关外,有时还用到其他方法。例如尤尔(Yule)的关联系数Q或归结系数γ(有时用W表示)

这些表示2×2表计数资料二因素之间相关程度的尺度不同,数值也可能不同,但都能反映两因素之间的相关。Q与γ之间还存在一定的数量关系:Q=2/(1+γ2)。

【例5-15】 有研究者调查了358名不同性别的学生对某项教育措施的评价态度,结果如下表。根据这些结果能否说性别与评价态度有关?相关的程度如何?

解:从表中可知a=66,b=106,c=28,d=158,N=358,

代入公式5-17得:

代入公式5-18a得:

代入公式5-18b得:

答:几个系数均表示性别与评价态度有一定的相关,相关是否显著有待于进行χ2检验。