独立性检验主要讨论两个变量之间的关系,并对其显著性进行检验,当变量类别多于两个以上时,这时就要运用多重列联表分析方法(multiple contingency table analysis)。比如说有一个三因子列联表,目的是讨论性别(男与女)、婚姻状况(未婚与已婚)以及生活满意状态(刺激、规律或无聊)三个变量之间的关系,可以将其中一个变量作为分层变量或控制变量,分别就控制变量每一个水平下另两个变量所形成的列联表来进行比较分析就行。如果将性别视为控制变量,分别进行男性与女性的婚姻状况与生活满意状态的列联表分析,此时,三因子列联表就被拆分成两个二因子列联表,即男性样本可以得到一个2×3的列联表,女性样本可以得到另一个2×3的列联表。分别就两个列联表各自的统计量进行计算,再加以比较即可,其数学原理与独立性检验相同。对于控制变量的不同水平所进行的单个列联表分析,如果呈现一致性的结果,例如各单元格的百分比分布比例一致,χ2值不显著,此时可以将各水平下的χ2值相加,以推测列联表中两个变量总的χ2值,并进行关联性检定,如何具体合并,可参考本章后面的内容。但是当各水平列联表的分布情形不一致时,就必须单独就个别列联表来解释。
例如,某通信公司想了解大学生对手机品牌的偏好,随机找了72个大学生,调查其性别、家庭经济水平以及最喜欢的手机品牌,来探讨这三个变量之间的关系,调查结果如下表所示。解决这个问题,可以将性别视为控制变量,分别进行男生与女生的经济水平与手机品牌的2×3列联表分析,或以经济水平作为控制变量,分析性别与手机偏好的关系。一般情况下,均以人口学变量等不易受到其他因素影响的前置变量为控制变量。因此这个例子中以性别为控制变量要更好一些,读者自己可以结合计算机统计软件来计算并做比较分析。
随着变量数目的增加,分析难度也在增加。如果是四个以上的变量,必须设置多个控制变量,这会在统计分析时有一定困难。一般而言,应避免同时分析过多变量的关系。另外,用χ2检验来进行多重列联表分析,缺乏一个统一的指标来检验变量关联的强度,为解决此问题,可使用G2统计法同时处理多个变量的关联分析,它的原理是以观察次数与期望次数比值的自然对数为基础,性质与χ2值类似。