简单讲,χ2检验方法检验的是样本观测次数(或百分比)与理论或总体次数(或百分比)的差异性。理论或总体的分布状况,用统计的期望值来表示。χ2检验的统计原理,是比较观察值与理论值的差别,如果两者的差异越小,检验的结果越不容易达到显著性水平;两者的差异越大,检验的结果越可能达到显著性水平,就可以下结论拒绝虚无假设而接受备择假设。基本公式如下:
这个公式是根据1899年统计学家皮尔逊推导的配合适度的理论公式而来。它是实际观察次数(f0)与某理论次数(fe)之差的平方再除以理论次数,是一个与χ2分布非常近似的次数分布。当fe越大(fe≥5),接近得越好。f0与fe相差越大,χ2值就越大;χ2值越大,代表统计量与理论值的差异越大。f0与fe相差小,χ2值也小。因此,它能够用来表示f0与fe相差的程度,同时它也具备与χ2分布相同的一些特点:f0与fe之差的平方再除以fe的值,随自由度而变化,变化的趋势与χ2分布一样。同时它也具有可加性特点等等。由于具体计算时,都用列联表形式表示数据,所以,公式中的f0,fe实际上表示的是列联表中每项分类单元格中的实计数与理论次数。
一旦χ2值大于某一临界值,即可获得显著的统计结论。这个临界值是由某一特定显著水平、某一特定自由度条件下,从χ2的理论分布推导而来。在实际统计分析时,是通过查χ2分布表获得的。