在实际应用方差分析时,为了方便,一般直接从原始数据求平方和,这时平方和的公式为:
现以表9-1所列数据,介绍方差分析的基本过程。从表中看,三种实验处理的平均数分别为13,5和2,这似乎是由于实验处理不同所造成,但是在同一种实验处理中的4个数据并不相等,造成这个现象的原因在于实验的某些偶然误差及各组被试彼此间的个别差异,可以统称之为组内变异,也就是说,这12个数据彼此的差异,有实验处理的原因,也有“组内变异”的原因,只有实验处理的作用显著地大于组内变异作用时,才能确认实验处理的有效作用,即A,B,C三种处理之间差异显著。所以,必须通过方差分析,看看组间方差是否在统计上显著地大于组内方差。具体步骤如下:
(一)求平方和
平方和的计算方法有三种:一种是用“平方和”定义公式,即公式9-2,9-3,9-4。一种是用原始数据公式,即公式9-10,9-11,9-12。另一种是利用样本统计量进行计算。
1.总平方和
总平方和是所有观测值与总平均数的离差的平方总和。用原始数据计算总平方和要使用公式9-10。表9-1中数据的总平方和等于:
2.组间平方和
组间平方和是几个组的平均数与总平均数的离差的平方总和。用原始数据计算组间平方和使用公式9-11。表9-1中数据的组间平方和等于:
3.组内平方和
组内平方和是各被试的数值与组平均数之间的离差的平方总和。计算组内平方和的公式为9-12。表9-1中数据的组内平方和等于:
(二)计算自由度
计算自由度的公式见公式9-8。在表9-1中,共有3组,每组有4个被试,因此
总自由度分别dfT=N-1=12-1=11
组间自由度 dfB=k-1=3-1=2
组内自由度 dfW=k(n-1)=3×(4-1)=9
(三)计算均方
组间均方的MSB计算是用组间平方和除以组间自由度,组内均方MSW是用组内平方和除以组内自由度。使用公式9-6,9-7分别计算表9-1中数据的MSB和MSW分别为:
(四)计算F值
如果计算得到的组间均方比组内均方大,这就表示组间平均数之间有差异。但二者差异是否达到显著性水平呢?这还需要计算F值并作检验。计算F值用公式9-9。表9-1中数据的F值为:
(五)查F值表进行F检验并做出决断
假如拒绝虚无假设的p值(p-value)定为p=0.05,如果计算的值远大于所确定的显著性水平的临界值,表明F值出现的几率小于0.05,就可拒绝虚无假设,可以说不同组的平均数之间在统计上至少有一对有显著差异。假如实验控制适当,也可以提出自变量对因变量作用显著的结论。参考各组的平均数,进一步做事后检验,可以确定究竟是哪一对平均数之间有显著差异,得出更深层次的结论。如果计算的F值小于p为0.05的临界值,就不能拒绝虚无假设,只能说不同组的平均数之间没有显著差异。除了确定显著性水平外,在查F表时,还必须明确是用单侧检验,还是双侧检验。另外,p值也可定为0.01。
根据表9-1中数据,组间自由度dfB=2,组内自由度dfW=9,定p值为0.01,查附表4,F0.01(2,9)=8.02(F下标的数字0.01表示显著性水平;括号中前面的数字表示分子自由度,后面的数字表示分母自由度)。结果F>F0.01(2,9),即p<0.01,达到显著性水平。也就是说,在总变异中,三种不同强度的噪音引起的部分变异显著地大于由误差(包括个体差异)引起的部分变异,因此应该认为三种实验处理之间的差异显著。
(六)陈列方差分析表
上面几个步骤的计算结果,可以归纳成一个方差分析表。一般在实验报告中的结果部分,也不需要写出统计检验的过程,只需列出方差分析表,简明扼要,一目了然。不同的实验设计,方差分析表组成要素基本一致,主要包括变异来源、平方和、自由度、均方、F值和p值。因实验设计不同,变异来源也不同,相应的自由度和均方值、F值、p值也会发生变化。
下面是根据表9-1数据进行完方差分析后,归纳的方差分析表。