现代心理与教育统计学

第二节 两个独立样本的非参数检验方法

字体:16+-

一、秩和检验法

“秩和”(the sum of ranks)即秩次的和或者等级之和。这一方法首先由维尔克松(Wilcoxon)提出,叫维尔克松两样本检验法,后来曼—特尼(Mann-Whitney)将其应用到两样本容量不等(n1≠n2)的情况,因而又称作曼—特尼维尔克松秩和检验(Mann-Whitney-Wilcoxon rank sum test),曼—特尼U检验。

(一)秩统计量

秩统计量(rank statistics)的统计定义是:如果将样本数据记为X1,…,Xn,相应的顺序统计量记为Xn1≤…≤Xnj,若Xi=Xnj,则称Ri=j为Xi在样本中的“秩”(rank),i=1,…,n。(R1,…,Rn)就是秩统计量,又称为“秩次统计量”(rank order statistics)。例如,一组观测值为X1=5,X2=3,X3=8,X4=6,X5=2,X6=4。由小到大排列它的顺序统计量就是X5=2,X2=3,X6=4,X1=5,X4=6,X3=8,秩统计量就为r1=4,r2=2,r3=6,r4=5,r5=1,r6=3。

在秩统计量的定义中,如果样本数据中存在“结”(tie),即两个数据值相同时,通常把原来的样本序号小的数据的秩排在前面。如果有多个数据值相同,可以进一步推广这一思想。

基于秩统计量的检验方法就称为秩检验。针对各种不同的假设,由秩统计量所产生的检验统计量(通常称为秩检验统计量)也有很多种。

(二)适用资料

秩和检验法与参数检验中独立样本的t检验相对应。由于t检验中要求“总体正态”,当这一前提不成立时就不能使用t检验,此时可以用秩和检验代替t检验。当两个独立样本都为顺序变量时,也需使用秩和法来进行差异检验。

(三)计算过程

在秩和检验中,当两个样本容量不等时,用“维尔克松W”(WilcoxonW)来表示曼-惠特尼维尔克松秩和检验(Mann-Whitney Wilcoxon rank sum test)中两组中较大的一组的秩和。如果两个组的样本容量相等,W值用两个组中第二个组的等级来计算。

1.两个样本容量均小于10时(n1≤10,n2≤10)

具体步骤:

(1)将两个样本数据混合由小到大作等级排列(最小的为1等)。

(2)设n1<n2,将容量较小的样本(n1)中各数据的等级相加,以T表示。

(3)把T值与秩和检验表中的临界值比较,若T≤T1或T≥T2,则表明两样本差异有统计学意义;若T1<T<T2,则意味着两样本差异无统计学意义。

【例11-1】 在一项关于模拟训练的实验中,以技工学校的学生为对象,对5名学生用针对某一工种的模拟器进行训练,另外让6名学生下车间直接在实习中训练,经过同样时间后对两组人进行该工种的技术操作考核,结果如下:

模拟器组:56,62,42,72,76

实 习 组:68,50,84,78,46,92

假设两组学生初始水平相同,问两种训练方式效果是否不同?

解:由于操作考核是否符合正态分布并不确定,且模拟器组与实习组彼此独立,因此应当用秩和法进行差异检验。

(1)排等级:

(2)计算秩和(等级和)

T=1+4+5+7+8=25(即模拟器组的秩和)

(3)查秩和检验表n1=5,n2=6时,T1=19,T2=41(表中值为单侧检验,故这里查0.025时的临界值)

19<25<41 即 T1<T<T2

答:尚不能认为两种方式的训练效果不同。

2.两个样本容量均大于10(n1>10,n2>10)

一般认为当两个样本容量都大于10时,秩和T的分布接近正态分布,其平均数及标准差如下:

其中n1为较小的样本容量,即n1≤n2,这样,就可以按下面公式进行差异检验了

Z值落在-1.96~ 1.96区间内则表明差异无统计学意义(双侧,α=0.05),落在该区间之外则表明差异有统计学意义。若0.05水平单侧检验则Z值在-1.65~1.65区间内差异无统计学意义,在区间之外表明差异有统计学意义。

【例11-2】 对某班学生进行注意稳定性实验,男生与女生的实验结果如下,问男女生之间注意稳定性是否不同?

男生:(n1=14)19,32,21,34,19,25,25,31,31,27,22,26,26,29

女生:(n2=17)25,30,28,34,23,25,27,35,30,29,29,33,35,37,24,34,32

解:先将两组实验数据混合,从小到大排序然后标出男生、女生每个人相应的等级。结果男生的等级依次为:1.5,23.5,3,27,1.5,8.5,8.5,21.5,21.5,13.5,4,11.5,11.5,17。女生的等级依次为:8.5,19.5,15,27,5,8.5,13.5,29.5,19.5,17,17,25,29.5,31,6,27,23.5由于n1<n2,根据定义,男生的等级总和:

T=1.5+23.5+3+27+1.5+8.5+8.5+21.5+21.5+13.5+4+11.5+11.5+17=174

代入公式11-3得:

答:可以认为男女生注意稳定性之间的差异有统计学意义。

在这个例子中有等秩(tie)现象,因此在使用正态近似法时也可使用下面的校正公式:

式中tk表示第k个相同等级中相同值的个数

按校正公式计算,则此例中的σT=25.09,ZC=1.97。在心理学研究数据中,等秩情况大量存在,该校正公式有重要应用价值。

秩和检验法对两个样本具体观察值的相互关系给予了关注,比后面的符号检验法对数据信息的利用率高,故检验效能较高。在正态分布总体下可达t检验效率的95%,而在偏峰分布总体下,其检验效能一般比t检验还要高。