现代心理与教育统计学

三、分层随机抽样

字体:16+-

(一)方法

分层随机抽样简称分层抽样(stratified sampling或hierarchical sampling)。具体做法是按照总体已有的某些特征,将总体分成几个不同的部分(每一部分叫一个层),再分别在每一部分中随机抽样。它充分利用了总体的已有信息,因而是一种非常实用的抽样方法。

对于一个总体究竟应该如何分层,分几层,要视具体情况而定。总的一个原则是,各层内的变异要小,而层与层之间的变异越大越好,否则将失去了分层的意义。例如,从某综合大学抽样调查学生逻辑推理能力,根据以往的研究结果,文科与理科学生的逻辑推理能力有显著差异,因而进行分层抽样时就按文、理科分为两层,或分成文、理、交叉学科三个层次。有些复杂问题,常常还需要按两个或两个以上的分层标准进行分层。例如,以儿童为对象,进行心理实验研究时,要考虑到遗传、环境、年龄、性别等对儿童有影响的各种因子,在选取样本时,应该按照这些因子进行多个分层标准的分层抽样。美国心理学家韦克斯勒(Wechsler)1966年编制的幼儿智力量表(WPPSI),抽样时曾考虑到6个分层标准:①年龄(4岁~6岁半,每半岁为一组);②性别;③种族(白人与非白人);④地区(东北部、中北部、西部、南部);⑤家长职业(8种职业);⑥城市与农村。这样,先按年龄分成6个年龄组,每组又按性别分为男女各半,然后再考虑种族、地区、家长职业、城乡等继续分层。日本1967年修订WPPSI时,认为日本国情与美国不同,因此只按年龄、性别、地区三个标准进行分层。可见分层标准并不是一成不变的,即使是同一个研究课题,在不同的条件下,用什么标准进行分层以及对于每一个分层标准应当分为几层均需视具体情况而决定。

既然各个层之间的差异较大,那么各层的人数分配也不应一律等同。设总体为N,所需样本容量为n,则如何合理地将n分配在各层,是分层抽样的一个重要问题。具体施行过程中有两种方式:

1.按各层人数比例分配

这是在各层内的标准差不知道的情况下常用的分配方式,基本思想是人数多的层多分配,人数少的层少分配。设各层的人数分别为N1,N2,N3…Nk,每层应分配的人数为n1,n2,n3,…,nk。则

N=N1+N2+N3+…+Nk

n=n1+n2+n3+…+nk

如果按人数比例分配,则

任意一层应分配的人数应当为:

2.最佳分配

这种分配不但根据各层人数比例,还考虑到了各层标准差。如果各层内的标准差已知,就应该考虑到标准差大的层要多分配,标准差小的层要少分配。这样,不但根据各层人数比例,还考虑到了各层标准差的分配,叫最佳分配。这时,任意一层应分配的人数ni为:

式中σi为任一层内的标准差,若σi没有现成资料可以从该层抽一个小样本算出样本标准差si估计之,即:

(二)标准误

为了简化公式,先引入统计量Wi

1.平均数的标准误

无限总体:

公式14-8实际上与公式14-1意义相同,在公式14-1中以样本s估计总体σ,而在公式14-8中是以各层的si联合估计全总体σ。

有限总体:

式中Ni为某一层的个体总数

ni为某一层应分配的样本容量

si为某一层的标准差

【例14-1】 某大学为了调查新生推理能力,以分层抽样的方式从1500名新生中抽取 200名进行瑞文推理测验。已知新生中文科500名、理科800名、边缘学科200名,根据历年同类调查的资料,新生瑞文推理测验成绩的标准差,文科是s1=10,理科是s2=7,边缘学科s3=12,试问这次调查时这200名被试如何在文、理、边缘学科中分配?样本平均数(n=200)分布的标准误为多少?

解:

因此,200人的样本应包括77名文科生,86名理科生,37名边缘学科学生。样本平均数(n=200)分布的标准误为

2.比率的标准误(样本容量n较大时)

无限总体:

有限总体:

式中:pi为某一层内的比率

qi=1-pi

Wi,Ni,ni意义同前。

(三)评价

分层抽样由于充分利用了总体已知的信息,其样本的代表性及推论的精确性一般优于简单随机抽样。比较两种抽样方式的标准误,能够说明这种分层的效果。

如前所述,一般总体方差并不易得到,常以样本方差s2来估计,因而这里s2代表总体的变异。在分层抽样中,总体变异实际上来源于层与层之间和各层内部,即层间与层内两部分。

从公式14-8式可知,分层抽样时平均数的标准误为

对于同一总体,如果按简单随机方式抽样,则总变异不存在分解为两部分来源的问题。这时平均数的标准误与总变异有关,即:

这表明,对于同一个总体,分层抽样与简单随机抽样在样本容量相同时,前者的抽样误差小于后者的抽样误差。