(一)方法
一般所说的随机抽样,就是指简单随机抽样(simple random sampling),它是最基本的抽样方法,适用范围广,最能体现随机化原则,原理简单。抽取时,总体中每个个体应有独立的、等概率被抽取的可能。常用的具体抽取方式有抽签法和随机数字法。抽签法(drawing lots)是把总体中的每一个体都编上号码并做成签,充分混合后从中随机抽取一部分,这部分签所对应的个体就组成一个样本。随机数字表(random number table)是由一些任意的数字毫无规律地排列而成的数字表。附表19就是由1万个数字无规律排列组成的一个随机数字表。使用随机数字表进行抽样时,先给总体编号,然后从表中任意一个数字开始依次往下数,并把最后几位数字小于总体编号数字的选出,按研究要求组成一个样本。例如,从 50个人中随机抽取10人,先将50人从1至50编上号,假如选定04与05~09交叉处的99896开始,纵向往下数并规定凡是最后两位数字小于50的均可入样本,则 23,41,26,25,18,9,28,1,26,36十个编号的人可组成一个样本。
(二)标准误
前面说过,在图14-1中,d值是抽样结果精确度的一个指标,而d值实际上受标准误的影响,标准误越大,则d值也大,这时意味着抽样结果的精确度越小。因此从各种抽样方法的标准误大小,能够直接评价抽样的精确度。
在讨论标准误的公式之前,应该注意区分有限总体与无限总体这两个概念。如果总体中包含个体的数量是有限的,该总体就叫有限总体,也就是说无论N有多大,只要不是无穷大,就是有限总体。如果总体中所含个体的数量是无限的,即N→∞,则该总体叫做无限总体。例如,某运动员投篮10次,命中8次,命中率为80%。这10次投篮,相当于一个 n=10的样本,而总体N(即总的投篮次数)从理论上讲是无限的,因此可以说这个样本是从无限总体抽取的(有时N虽然有限,但样本容量n与N相比很小,即n≤N,则也可近似视为无限总体)。在介绍参数估计和假设检验时,都假设是无限总体的情况,介绍的各个公式也都是在“无限总体中抽样”这一前提之下给出的。在实际研究中,如果总体是有限的,而且不宜假设为无限总体时,则应该注意其区别。
1.平均数的标准误
在简单随机抽样中,平均数的标准误公式如下(由于在实际中总体标准差一般很少事先知道,因此本章的公式均以样本标准差代替总体标准差):
当样本所属总体是无限总体时:
n为样本容量
当样本所属总体是有限总体时:
n为样本容量
N为总体容量
2.比率的标准误
简单随机抽样中当样本容量n较大时比率的标准误为:
无限总体:
有限总体:
(三)评价
从理论上说,简单随机抽样是最符合随机原则的,而且分析抽样误差比较简明。但是这种方法在实践中受到一些限制,存在一些不足。例如,简单随机抽样需要把总体中每一个体编上号码,如果总体很大,这种编号几乎是不可能的。再者,这种抽样方法常常忽略总体已有的信息,降低了样本的代表性。例如,对某一地区的学生进行抽样,测试该地区学生的智力水平,重点学校与一般学校的学生是有差异的,如果不考虑这个因子,则所抽取的样本很可能抽到重点学校的学生多些,或根本没有重点学校的学生。这样,样本的代表性是不理想的,若充分考虑并利用重点与一般存在差异这一已有信息,可以设计出更好的抽样方法(见后面的分层随机抽样)。另外,在大规模的抽样研究时,用抽签法是不可能的,而用随机数字表一个一个地抽,又太费时费力。这时就得采用和简单随机抽样相似,但实施简便的等距抽样方法。