现代心理与教育统计学

第一节 非参数检验的基本概念与特点

字体:16+-

一、非参数概念

“非参数”概念可以从几个不同角度理解。它首先是指非参数模型。当总体或样本的分布能够由有限的几个参数来确定时,就是参数模型;否则就是非参数模型。从统计学的观点出发,所谓参数模型,是指分布的“模式”(pattern)已经知道(比如说已经知道总体分布为正态分布),而其中的一些具体的细节(参数)是未知的,这种对分布模式的知识可以解释为在观察样本之前所掌握的信息,利用这种事先掌握的信息,可以使研究者更有效地提炼样本中的(关于参数的)信息。例如,如果已经知道总体分布为正态分布,则可以进一步知道样本均值和样本方差是有关总体均值和方差的充分统计量。而在非参数模型中,缺乏关于总体分布模式的知识,或相关信息很少。

其次,在非参数统计中面临的问题也与参数统计中不同。一类问题是想要知道分布是否属于某一参数模型。一旦确认这一点,就可以采用参数模型作更深入的推断,χ2拟合优度检验解决的就是这类问题。这类问题本质上虽然是非参数的,但还是与参数模型有关系。另一类问题则根本与参数模型没有任何关系。例如,通常假定样本是从同一总体中随机抽取的,这就会假定独立样本是同分布。但是,有时要在非参数模型前提下对“一组独立样本是否是同分布的”“两个变量是否独立?”“两组样本是否取自同一总体?”进行检验,对两组正态样本的均值进行比较等等。

最后,在非参数统计中使用的统计量与参数统计中使用的统计量也不同。由于是非参数模型,在提炼样本中的信息时,不可能将样本压缩得十分紧凑,而不损失信息。一个重要的事实是:假定样本是独立分布的,则不存在比顺序统计量更小的充分统计量。因此,当用顺序统计量这种测量水平较低的统计量进行推断时,势必要损失一部分信息。问题是这种损失究竟有多大?这也是非参数统计理论中关心的一个重要问题。另一方面,由于是在非参数模型下处理问题,因此所使用的统计量应该具有不依赖总体分布的性质,也就是说,统计量的分布或至少是极限分布,应该与总体分布无关。