一、中数
中数(median),又称中点数,中位数,中值,符号为Md或Mdn。中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。这个数可能是数据中的某一个,也可能根本不是原有的数。如果将数据依大小顺序排列,中数恰好位于中间,它将数据的数目分成较大的一半和较小的一半。中数是集中量数的一种,它能描述一组数据的典型情况,心理与教育研究工作中经常应用它。
中数的求法根据数据是否分组,有不同的方法。
(一)未分组数据求中数的方法
根据中数的概念,首先将数据依其取值大小排序,然后找出位于中间的那个数,就是中数。此时又分几种情况:
1.一组数据中无重复数值的情况
指一组数据中没有相同的数,这时取处于序列中间位置的那个数为中数。此时又可分为两种情况:
【例3-2】 求数列4,6,7,8,12的中数?
【例3-3】 有2,3,5,7,8,10,15,19共计8个数,求其中数。
2.一组数据中有重复数值的情况
指一组数据中有相同数值的数据,这时计算中数的方法基本与无重复数值的单列数据相同。但根据重复数值数据在该组数据中所处的位置又细分为几种情况。当位于中间的那几个数是重复数值时,求中数的方法就比较复杂了。
(1)当重复数值没有位于数列中间时,求中数的方法与无重复数据时求中数的方法相同。
【例3-4】 求数列5,5,6,10,12,15,17的中数。
解:在这个数列中,重复数值为5,但它排在数列的前端,故中数为10。
(2)当重复数目位于数列中间,数据的个数为奇数的情形。
【例3-5】 求数列11,11,11,11,13,13,13,17,17的中数。
图3-1 一列数据有重复数值时的中数示意图
(3)当重复数目位于数列中间,数据的个数为偶数的情形。
如果数据的个数是偶数,计算方法与数据的个数为奇数时基本相同。
【例3-6】 求数列11,11,11,11,13,13,13,17,17,18的中数。
因此,根据前面的计算可知位于序列中最前面那个13的上限是12.83,即该组数据的中数是12.83。
公式3-3b中,La为中数所在分组区间的精确上限,Fa为该组以上各组次数的累加次数,i为组距。另外,也可用累加曲线求出中位数。图3-2是累加曲线求中数的示意图,图中表示的中数大约为80。
图3-2 累加曲线求中数示意图
(二)中数的优缺点与应用
从中数的计算可以看出:中数是根据观测数据计算而来,不能凭主观意定。计算简单,容易理解,中数的概念简单明白,这是它的优点。但是,它也有一些不足之处,如:中数的计算不是每个数据都加入,其大小不受制于全体数据;反应不够灵敏,极端值的变化对中数不产生影响;中数受抽样影响较大,不如平均数稳定;计算时需要对数据先排列大小;中数乘以总数与数据的总和不相等(中数等于平均数时例外);中数不能作进一步代数运算,等等。因此,在一般情况下,中数不被普遍应用。
但在一些特殊情况下,它的应用受到重视。这些特殊情况是:①当一组观测结果中出现两个极端数目时。这种情况在心理与教育科研实验中常常出现,因为心理与教育实验中的偶然因素非常复杂,有时实验中为了平衡各种误差,经常是同一种观测要在同一个被试身上反复进行多次,而只取某一个代表值作为对该被试的观测结果。这时若出现两极端的数目,又不能确定这些极端数目是否由错误观测造成,因而不能随意舍去,在这种情况下,只能用中数作为该被试的代表值,这样做,并不影响进一步的统计分析。因为求中数不受极大值与极小值的影响,而决定中数的关键是居中的那几个数据的数值大小。②当次数分布的两端数据或个别数据不清楚时,只能取中数作为集中趋势的代表值。在心理与教育实验中,经常会出现个别被试不能坚持继续进行实验这一现象,有时只知个别被试的观测结果是在分布的哪一端,但具体数值不清楚,这种情况下就只能取中数,而不能计算平均数。③当需要快速估计一组数据的代表值时,也常用中数。