除了次数分布图,心理与教育统计中常用的统计图还有条形图、圆形图、线形图、散点图等等。下面分述各种图形的绘制方法、功用及特点。
(一)条形图
条形图(bar chart),也叫直条图,主要用于表示离散型数据资料,即计数资料。它是以条形的长短表示各事物间数量的大小与数量之间的差异情况。条形图中一个轴是分类轴,表示类别,描述计数数据;另一个轴是数量轴,表示大小多少,描述计量数据,在这个轴上数据单位(data unit)的大小取决于原始数据。条形图因使用的条形形状不同而有多种名称,如矩形条图,梯形条图,尖形条图等,其中矩形条图应用最多,一般说的条形图就是指这种矩形条图。条形图又可分简单条形图(simple)、分组条形图(clustered)、分段条形图(stacked)三种。如图2-10 所示。
图2-10 三种类型的条形图
注:数据来源于表2-10中二年级组
绘制条形图时要注意以下几点:
1.尺度须从零点开始。要等距分点,一般不能断开,否则会使长条间的比例发生错误,不易显示资料的差异情形。在不得已而断开的时候,应将数值在折断处注明。
2.条宽与间隔的比例要适当。条形图是以条形的长短表明数量的多少,宽度与数量大小无关,但过宽或过窄会影响美观,因而各直条的宽窄要一致,适度,应有一条共同的直线,如X轴或Y轴为基线。为使图形区域美观大方,各条形之间的间隔(分类间距)要一致,一般为直条宽度的0.5~1倍之间比较合适。
3.直条的排列顺序可按时间序列,数量多少,以及相比较事物的固有序列,或根据具体情况来定。相比较的数目不宜太多。
4.图形区域中条形的顶端和下端尽量少用数据标签,如数值、系列名称、类别名称。如果需要,应注意协调美观。
5.调节过长条形的方法有两种:一种是调整图尺。要么改变图尺的刻度单位即改变每一间隔的增量(increment),要么采用断裂法,将图尺变为一条中间有间隙(gap)的断线(broken line)。另一种方法是使用折叠法、回转法来调整条形本身。后一种方法应尽量少用,因为这样调节后,容易影响图形的形状和大小,削弱了图形直观比较的特性。
6.在分组和分段这种复式条形图中,互相比较的长条拼在一起,不留空隙。各组内长条排列次序必须一致,以便比较。这种条形图必须有图例,以区分比较的数据。简单条形图可以不要图例。
表面上看,条形图似乎与前面介绍的直方图相似,事实上它们有着严格的区别:①描述的数据类型不同。条形图用来描述称名型数据或计数数据,而直方图主要用来描述分组的连续性数据。②表示数据多少的方式不同。条形图用直条的长短或高低表示数据的多少和大小,而直方图用面积表示数据的多少和大小。直方图的总面积与总次数相等。③坐标轴上的标尺分点意义不同。条形图的一个坐标轴是分类轴,而直方图的一个坐标轴上表示的是另一个刻度值。④图形直观形状不同。条形图之间有间隔,直条与直条之间的间隔大小没有任何关系,不表示任何意义。直方图各个直方块之间紧密相接,没有间隙,当在某一数据上面分布的人数极少或没有,会出现断点。因此,在使用过程中,要注意二者之间的区别。
(二)圆形图
圆形图(circle graph),又称饼图(pie),主要用于描述间断性资料,目的是为显示各部分在整体中所占的比重大小,以及各部分之间的比较。圆形图显示的资料多以相对数(如百分数)为主。圆形图的图尺为圆周,分度是将圆周等分为100份,每百分之一相当于3.6°,一般以圆的上方,即时钟的指针在12时的位置的半径为基线。整个360°圆代表要显示的全部数量,圆形图中每一个楔形(wedge)或每一片(slice)表示整个数量中的一部分,它的度数取决于这部分在整体中所占的比例。绘制图形时可用下面的公式计算代表每部分数量的楔形的度数:
例如,某大学心理学系有教职工58人,其中教师48人,行政、教辅和产业人员10人。48位教师中,教授18人,副教授15人,讲师15人。教职工圆形比例如图2-11所示,图中各扇区面积和旁边标注的数字为百分比。
图2-11 某大学心理学系教职工比例
绘制圆形图时要注意以下几点:
1.基线确定后,各部分按顺时针方向由大而小排列,或按相比较事物固有顺序排列。
2.图中各扇区用线条分开,注明简要文字及百分比,也可用不同颜色或不同线条将图中各部分分开,如果不在图中注明文字,可在图例中用文字说明图中各部分的内容。
3.在比较两种性质类似的资料时,二圆的直径应相同,图中各部分排列顺序也要一致。
4.图形中各个扇区或所有楔形的度数加起来应该等于360°。但是,由于我们不能使用量角器精确地测量度数,计算的度数值一般使用四舍五入法处理,因此,实际上所有角度加起来可能不一定恰好就是360°。
(三)线形图
线形图(line graph)更多用于连续性资料,凡欲表示两个变量之间的函数关系,或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的情形,用线形图表示是较好的方法。也可在线形图中画两条线或多条线,用于比较两组或多组数据资料。线形图是教育与心理学实验报告中最常用的图示结果的方法。
常见的两种线形图有折线图和曲线图。折线图(broken line graph)是由条形图中每个条形顶部的中点连接而成,曲线图(curve)是折线分布修匀后比较平滑的线形图。绘制线形图的基本要点如下:
1.通常横轴表示时间或自变量;纵轴表示频数或因变量。
2.通常纵轴从零点开始,零点在纵轴与横轴相交处称为原点(对数尺度除外)。
3.线与横轴间不应有说明文字或数目等,线条要粗于坐标纸格线。如有几条线,最好应用如虚线、实线、点线等不同线形以示区别,并用图例说明。一般比较的线不要超过五条。
4.若横轴表示组距,坐标轴上刻度只需标明组距起点的数值,或组中值,线图上与横轴各组段相当的点子应画在该组段中点的垂线上。
5.根据资料的性质,横轴与纵轴可分别取对数单位,也可同时取对数单位。横轴与纵轴分别取对数单位的称作半对数曲线,同时取对数单位的称为对数曲线。
如图2-6就是根据表2-7的数据资料绘制的线形图。
(四)散点图
散点图(scatter plot),又称点图、散布图(scatter diagram或scattergram,scattergraph),它是用相同大小圆点的多少或疏密表示统计资料数量大小以及变化趋势的图。
图2-12 31人的视、听反应时散点图
通常以圆点分布的形态表示两种现象间相关程度,有关散布图的详细内容将在第五章做进一步介绍。图2-12是根据表2-5绘制的散点图。
这些常用的统计图形,根据它们表现的作用和内容,把它们可分为五类。第一种是表现分布的图形,比如直方图。第二种是表现内容的图,如条形图和圆形图。圆形图由于无方向,所以较条形图应用得较少。第三种类型是表现变化的图,这种图形的代表是线形图。第四种类型的图形主要用于表现比较,如内容的比较、分布的比较、变化的比较,这几种图形都能采用,究竟选用哪种图形,要针对表现的对象,充分发挥各种图的优势,择优选用。第五种图形是表现相关的图形,即散点图。此外,用来直观描述观测值的图示方法还有茎叶图(stem-and-leaf display)与盒状图(boxplot),本章中就不一一讨论了。
【资料卡2-2】
茎叶图
茎叶图是普林斯顿大学John Tukey教授于1977年发展出来的一种直观描述数据分布的方法。当观测数据不很多(通常在100个以下)时,用茎叶图刻画数据的分布特征,非常形象直观有效,而且不丢失信息。在茎叶图中,茎是指观测值中十位数值部分,各个叶代表数据中的个位数部分。如果是分组数据,茎就是分组区间,叶为落在各分组区间的每个数。原则上茎叶图的茎一般用数据中十位数及以上的数字,叶为最后一位数。如果数据是整数,叶就为个位数,如果是小数,就取分位数,如果遇到小数点后有几位小数,可以采取适当进位的方法,保留一位小数。如果叶子过于集中,有时还可以把茎再一分为二。茎和叶完全取决于数值的大小、分布的范围。它最适合于表现两位数数据。
绘制茎叶图的基本程序是:先把数据区分为茎和叶,数据中除了最后一位数字以外的数字作为茎,将茎由小至大从上往下依序垂直排列在左侧。如果每个数字只填写一次,代表以10为组距,若写二次,则表示以5为组距,以此类推。把观测值的最后一位数,也就是个位数值写在对应的茎的右边作为叶子。叶子的排序应该从左至右由小到大排列。叶子填写完毕后,计算其次数,记录在茎的左侧,形成一个次数分布表,这样一个完整的茎叶图就完成了。右面的茎叶图是根据本章【例2-1】的数据用SPSS软件绘制的。所有数据四舍五入为整数,茎取十位数,叶子取个位数,因茎部分的数字每个都重复5次,组距为2。
茎叶图像一个侧放的直方图,主要优点是全部保留了原始数据,同时呈现出直方图的形式,兼具次数分配表与直方图的双重优点,将二者同时以图的方式表现出来,有着非常实用的价值,为准确便捷地计算统计特征值提供了可能,是探索性数据分析的常用方法。
在教育、心理科学研究中,图表有着重要的作用。但是如果绘制的图表不准确,图示的数量不精确,反而会掩蔽事实真相,因而在使用时应倍加注意。早期绘制图表主要使用坐标纸、绘图专用笔、绘图专用墨水等工具,绘制一幅精美的图表花费时间很长。目前,许多计算机软件中都有作图模块,一些专用的统计程序和作图程序使用也越来越广泛。运用计算机程序绘制各种图表,使这一工作变得简单轻松。因此,熟悉各种统计图表的绘制方法,熟练掌握手工、计算机绘制统计图表的技能,准确绘制各种统计图表是心理与教育类专业学生的基本功。