在相关研究中,常用相关散点图表示两个变量之间的关系。在平面直角坐标系中,以X、Y二列变量中的一列变量(如X变量)为横坐标,以另一列变量(如Y变量)为纵坐标,把每对数据Xi、Yi当做同一个平面上的N个点(Xi、Yi),一一描绘在XOY坐标系中,产生的图形就称为散点图或相关图。散点图通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够对原始数据间的关系做出直观而有效的预测和解释。成对观测值越多,散点图提供的信息就越准确。因此,散点图是确定变量之间是否存在相关关系及关系紧密程度的简单而又直观的方法。
不同形状的散点图形显示了两个变量间不同程度的相关关系。假设在平面直角坐标系中,以X轴为基线,每一对数据值准确地落在一条直线上,且直线左高右低,就为完全负相关(图5-2A);如果直线的方向与图5-2A完全相反,呈左低右高,则为完全正相关(图5-2B)。
图5-2 完全正相关和完全负相关图示
如果所有散点分布呈椭圆状,则说明二变量之间呈线性关系。在椭圆状的散点图中,如果椭圆长轴的倾斜方向左低右高(以X轴为基准),则为正相关(图5-3A),左高右低则为负相关(图5-3B);如果散点图呈现圆形(图5-3C、图5-3D),就为零相关或弱相关。
图5-3 不同椭圆形状的散点图表示的相关度
图5-4 以Z分数为坐标的散点图
图5-4中的直线称为拟合直线,代表数据点的相关趋势。这条直线是用统计方法求得的,因每个数据点与它的离差最小,所以称为最佳拟合直线。数据与最佳拟合直线之间的离差越小,拟合直线对数据相关关系预测的可靠度及精确性会越高。
用一些合理的统计指标对相关现象的观测值进行的统计分析叫相关分析。在研究中如果无法适当操纵自变量的变化,就经常使用这种类型的分析。相关分析是一种重要的方法,在教育科学、心理科学、社会科学等学科研究中应用广泛,存在大量的例证。因为,在这些领域,要实现对个体、教育组织、社会团体等的系统性操纵,有时是极为困难的。同时,相关分析还是许多多元分析的基础。