(一)计算相关矩阵
因子分析的基础是变量之间的相关。因此,因子分析的第一步是计算各个题目之间的两两相关,详细检验项目相关矩阵代表的意义。
用来探讨这些相关系数是否适当的第一种方法是巴特莱球形检验(Bartett's test of sphericity)。由于因子分析使用相关系数作为因子抽取的基础,一般而言,相关矩阵中的相关系数必须显著地高于0,某一群题目两两之间有高相关,显示可能存在一个因子,多个群落代表多个因子。如果相关系数都偏低且接近,则因子的抽取越不容易,巴特莱球形检验即可用来检验这些相关系数是否不同且大于0。球形检验结果显著,表示相关系数可以用于因子分析抽取因子。
第二种方法是使用偏相关矩阵来判断。变量之间是否具有高度关联,可以从偏相关矩阵(partial correlation)来判断,以偏相关计算两个变量的关系时,排除了其他变量的影响。因子分析计算过程中,可以得到一个反映像矩阵,呈现出偏相关的大小,该矩阵中,若有多数系数偏高,则应放弃使用因子分析。对角线的系数除外,该系数称为取样适切性量数(KMO;Kaiser-Meyer-Olkin measure of sampling adequacy),代表与该变量有关的所有相关系数与净相关系数的比较值,该系数越大,表示相关情形良好。
第三种方法是检查共同性指数(communality)。某一变量与其他所有变量的复相关系数的平方,得到的数值称为共同性,表示该变量的变异量被共同因子解释的比例,其计算方式为在一变量上各因子负荷量平方值的总和。变量的共同性越高,因子分析的结果就越理想。
(二)因子抽取的方法
因子抽取(factor extraction)这一步骤的目的在于决定这些测量变量当中存在着多少个潜在的成分(component)或因子(factor)。除了人为设定因子个数之外,决定因子个数的具体方法有:
1.主成分法(principal component analysis)。主成分法以线性方程式将所有变量加以合并(linear combination),计算所有变量共同解释的变异量,该线性组合称为主成分。第一次线性组合建立后,计算出的第一个主成分估计,可以解释全体变异量的最大一部分。其所解释的变异量即属第一个主成分所有,分离后剩余的变异量,经第二个方程式线性合并,抽离出第二个主成分,其所涵盖的变异量即属于第二个主成分的变异量。依此类推,所剩的共同变异越来越小,每一成分的解释量依次递减,直到无法抽取共同变异量为止。但通常只保留解释量较大的几个成分代表所有的变量。主成分分析法适用于单纯为简化大量变量为较少数的成分时,作为因子分析的预备工作。
2.主轴因子法(principal axis factors)。主轴因子法是分析变量间的共同变异量而非全体变异量。其计算方式与主成分分析有差异,主轴因子法用共同性(communality)取代了相关矩阵中的对角线1.00,目的在于抽出一系列互相独立的因子。第一个因子解释最多的原来变量间共同变异量;第二个因子解释除去第一个因子解释后,剩余共同变异量的最大变异,其余因子依序解释剩余的变异量中的最大部分。直到所有的共同变异被分割完毕为止。此法符合因子分析模式的假设,亦即分析变量间共同变异,而非分析变量的总变异,因子的内容较易了解。
3.最小平方法(least squares method)。最小平方法利用最小差距原理,针对特定个数的因子,计算出一个因子形态矩阵(factor pattern matrix)后,使原始相关矩阵与新的因子负荷量矩阵系数相减平方后数值最小,称为未加权最小平方法(unweighted least squares method),表示所抽离的因子与原始相关模式最接近。若相关系数事先乘以变量的残差(uniqueness),使残差大的变量(可解释变异量少者)比重降低,计算得到原始相关系数除以新因子负荷系数差异的最小平方距离,进行因子的确认称为加权最小平方法(weighted least squares method)。
4.最大似然法(maximum-likelihood method)。相关系数经变量的残差(uniqueness)加权后,利用似然函数(likelihood function),估计出最可能出现的相关矩阵的方法。
在各种方法中,主成分法是最简单的一种策略,主要归因于它的数学转换程序比较简单,容易理解与操作。就其原理来看,主成分分析法是从测量变量中用数学方式寻找较少且互相独立的成分以便简化解释复杂的测量资料;主因子分析法的目的是在寻求数字背后隐含的意义与潜在的结构。如果研究者的意图只是获得因子分数,并进行相关性研究,采用主成分分析法就能达到目的,如果要探讨抽象概念的涵义,建立理论假设和结构,则应采用主因子分析模式。
(三)因子数目
因子个数的决定主要依据特征值(eigenvalue)的大小。特征值代表某一因子可解释的总变异量,特征值越大,代表该因子的解释力越强。一般而言,特征值需大于1才可被视为一个因子。低于1的特征值,代表该因子所解释的变异少于一个标准化的变量的变异,这样的因子实际意义不大。
另一种方法则是用碎石检验(scree test)来确定,即将每一个因子依其特征值排列,特征值逐渐递减,当因子的特征值逐渐接近,没有变化之时,代表特殊的因子已无法被抽离出来,当特征值急剧增加之时,即代表有重要因子出现,也就是特征值曲线变陡之时,就是决定因子个数之时,因此把碎石检验又叫做陡坡检验。
(四)因子旋转
将前一步骤所抽取的因子,经过数学转换,使因子或成分能够清楚的区分,能够反映出特定的意义,称为因子旋转(factor rotation)。前面几个步骤,目的在于建立变量与因子之间的关系。而因子旋转的目的,则是在理清因子与原始变量之间的关系,以确立因子间最简单的结构,达到简化的目的,使新因子具有更鲜明的实际意义,更好地解释因子分析的结果。所谓简单结构(simple structure),就是使每一个变量仅在一个公共因子上有较大载荷,而在其他公共因子上的载荷比较小。
旋转的过程是将因子之间的相对关系,以变换矩阵(transformation matrix)所计算出的因子负荷矩阵的参数,将原来的共变结构所抽离出来的项目系数进行数学转换,形成新的旋转后因子负荷矩阵(经正交旋转)或结构矩阵(经斜交旋转),使结果更易解释,有助进行因子的命名。
因子旋转的方法有多种。其中一类称为正交旋转(orthogonal rotation)。所谓正交,是指旋转过程中因子之间的轴线夹角为90度,即因子之间的相关设定为0,如最大变异法(varimax)、四次方最大值法(quartimax)、均等变异法(equimax rotation)。另一类型的旋转方法称为斜交旋转(oblique rotation),这种方法允许因子与因子之间具有一定的相关性,在旋转过程中同时对于因子的关连情形进行估计,例如最小斜交法(oblimin rotation)、最大斜交法(oblimax rotation)、四次方最小值法(quartimin)等。
以正交旋转转换得到的新参数,是基于因子间是相互独立的前提。在数学原理上是将所有的变量在同一个因子或成分的负荷量平方的变异量达到最大,这样做能够使因子结构达到最简,且对于因子结构的解释较为容易,概念较为清晰,对于测验编制者,寻求明确的因子结构,以发展一套能够区别不同因子的量表,正交旋转法是最佳的策略。但是,将因子之间进行最大的区分,往往会扭曲了潜在特质在现实生活中的真实关系,容易造成偏误,因此一般进行实证研究的验证时,除非研究者有其特定的理论作为支持,或有强而有力的实证证据,否则为了精确的估计变量与因子关系,使用斜交旋转是较贴近真实的一种做法。
在旋转过程中,会出现几种不同的参数矩阵。如复制相关矩阵(reproduced correlation matrix),是利用因子结构中因子与变量间的相关值估计出的变量与变量的相关矩阵。它和观察到的真正相关矩阵的差异(即残差相关矩阵),用来检验因子结构是否合适。残差相关矩阵(residual correlation matrix)则是测量变量的相关矩阵与估计的相关矩阵的离差所形成的矩阵。当矩阵中过大的残差值过多时,表示并不适合于执行因子分析。因子分数系数矩阵(factor score coefficient matrix)可用来把测验的原始分数,用因子分析建立的因子结构转换成新的因子分数,并应用于进一步的统计分析运算。其原理是以因子为因变量,以测量变量为预测变量,将原始分数进行线性组合。