上一篇文章中,初步介绍了验证性因子分析的功能及应用场景。下面通过一个实例来具体了解一下,验证性因子分析的操作步骤以及过程中需要注意的内容。当前有一份215份的研究量表数据,共由四个因子表示,第一个因子共5项,分别是A1~A5;第二项因子共5项,分别是B1~B5;第三个因子共4项,分别是C1~C4;第4个因子共6项,分别是D1~D6。现希望验证此量表的 聚合效度 和 区分效度 ,并且希望进行 共同方法偏差分析 。 验证性因子分析的步骤大致可分为四步,分别是:模型构建、删除不合理测量项、模型MI指标修正和模型分析。 (1)模型构建 即将因子与测量项对应关系放置规范;在进行CFA分析前一般需要进行EFA,清理掉对应关系出现严重偏差的测量项 (2)删除不合理测量项 如果因子与测量项间的对应关系出现严重偏差,此时可考虑删除某测量项;也或者某测量项与因子间的载荷系数值过低(比如小于),说明该测量项与因子间关系较弱,需要删除掉该测量项 (3)模型MI指标修正 如果说模型拟合指标不佳,可考虑进行模型MI指标修正【SPSSAU默认提供MI大于20,MI大于10,MI大于5,和MI大于3共四种模型修正方式】 (4)最终模型分析 本例子中的量表共分为四个因子,暂不进行模型MI修正,放置如下:SPSSAU共输出6个表格,各表格对应解释说明如下:从上表可知,本次针对共4个因子,以及20个分析项进行验证性因子分析(CFA)分析。本次分析有效样本量为215,超出分析项数量的10倍,样本量适中。 CFA分析建议样本量至少为测量项(量表题)的5倍以上,最好10倍以上,且一般情况下至少需要200个样本。一个因子对应的测量项最好在5~8个之间,便于后续删除掉不合理测量项。 因子载荷系数表格展示 因子和测量项之间的关联关系 ,通常使用标准载荷系数值表示因子与分析项间的相关关系。分析时主要看标准载荷系数值和P值。 如果呈现出显著性,且标准载荷系数值大于,则说明有着较强的相关关系。反之,如果没有呈现出显著性,也或者标准载荷系数值较低(比如低于),则说明该分析项与因子间相关关系较弱。 上表格显示,B1与Factor2之间的因子载荷系数值为 < ,说明对应关系较弱,可考虑将此项从Factor2中移除出去。从整体上看,各个测量项全部均呈现出水平的显著性(P< ),而且标准化载荷系数值均大于(除B1外),因而说明整体上看,因子与测量项之间有着良好的对应关系,聚合效度较好。此表格主要查看指标的 聚合效度 和区分效度 情况,输出指标包括AVE和CR值。通常AVE值>,CR值>,说明数据聚合效度较好。 从上格可知:本研究涉及的4个因子(SPSSAU默认给定名字为Factor 1, Factor 2, Factor 3, Factor 4),它们的AVE值全部均大于,而且CR值全部均大于,因而说明本次测量量表数据具有优秀的聚合效度。此表格展示 模型拟合指标 ,共分为常用指标和其它指标。表中提供各指标相应的建议判断标准,可直接对比判断标准值。一些其它指标通常使用较少,研究人员可结合实际情况进行选择。如果模型拟合不好需要,需要根据相关专业知识和模型修正指标对模型进行修正。上表来看:卡方自由度值为,大于3,而且GFI小于,RMSEA为接近于这一标准,RMR值为不在标准范围内。综合来看,模型构建欠佳,需要进行模型修正。比如这里将MI>10作为修正标准然后重新进行模型拟合,得到结果如下上表格展示 因子与测量项的对应关系MI值 ,因子与其下属测量项的关系可通过因子载荷系数表格进行查看。MI值并不固定标准大小,一般情况下,该值如果大于20则说明关联性很强。 从上表格可以看到,C2与Factor2,Factor4这两个因子间的MI指标均大于15,说明C2与Factor2,Factor4之间可能有着较强的关联性;同时,D5与Factor3之间的MI值为,说明二者有较强的关联性。 综合可知:可考虑将C2,D6这两个指标进行删除,同时上述因子载荷表格分析还发现B1也可以进行删除。因而将此三项进行删除后可再次进行模型(限于篇幅限制,SPSSAU并不继续进行分析)。上表格展示因子与因子之间的关联性,可通过标准系数进行分析。从上表可知,在进行因子协方差表格分析时,本研究共4个因子,他们两两之间的标准系数值均介于之间,说明因子之间具有较强的关联性。聚合效度通常是针对 AVE,CR,因子载荷系数 这三个指标进行分析,并且均是在模型最终确认后的指标进行分析。 分析结果表明:本研究量表数据具有优秀的聚合效度区分效度的测量是使用 AVE的平方根值 ,然后与4个因子的相关系数进行对比。 如果AVE平方根值大于“该因子与其它因子间的相关系数”,此时说明具有良好的区分效度。 区分效度首先需要进行相关分析(以及每个因子对应多项,需要使用‘生成变量’功能将其概括成一个整体后再进行两两相关分析)。如下:常见的区分效度分析时,会将上表格中斜对角线的1,换成AVE值的平方根,然后再进行对比分析。最终如下表格式:上图可知,因子1的AVE根号值为,大于因子1与另外3个因子之间的相关系数值(最大为);因子2的AVE根号值为,大于因子2与另外3个因子之间的相关系数值(最大为);类似地,因子3的AVE根号值,因子4的AVE根号值均大于它们与其它因子的相关系数值。因而说明研究量表数据的区分效度良好。特别提示: 常见的区分效度分析是将AVE根号值与‘相关系数值’进行对比;有时候区分效度的验证方法为:“比较多个CFA模型进行分析说明”,建议研究人员以参考文献为准; 区分效度进行时,需要先进行相关分析,以及取AVE均方根,然后将手工表格合并处理好后进行分析说明。共同方法偏差(CMV)常见有两种验证方式,一种是使用探索性因子分析EFA方法进行检验 (也称作Harman单因子检验方法),即查看把所有量表项进行探索性因子分析EFA时,如果只得出一个因子或者第一个因子的解释力(方差解释率)特别大,通常以50%为界,此时可判定存在同源方差(共同方法偏差),反之说明没有共同方法偏差问题。如果是使用CFA进行验证;则将所有的测量项(即所有因子对应的测量量表题项)放在一个因子里面,然后进行分析,如果测量出来显示模型的拟合指标,比如卡方自由度比,RMSEA,RMR,CFI等无法达标,则说明模型拟合不佳,即说明所有的测量项并不应该同属于一个因子(放在一起时模型不好),因而说明数据通过共同方法偏差CMV检验,数据无共同方法偏差问题。本次共有4个因子对应20个测量项,将此20个测量项全部放在一个因子里面进行CFA分析并且得到模型拟合指标,如下图:上图显示卡方自由度值为,明显高于标准(>3),并且GFI,CFI,NFI,NNFI这四个指标值全部均低于,明显偏差标准值(大于),RMSEA和RMR值均大于,也严重偏差标准值。其它指标比如AGFI,IFI,PGFI,PNFI等也均低于,严重偏差大于这一标准,因而说明模型拟合质量非常糟糕,也即说明不能本次研究量表数据无法聚焦成一个因子,即说明无共同方法偏差问题。特别提示: 上述为两种常见的共同方法偏差验证方法,还有其它验证方法,建议研究人员以参考文献为准; 研究人员需要在事前注意共同方法偏差问题,而不能等到事后发现共同方法偏差才能处理。登录 SPSSAU官网 体验在线数据分析