【www.shanpow.com--热门范文】
第一篇spss怎么用:【攻略】手把手教你怎么用SPSS做统计分析 - 实验方法 - 丁香通
使用SPSS软件进行数据分析
主成分分析 【例子】以全国31个省市的8项经济指标为例,进行主成分分析。第一步:录入或调入数据(图1)。
第二步:打开“因子分析”对话框。沿着主菜单的“Analyze→Data Reduction→Factor”的路径(图2)打开因子分析选项框(图3)。
图2 打开因子分析对话框的路径
图3 因子分析选项框
第三步:选项设置。首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。在本例中,全部8个变量都要用上,故全部调入(图4)。因无特殊需要,故不必理会“Value”栏。下面逐项设置。
图4 将变量移到变量栏以后
⒈ 设置Descriptives选项。单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。
图5 描述选项框
在Statistics栏中选中Univariate descriptives复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial solution复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。在Correlation Matrix栏中,选中Coefficients复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Determinant复选项,则会给出相关系数矩阵的行列式,如果希望在Excel中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选)。设置完成以后,单击Continue按钮完成设置(图5)。⒉ 设置Extraction选项。打开Extraction对话框(图6)。因子提取方法主要有7种,在Method栏中可以看到,系统默认的提取方法是主成分(Principal components),因此对此栏不作变动,就是认可了主成分分析方法。在Analyze栏中,选中Correlation matirx复选项,则因子分析基于数据的相关系数矩阵进行分析;如果选中Covariance matrix复选项,则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。在Display栏中,选中Unrotated factor solution(非旋转因子解)复选项,则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。选中Scree Plot(“山麓”图),则在分析结果中给出特征根按大小分布的折线图(形如山麓截面,故得名),以便我们直观地判定因子的提取数量是否准确。在Extract栏中,有两种方法可以决定提取主成分(因子)的数目。一是根据特征根(Eigenvalues)的数值,系统默认的是。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认,则所有方差大于等于1的主成分将被保留,其余舍弃。如果觉得最后选取的主成分数量不足,可以将值降低,例如取;如果认为最后的提取的主成分数量偏多,则可以提高值,例如取。主成分数目是否合适,要在进行一轮分析以后才能肯定。因此,特征根数值的设定,要在反复试验以后才能决定。一般而言,在初次分析时,最好降低特征根的临界值(如取) ,这样提取的主成分将会偏多,根据初次分析的结果,在第二轮分析过程中可以调整特征根的大小。第二种方法是直接指定主成分的数目即因子数目,这要选中Number of factors复选项。主成分的数目选多少合适?开始我们并不十分清楚。因此,首次不妨将数值设大一些,但不能超过变量数目。本例有8个变量,因此,最大的主成分提取数目为8,不得超过此数。在我们第一轮分析中,采用系统默认的方法提取主成分。
图6 提取对话框
需要注意的是:主成分计算是利用迭代(Iterations)方法,系统默认的迭代次数是25次。但是,当数据量较大时,25次迭代是不够的,需要改为50次、100次乃至更多。对于本例而言,变量较少,25次迭代足够,故无需改动。设置完成以后,单击Continue按钮完成设置(图6)。⒊ 设置Scores设置。选中Save as variables栏,则分析结果中给出标准化的主成分得分(在数据表的后面)。至于方法复选项,对主成分分析而言,三种方法没有分别,采用系统默认的“回归”(Regression)法即可。
图7 因子得分对话框
选中Display factor score coefficient matrix,则在分析结果中给出因子得分系数矩阵及其相关矩阵。设置完成以后,单击Continue按钮完成设置(图7)。⒋ 其它。对于主成分分析而言,旋转项(Rotation)可以不必设置;对于数据没有缺失的情况下,Option项可以不必理会。全部设置完成以后,点击OK确定,SPSS很快给出计算结果(图8)。
图8 主成分分析的结果
第四步,结果解读。在因子分析结果(Output)中,首先给出的Descriptive Statistics,第一列Mean对应的变量的算术平均值,计算公式为
第二列Std. Deviation对应的是样本标准差,计算公式为
第三列Analysis N对应是样本数目。这一组数据在分析过程中可作参考。
接下来是Correlation Matrix(相关系数矩阵),一般而言,相关系数高的变量,大多会进入同一个主成分,但不尽然,除了相关系数外,决定变量在主成分中分布地位的因素还有数据的结构。相关系数矩阵对主成分分析具有参考价值,毕竟主成分分析是从计算相关系数矩阵的特征根开始的。相关系数阵下面的Determinant=1.133E-0.4是相关矩阵的行列式值,根据关系式可知,det(λI)=det(R),从而Determinant=1.133E-0.4=λ1*λ2*λ3*λ4*λ5*λ6*λ7*λ8。这一点在后面将会得到验证。
在Communalities(公因子方差)中,给出了因子载荷阵的初始公因子方差(Initial)和提取公因子方差(Extraction),后面将会看到它们的含义。
在Total Variance Explained(全部解释方差) 表的Initial Eigenvalues(初始特征根)中,给出了按顺序排列的主成分得分的方差(Total),在数值上等于相关系数矩阵的各个特征根λ,因此可以直接根据特征根计算每一个主成分的方差百分比(% of Variance)。由于全部特征根的总和等于变量数目,即有m=∑λi=8,故第一个特征根的方差百分比为λ1/m=3.755/8=46.939,第二个特征根的百分比为λ2/m=2.197/8= 27.459,……,其余依此类推。然后可以算出方差累计值(Cumulative %)。在Extraction Sums of Squared Loadings,给出了从左边栏目中提取的三个主成分及有关参数,提取的原则是满足λ>1,这一点我们在图6所示的对话框中进行了限定。
图8 特征根数值衰减折线图(山麓图)
主成分的数目可以根据相关系数矩阵的特征根来判定,如前所说,相关系数矩阵的特征根刚好等于主成分的方差,而方差是变量数据蕴涵信息的重要判据之一。根据λ值决定主成分数目的准则有三:i 只取λ>1的特征根对应的主成分从Total Variance Explained表中可见,第一、第二和第三个主成分对应的λ值都大于1,这意味着这三个主成分得分的方差都大于1。本例正是根据这条准则提取主成分的。ii 累计百分比达到80%~85%以上的λ值对应的主成分在Total Variance Explained表可以看出,前三个主成分对应的λ值累计百分比达到89.584%,这暗示只要选取三个主成分,信息量就够了。iii 根据特征根变化的突变点决定主成分的数量从特征根分布的折线图(Scree Plot)上可以看到,第4个λ值是一个明显的折点,这暗示选取的主成分数目应有p≤4(图8)。那么,究竟是3个还是4个呢?根据前面两条准则,选3个大致合适(但小有问题)。在Component Matrix(成分矩阵)中,给出了主成分载荷矩阵,每一列载荷值都显示了各个变量与有关主成分的相关系数。以第一列为例,0.885实际上是国内生产总值(GDP)与第一个主成分的相关系数。将标准化的GDP数据与第一主成分得分进行回归,决定系数R2=0.783(图9),容易算出R=0.885,这正是GDP在第一个主成分上的载荷。
下面将主成分载荷矩阵拷贝到Excel上面作进一步的处理:计算公因子方差和方差贡献。首先求行平方和,例如,第一行的平方和为
这是公因子方差。然后求列平方和,例如,第一列的平方和为
这便是方差贡献(图10)。在Excel中有一个计算平方和的命令sumsq,可以方便地算出一组数据的平方和。显然,列平方和即方差贡献。事实上,有如下关系成立:
相关系数矩阵的特征根=方差贡献=主成分得分的方差
至于行平方和,显然与前面公因子方差(Communalities)表中的Extraction列对应的数据一样。如果我们将8个主成分全部提取,则主成分载荷的行平方和都等于1(图11),即有hi=1,sj=λj。到此可以明白:在Communalities中,Initial对应的是初始公因子方差,实际上是全部主成分的公因子方差;Extraction对应的是提取的主成分的公因子方差,我们提取了3个主成分,故计算公因子方差时只考虑3个主成分。
图9 国内生产总值(GDP)的与第一主成分的相关关系(标准化数据)
图10 主成分方差与方差贡献
图11 全部主成分的公因子方差和方差贡献
提取主成分的原则上要求公因子方差的各个数值尽可能接近,亦即要求它们的方差极小,当公因子方差完全相等时,它们的方差为0,这就达到完美状态。实际应用中,只要公因子方差数值彼此接近(不相差太远)就行了。从上面给出的结果可以看出:提取3个主成分的时候,居民消费的公因子方差偏小,这暗示提取3个主成分,居民消费方面的信息可能有较多的损失。至于方差贡献,反映对应主成分的重要程度,这一点从方差的统计学意义可以得到理解。在图11中,将最后一行的特征根全部乘到一起,得0.0001133,这正是相关系数矩阵的行列式数值(在Excel中,求一组数据的乘积之和的命令是product)。最后说明Component Score Coefficient Matrix(成分得分系数矩阵)和Component Score Covariance Matrix(成分得分协方差矩阵),前者是主成分得分系数,后者是主成分得分的协方差即相关系数。从Component Score Covariance Matrix可以看出,标准化主成分得分之间的协方差即相关系数为0(j≠k)或1(j=k),这意味着主成分之间彼此正交即垂直。初学者常将Component Score Coefficient Matrix表中的数据当成主成分得分或因子得分,这是误会。成分得分系数矩阵的数值是主成分载荷除以相应的特征根得到的结果。在Component Matrix表中,将第一列数据分别除以λ1=3.755,第二列数值分别除以λ2=2.197,…,立即得到Component Score Coefficient;反过来,如果将Component Score Coefficient Matrix表中的各列数据分别乘以λ1=3.755,λ2=2.197,…,则可将其还原为主成分载荷即Component Matrix中的数据。
实际上,主成分得分在原始数据所在的SPSS当前数据栏中给出,不过给出的都是标准化的主成分得分(图12a);将各个主成分乘以相应的√λ即特征根的二次方根可以将其还原为未经标准化的主成分得分。
a.标准化的主成分得分 b. 非标准化的主成分得分图12 两种主成分得分
计算标准化主成分得分的协方差或相关系数,结果与Component Score Covariance Matrix表中的给出的结果一致(见图13)。第一因子第二因子第三因子第一因子1第二因子0.00000 1第三因子0.00000 0.00000 1
图13 主成分(得分)之间的相关系数矩阵
第五步,计算结果分析。从Component Matrix即主成分载荷表中可以看出,国内生产总值、固定资产投资和工业产值在第一主成分上载荷较大,亦即与第一主成分的相关系数较高;职工工资和货物周转量在第二主成分上的载荷绝对值较大,即负相关程度较高;消费价格指数在第三主成分上的载荷较大,即相关程度较高。因此可将主成分命名如下:第一主成分:投入-产出主成分;第二主成分:工资-物流主成分;第三主成分:消费价格主成分。问题在于:一方面,居民消费和商品零售价格指数的归类比较含混;另一方面,主成分的命名结构不清。因此,有必要作进一步的因子分析。
至于因子旋转之类,留待“因子分析”部分说明;计算结果的系统分析不属于软件操作范围,预备课堂讲解。【说明】本人计算机是双系统,现在常用的WinMe系统出了毛病,SPSS10.0在WinMe系统中;故这次改用本人Win2000系统中的SPSS11.0。对于因子分析之类,SPSS11.0与SPSS10.0基本没有什么差别。
编辑: wudihero007
分享到:
第二篇spss怎么用:spss使用说明(转)
本节将介绍利用SPSS软件对量表进行处理分析。 在获取原始数据后,我们利用SPSS对量表可以作出三种分析,即项目分析、因素分析和信度分析。
项目分析,目的是找出未达显著水准的题项并把它删除。它是通过将获得的原始数据求出量表中题项的临界比率值——CR值来作出判断。通常,量表的制作是要经过专家的设计与审查,因此,题项一般均具有鉴别度,能够鉴别不同受试者的反应程度。故往往在量表处理中可以省去这一步。
因素分析,目的是在多变量系统中,把多个很难解释,而彼此有关的变量,转化成少数有概念化意义而彼此独立性大的因素,从而分析多个因素的关系。在具体应用时,大多数采用“主成份因素分析”法,它是因素分析中最常使用的方法。
信度分析,目的是对量表的可靠性与有效性进行检验。如果一个量表的信度愈高,代表量表愈稳定。也就表示受试者在不同时间测量得分的一致性,因而又称“稳定系数”。根据不同专家的观点,量表的信度系数如果在0.9以上,表示量表的信度甚佳。但是对于可接受的最小信度系数值是多少,许多专家的看法也不一致,有些专家定为0.8以上,也有的专家定位0.7以上。通常认为,如果研究者编制的量表的信度过低,如在0.6以下,应以重新编制较为适宜。
在本节中,主要介绍利用SPSS软件对量表进行因素分析。 一、因素分析基本原理 因素分析是通过求出量表的“结构效度”来对量表中因素关系作出判断。在多变量关系中,变量间线性组合对表现或解释每个层面变异数非常有用,主成份分析主要目的即在此。变量的第一个线性组合可以解释最大的变异量,排除前述层次,第二个线性组合可以解释次大的变异量,最后一个成份所能解释总变异量的部份会较少。 主成份数据分析中,以较少成份解释原始变量变异量较大部份。成份变异量通常用“特征值”表示,有时也称“特性本质”或“潜在本质”。因素分析是一种潜在结构分析法,其模式理论中,假定每个指针(外在变量或称题项)均由两部分所构成,一为“共同因素”、一为“唯一因素”。共同因素的数目会比指针数(原始变量数)还少,而每个指针或原始变量皆有一个唯一因素,亦即一份量表共有n个题项数,则会有n个唯一因素。唯一因素性质有两个假定: (1)所有的唯一因素彼此间没有相关; (2)所有的唯一因素与所有的共同因素间也没有相关。 至于所有共同因素间彼此的关系,可能有相关或可能皆没有相关。在直交转轴状态下,所有的共同因素间彼此没有相关;在斜交转轴情况下,所有的共同因素间彼此就有相关。因素分析最常用的理论模式如下: 其中 (1)为第i个变量的标准化分数。 (2)Fm为共同因素。 (3)m为所有变量共同因素的数目。 (4)为变量的唯一因素 (5)为因素负荷量。 因素分析的理想情况,在于个别因素负荷量不是很大就是很小,这样每个变量才能与较少的共同因素产生密切关联,如果想要以最少的共同因素数来解释变量间的关系程度,则彼此间或与共同因素间就不能有关联存在。
-
所谓的因素负荷量,是因素结构中原始变量与因素分析时抽取出共同因素的相关。
在因素分析中,有两个重要指针:一为“共同性”,二为“特征值”。
-
所谓共同性,就是每个变量在每个共同因素之负荷量的平方总和(一横列中所有因素负荷量的平方和),也就是个别变量可以被共同因素解释的变异量百分比,这个值是个别变量与共同因素间多元相关的平方。
从共同性的大小可以判断这个原始变量与共同因素间之关系程度。而各变量的唯一因素大小就是1减掉该变量共同性的值。(在主成份分析中,有多少个原始变量便有多少个成份,所以共同性会等于1,没有唯一因素)。
-
所谓特征值,是每个变量在某一共同因素之因素负荷量的平方总和(一直行所有因素负荷量的平方和)。
在因素分析的共同因素抽取中,特征值最大的共同因素会最先被抽取,其次是次大者,最后抽取得共同因素的特征值最小,通常会接近0(在主成份分析中,有几个题项,便有几个成份,因而特征值的总和刚好等于变量的总数)。将每个共同因素的特征值除以总题数,为此共同因素可以解释的变异量,因素分析的目的之一,即在因素结构的简单化,希望以最少的共同因素,能对总变异量作最大的解释,因而抽取得因素愈少愈好,但抽取因素的累积解释的变异量愈大愈好。 我们通过一个例子说明如何利用SPSS软件对量表进行分析。 二、利用SPSS对量表进行因素分析 【例6-9】 现要对远程学习者对教育技术资源的了解和使用情况进行了解,设计一个里克特量表,如表6-27所示。 将该量表发放给20人回答,假设回收后的原始数据如表6-28所示。 操作步骤: ⒈ 录入数据 定义变量“A1”、“A2”、“A3”、“A5”、“A6”、“A7”、“A8”、“A9”、“A10”,并按照表 输入数据,如图6-33所示。 ⒉ 因素分析 (1)选择“AnalyzeData ReductionFactor…”命令,弹出“Factor Analyze”对话框,将变量“A1”到“A10”选入“Variables”框中,如图6-34所示。 (2)设置描述性统计量 单击图6-34对话框中的“Descriptives…”按钮,弹出“Factor Analyze:Descriptives”(因素分析:描述性统计量)对话框,如图6-35所示。 ① “Statistics”(统计量)对话框 A “Univariate descriptives”(单变量描述性统计量):显示每一题项的平均数、标准差。 B “Initial solution”(未转轴之统计量):显示因素分析未转轴前之共同性、特征值、变异数百分比及累积百分比。 ② “Correlation Matric”(相关矩阵)选项框 A “Coefficients”(系数):显示题项的相关矩阵 B “Significance levels”(显著水准):求出前述相关矩阵地显著水准。 C “Determinant”(行列式):求出前述相关矩阵地行列式值。 D “KMO and Bartlett’s test of sphericity”(KMO与Bartlett的球形检定):显示KMO抽样适当性参数与Bartlett’s的球形检定。 E “Inverse”(倒数模式):求出相关矩阵的反矩阵。 F “Reproduced”(重制的):显示重制相关矩阵,上三角形矩阵代表残差值;而主对角线及下三角形代表相关系数。 G “Anti-image”(反映像):求出反映像的共变量及相关矩阵。 在本例中,选择“Initial solution”与“KMO and Bartlett’s test of sphericity”二项,单击“Continue”按钮确定。 (3)设置对因素的抽取选项 单击图6-34对话框中的“Extraction…”按钮,弹出“Factor Analyze:Extraction”(因素分析:抽取)对话框,如图6-36所示。 ① “Method”(方法)选项框:下拉式选项内有其中抽取因素的方法: A “Principal components”法:主成份分析法抽取因素,此为SPSS默认方法。 B “Unweighted least squares”法:未加权最小平方法。 C “Generalized least square”法:一般化最小平方法。 D “Maximum likelihood”法:最大概似法。 E “Principal-axis factoring”法:主轴法。 F “Alpha factoring”法:α因素抽取法。 G “Image factoring”法:映像因素抽取法。 ② “Analyze”(分析)选项框 A “Correlation matrix”(相关矩阵):以相关矩阵来抽取因素 B “Covariance matrix”(共变异数矩阵):以共变量矩阵来抽取因素。 ③ “Display”(显示)选项框 A “Unrotated factor solution”(未旋转因子解):显示未转轴时因素负荷量、特征值及共同性。 B “Scree plot”(陡坡图):显示陡坡图。 ④ “Extract”(抽取)选项框 A “Eigenvalues over”(特征值):后面的空格默认为1,表示因素抽取时,只抽取特征值大于1者,使用者可随意输入0至变量总数之间的值。 B “Number of factors”(因子个数):选取此项时,后面的空格内输入限定的因素个数。 在本例中,设置因素抽取方法为“Principal components”,选取“Correlation matrix”、“Unrotated factor solution”、“Principal components”选项,在抽取因素时限定在特征值大于1者,即SPSS的默认选项。单击“Continue”按钮确定。 (4)设置因素转轴 单击图6-34对话框中的“Rotation…”按钮,弹出“Factor Analyze:Rotation”(因素分析:旋转)对话框,如图6-37所示。 ① “Method”(方法)选项方框内六种因素转轴方法: A “None”:不需要转轴 B “Varimax”:最大变异法,属正交转轴法之一。 C “Quartimax”:四次方最大值法,属正交转轴法之一。 D “Equamax”:相等最大值法,属正交转轴法之一。 E “Direct Oblimin”:直接斜交转轴法,属斜交转轴法之一。 F “Promax”:Promax转轴法,属斜交转轴法之一。 ② “Display”(显示)选项框: A “Rotated solution”(转轴后的解):显示转轴后的相关信息,正交转轴显示因素组型矩阵及因素转换矩阵;斜交转轴则显示因素组型、因素结构矩阵与因素相关矩阵。 B “Loading plots”(因子负荷量):绘出因素的散步图。 ③ “Maximum Iterations for Convergence”:转轴时之行的叠代最多次数,后面默认得数字为25,表示算法之行转轴时,执行步骤的次数上限。 在本例中,选择“Varimax”、“Rotated solution”二项。研究者要选择“Rotated solution”选项,才能显示转轴后的相关信息。单击“Continue”按钮确定。 (5)设置因素分数 单击图6-34对话框中的“Scores…”按钮,弹出“Factor Analyze:Factor Scores”(因素分析:因素分数)对话框,如图6-38所示。 ① “Save as variable”(因素存储变量)框 勾选时可将新建立的因素分数存储至数据文件中,并产生新的变量名称(默认为fact_1、fact_2、fact_3、fact_4等)。在“Method”框中表示计算因素分数的方法有三种: A “Regression”:使用回归法。 B “Bartlett”:使用Bartlette法 C “Anderson-Robin”:使用Anderson-Robin法。 ② “Display factor coefficient matrix”(显示因素分数系数矩阵)选项 勾选时可显示因数分数系数矩阵。 在本例中,取默认值。单击“Continue”按钮确定。 (6)设置因素分析的选项 单击图6-34对话框中的“Options…”按钮,弹出“Factor Analyze:Options”(因素分析:选项)对话框,如图6-39所示。 ①“Missing Values”(遗漏值)选项框:遗漏值的处理方式。 A “Exclude cases listwise”(完全排除遗漏值):观察值在所有变量中没有遗漏值者才加以分析。 B “Exclude cases pairwise”(成对方式排除):在成对相关分析中出现遗漏值得观察值舍弃。 C “Replace with mean”(用平均数置换):以变量平均值取代遗漏值。 ②“Coefficient Display Format”(系数显示格式)选项框:因素负荷量出现的格式。 A “Sorted by size”(依据因素负荷量排序):根据每一因素层面的因素负荷量的大小排序。 B “Suppress absolute values less than”(绝对值舍弃的下限):因素负荷量小于后面数字者不被显示,默认的值为0.1。 在本例中,选择“Exclude cases listwise”、“Sorted by size”二项,并勾选“Suppress absolute values less than”,其后空格内的数字不用修改,默认为0.1。如果研究者要呈现所有因素负荷量,就不用选取“Suppress absolute values less than”选项。在例题中为了让研究者明白此项的意义,才勾选了此项,正式的研究中应呈现题项完整的因素负荷量较为适宜。单击“Continue”按钮确定。 设置完所有的选项后,单击“OK”按钮,输出结果。 ⒊ 结果分析 (1)KMO及Bartlett’检验 如图6-40所示,显示KMO及Bartlett’检验结果。 KMO是Kaiser-Meyer-Olkin的取样适当性量数,当KMO值愈大时,表示变量间的共同因素愈多,愈适合进行因素分析,根据专家Kaiser(1974)观点,如果KMO的值小于0.5时,较不宜进行因素分析,此处的KMO值为0.695,表示适合因素分析。 此外,从Bartlett’s球形检验的 值为234.438,自由度为45,达到显著,代表母群体的相关矩阵间有共同因素存在,适合进行因素分析。 (2)共同性 如图6-41所示,显示因素间的共同性结果。 共同性中显示抽取方法威主成份分析法,最右边一栏为题项的共同性。 (3)陡坡图 如图6-42所示,显示因素的陡坡图。 从陡坡图中,可以看出从第三个因素以后,坡线甚为平坦,因而以保留3个因素较为适宜。 (4)整体解释的变异数——未转轴前的数据 如图6-43所示,显示的是未转轴前整体解释的变异数。 从图中可以看出,左边10个成份因素的特征值总和等于10。解释变异量为特征值除以题项数,如第一个特征值得解释变异量为6.358÷10 63.579%。 将左边10个成份的特征值大于1的列于右边。特征值大于1的共有三个,这也是因素分析时所抽出的共同因素数。由于特征值是由大到小排列,所以第一个共同因素的解释变异量通常是最大者,其次是第二个1.547,再是第三个1.032。 转轴后的特征值为4.389、3.137、1.411,解释变异量为43.885%、31.372%、14.108%,累积的解释变异量为43.885%、75.257%、89.366%。转轴后的特征值不同于转轴前的特征值。 (5)未转轴的因素矩阵 如图6-44所示,显示的是未转轴的因素矩阵。 从图中可以看出,有3个因素被抽取,并且因素负荷量小鱼0.1的未被显示。 (6)转轴后的因素矩阵 如图6-45所示,显示了转轴后的因素矩阵。 从图中可以看出A1、A8、A6、A5、A4为因素一,A10、A9、A7为因素二,A3、A2为因素三。题项在其所属的因素层面顺序是按照因素负荷量的高低排列。 (7)因素转换矩阵 如图6-46所示,显示了因素转换矩阵。它是在“Factor Analysis:Rotation”对话框中“Display”选项框中选择“Rotated Solution”选项框以后生成该表。 ⒋ 结果说明 根据因素的特征值和旋转后的因素矩阵,采用了主成份分析法抽取出3个因素作为共同因素,并使用因素转轴方法中的Varimax最大变异法,转轴后去掉了因素负荷量小于0.1的的系数,按照从大到小的顺序进行排列,使得变量与因素的关系豁然明了。对其作如表6-29 所示的因素分析摘要表。 转轴后的特征值为4.389、3.137、1.411,解释变异量为43.885%、31.372%、14.108%,累积的解释变异量为43.885%、75.257%、89.366%。转轴后的特征值不同于转轴前的特征值。
第三篇spss怎么用:SPSS操作
第四节
统计推断的SPSS操作
一、
平均数的显著性检验与总体平均数的估计
1.数据
例1:某区英语测验平均成绩为65分,先从某中学随机抽取20份试卷,其分数为:
72 76 68
78 62 59
64 85 70
75
61 74 87
83 54 76
56 66 68
62
问该校初三英语水平与全区是否基本一致(α=0.05)。
将上面的数据输为一列,命名为score,保存到文件“5-6-1.sav”中。
2.理论分析:
本例题数据是成绩,其总体为正态分布,总体方差未知,符合总体平均数显著性检验条件。
3. SPSS菜单可直接提供平均数显著性检验
⑴单击主菜单Analyze/Compare Means/One-Sample T Test…,进入主对话框,如下图5-17所示:
图7-1:单样本总体平均数检验主对话框 图5-18:单样本t检验Options窗口
①
把指定分析的变量score从左侧的矩形框选入到右边的检验变量表列(Test
Variable(s))中;
②
在主对话框右下方的检验值(Test Value)后面的方框中填入指定检验的总体均值,此处应为65。
⑵点击Options…选项出现单样本t检验的选择窗口(图5-18),
①
在此窗口可以定义输出的置信区间(Confidence lnlerval),系统默认设置为95%的置信区间,用户可以按照需要改变这一数据。
②
在Options窗口还可定义处理缺失值(Missing Values)的方法。一般情况下大多保持默认(Exclude cases analysis by analysis)即可。
③
设置完成后,点击continue返回主对话框。
(3)在主对话框中点击OK,得到此程序运行结果。
4.结果及解释
(1)
输出样本统计量的基本描述信息
One-Sample Statistics
N
Mean
Std. Deviation
Std. Error Mean
SCORE
20
69.8000
9.4735
2.1183
上表提供所分析变量的基本描述统计量的信息,依次为样本容量(N)、均值(Mean)、标准差(Std. Deviation)、标准误(Std. Error Mean),本例中所调查的样本容量N=20,样本平均值为69.80(Mean=69.80),标准差为9.4735(Std. Deviation=9.4735),标准误为2.1183(Std. Error Mean)。
(2)输出样本均值与总体均值差异性检验结果
One-Sample Test
Test Value = 65
t
df
Sig. (2-tailed)
Mean Difference
95% Confidence Interval of the Difference
Lower
Upper
SCORE
2.266
19
.035
4.8000
.3663
9.2337
上表显示了单样本t检验的结果,最上面一栏为所检验的总体均值(Test Value=65),下面依次为指定分析的变量(SCORE)、t值(t=2.266)、自由度(df=19)、双侧检验的显著性水平(Sig. (2-tailed=0.035)、样本均值与总体均值之差(Mean
Difference=4.8000)、两均值之差95%的置信区间(95% Confidence
Interval of the Difference):(0.3663,9.2337)。上面例1检验结果表明,在0.05的显著性水平下,该校初三英语水平与全区存在显著差异。即指某校初三样本平均数与全区总体平均数有显著性差异,或者说样本平均数与总体平均数的差异不是抽样误差所致,而是该样本来自另一总体。作此结论犯错误的概率小于5%。 样本均值69.8与总体均值65差异4.8的95%的置信区间为(0.3663,9.2337),该区间不包含零,所以根据这一结果也可得到样本均值与总体均值存在显著差异的结论。
二、两独立样本的平均数差异的显著性检验
SPSS菜单提供的直接分析程序适于两总体都是正态分布、两总体方差都未知的独立样本情况(相关样本的程序随后介绍)。下面结合实例简单说明如何应用SPSS进行两个独立样本的平均数差异的显著性检验。
1.数据
例2:采用第二章中学生考试成绩的数据(文件2-6-1.sav中的数据),目的是分析不同性别学生这次考试成绩是否存在差异。(α=0.05)。
2.理论分析
上面例2中的数据,学生考试成绩按照性别分成两组,每组可以看成是服从正态分布的连续性变量,并且方差未知,对于不同性别学生样本可以看成是相互独立的。
3.用SPSS进行独立样本t检验
(1)打开数据文件“2-6-1.sav”,单击主菜单 Analyze/Compare
Means/Independent Samples T Tests…,进入独立样本t检验主对话框,在此对话框中,将变量score选入的检验变量表列(Test
Value(s))下的矩形框,将变量sex选入右边的分组变量(Grouping Variable)下的矩形框,如图5-19所示。
图5-19 独立样本t检验主对话框 图5-20 数字型变量组定义窗口
(2)单击主对话框中的定义组(define groups…)按钮进入定义组别对话框,对于分组变量为数值型的变量,定义分组有两种方式:
·Use Specified Values. 由用户指定分组的值,这是默认的情况。输入与分组变量两个分类相对应的第一组和第二组的值,具有其它值的观测不被分析。
·Cut Point 用户指定分割点,所有大于或等于分割点值的观测被分到一个组,其余的分到另外一个组。
应该注意,对于字符型的分组变量,定义分组只有Use Specified
Values一种方式。
这里数据中性别男女分别用数字0和1表示,所以这里在第一组(Group 1)后的方框中输入数字0,在第一组(Group 2)后的方框中输入数字1,我们指明了用以区分两组数据的变量值分别为0与1。如图5-20所示。点击Continue返回主对话框
(3)在主对话框中点击Options…选项,出现独立样本t检验的选择窗口,该窗口与单样本t检验的选择窗口(图5-18)类似,在此窗口可以定义输出的置信区间和处理缺失值的方法。这里我们采用系统默认设置。
(4)点击OK得到程序运行结果。
4.结果及解释
(1)输出分组描述统计量表
Group Statistics
SEX
N
Mean
Std. Deviation
Std. Error Mean
SCORE
男生
52
79.731
7.826
1.085
女生
48
79.625
6.127
.884
上表提供了不同组的有效观测值,分析变量按组的平均数、标准差及标准误。本例结果表明在调查的100人中,男生52人,女生48人;男生组的平均分数为79.731分,标准差为7.826,标准误为1.085;女生组的平均分数为79.625分,标准差为6.127,标准误为0.884。
(2)输出独立样本检验结果
Independent Samples Test
Levene"s Test for Equality of Variances
t-test for Equality of Means
F
Sig.
t
df
Sig. (2-tailed)
Mean Difference
Std. Error Difference
95% Confidence Interval of the Difference
Lower
Upper
SCORE
Equal variances assumed
3.982
.049
.075
98
.941
.106
1.414
-2.699
2.911
Equal variances not assumed
.076
95.517
.940
.106
1.400
-2.673
2.885
上表为独立样本t检验结果,因为在进行两独立样本均值差异性的显著性检验时,首先应该判断两组的方差是否相等,方差相等和不等需用不同的统计量进行差异性的检验。在SPSS的输出结果中也显示了两类t检验的结果。上面的一栏为符合方差齐性时的t检验结果,下面的一栏为方差齐性假设不成立时的结果。判断方差是否齐性可以通过观察Levene方差齐性检验的结果来判断,如上表中的方差齐性检验的结果对应的F统计量的值为3.982,显著性水平为.049<.05,所以在0.05的显著性水平下可以判定方差非齐性,所以T检验结果应该看下面一栏。不论方差是否齐性,t检验都提供了t值、自由度、显著性水平、两平均数之差、标准误及平均数之差的95%的置信区间。本例结果:t=0.076,df=95.517,p=0.940>0.05,均值的差异为0.106,标准误为1.400,均值差异95%的区间估计为(-2.673,2.885)包含0在内,所以根据上述结果可以说男女生的这一次考试成绩在0.05的显著性水平下不存在显著差异。
三、相关样本的平均数差异的T检验
适用条件为两总体正态分布、两总体方差都未知,且两个样本之间存在一一对应关系。
1.数据
例3:对12名被试进行两种夹角(15度,30度)的缪勒—莱尔错觉实验,结果如下(数据在下面程序中),问两种夹角的情况下错觉量是否有显著差异?
上面所有的例子都是直接在SPSS数据编辑窗口(SPSS Data Editor)将数据输入,这里我们介绍另一种输入数据的方法,在SPSS句法编辑窗口(SPSS Syntax Editor)输入数据。在SPSS主窗口选择菜单File/New/Syntax,即打开一个新的句法编辑窗口,在该窗口输入下列程序(有关语句的具体说明可以参考过关专门介绍SPSS的文献),然后在句法编辑窗口选择菜单Run/All(也可以先用鼠标选中要执行的语句,然后选择Run/Selection),便可以在数据编辑窗口得到类似于上面例题中介绍过的数据文件。
data list free/ subject first
second.
begin data.
1 12 13
2 13 13
3 14 15
4 12 15
5 12
16
6 13
16
7 12 12
8 11 11
9 13 13
10 14
14
11 13 13
12 14
16
end
data.
在新生成的数据文件中,第一列“subject”为被试编号,第二列“first” 为15度夹角时的错觉量,第三列“second”为30度夹角时的错觉量。将生成的数据文件保存为“5-6-3.sav”。
2.理论分析
上述数据为12个被试前后两次在不同条件下测量的结果,因为两次的测量结果受同一被试特征的影响,所以可以看成是相关样本。对于第一次和第二次的错觉试验结果可以看成是从总体上服从正态分布的连续性资料,两样本总体方差未知,所以对这样两组数据平均数之间差异性的检验应用配对样本的t检验。
3.相关样本t检验过程
(1)单击主菜单Analyze/Compare Means / Paired-Samples T Test…进入主对话框,将所要比较的两个变量“first”和“second”同时从左边的矩形框选入右边的配对变量表列(Paired
Variables)下的矩形框,如图5-21所示(把相关变量选入到分析变量表中去):
图5-21:配对样本t检验对话框
(2)Options…选项与前面独立样本中检验选项相同,可以提供差异的置信区间估计和处理缺失值的方法,这里我们采用系统默认的设置。
(3)点击OK得到结果。
4.结果及解释
(1)输出配对样本描述统计量
Paired Samples Statistics
Mean
N
Std. Deviation
Std. Error Mean
Pair
1
FIRST
12.7500
12
.9653
.2787
SECOND
13.9167
12
1.6765
.4840
上表分别显示了两个相关变量的均值、样本容量、标准差及标准误。在例3中,两组的样本容量都是12,15度的缪勒—莱尔错觉实验结果被试的平均错觉量为12.75,标准差为0.9653,标准误为0.2787;30度的缪勒—莱尔错觉实验被试的平均错觉量为13.9167,标准差为1.6765,标准误为0.4840。 (2)输出两相关样本相关系数及检验结果
Paired Samples Correlations
N
Correlation
Sig.
Pair 1
FIRST & SECOND
12
.492
.105
上表结果显示,两次测试之间的相关系数为0.492,对应的显著性水平Sig.=0.105>0.05,说明两次测试结果在0.05的显著性水平下不存在显著差异。
(3)输出配对样本t检验结果
Paired Samples Test
Paired Differences
95% Confidence Interval
of the Difference
t
df
Sig.
(2-tailed)
Mean
Std. Deviation
Std. Error Mean
Lower
Upper
Pair 1
first - second
-1.1667
1.4668
.4234
-2.0986
-.2347
-2.755
11
.019
上表依次提供了两样本差的平均数、标准误、置信区间、t值、自由度及双侧检验的显著性水平。例3中数据的检验结果表明:
15度与30度缪勒—莱尔错觉实验结果平均值的差异为-1.1667,标准差为1.4668,标准误为0.4234;两组平均数差异的95%的置信区间为(-2.0986,-0.2347),不包含0在内,说明两组均值的差异显著;两样本差异性检验t统计量的值为-2.755,自由度11,对应P=.019<.05,同样说明两种条件下的错觉量差异显著。
四、方差齐性的显著性检验
适合于独立样本的方差齐性的检验,根据前面的独立样本的平均值的检验结果中提供的Levene检验统计量的F值和P值来判断两组独立样本的方差是否相等。
对于总体标准差、总体方差差异性的检验和相关样本的方差齐性的检验,SPSS不能直接进行检验。
五、相关系数的显著性检验
SPSS可以通过点击Analyze/Correlate/Bivariate…,得到斯皮尔曼积差相关系数、斯皮尔曼等级相关系数和肯德尔τ系数,并且给出相关系数显著性检验的结果(具体内容见第三章第五节)。但是应该特别注意,由SPSS提供的相关系数显著性检验的结果,只是用来检验相关系数与零的差异是否显著,至于两个相关系数之间差异的显著性检验和相关系数与一个非零常数的差异的显著性检验,不能直接通过SPSS菜单操作完成。