判别分析


热门范文 2019-09-24 20:05:35 热门范文
[摘要]判别分析篇(1):判别分析导入界面群組統計資料group平均數標準偏差有效的 N (listwise)未加權加權1V1529 28696 9401515 000V210 969 2201515 000V3164 53240 7711515 000V6398 54

【www.shanpow.com--热门范文】

判别分析篇(1):判别分析

 
 
 
 
导入界面
 
 
 
 
 
 
 
 
 
 
  群組統計資料
group
平均數
標準偏差
有效的 N (listwise)
未加權
加權
1
V1
529.28
696.940
15
15.000
V2
10.96
9.220
15
15.000
V3
164.53
240.771
15
15.000
V6
398.54
447.351
15
15.000
2
V1
2,557.90
2,388.992
10
10.000
V2
31.90
33.773
10
10.000
V3
494.90
466.891
10
10.000
V6
2,891.75
2,263.181
10
10.000
3
V1
10,646.34
9,118.647
4
4.000
V2
108.20
93.725
4
4.000
V3
2,754.12
2,691.754
4
4.000
V6
17,097.32
16,991.888
4
4.000
總計
V1
2,624.26
4,746.834
29
29.000
V2
31.59
49.163
29
29.000
V3
635.63
1,281.590
29
29.000
V6
3,561.55
8,023.394
29
29.000  
 
 
1、单击“分析”—“分类”—“判别”就进入了判别分析的对话框,从对话框左侧的变量列表中选中进行判别分析的有关变量V1到V6,进入自变量框,作为判别分析的基础数据变量。从对话框左侧的变量列表中选分组变量group进入分组变量框,并点击“分组范围”,在“分组范围”对话框中,定义判别原始数据的类别数,在最小值处输入1,在最大值处输入3.
2、打开statitics对话框,在“描述性”菜单下选择:
3、“单变量ANOVAS”,对各类中同一自变量均值都相等的假设进行检验。
   BOX’S M,对各类的协方差矩阵相等的假设进行检验。
在“函数系数”菜单下,选择
Fisherh’s:给出Bayes判别函数系数
未标准化:给出费歇的判别函数系数
4、打开“分类”对话框:
在“先验概率”菜单下,选择先验概率赋值方式(此项为贝叶斯判别选项):
所有组相等:各类先验概率相等。
根据组大小计算:各类的先验概率与其样本量成正比。
在“使用方差矩阵”菜单下,选择计算中使用的共同协方差矩阵的估计方式:
在组内:使用合并类内协方差矩阵进行分类(系统默认)
分组:使用各类协方差矩阵进行分类
在“输出”菜单下选择生成到输出窗口中的分类结果
个案结果:输出每个观测量包括判别分数,实际类,预测类(根据判别函数求得的分类结果)和后验概率等
摘要表:输出分类的小结,给出正确分类观测数(原始类和根据判别函数计算的预测类相同)和错分观测量数和错分率。
留一分类:输出交互验证结果。
在“图”菜单中选择要求输出的样品投影图(此项为费歇判别选项)
合并组:生成一张包括各类的散点图
分组:每类生成一个散点图
面积图:根据生成的函数值吧各个观测值分到各组的区域图
5、打开“保存”对话框,将以下三项全勾上:
预测组成员:建立一个新变量,系统根据判别分数把观测量按后验概率绝对值最大指派所属的类
判别分数:保存各样品的判别的分值,该得分是由为标准化的费歇判别投影函数计算所得
组成员概率:建立新变量,表明观测量属于各类的后验概率
全部选择完成后,点击“OK”输出主要结果如下:
方差分析
表一
  群組平均值的等式檢定
 
Wilks" Lambda
(λ)
F
df1
df2
顯著性
V1
.488
13.663
2
26
.000
V2
.559
10.269
2
26
.001
V3
.533
11.392
2
26
.000
V6
.508
12.607
2
26
.000  
 
根据主成分分析后结果和表1说明,V1——铅,——V2汞,V3——镉,V6——砷有显著性差异,此检验说明判别有意义。
 
BOX’M检验
表2
Box"s 共變異數矩陣等式檢定
  對數行列式
group
等級
對數行列式
1
4
39.099
2
4
48.236
3
.a
.b
聯合組內
4
49.155
列印的行列式等級及自然對數是群組共變異數矩陣的等級及自然對數。
a. 等級 < 4
b. 作為非單數的觀察值太少
   
  測試結果a
Box"s M 共變異等式檢定
160.341
F
近似值
12.745
df1
10
df2
1728.341
顯著性
.000
檢定相等母體共變異數矩陣的虛無假設。
a. 部分共變異數矩陣是單數,且普通程序不會運作。非單數群組將根據它們自己的聯合組內共變異數矩陣進行檢定。它的行列式對數為 49.646。  
 
是对各组协方差矩阵是否相等的BOX’M检验,第一张表反映协方差矩阵的秩和行列式的对数值。由行列式值可以看出,协方差矩阵不是病态矩阵。
第二张表示对各总体协方差阵是否相等的统计检验。由F值及其显著水平,我们在0.05的显著性水平下拒绝原假设,(原假设假定各总体协方差阵相等)。我们得出的显著性值0.00<0.05,所以采用组内协方差矩阵。
(1)特征值
  特徵值
函數
特徵值
變異的 %
累加 %
典型相關性
1
1.081a
93.5
93.5
.721
2
.075a
6.5
100.0
.265
a. 前 2 個典型區別函數用於分析。  
 
结果分析的是典型判别函数。反应的判别函数的特征值,解释方差的比例和典型相关系数。第一判别函数解释了99.1%的方差,第二判别函数解释了0.9%的方差,两个判别函数解释了全部方差。
(2)wilk’s检验
  Wilks" Lambda
(λ)
函數的檢定
Wilks" Lambda
(λ)
卡方
df
顯著性
1 至 2
.447
19.737
8
.011
2
.930
1.781
3
.619  
此结果表明:此表是对两个判别函数的显著性检验,由特征值检验,认为两个判别函数在0.05的显著性水平上显著的。
(3)标准化函数系数
  標準化典型區別函數係數
 
函數
1
2
V1
.971
-2.384
V2
-.002
-.323
V3
-.439
2.310
V6
.463
.594  
Y1=0.971V1—0.002V2—0.4391V3+0.463V6
Y2=—2.384V1—0.323V2—2.310V3V4+0.594V6
(4)类中心坐标
  群組重心的函數
group
函數
1
2
1
-.624
.190
2
-.007
-.358
3
2.359
.185
以群組平均值求值的非標準化典型區別函數 此结果表明:是判别函数在各组的重心。根据结果,判别函数在Y=1这一组的重心为(—0.654,—0.190),在Y=2这一组的重心为(—0.07,0.358,在Y=3这一组的重心为(2.359,0.185)
(5)投影分界图
 
 
 
 
 
                                               
地域圖
標準區別
函數 2
      
-8.0      -6.0     
-4.0     
-2.0       
.0       2.0      
4.0       6.0      
8.0
         
+---------+---------+---------+---------+---------+---------+---------+---------+
    
8.0
+                                              
13                               
+
        
I                                              
13                               
I
        
I                                              
13                                I
        
I                                              
13                               
I
        
I                                              
13                               
I
        
I                                    
          13                               
I
    
6.0 +         
+        
+        
+         +     
13 +        
+        
+          +
        
I                                              
13                               
I
        
I             
                                 13                               
I
        
I                                              
13                               
I
        
I                                              
13                               
I
        
I                                              
13                               
I
    
4.0 +         
+        
+        
+         +     
13 +        
+        
+          +
        
I                                              
13                                I
        
I                                              
13                               
I
        
I                                              
13                               
I
        
I                                              
13                               
I
        
I                                              
13                               
I
    
2.0 +         
+        
+        
+         +     
13 +         +        
+          +
        
I                                              
13                               
I
        
I                                              
13                               
I
        
I                                    
          13                               
I
        
I                                            
1123                               
I
        
I                                    
*      12223  
*                           
I
     
.0 +          +         +        
+         + 112  
23+        
+        
+          +
        
I                                       
*122   
23                              
I
        
I                                      
112     
23                              
I
        
I                                     
122       
23                             
I
        
I                                   
112         
23                             
I
        
I                                  
122          
23                              I
   
-2.0 +         
+        
+         +  112   
+        
23       
+        
+          +
        
I                               
122              
23                            
I
        
I                             
112                  23                           
I
        
I                            
122                  
23                           
I
        
I                           
12                    
23                           
I
        
I              
           112                      
23                          
I
   
-4.0 +         
+         +    122 
+        
+         +
23     
+        
+          +
        
I                      
112                          
23                         
I
         I                     
122                           
23                         
I
        
I                   
112                             
23                         
I
        
I                  
122                               
23                         I
        
I                
112                                 
23                        
I
   
-6.0 +         
+     122 +        
+        
+         +  
23    +        
+          +
        
I             
112                     
                23                       
I
        
I            
122                                      
23                       
I
        
I          
112                                         
23                      
I
        
I         
122                                          
23                      
I
        
I       
112                                            
23                      
I
   
-8.0 +      
122                                              
23                     
+
         
+---------+---------+---------+---------+---------+---------+---------+---------+
      
-8.0      -6.0     
-4.0     
-2.0       
.0       2.0      
4.0       6.0      
8.0
                                           
標準區別函數 1
 
 
 
地域圖中使用的符號
 
符號  群組  標籤
---- 
----  ----------------
 
 
1      1
 
2      2
 
3      3
 
*         指出群組質心
 
 
 
上图为各类样品投影后的分界图,其中1代表“废水中重金属含量较低”,2代表“废水中重金属含量中等”,3代表“废水中重金属含量较高”。“+”代表各类投影中心,“32”分界线表明是第2类和第3类的投影后的界限,其余两条线意义相似。
 
  逐觀察值統計資料
 
個案編號
實際群組
最高群組
第二高群組
區別評分
 
預測的群組
P(D>d | G=g)
P(G=g | D=d)
重心的馬氏 (Mahalanobis) 距離平方
群組
P(G=g | D=d)
重心的馬氏 (Mahalanobis) 距離平方
函數 1
函數 2
 
p
df
原始
1
1
1
.996
2
.690
.009
2
.309
.805
-.718
.189
2
1
1
.986
2
.666
.027
2
.332
.609
-.682
.035
3
1
1
.997
2
.684
.007
2
.314
.754
-.702
.162
4
1
1
.995
2
.688
.010
2
.310
.791
-.722
.171
5
1
1
1.000
2
.680
.001
2
.318
.709
-.651
.184
6
1
1
.224
2
.870
2.995
2
.129
6.006
-1.015
1.875
7
1
1
.999
2
.678
.001
2
.320
.693
-.651
.170
8
1
1
.992
2
.667
.017
2
.331
.606
-.661
.065
9
1
1
.986
2
.659
.027
2
.339
.544
-.638
.025
10
2
1**
.994
2
.678
.013
2
.321
.699
-.702
.107
11
1
1
.996
2
.676
.008
2
.322
.677
-.680
.116
12
1
1
.973
2
.688
.055
2
.309
.843
-.523
.401
13
1
2**
.890
2
.532
.233
1
.461
1.331
-.091
-.834
14
2
1**
.850
2
.568
.325
2
.427
.085
-.285
-.268
15
2
1**
.977
2
.652
.046
2
.346
.499
-.630
-.025
16
1
1
.930
2
.713
.145
2
.284
1.176
-.572
.567
17
1
1
.711
2
.542
.683
2
.455
.221
-.406
-.607
18
1
1
.991
2
.696
.019
2
.302
.878
-.650
.323
19
2
2
.553
2
.666
1.186
1
.302
3.582
.554
-1.292
20
2
1**
.137
2
.871
3.975
2
.128
7.005
-.762
2.179
21
2
1**
.771
2
.537
.519
2
.451
.056
.024
-.124
22
2
2
.029
2
.792
7.086
1
.106
11.917
1.295
-2.680
23
2
1**
.682
2
.500
.766
2
.487
.007
.072
-.341
24
3
2**
.201
2
.701
3.204
1
.172
6.823
1.204
-1.676
25
3
2**
.521
2
.565
1.302
1
.276
3.542
1.124
-.507
26
2
1**
.678
2
.519
.776
2
.459
.210
.242
.026
27
2
2
.716
2
.605
.668
1
.384
2.388
.118
-1.166
28
3
1**
.236
2
.563
2.891
2
.343
3.072
.714
1.239
29
3
3
.000
2
1.000
18.541
2
.000
45.171
6.395
1.686
交叉驗證b
1
1
1
.996
4
.684
.185
2
.314
.928
 
2
1
1
.998
4
.662
.137
2
.336
.679
 
3
1
1
.994
4
.678
.237
2
.320
.925
 
4
1
1
.998
4
.683
.127
2
.315
.862
 
5
1
1
.991
4
.673
.282
2
.325
.926
 
6
1
1
.115
4
.847
7.427
2
.152
10.054
 
7
1
1
.923
4
.662
.909
2
.335
1.457
 
8
1
1
.998
4
.662
.134
2
.336
.683
 
9
1
1
.995
4
.653
.197
2
.344
.668
 
10
2
1**
.999
4
.697
.094
2
.301
.962
 
11
1
1
.993
4
.669
.247
2
.329
.858
 
12
1
1
.834
4
.664
1.459
2
.332
2.035
 
13
1
2**
.959
4
.570
.633
1
.421
2.051
 
14
2
1**
.882
4
.598
1.176
2
.396
1.188
 
15
2
1**
.974
4
.678
.491
2
.320
1.183
 
16
1
1
.994
4
.706
.231
2
.291
1.196
 
17
1
1
.937
4
.528
.814
2
.468
.245
 
18
1
1
.999
4
.691
.084
2
.306
.900
 
19
2
1**
.004
4
.483
15.377
2
.392
14.985
 
20
2
1**
.087
4
.986
8.141
2
.014
15.894
 
21
2
1**
.169
4
.703
6.440
2
.280
7.469
 
22
2
3**
.000
4
.960
26.586
2
.032
35.241
 
23
2
1**
.063
4
.712
8.910
2
.267
10.065
 
24
3
2**
.075
4
.812
8.505
1
.188
12.245
 
25
3
2**
.003
4
.588
16.275
1
.412
17.794
 
26
2
1**
.550
4
.590
3.047
2
.382
3.105
 
27
2
2
.521
4
.537
3.224
1
.449
4.394
 
28
3
1**
.280
4
.671
5.068
2
.328
5.692
 
29
3
3
.000
4
1.000
738.496
2
.000
1,005.424
 
若為原始資料,則馬氏 (Mahalanobis) 距離的平方會基於典型函數。
若為交叉驗證資料,則馬氏 (Mahalanobis) 距離的平方會依據觀察。
**. 錯誤分類的觀察值
b. 僅會針對分析中的那些觀察值進行交叉驗證。在交叉驗證中,每一個觀察值都會依據從該觀察值之外的所有觀察值衍生的函數進行分類。  
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
  分類結果a,c
 
group
預測的群組成員資格
總計
 
1
2
3
原始
計數
1
14
1
0
15
2
7
3
0
10
3
1
2
1
4
%
1
93.3
6.7
.0
100.0
2
70.0
30.0
.0
100.0
3
25.0
50.0
25.0
100.0
交叉驗證b
計數
1
14
1
0
15
2
8
1
1
10
3
1
2
1
4
%
1
93.3
6.7
.0
100.0
2
80.0
10.0
10.0
100.0
3
25.0
50.0
25.0
100.0
a. 62.1% 個原始分組觀察值已正確地分類。
b. 僅會針對分析中的那些觀察值進行交叉驗證。在交叉驗證中,每一個觀察值都會依據從該觀察值之外的所有觀察值衍生的函數進行分類。
c. 55.2% 個交叉驗證已分組觀察值已正確地分類。  
 
 

判别分析篇(2):聚类分析、判别分析、主成分分析、因子分析


聚类分析、判别分析、主成分分析、因子分析
主成分分析与因子分析的区别
 
1. 目的不同: 因子分析把诸多变量看成由对每一个变量都有作用的一些公共因子和仅对某一个变量有作用的特殊因子线性组合而成,因此就是要从数据中控查出对变量起解释作用的公共因子和特殊因子以及其组合系数;主成分分析只是从空间生成的角度寻找能解释诸多变量变异的绝大部分的几组彼此不相关的新变量(主成分)。
2. 线性表示方向不同: 因子分析是把变量表示成各公因子的线性组合;而主成分分析中则是把主成分表示成各变量的线性组合。
3. 假设条件不同:主成分分析中不需要有假设;因子分析的假设包括:各个公共因子之间不相关,特殊因子之间不相关,公共因子和特殊因子之间不相关。
4. 提取主因子的方法不同:因子分析抽取主因子不仅有主成分法,还有极大似然法,主轴因子法,基于这些方法得到的结果也不同;主成分只能用主成分法抽取。
5. 主成分与因子的变化:当给定的协方差矩阵或者相关矩阵的特征值唯一时,主成分一般是固定的;而因子分析中因子不是固定的,可以旋转得到不同的因子。
6. 因子数量与主成分的数量:在因子分析中,因子个数需要分析者指定(SPSS根据一定的条件自动设定,只要是特征值大于1的因子主可进入分析),指定的因子数量不同而结果也不同;在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分(只是主成分所解释的信息量不等)。
7. 功能:和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势;而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这种情况也可以使用因子得分做到,所以这种区分不是绝对的。 1 、聚类分析
基本原理:将个体(样品)或者对象(变量)按相似程度(距离远近)划分类别,使得同一类中的元素之间的相似性比其他类的元素的相似性更强。目的在于使类间元素的同质性最大化和类与类间元素的异质性最大化。
常用聚类方法:系统聚类法,K-均值法,模糊聚类法,有序样品的聚类,分解法,加入法。
注意事项:1. 系统聚类法可对变量或者记录进行分类,K-均值法只能对记录进行分类;
          2. K-均值法要求分析人员事先知道样品分为多少类;
           3. 对变量的多元正态性,方差齐性等要求较高。
应用领域:细分市场,消费行为划分,设计抽样方案等
2、判别分析
基本原理:从已知的各种分类情况中总结规律(训练出判别函数),当新样品进入时,判断其与判别函数之间的相似程度(概率最大,距离最近,离差最小等判别准则)。
常用判别方法:最大似然法,距离判别法,Fisher判别法,Bayes判别法,逐步判别法等。
注意事项:1. 判别分析的基本条件:分组类型在两组以上,解释变量必须是可测的;
           2. 每个解释变量不能是其它解释变量的线性组合(比如出现多重共线性情况时,判别权重会出现问题);
           3. 各解释变量之间服从多元正态分布(不符合时,可使用Logistic回归替代),且各组解释变量的协方差矩阵相等(各组协方方差矩阵有显著差异时,判别函数不相同)。
相对而言,即使判别函数违反上述适用条件,也很稳健,对结果影响不大。
应用领域:对客户进行信用预测,寻找潜在客户(是否为消费者,公司是否成功,学生是否被录用等等),临床上用于鉴别诊断。
3、 主成分分析/ 因子分析
主成分分析基本原理:利用降维(线性变换)的思想,在损失很少信息的前提下把多个指标转化为几个综合指标(主成分),即每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,使得主成分比原始变量具有某些更优越的性能(主成分必须保留原始变量90%以上的信息),从而达到简化系统结构,抓住问题实质的目的。
因子分析基本原理:利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子。(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)
求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知)。
        (实际研究中,总体协方差阵与相关阵是未知的,必须通过样本数据来估计)
求解因子载荷的方法:主成分法,主轴因子法,极大似然法,最小二乘法,a因子提取法。
注意事项:1. 由协方差阵出发与由相关阵出发求解主成分所得结果不一致时,要恰当的选取某一种方法;
          2. 对于度量单位或是取值范围在同量级的数据,可直接求协方差阵;对于度量单位不同的指标或是取值范围彼此差异非常大的指标,应考虑将数据标准化,再由协方差阵求主成分;
          3.主成分分析不要求数据来源于正态分布;
          4. 在选取初始变量进入分析时应该特别注意原始变量是否存在多重共线性的问题(最小特征根接近于零,说明存在多重共线性问题)。
             5. 因子分析中各个公共因子之间不相关,特殊因子之间不相关,公共因子和特殊因子之间不相关。
应用领域:解决共线性问题,评价问卷的结构效度,寻找变量间潜在的结构,内在结构证实。
4、对应分析/最优尺度分析
基本原理:利用降维的思想以达到简化数据结构的目的,同时对数据表中的行与列进行处理,寻求以低维图形表示数据表中行与列之间的关系。
对应分析:用于展示变量(两个/多个分类)间的关系(变量的分类数较多时较佳);
最优尺度分析:可同时分析多个变量间的关系,变量的类型可以是无序多分类,有序多分类或连续性变量,并 对多选题的分析提供了支持。
5、典型相关分析
基本原理:借用主成分分析降维的思想,分别对两组变量提取主成分,且使从两组变量提取的主成分之间的相关程度达到最大,而从同一组内部提取的各主成分之间互不相关。

判别分析篇(3):spss进行判别分析步骤

1.Discriminant
Analysis判别分析主对话框  
 如图 1-1 所示
 
图 1-1    Discriminant
Analysis 主对话框  
(1)选择分类变量及其范围
在主对话框中左面的矩形框中选择表明已知的观测量所属类别的变量(一定是离散变量), 
按上面的一个向右的箭头按钮,使该变量名移到右面的Grouping Variable 框中。
此时矩形框下面的Define Range
按钮加亮,按该按钮屏幕显示一个小对话框如图1-2 所示,供指定该分类变量的数值范围。
 
图 1-2   Define Range 对话框
在Minimum 框中输入该分类变量的最小值在Maximum 框中输入该分类变量的最大值。按Continue
按钮返回主对话框。
(2)指定判别分析的自变量
图 1-3    展开 Selection
Variable 对话框的主对话框
  在主对话框的左面的变量表中选择表明观测量特征的变量,按下面一个箭头按钮。
把选中的变量移到Independents 矩形框中,作为参与判别分析的变量。
(3) 选择观测量
 
图 1-4    Set Value
子对话框
  如果希望使用一部分观测量进行判别函数的推导而且有一个变量的某个值可以作为这些观测量的标识,
则用Select 功能进行选择,操作方法是单击Select 按钮展开Selection Variable。选择框如图1-3
所示。
并从变量列表框中选择变量移入该框中再单击Selection Variable 选择框右侧的Value按钮,
展开Set Value(子对话框)对话框,如图1-4 所示,键入标识参与分析的观测量所具有的该变量值,
一般均使用数据文件中的所有合法观测量此步骤可以省略。
(4) 选择分析方法
 
在主对话框中自变量矩形框下面有两个选择项,被选中的方法前面的圆圈中加有黑点。这两个选择项是用于选择判别分析方法的
l      Enter
independent together
选项,当认为所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。选择该项将不加选择地使用所有自变量进行判别分析,建立全模型,不需要进一步进行选择。
l      Use
stepwise method
选项,当不认为所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。因此需要判别贡献的大小,再进行选择当鼠标单击该项时Method
按钮加亮,可以进一步选择判别分析方法。
2.Method对话框 如图
1-5 所示: 
 
图 1-5    Stepwise Method
对话框
单击“Method”按钮展开Stepwise Method对话框。
(1)Method 栏选择进行逐步判别分析的方法
可供选择的判别分析方法有:
l   Wilks"lambda 选项,每步都是Wilk 的概计量最小的进入判别函数
l   Unexplained variance
选项,每步都是使各类不可解释的方差和最小的变量进入判别函数。
l   Mahalanobis’distance
选项,每步都使靠得最近的两类间的Mahalanobis 距离最大的变量进入判别函数
l   Smallest F ratio 选项,每步都使任何两类间的最小的F
值最大的变量进入判刑函数
l   Rao’s V 选项,每步都会使Rao V
统计量产生最大增量的变量进入判别函数。可以对一个要加入到模型中的变量的V
值指定一个最小增量。选择此种方法后,应该在该项下面的V-to-enter
后的矩形框中输入这个增量的指定值。当某变量导致的V值增量大于指定值的变量后进入判别函数。
(2) Criteria 栏选择逐步判别停止的判据
可供选择的判据有:
l    Use F value
选项,使用F值,是系统默认的判据当加人一个变量(或剔除一个变量)后,对在判别函数中的变量进行方差分析。当计算的F值大于指定的Entry
值时,该变量保留在函数中。默认值是Entry为3.84:当该变量使计算的F值小于指定的Removal
值时,该变量从函数中剔除。默认值是Removal为2.71。即当被加入的变量F 值为3.84
时才把该变量加入到模型中,否则变量不能进入模型;或者,当要从模型中移出的变量F值<2.71时,该变量才被移出模型,否则模型中的变量不会被移出.设置这两个值时应该注意Entry值〉Removal
值。
l    Use Probability of
F选项,用F检验的概率决定变量是否加入函数或被剔除而不是用F值。加入变量的F值概率的默认值是0.05(5%);移出变量的F
值概率是0.10(10%)。Removal值(移出变量的F值概率) >Entry值(加入变量的F值概率)。
(3) Display栏显示选择的内容
对于逐步选择变量的过程和最后结果的显示可以通过Display 栏中的两项进行选择:
l    Summary of steps
复选项,要求在逐步选择变量过程中的每一步之后显示每个变量的统计量。
l    F for Pairwise distances
复选项,要求显示两两类之间的两两F 值矩阵。
3.Statistics对话框 指定输出的统计量如图1-6
所示:
 
 
图 1-6    Statistics 对话框
可以选择的输出统计量分为以下3 类:
(l) 描述统计量
在 Descriptives 栏中选择对原始数据的描述统计量的输出:
l  Means 复选项,可以输出各类中各自变量的均值MEAN、标准差std Dev
和各自变量总样本的均值和标准差。
l  Univariate ANOV
复选项,对各类中同一自变量均值都相等的假设进行检验,输出单变量的方差分析结果。
l  Box’s M
复选项,对各类的协方差矩阵相等的假设进行检验。如果样本足够大,表明差异不显著的p 值表明矩阵差异不明显。
(2) Function coefficients 栏:选择判别函数系数的输出形式
l  Fisherh’s
复选项,可以直接用于对新样本进行判别分类的费雪系数。对每一类给出一组系数。并给出该组中判别分数最大的观测量。
l  Unstandardized 复选项,未经标准化处理的判别系数。
(3) Matrices 栏:选择自变量的系数矩阵
l  Within-groups correlation
matrix复选项,即类内相关矩阵,
它是根据在计算相关矩阵之前将各组(类)协方差矩阵平均后计算类内相关矩阵。
l   Within-groups covariance
matrix复选项,即计算并显示合并类内协方差矩阵,
是将各组(类)协方差矩阵平均后计算的。区别于总协方差阵。
l   Separate-groups covariance
matrices复选项,对每类输出显示一个协方差矩阵。
l   Total covariance
matrix复选项,计算并显示总样本的协方差矩阵。
4.Classification
对话框指定分类参数和判别结果 如图1-7 所示
图 1-7    Classification 对话框
5.Save对话框,指定生成并保存在数据文件中的新变量。如图1-8
所示:
 
图 1-8    Save 对话框
6.选择好各选择项之后,点击“OK”按钮,提交运行Discriminant过程。

本文来源:https://www.shanpow.com/news/465710/

《判别分析.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式

相关阅读
  • 《中国九年义务教育歌》 《中国九年义务教育歌》
  • 员工作业效率算法说明 员工作业效率算法说明
  • 补入党介绍人证明 补入党介绍人证明
  • 严字当头确保全面从严治党主体责任落地落实 严字当头确保全面从严治党主体责任落地落实
  • 被巡察单位党组工作汇报材料 被巡察单位党组工作汇报材料
  • 疫情防控党课讲稿大全 疫情防控党课讲稿大全
  • 疫情防控事迹材料 疫情防控先进个人事迹材料 疫情防控事迹材料 疫情防控先进个人事迹材料
  • 大学生读书笔记1000字 大学生读书笔记1000字
为您推荐