因子分析

2024-05-11

1. 因子分析

  数据简化 
    因子分析的用途 
    数学模型 
                                                                                                                                                                                                            用矩阵的方式表达 
                                            因子分析模型的性质 
    因子载荷矩阵中的统计特征 
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            旋转因子的目的 
                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                    回归方法 
                                                                                                                                                                                                            主成分分析与因子分析    主成分分析与因子分析有所不同,主成分分析仅仅是变量变换。
   主成分和公共因子的位置不同。因子分析也有因子载荷( factor loading)的概念,代表了因子和原先变量的相关系数。但是在因子分析公式中的因子载荷位置和主成分分析不同。   在数学模型上,因子分析和主成分分析也有不少区别。而且因子分析的计算也复杂得多。根据因子分析模型的特点,它还多一道程序:因子旋转( factor rotation);这个步骤可以使结果更好。   旋转后的公共因子一般没有主成分那么综合,公共因子往往可以找到实际意义,而主成分常找不到实际的含义。   可以看出,因子分析和主成分分析都依赖于原始变量,也只能反映原始变量的信息。所以原始变量的选择很重要。在得到分析的结果时,并不一定会都得到如我们例子那样清楚的结果。这与问题的性质,选取的原始变量以及数据的质量等都有关系。如果原始变量本质上独立,就很难把很多独立变量用少数综合的变量概括,降维就可能失败。数据越相关,降维效果就越好。可用如下方法进行变量间的相关性检验:

因子分析

2. 因子分析

探究某地区影响消费者消费水平的因子。
  
 共回收有效问卷1147份,数据量较为庞大。
  
 执行analyze/dimension reduction/factor;
  
 并选择KMO与巴特利球形检验;碎石图及相关的描述性统计,得到下列各图的结果。
                                          
 结果表明,KMO=0.61>0.6,显著性P=0.000<0.05,因此,因子模型的适应性良好,可用来做因子分析;
                                          
 实际上这里对整体数据的特征提取不是非常好,公因子方差系数一般低于0.8,证明信息量损失还是比较大的。不过大于0.7的数据还是可以用的。
                                          
 可以看到,总共分为7类,如果保证尽可能的信息损失,至少三个主成分因子的方差累积和应该为85%,就比较良好,目前看来只有62.12%,不过作为案例分析,是可以的。
  
 再来看一下上述提取过程的碎石图:
                                          
 接下来是关于成分提取的分析,主要提取了三个主成分,这里我们主要看转置后的主成分分析,如下图:
                                          
 上图说明:我们可以将家庭收入、学历归为一类;婚姻状况和年龄归为一类;城市和性别分为一类。其中职业未显示相应的数值,是因为其因子成分值小于0.5,这时候最好的处理方式是将其单独归为一类主成分因子。
  
 接下来,我们可以再看一下新得到的数据
                                          
 序号为1的这个被调研对象的家庭收入、学历一般,但是婚姻状况和年龄还可以,所在的城市和人口性别比例也挺不错。
  
 以上就是因子分析的内容,若是看到的朋友觉得有什么疑问或者不正确的地方,欢迎批评指正,这是在熊一炎老师的帮助下进行的简单的分析。

3. 因子分析

在分析处理多变量问题时,变量间往往相关极为密切,使得观测数据所反映的信息有重叠。为了从多个变量中选择与铝土矿成矿密切相关的指标,本书对铝土矿各相关成矿要素进行因子分析,以达到简化变量的目的。
(1)A组数据
表11.3中前3个主成分的累计方差贡献率为81.940%,虽然没有达到85%,但第四个主成分的特征根小于1。因此,按照主成分的选择要求,选择3个主成分比较合适。
表11.3 主成分的方差贡献率和累计方差贡献率


表11.4 旋转后的因子载荷矩阵


从因子载荷矩阵(表11.4)和因子载荷图(图11.1)看,第一个主成分主要解释了矿层均厚、w(Al2O3)、w(SiO2)和铝硅比值等4个变量,这个主成分反映了对铝土矿有利的沉积-成矿环境,即沉积盆地持续稳定的沉积-成矿环境,使矿层不断加厚,Al2O3不断富集,SiO2不断贫化,A/S不断增加;第二个主成分主要解释了w(Fe2O3)和w(TiO2)这2个变量,可能反映了铝土矿成矿物质来源和表生作用对铝土矿成矿的影响;而第三个主成分只解释了矿系厚度一个变量,这个可能主要与含矿岩系沉积在灰岩风化面之上有关,反映了地形起伏对铝土矿成矿作用的影响。

图11.1 正交旋转因子载荷图

(2)B组数据
表11.5中前3个主成分的累计方差贡献率为77.450%,虽然没有达到85%,但第四个主成分的特征根小于1。因此,按照主成分的选择要求,选择3个主成分比较合适。
从因子载荷矩阵(表11.6)和因子载荷图(图11.2)看,第一个主成分主要解释了w(SiO2)和铝硅比值两个变量,含有部分矿层均厚和w(Al2O3),这个主成分反映了对铝土矿有利的沉积-成矿环境,随着SiO2不断贫化,铝硅比值不断增加,矿层均厚和w(Al2O3)则说明沉积盆地持续稳定的沉积-成矿环境,使矿层不断加厚,Al2O3不断富集;第二个主成分主要解释了w(Al2O3)、w(Fe2O3)和w(TiO2)这3个变量,可能反映了铝土矿成矿物质来源和表生作用对铝土矿成矿的影响,同时说明Al的富集伴随着Fe的流失;而第三个主成分解释了矿层均厚和w(TS)两个变量,含有部分w(Al2O3)、w(Fe2O3)和w(TiO2),这个可能主要反映了表生作用对各组分的普遍影响。
表11.5 主成分的方差贡献率和累计方差贡献率


表11.6 旋转后的因子载荷矩阵



图11.2 正交旋转因子载荷图

从因子分析的结果看,可以选择w(Al2O3)、铝硅比值和矿层厚度这三个连续变量进行定位预测。

因子分析

最新文章
热门文章
推荐阅读