分析流程
数据源:
女生日食谱营养成分.xlsx
算法配置:
算法:主成分分析(PCA)
分析结果:
暂无数据
分析步骤
1.首先进行KMO和Bartlett的检验,判断是否可以进行主成分分析。对于KMO值:0.8上非常合适做主成分分析,0.7-0.8之间一般适合,0.6-0.7之间不太适合,0.5-0.6之间表示差,0.5下表示极不适合,对于Bartlett的检验,若P小于0.05,拒绝原假设,则说明可以做主成分分析,若不拒绝原假设,则说明这些变量可能独立提供一些信息,不适合做主成分分析。
2.通过分析方差解释表格和碎石图,确定主成分的数量方差解释表格主要是看主成分对于变量解释的贡献率(可以理解为究竟需要多少主成分才能把变量表达为100%),如果太低(如低于60%)则需要调整主成分数据。碎石图的作用是根据特征值下降的坡度来确认需要选择的主成分个数,这两者结合可用于确认或调整主成分个数。
3.通过分析主成分载荷系数与热力图,可以分析到每个主成分中隐变量的重要性,如研究【多金属矿体】中25种有用元素的分布规律,其中各元素视为指标,假设前文确定得到5个主成分,主成分1中,SO、SO2、Na2S、HS、H2S主成分载荷系数较大,因此可将主成分1确定为硫化物成分,以此类推,也可结合具体业务进行各主成分的隐变量分析。
4.基于主成分载荷图通过将多主成分降维成双主成分或者三主成分,通过象限图的方式呈现主成分的空间分布。如果提取2个主成分时,无法呈现三维载荷主成分散点图,如果提取1个主成分时,无法显示主成分象限图。
5.通过分析成分矩阵,得出主成分成分公式与权重。
6.输出主成分分析法综合得分。
详细结论
输出结果1:KMO检验和Bartlett的检验
KMO检验和Bartlett的检验
KMO值
0.000
Bartlett球形度检验
近似卡方
4201.534
df
276
P
0.000***
注:***、**、*分别代表1%、5%、10%的显著性水平
图表说明:
上表展示了KMO检验和Bartlett球形检验的结果,用来分析是否可以进行主成分分析。
●若通过KMO检验(KMO0.6),说明了题项变量之间是存在相关性的,符合主成分分析要求。
●若通过Bartlett检验:P0.05,呈显著性,则可以进行主成分分析。
智能分析
KMO检验的结果显示,KMO的值为nan,同时,Bartlett球形检验的结果显示,显著性P值为0.000***,水平上呈现显著性,拒绝原假设,各变量间具有相关性,主成分分析有效,程度为极不适合。
输出结果2:方差解释表格
总方差解释
成分
特征根
特征根
方差解释率(%)
累积方差解释率(%)
1
11.404
47.516
47.516
2
3.686
15.358
62.874
3
3.018
12.575
75.449
4
1.379
5.744
81.193
5
1.229
5.12
86.313
6
1.127
4.696
91.009
7
0.732
3.051
94.06
8
0.416
1.735
95.795
9
0.349
1.455
97.25
10
0.326
1.359
98.609
11
0.175
0.728
99.337
12
0.14
0.582
99.919
13
0.019
0.077
99.996
14
0.001
0.004
100
15
100
16
100
17
100
18
100
19
100
20
100
21
100
22
100
23
100
24
100
图表说明:
上表为总方差解释表格,主要是看主成分对于变量解释的贡献率(可以理解为究竟需要多少主成分才能把变量表达为100%),一般都要表达到90%以上才可以,否则就要调整因子数据。
●一般情况下,方差解释率越高,说明该主成分越重要,权重占比也应该越高。
智能分析
方差解释表中,在主成分7时,总方差解释的特征根低于1.0,变量解释的贡献率达到94.06,以上仅为参考,若特征根小于1.0临界值过大,也可以集合具体情况具体分析。
输出结果3:碎石图
图表说明:
●碎石图是根据各主成分对数据变异的解释程度绘制的图。其作用是根据特征值下降的坡度来确认需要选择的主成分个数,结合方差解释表可用于确认或调整主成分个数。
●每一个主成分为一个点,通过“坡度趋于平缓”的未知判断提取主成分的数量。
输出结果4:因子载荷系数表
因子载荷系数表
因子载荷系数
共同度(公因子方差)
主成分1
可食部(克)
0.193
0.037
能量(kcal/g)
0.585
0.342
水(g/100g)
-0.115
0.013
蛋白质(g/100g)
0.971
0.942
脂肪(