当前位置:文档之家› 主成分分析实验报告

主成分分析实验报告

主成分分析实验报告
主成分分析实验报告

项目名称实验4―主成分分析

所属课程名称多元统计分析(英)项目类型综合性实验

实验(实训)日期2012年 4 月15 日

实验报告4

主成分分析(综合性实验)

(Principal component analysis)

实验原理:主成分分析利用指标之间的相关性,将多个指标转化为少数几个综合指标,从而达到降维和数据结构简化的目的。这些综合指标反映了原始指标的绝

大部分信息,通常表示为原始指标的某种线性组合,且综合指标间不相关。利用矩阵代数的知识可求解主成分。

实验题目:下表中给出了不同国家及地区的男子径赛记录:(t8a6)

Country 100m

(s) 200m

(s)

400m

(s)

800m

(min)

1500m

(min)

5000m

(min)

10,000m

(min)

Marathon

(mins)

Argentina 10.39 20.81 46.84 1.81 3.7 14.04 29.36 137.72 Australia 10.31 20.06 44.84 1.74 3.57 13.28 27.66 128.3 Austria 10.44 20.81 46.82 1.79 3.6 13.26 27.72 135.9 Belgium 10.34 20.68 45.04 1.73 3.6 13.22 27.45 129.95 Bermuda 10.28 20.58 45.91 1.8 3.75 14.68 30.55 146.62 Brazil 10.22 20.43 45.21 1.73 3.66 13.62 28.62 133.13 Burma 10.64 21.52 48.3 1.8 3.85 14.45 30.28 139.95 Canada 10.17 20.22 45.68 1.76 3.63 13.55 28.09 130.15 Chile 10.34 20.8 46.2 1.79 3.71 13.61 29.3 134.03 China 10.51 21.04 47.3 1.81 3.73 13.9 29.13 133.53 Columbia 10.43 21.05 46.1 1.82 3.74 13.49 27.88 131.35 Cook Islands 12.18 23.2 52.94 2.02 4.24 16.7 35.38 164.7 Costa Rica 10.94 21.9 48.66 1.87 3.84 14.03 28.81 136.58 Czechoslovakia 10.35 20.65 45.64 1.76 3.58 13.42 28.19 134.32 Denmark 10.56 20.52 45.89 1.78 3.61 13.5 28.11 130.78 Dominican Republic 10.14 20.65 46.8 1.82 3.82 14.91 31.45 154.12 Finland 10.43 20.69 45.49 1.74 3.61 13.27 27.52 130.87 France 10.11 20.38 45.28 1.73 3.57 13.34 27.97 132.3 German (D.R.) 10.12 20.33 44.87 1.73 3.56 13.17 27.42 129.92 German (F.R.) 10.16 20.37 44.5 1.73 3.53 13.21 27.61 132.23 Great Brit.& N. Ireland 10.11 20.21 44.93 1.7 3.51 13.01 27.51 129.13

Guatemala 10.98 21.82 48.4 1.89 3.8 14.16 30.11 139.33 Hungary 10.26 20.62 46.02 1.77 3.62 13.49 28.44 132.58 India 10.6 21.42 45.73 1.76 3.73 13.77 28.81 131.98 Indonesia 10.59 21.49 47.8 1.84 3.92 14.73 30.79 148.83 Ireland 10.61 20.96 46.3 1.79 3.56 13.32 27.81 132.35 Israel 10.71 21 47.8 1.77 3.72 13.66 28.93 137.55 Italy 10.01 19.72 45.26 1.73 3.6 13.23 27.52 131.08 Japan 10.34 20.81 45.86 1.79 3.64 13.41 27.72 128.63 Kenya 10.46 20.66 44.92 1.73 3.55 13.1 27.38 129.75 Korea 10.34 20.89 46.9 1.79 3.77 13.96 29.23 136.25 D.P.R Korea 10.91 21.94 47.3 1.85 3.77 14.13 29.67 130.87 Luxembourg 10.35 20.77 47.4 1.82 3.67 13.64 29.08 141.27 Malaysia 10.4 20.92 46.3 1.82 3.8 14.64 31.01 154.1 Mauritius 11.19 22.45 47.7 1.88 3.83 15.06 31.77 152.23 Mexico 10.42 21.3 46.1 1.8 3.65 13.46 27.95 129.2 Netherlands 10.52 20.95 45.1 1.74 3.62 13.36 27.61 129.02 New Zealand 10.51 20.88 46.1 1.74 3.54 13.21 27.7 128.98 Norway 10.55 21.16 46.71 1.76 3.62 13.34 27.69 131.48 Papua New Guinea 10.96 21.78 47.9 1.9 4.01 14.72 31.36 148.22 Philippines 10.78 21.64 46.24 1.81 3.83 14.74 30.64 145.27 Poland 10.16 20.24 45.36 1.76 3.6 13.29 27.89 131.58 Portugal 10.53 21.17 46.7 1.79 3.62 13.13 27.38 128.65 Rumania 10.41 20.98 45.87 1.76 3.64 13.25 27.67 132.5 Singapore 10.38 21.28 47.4 1.88 3.89 15.11 31.32 157.77 Spain 10.42 20.77 45.98 1.76 3.55 13.31 27.73 131.57 Sweden 10.25 20.61 45.63 1.77 3.61 13.29 27.94 130.63 Switzerland 10.37 20.46 45.78 1.78 3.55 13.22 27.91 131.2 Taipei 10.59 21.29 46.8 1.79 3.77 14.07 30.07 139.27

Turkey 10.71 21.43 47.6 1.79 3.67 13.56 28.58 131.5 USA 9.93 19.75 43.86 1.73 3.53 13.2 27.43 128.22 USSR 10.07 20 44.6 1.75 3.59 13.2 27.53 130.55 Western Samoa 10.82 21.86 49 2.02 4.24 16.28 34.71 161.83 (数据来源:1984年洛杉机奥运会IAAF/AFT径赛与田赛统计手册)

实验要求:

(1)试用Princomp过程求主成分;并对结果进行解释;

(2)试用方差累积贡献率和Scree图确定主成分的个数;

(3)计算各国第一主成分的得分并排名;

(4)试对结果进行解。

实验题目分析报告:

(1)试用Princomp过程求主成分;并对结果进行解释;

如上就是主成分分析截图,利用sas处理数据后我们可以知道:有8个主成分。

(2)试用方差累积贡献率和Scree图确定主成分的个数;

从上面的主成分累计贡献率截图和碎石图我们可以分析:选取两个主成分的贡献率就已经达到0.9375.所以我们选取2个主成分个数。

(3)计算各国第一主成分的得分并排名;

得分排名国家得分得分排名国家得分得分排名国家得分1Cook Islands10.5556320Argentina0.26189639Brazil-1.55826 2Western Samo7.23121621Luxembourg0.22050940New Zealand-1.59971 3Mauritius 4.25865822Korea0.20754541Sweden-1.60323 4Papua New G3.90919323India-0.1652442Switzerland-1.63897 5Singapore 3.12211124Greece-0.3795943Finland-1.69202 6Thailand 2.76181725Chile-0.3810844Canada-1.74635 7Indonesia 2.74779926Columbia-0.3900745Poland-2.00061 8Guatemala2.67243527Mexico-0.6785346Belgium-2.04126 9Costa Rica2.29664728Austria-0.8076447Kenya-2.16832 10Philippines2.07042229Norway-0.8114948France-2.1719 11Burma 1.9718730Ireland-0.884249Australia-2.44637 12Dominican Re1.71488631Portugal-0.9163750German (F.R.)-2.55274 13Malaysia 1.70828332Denmark-1.1132451German (D.R.)-2.59009 14D.P.R Korea1.68368733Rumania-1.1964952USSR-2.62685 15Taipei0.95050234Hungary-1.2051953Italy-2.72695 16Bermuda0.73925735Japan-1.2378754Great Brit.& N-3.02423 17Israel0.43458636Czechoslovak-1.3725655USA-3.43056 18China0.4089737Spain-1.48059

19Turkey0.2660838Netherlands-1.55543

(4)试对结果进行解。

对上述的各个国家的第一主成分得分排名,排在第一的是Coook Island,排名中也

有出现第一主成分得分负数的,这主要是因为求出来的数据与对应的数据相乘的

结果。

相关程序:

(1)导入数据程序

PROC IMPORT OUT= WORK.b

DATAFILE= "f:\sas\test.xls"

DBMS=EXCEL REPLACE;

RANGE="Sheet1$";

GETNAMES=YES;

MIXED=NO;

SCANTEXT=YES;

USEDATE=YES;

SCANTIME=YES;

RUN;

(2)得到主成分并且画图分析程序:

title;

footnote;

*** Principal Components Analysis *** ;

options pageno=1;

ods output Eigenvalues = work._eigen;

proc princomp data=WORK.b out=WORK.SCORE outstat=WORK.STATS;

var A B C D E F G H;

run; quit;

goptions reset=all device=WIN;

*** Scree Plot ***;

data work._eigen; set work._eigen;

if eigenvalue > 0;

rename number=Component;

drop difference proportion cumulative;

run;

title;

footnote;

goptions ftext=SWISS ctext=BLACK htext=1 cells;

axis1 minor=none major=(number=5) label=('Eigenvalue');

pattern1 value=SOLID color=BLUE;

proc gchart data=work._eigen ;

format eigenvalue best8.;

vbar component / type=sum sumvar=eigenvalue discrete

raxis=axis1 frame

cframe=CXF7E1C2 caxis=BLACK coutline=BLACK

name='SCREE'

description='Scree plot'; run;

quit;

goptions reset=pattern ftext= ctext= htext=; goptions reset=all device=WIN ;

主成分分析实验报告

项目名称实验4―主成分分析 所属课程名称多元统计分析(英)项目类型综合性实验 实验(实训)日期2012年 4 月15 日

实验报告4 主成分分析(综合性实验) (Principal component analysis) 实验原理:主成分分析利用指标之间的相关性,将多个指标转化为少数几个综合指标,从而达到降维和数据结构简化的目的。这些综合指标反映了原始指标的绝大部分信息,通常表示为原始指标的某种线性组合,且综合指标间不相关。利用矩阵代数的知识可求解主成分。

实验题目:下表中给出了不同国家及地区的男子径赛记录:(t8a6) Country 100m (s) 200m (s) 400m (s) 800m (min) 1500m (min) 5000m (min) 10,000m (min) Marathon (mins) Argentina 10.39 20.81 46.84 1.81 3.7 14.04 29.36 137.72 Australia 10.31 20.06 44.84 1.74 3.57 13.28 27.66 128.3 Austria 10.44 20.81 46.82 1.79 3.6 13.26 27.72 135.9 Belgium 10.34 20.68 45.04 1.73 3.6 13.22 27.45 129.95 Bermuda 10.28 20.58 45.91 1.8 3.75 14.68 30.55 146.62 Brazil 10.22 20.43 45.21 1.73 3.66 13.62 28.62 133.13 Burma 10.64 21.52 48.3 1.8 3.85 14.45 30.28 139.95 Canada 10.17 20.22 45.68 1.76 3.63 13.55 28.09 130.15 Chile 10.34 20.8 46.2 1.79 3.71 13.61 29.3 134.03 China 10.51 21.04 47.3 1.81 3.73 13.9 29.13 133.53 Columbia 10.43 21.05 46.1 1.82 3.74 13.49 27.88 131.35 Cook Islands 12.18 23.2 52.94 2.02 4.24 16.7 35.38 164.7 Costa Rica 10.94 21.9 48.66 1.87 3.84 14.03 28.81 136.58 Czechoslovakia 10.35 20.65 45.64 1.76 3.58 13.42 28.19 134.32 Denmark 10.56 20.52 45.89 1.78 3.61 13.5 28.11 130.78 Dominican Republic 10.14 20.65 46.8 1.82 3.82 14.91 31.45 154.12 Finland 10.43 20.69 45.49 1.74 3.61 13.27 27.52 130.87 France 10.11 20.38 45.28 1.73 3.57 13.34 27.97 132.3 German (D.R.) 10.12 20.33 44.87 1.73 3.56 13.17 27.42 129.92 German (F.R.) 10.16 20.37 44.5 1.73 3.53 13.21 27.61 132.23 Great Brit.& N. Ireland 10.11 20.21 44.93 1.7 3.51 13.01 27.51 129.13 Greece 10.22 20.71 46.56 1.78 3.64 14.59 28.45 134.6 Guatemala 10.98 21.82 48.4 1.89 3.8 14.16 30.11 139.33 Hungary 10.26 20.62 46.02 1.77 3.62 13.49 28.44 132.58 India 10.6 21.42 45.73 1.76 3.73 13.77 28.81 131.98

SPSS进行主成分分析的步骤(图文)精编版

主成分分析的操作过程 原始数据如下(部分) 调用因子分析模块(Analyze―Dimension Reduction―Factor),将需要参与分析的各个原始变量放入变量框,如下图所示:

单击Descriptives按钮,打开Descriptives次对话框,勾选KMO and Bartlett’s test of sphericity选项(Initial solution选项为系统默认勾选的,保持默认即可),如下图所示,然后点击Continue按钮,回到主对话框: 其他的次对话框都保持不变(此时在Extract次对话框中,SPSS已经默认将提取公因子的方法设置为主成分分析法),在主对话框中点OK按钮,执行因子分析,得到的主要结果如下面几张表。 ①KMO和Bartlett球形检验结果:

KMO为0.635>0.6,说明数据适合做因子分析;Bartlett球形检验的显著性P值为 0.000<0.05,亦说明数据适合做因子分析。 ②公因子方差表,其展示了变量的共同度,Extraction下面各个共同度的值都大于0.5,说明提取的主成分对于原始变量的解释程度比较高。本表在主成分分析中用处不大,此处列出来仅供参考。 ③总方差分解表如下表。由下表可以看出,提取了特征值大于1的两个主成分,两个主成分的方差贡献率分别是55.449%和29.771%,累积方差贡献率是85.220%;两个特征值分别是3.327和1.786。 ④因子截荷矩阵如下:

根据数理统计的相关知识,主成分分析的变换矩阵亦即主成分载荷矩阵U 与因子载荷矩阵A 以及特征值λ的数学关系如下面这个公式: λi i i A U = 故可以由这二者通过计算变量来求得主成分载荷矩阵U 。 新建一个SPSS 数据文件,将因子载荷矩阵中的各个载荷值复制进去,如下图所示: 计算变量(Transform-Compute Variables )的公式分别如下二张图所示:

烟道气体成分分析方案

a) 对烟气成分进行分析,在设备上选择质谱仪作为在线分析仪表。采用 1 台质谱仪、4套采样探头、2套前处理系统、1套后处理系统及1座分析小屋。质谱仪同时对两个采样点(余热锅炉入口、电收尘出口)进行分析,两采样点双流路切换分析,每个点的分析时间小于10S。 对于烟气成分分析选用上海舜宇恒平的工业连续在线质谱仪进行测量。质谱仪可快速响应,实时监测烟道气中成分变化,以便快速反映工艺状况、指导工艺生产。烟气中湿度测量选用瑞士ROTRONI(公司的高温湿度计进行测量,自带温度计算。 由于烟气中含有大量粉尘和水,系统难点在于预处理系统的处理,本系统主要采用采样探头的一备一用设计,同时自动控制反吹以防止堵塞,同时采用美国杜邦公司的nafion 管进行脱水。 整个方案主要由采样探头、前处理、后处理、及在线分析设备构成。 在现场需要布置单独的现场小屋用于放置在线分析设备。 样品采样探头安装在工艺现场取样点位置,针对余热锅炉入口和电收尘出口工况中高温、高粉尘、高水的特殊情况,每个采样点均采用一反吹的冗余设计,由PLC控制系统实现,正常工作时,PLC空制相应的电磁阀动作,一个采样探头正常工作取样、另外一套采样探头反吹电磁阀打开,氮气对另外一个采样探头进行反吹。以防止探头堵塞。 探头采用法兰对接,采样探针伸入烟道的至位置。由于烟道内的高温高粉尘工况,为防止粉尘的冲刷在探针外部设有保护套管,同时探针入口处设有金属网的过滤器,以减少进入取样管的粉尘,防止管线堵塞。 PLC控制系统安装在分析小屋内,同时控制4个采样点之间的切换和反吹,每个位号的采样点的双采样探头切换采用定时反吹,具体的切换间隔根据现场实际调试而定。 前处理箱就近安装在工艺现场取样点位置,用于样品的降温、除尘和脱水。样品的降温通过风冷方式实现,冷却用的仪表风先进行伴热,温度维持在

实验六主成分分析报告

实验六 主成分分析 一、实验目的 通过本次实验,掌握SPSS 及ENVI 的主成分分析方法。 二、有关概念 1. 主成分分析的概念 主成分分析(又称因子分析),是将多个实测变量转换为少数几个不相关的 综合指标的多元统计分析方法。代表各类信息的综合指标就称为因子或主成份。 主成分分析的数学模型可写为: m m x a x a x a x a z 131********++++= m m x a x a x a x a z 23232221212++++= m m x a x a x a x a z 33332321313++++= ……… m nm n n n n x a x a x a x a z ++++= 332211 其中,x 1、x 2、 x 3、 x 4 …x m 为原始变量;z 1、 z 2、 z 3、 z 4 …z n 为主成份,且有m ≥n 。 写成矩阵形式为:Z=AX 。Z 为主成份向量,A 为主成份变换矩阵,X 为原始变 量向量。主成份分析的目的是把系数矩阵A 求出,主成份Z1、Z2、Z3…在总方差中所占比重依次递减。 从理论上讲m=n 即有多少原始变量就有多少主成份,但实际上前面几个主成 份集中了大部分方差,因此取主成份数目远远小于原始变量的数目,但信息损失很小。 因子分析的一个重要目的还在于对原始变量进行分门别类的综合评价。如果 因子分析结果保证了因子之间的正交性(不相关)但对因子不易命名,还可以通过对因子模型的旋转变换使公因子负荷系数向更大(向1)或更小(向0)方向变化,使得对公因子的命名和解释变得更加容易。进行正交变换可以保证变换后各因子仍正交,这是比较理想的情况。如果经过正交变换后对公因子仍然不易解释,也可进行斜交旋转。 2. 因子提取方法 SPSS 提供的因子提取方法有: ①Principal components 主成份法。该方法假设变量是因子的纯线性组合。

SPSS进行主成分分析报告地步骤(图文)

主成分分析の操作過程 原始數據如下(部分) 調用因子分析模塊(Analyze―Dimension Reduction―Factor),將需要參與分析の各個原始變量放入變量框,如下圖所示:

單擊Descriptives按鈕,打開Descriptives次對話框,勾選KMO and Bartlett’s test of sphericity選項(Initial solution選項為系統默認勾選の,保持默認即可),如下圖所示,然後點擊Continue按鈕,回到主對話框: 其他の次對話框都保持不變(此時在Extract次對話框中,SPSS已經默認將提取公因子の方法設置為主成分分析法),在主對話框中點OK按鈕,執行因子分析,得到の主要結果如下面幾張表。 ①KMO和Bartlett球形檢驗結果:

KMO為0.635>0.6,說明數據適合做因子分析;Bartlett球形檢驗の顯著性P值為0.000<0.05,亦說明數據適合做因子分析。 ②公因子方差表,其展示了變量の共同度,Extraction下面各個共同度の值都大於0.5,說明提取の主成分對於原始變量の解釋程度比較高。本表在主成分分析中用處不大,此處列出來僅供參考。 ③總方差分解表如下表。由下表可以看出,提取了特征值大於1の兩個主成分,兩個主成分の方差貢獻率分別是55.449%和29.771%,累積方差貢獻率是85.220%;兩個特征值分別是3.327和1.786。 ④因子截荷矩陣如下:

根據數理統計の相關知識,主成分分析の變換矩陣亦即主成分載荷矩陣U 與因子載荷矩陣A 以及特征值λの數學關系如下面這個公式: λ i i i A U = 故可以由這二者通過計算變量來求得主成分載荷矩陣U 。 新建一個SPSS 數據文件,將因子載荷矩陣中の各個載荷值複制進去,如下圖所示: 計算變量(Transform-Compute Variables )の公式分別如下二張圖所示:

锅炉烟气成分分析

7.2锅炉烟气成分分析 在火力发电的过程中,对锅炉烟气含氧量、二氧化碳含量、一氧化碳含量的分析测量对于指导锅炉燃烧控制有重要的意义。 为保持锅炉处于最佳燃烧状态,应使实际供给的空气量大于理论空气量,锅炉机组热损失最小的炉膛出口的最佳过剩空气系数应保持在一定范围内。 对锅炉铟气中的过剩空气系数的分析测量要考虑到烟气取样点的选择或给予必要的修正。目前,一般把烟气取样点设计在过热器出口或省煤器出口处。燃烧理论指出:在燃料一定情况下,当完全燃烧时,过剩空气系数是烟气中氧量或二氧化碳含量的函数,此时一氧化碳的含量为零。当不完全燃烧时,因烟气中含有一氧化碳,过剩空气系数与氧量或二氧化碳含量的函数要受到一氧化碳含量的影响:因此对一氧化碳含量和氧气或二氧化碳含量的监视,对于指导燃烧更为有利。实际燃烧时,很多情况是烟气中一氧化碳含量比较少.因此,对于一氧化碳分析仪要求有较高的灵敏度和精确度。在不完全燃烧时,烟气中还会有未燃尽的可燃物含量对烟气中的一氧化碳的含量、二氧化碳含量和氧量都有影响。过剩空气系数α与一氧化碳含量二氧化碳含量和氧量的函数关系就更复杂,这种情况下.通过对一氧化碳含量和氧量的监测来指导燃烧会更有实际意义。目前,对于高压大型锅炉,烟气中未燃尽可燃物的含量很小.通常多是通过对烟气中的含氧量的监测来指导燃烧控制。

7.2.2 氧化锆氧量计 氧化锆氧量计属于电化学分析器中的一种。氧化锆(2 ZrO )是一种氧离子导电的固体电解质。氧化锆氧量计可以用来连续地分析各种锅炉烟气中的氧含量,然后控制送风量来调整过剩空气系数α值,以保证最佳的空气燃料比,达到节能效果。氧化锆传感器探头可以直接插人烟道中进行测量,氧化锆测量探头工作温度必须在850℃左右的高温下运行,否则灵敏度将会下降。所以氧化锆氧量计在探头上都装有测温传感器和电加热设备。 1) 氧化锆传感器测量原理 氧化锆在常温下为单斜晶体,当温度为 1150℃时,晶体排列由单斜晶体变为立方晶 体,同时有不到十分之一的体积收缩。如果 在氧化锆中加人一定量的氧化钙(CaO )和 氧化钇(32O Y ),则其晶型变为不随温度而 变的稳定的萤石型立方晶体,这时四价的锆 被二价的钙和三价的钇置换,同时产生氧离 子空穴。当温度为800℃以上时,空穴型的 氧化锆就变成了良好的氧离子导体,从而可以构成氧浓差电池。 氧浓差电池的原理如图7.13所示。在氧化锆电解质的两侧各烧结上一层多孔的铂电极,便形成了氧浓差电池。电池左边是被测的烟气,它的氧含量一般为4%~6%,设氧分压为1p ,氧浓度为1?。电池的右边是参比气体,如空气,它的氧含量一般为20.8%,氧分压为2p ,浓度为2?。在温度T=850℃时,氧化锆氧浓差电池的工作原理可用下式表示: Pt p O CaO ZrO p O Pt ),(,)(,22212分压力分压力 负极 电解质 正极 在正极上氧分子得到电子成为氧离子,即 -?→?+22224)(O e p O 分压力 在负极上氧离子失去电子成为氧分子,即 )(421 22p O e O 分压力?→?-- 这个过程就好像2 O 从正极渗透到负极上去一样。这也好像是图7.13氧浓差电池的原理

主成分分析案例

姓名:XXX 学号:XXXXXXX 专业:XXXX 用SPSS19软件对下列数据进行主成分分析: ……

一、相关性 通过对数据进行双变量相关分析,得到相关系数矩阵,见表1。 表1 淡化浓海水自然蒸发影响因素的相关性 由表1可知: 辐照、风速、湿度、水温、气温、浓度六个因素都与蒸发速率在0.01水平上显著相关。 分析:各变量之间存在着明显的相关关系,若直接将其纳入分析可能会得到因多元共线性影响的错误结论,因此需要通过主成份分析将数据所携带的信息进行浓缩处理。 二、KMO和球形Bartlett检验 KMO和球形Bartlett检验是对主成分分析的适用性进行检验。 KMO检验可以检查各变量之间的偏相关性,取值范围是0~1。KMO的结果越接近1,表示变量之间的偏相关性越好,那么进行主成分分析的效果就会越好。实际分析时,KMO统计量大于0.7时,效果就比较理想;若当KMO统计量小于0.5时,就不适于选用主成分分析法。 Bartlett球形检验是用来判断相关矩阵是否为单位矩阵,在主成分分析中,若拒绝各变量独立的原假设,则说明可以做主成分分析,若不拒绝原假设,则说明这些变量可能独立提供一些信息,不适合做主成分分析。

由表2可知: 1、KMO=0.631<0.7,表明变量之间没有特别完美的信息的重叠度,主成分分析得到的模型又可能不是非常完善,但仍然值得实验。 2、显著性小于0.05,则应拒绝假设,即变量间具有较强的相关性。 三、公因子方差 公因子方差表示变量共同度。表示各变量中所携带的原始信息能被提取出的主成分所体现的程度。 由表3可知: 几乎所有变量共同度都达到了75%,可认为这几个提取出的主成分对各个变量的阐释能力比较强。 四、解释的总方差 解释的总方差给出了各因素的方差贡献率和累计贡献率。

主成分案例分析

主成分案例分析 主成分分析案例 ---我国各地区普通高等教育发展水平综合评价 (一)案例教学目的 主成分分析试图在力保数据信息丢失最少的原则下,对多变量的截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。本案例运用主成分分析方法综合评价我国各地区普通高等教育的发展水平。通过本案例的教学,力图使学生加深对主成分分析的统计思想和实际意义的理解,明确主成分分析方法的适用环境,掌握主成分分析软件实现操作方法,提高学生思考、分析和解决实际问题的能力。 (二)案例研究背景 近年来,我国普通高等教育得到了迅速发展,为国家培养了大批人才。但由于我国各地区经济发展水平不均衡,加之高等院校原有布局使各地区高等教育发展的起点不一致,因而各地区普通高等教育的发展水平存在一定的差异。对我国各地区普通高等教育的发展水平进行综合评价,明确各地区的差异,有利于管理和决策部门从宏观上把握各地区普通高等教育的发展现状,更好的指导和规划高教事业的健康发展。 (三)案例研究过程 1、建立综合评价指标体系 高等教育是依赖高等院校进行的,高等教育的发展状况主要体现在高等院校的相关方面。遵循选取评价指标的目的性和可比性原则,从高等教育的五个方面选取十项评价指标,具体如下:

2、数据资料 指标的原始数据取自《中国统计年鉴,1995》和《中国教育统计年鉴,1995》除以各地区相应的人口数得到十项指标值见表1。其中:x为每百万人口高等院校数;x为每十万人口高等院校毕业生数;x123为每十万人口高等院校招生数;x为每十万人口高等院校在校生数;4 x 为每十万人口高等院校教职工数;x 为每十万人口高等院校专职56 教师数;x为高级职称占专职教师的比例;x为平均每所高等院校的78 在校生数;x为国家财政预算内普通高教经费占国内生产总值的比9 重;x为生均教育经费。 10 表1-1 我国各地区普通高等教育发展状况数据地区 x x x x x x x x x x 12345678910北京1 5.96 310 461 1557 931 319 44.36 2615 2.2 13631 上海2 3.39 234 308 1035 498 161 35.02 3052 0.9 12665 天津3 2.35 157 229 713 295 109 38.4 3031 0.86 9385 陕西4 1.35 81 111 364 150 58 30.45 2699 1.22 7881 辽宁5 1.5 88 128 421 144 58 34.3 2808 0.54 7733 吉林6 1.67 86 120 370 153 58 33.53 2215 0.76 7480 黑龙江7 1.17 63 93 296 117 44 35.22 2528 0.58 8570 湖北8 1.05 67 92 297 115 43 32.89

主成分分析、因子分析实验报告--SPSS

对2009年我国88个房地产上市公司的因子分析 分析结果: 表1 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。.637 Bartlett 的球形度检验近似卡方398.287 df 45 Sig. .000 由表1可知,巴特利特球度检验统计量的观测值为398.287,相应的概率p值接近0,小于显著性水平 (取0.05),所以应拒绝原假设,认为相关系数矩阵与单位矩阵有显著差异。同时,KMO值为0.637,根据Kaiser给出的KMO度量标准(0.9以上表示非常适合;0.8表示适合;0.7表示一般;0.6表示不太适合;0.5以下表示极不适合)可知原有变量不算特别适合进行因子分析。 表2 公因子方差 初始提取市盈率 1.000 .706 净资产收益率 1.000 .609 总资产报酬率 1.000 .822 毛利率 1.000 .280 资产现金率 1.000 .731 应收应付比 1.000 .561 营业利润占比 1.000 .782 流通市值 1.000 .957 总市值 1.000 .928 成交量(手) 1.000 .858 提取方法:主成份分析。 表2为公因子方差,即因子分析的初始解,显示了所有变量的共同度数据。第一列是因子分析初始解下的变量共同度,它表明,对原有10个变量如果采用主成分分析方法提取所有特征根(10个),那么原有变量的所有方差都可被解释,变量的共同度均为1(原有变量标准化后的方差为1)。事实上,因子个数小于原有变量的个数才是因子分析的目标,所以不可提取全部特征根;第二列是在按指定提取条件(这里为特征根大于1)提取特征根时的共同度。可以看到,总资产报酬率、成交量、流

SPSS软件进行主成分分析的应用例子

SPSS软件进行主成分分析的应用例子 2002年16家上市公司4项指标的数据[5]见表2,定量综合赢利能力分析如下: 第一,将EXCEL中的原始数据导入到SPSS软件中; 【1】“分析”|“描述统计”|“描述”。 【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组中,此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。 【3】返回SPSS的“数据视图”,此时就可以看到新增了标准化后数据的字段。

数据标准化主要功能就是消除变量间的量纲关系,从而使数据具有可比性,可以举个简单的例子,一个百分制的变量与一个5分值的变量在一起怎么比较?只有通过数据标准化,都把它们标准到同一个标准时才具有可比性,一般标准化采用的是Z标准化,即均值为0,方差为1,当然也有其他标准化,比如0--1标准化等等,可根据自己的研究目的进行选择,这里介绍怎么进行数据的Z标准化。 所的结论: 标准化后的所有指标数据。 注意: SPSS 在调用Factor Analyze 过程进行分析时, SPSS 会自动对原始数据进行标准化处理, 所以在得到计算结果后的变量都是指经过标准化处理后的变量, 但SPSS 并不直接给出标准化后的数据, 如需要得到标准化数据, 则需调用Descriptives 过程进行计算。 factor过程对数据进行因子分析(指标之间的相关性判定略)。 【1】“分析”|“降维”|“因子分析”选项卡,将要进行分析的变量选入“变量”列表;

【2】设置“描述”,勾选“原始分析结果”和“KMO与Bartlett球形度检验”复选框; 【3】设置“抽取”,勾选“碎石图”复选框; 【4】设置“旋转”,勾选“最大方差法”复选框; 【5】设置“得分”,勾选“保存为变量”和“因子得分系数”复选框; 【6】查看分析结果。 所做工作: a.查看KMO和Bartlett 的检验 KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析; Bartlett 球度度检验的Sig值越小于显著水平0.05,越说明变量之间存在相关关系。 所的结论: 符合因子分析的条件,可以进行因子分析,并进一步完成主成分分析。 注意: 1.KMO(Kaiser-Meyer-Olkin) KMO统计量是取值在0和1之间。当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时,KMO值接近1.KMO值越接近于1,意味着变量间的相关性越强,原有变量越适合作因子分析;当所有变量间的简单相关系数平方和接近0时,KMO值接近0.KMO值越接近于0,意味着变量间的相关性越弱,原有变量越不适合作因子分析。 Kaiser给出了常用的kmo度量标准: 0.9以上表示非常适合;0.8表示适合;0.7表示一般; 0.6表示不太适合;0.5以下表示极不适合。 2.Bartlett 球度检验: 巴特利特球度检验的统计量是根据相关系数矩阵的行列式得到的,如果该值较大,且其对应的相伴概率值小于用户心中的显著性水平,那么应该拒绝零假设,认为相关系数矩阵不可能是单位阵,即原始变量之间存在相关性,适合于做主成份分析;相反,如果该统计量比较小,且其相对应的相伴概率大于显著性水平,则不能拒绝零假设,认为相关系数矩阵可能是单位阵,不宜于做因子分析。 Bartlett 球度检验的原假设为相关系数矩阵为单位矩阵,Sig值为0.001小于显著水平0.05,因此拒绝原假设,说明变量之间存在相关关系,适合做因子分析。 所做工作: b. 全部解释方差或者解释的总方差(Total Variance Explained)

烟气成分分析

实验三 烟气成分分析 一、实验目的 锅炉中燃烧产物的计算和测定主要是求出燃烧后的烟气量和烟气组成。燃料燃烧后烟气的主要成分有:CO 2、SO 2 、O 2 、H 2 O 、N 2 、CO 等气体。本实验使用奥氏烟气分析器测定干烟气的容积成分百分数。通过实验使学生巩固烟气组成成分的概念,初步学会运用奥氏烟气分析器测定烟气成分的方法。 二、实验原理 奥氏烟气分析器是利用化学吸收法按容积测定气体成分的仪器。它主要由三个化学吸收瓶组成,利用不同化学药剂对气体的选择性吸收特性进行的。 吸收瓶Ⅰ内盛放氢氧化钾溶液(KOH ),它吸收烟气中的CO 2与SO 2气体。在烟气成分中常用RO 2表示CO 2与SO 2容积总和,即RO 2=CO 2+SO 2。 其化学反应式如下:2KOH+CO 2→K 2CO 3 ;KOH+SO 2→K 2SO 3 ; 吸收瓶Ⅱ内盛焦性没食子酸苛性钾溶液[C 6H 3(OK )3],它可吸收烟气中的RO 2与O 2气体。当RO 2被吸收瓶Ⅰ吸收后,吸收瓶Ⅱ则吸收的烟气容积中的O 2气体。 焦性没食子酸苛性钾溶液吸收O 2的化学反应式为: 4C 6H 3(OK )3 + O 2→2[(OK )3C 6H 2—C 6H 2(OK )3]+2 H 2 O 吸收瓶Ⅲ内盛氯化亚铜的氨溶液[Cu (NH 3)2Cl ],它可吸收烟气中的CO 气体。 其化学反应式为:Cu (NH 3)2Cl+2CO → Cu (CO )2Cl+ 2NH 3; 它同时也能吸收O 2气体。故烟气应先通过吸收瓶Ⅱ,使O 2被吸收后,这样通过吸收瓶Ⅲ吸收的烟气只剩下一氧化碳CO 气体了。 综上所述,三个吸收瓶的测定程序切勿颠倒。在环境温度下,烟气中的过饱和蒸汽将结露成水,因此在进入分析器前,烟气应先通过过滤器,使饱和蒸汽被吸收,故在吸收瓶中的烟气容积为干烟气容积,气体容积单位为Nm 3/Kg ,测定的成分为干烟气容积成分百分数,即CO 2+SO 2+O 2+CO+N 2=100% CO 2= %1002?gy CO V V (3-1) ; SO 2=%1002?gy SO V V (3-2) ; O 2 = %1002?gy O V V (3-3) ; CO = %100?gy CO V V (3-4);

SPSS软件进行主成分分析的应用例子

SPSS软件进行主成分分析的应用例子

SPSS软件进行主成分分析的应用例子 2002年16家上市公司4项指标的数据[5]见表2,定量综合赢利能力分析如下: 公司销售净利率(X1)资产净利率(X2)净资产收益率(X3)销售毛利率(X4) 歌华有线五粮液用友软件太太药业浙江阳光烟台万华方正科技红河光明贵州茅台中铁二局红星发展伊利股份青岛海尔湖北宜化雅戈尔福建南纸43.31 17.11 21.11 29.55 11.00 17.63 2.73 29.11 20.29 3.99 22.65 4.43 5.40 7.06 19.82 7.26 7.39 12.13 6.03 8.62 8.41 13.86 4.22 5.44 9.48 4.64 11.13 7.30 8.90 2.79 10.53 2.99 8.73 17.29 7.00 10.13 11.83 15.41 17.16 6.09 12.97 9.35 14.3 14.36 12.53 5.24 18.55 6.99 54.89 44.25 89.37 73 25.22 36.44 9.96 56.26 82.23 13.04 50.51 29.04 65.5 19.79 42.04 22.72 第一,将EXCEL中的原始数据导入到SPSS软件中; 注意: 导入Spss的数据不能出现空缺的现象,如出现可用0补齐。 【1】“分析”|“描述统计”|“描述”。 【2】弹出“描述统计”对话框,首先将准备标准化的变量移入变量组中,此时,最重要的一步就是勾选“将标准化得分另存为变量”,最后点击确定。 【3】返回SPSS的“数据视图”,此时就可以看到新增了标准化后数据的字段。 所做工作: a. 原始数据的标准化处理

主成分分析PCA(含有详细推导过程以及案例分析matlab版)

主成分分析法(PCA) 在实际问题中,我们经常会遇到研究多个变量的问题,而且在多数情况下,多个变量之间常常存在一定的相关性。由于变量个数较多再加上变量之间的相关性,势必增加了分析问题的复杂性。如何从多个变量中综合为少数几个代表性变量,既能够代表原始变量的绝大多数信息,又互不相关,并且在新的综合变量基础上,可以进一步的统计分析,这时就需要进行主成分分析。 I. 主成分分析法(PCA)模型 (一)主成分分析的基本思想 主成分分析是采取一种数学降维的方法,找出几个综合变量来代替原来众多的变量,使这些综合变量能尽可能地代表原来变量的信息量,而且彼此之间互不相关。这种将把多个变量化为少数几个互相无关的综合变量的统计分析方法就叫做主成分分析或主分量分析。 主成分分析所要做的就是设法将原来众多具有一定相关性的变量,重新组合为一组新的相互无关的综合变量来代替原来变量。通常,数学上的处理方法就是将原来的变量做线性组合,作为新的综合变量,但是这种组合如果不加以限制,则可以有很多,应该如何选择呢?如果将选取的第一个线性组合即第一个综合变量记为1F ,自然希望它尽可能多地反映原来变量的信息,这里“信息”用方差来测量,即希望)(1F Var 越大,表示1F 包含的信息越多。因此在所有的线性组合中所选取的1F 应该是方差最大的,故称1F 为第一主成分。如果第一主成分不足以代表原来p 个变量的信息,再考虑选取2F 即第二个线性组合,为了有效地反映原来信息,1F 已有的信息就不需要再出现在2F 中,用数学语言表达就是要求 0),(21=F F Cov ,称2F 为第二主成分,依此类推可以构造出第三、四……第p 个主成分。 (二)主成分分析的数学模型 对于一个样本资料,观测p 个变量p x x x ,,21,n 个样品的数据资料阵为: ??????? ??=np n n p p x x x x x x x x x X 21 222 21112 11()p x x x ,,21=

教育信息处理(实验九因子分析与主成分分析)实验报告-示例

1、对北京18个区县中等职业教育发展水平进行聚类。X1:每万人中职在校生数;X2:每万人中职招生数;X3:每万人中职毕业生数;X4:每万人中职专任教师数;X5:本科以上学校教师占专任教师的比例;X6:高级教师占专任教师的比例;X7:学校平均在校生人数;X8:国家财政预算中职经费占国内生产总值的比例;X9:生均教育经费。 具体步骤如下: 1、导入数据,建立数据文件(data.sav) 2、选择聚类分析(分析—分类—系统聚类分析),选择变量,分群选择个 案方式 3、聚类分析描述统计(统计量—合并进程表;聚类成员—单一方案—聚类 数3) 4、聚类分析绘制(树状图;冰柱—所有聚类,方向—垂直) 5、聚类分析方法(聚类方法—组间联接,度量标准—区间—平方Euclidean

距离) 6、聚类分析保存(聚类成员—单一方案—聚类数3) 7、保存实验结果,并分析结果 结果与分析: (1)输出结果文件中的第一部分如下图1所示。 图1中可以看出18个样本都进入了聚类分析,但有效样本为14个,缺失14个。 (2)输出结果文件中的第二部分为系统聚类分析的凝聚状态表如图2所示。

第一列表示聚类分析的步骤,可以看出本例中共进行了17个步骤的分析; 第二列和第三列表示某步聚类分析中,哪两个样本或类聚成了一类; 第四列表示两个样本或类间的距离,从表格中可以看出,距离小的样本之间先聚类; 第五列和第六列表示某步聚类分析中,参与聚类的是样本还是类。0表示样本,数字n(非零)表示第n步聚类产生的类参与了本步聚类; 第七列表示本步聚类结果在下面聚类的第几步中用到。 图2给中第一行表示,第二个样本和第四个样本最先进行了聚类,样本间的距离为4803.026,这个聚类的结果将在后面的第六步

主成分分析实验报告

项目名称实验4—主成分分析 所属课程名称多元统计分析(英) 项目类型综合性实验_____________ 实验(实训)日期2012年4 月15日

二、实验(实训)容: 【项目容】 主成分分析。 【方案设计】 题目: 由原始数据求主成分。 【实验(实训)过程】(步骤、记录、数据、程序等)附后 【结论】(结果、分析) 附后 三、指导教师评语及成绩: 评语: 成绩:指导教师签名: 批阅日期: 实验报告4 主成分分析(综合性实验) (Prin cipal comp onent an alysis) 实验原理:主成分分析利用指标之间的相关性,将多个指标转化为少数几个综合指标,从而达到降维和数据结构简化的目的。这些综合指标反映了原始指标的绝

大部分信息,通常表示为原始指标的某种线性组合,且综合指标间不相关。利用矩阵代数的知识可求解主成分 实验题目:下表中给出了不同国家及地区的男子径赛记录:(t8a6) Country 100m 200m 400m 800m 1500m 5000m 10,000m Marathon (s) (s) (s) (min) (min) (min) (min) (mins) Argentina 10.39 20.81 46.84 1.81 3.7 14.04 29.36 137.72 Australia 10.31 20.06 44.84 1.74 3.57 13.28 27.66 128.3 Austria 10.44 20.81 46.82 1.79 3.6 13.26 27.72 135.9 Belgium 10.34 20.68 45.04 1.73 3.6 13.22 27.45 129.95 Bermuda 10.28 20.58 45.91 1.8 3.75 14.68 30.55 146.62 Brazil 10.22 20.43 45.21 1.73 3.66 13.62 28.62 133.13 Burma 10.64 21.52 48.3 1.8 3.85 14.45 30.28 139.95 Canada 10.17 20.22 45.68 1.76 3.63 13.55 28.09 130.15 Chile 10.34 20.8 46.2 1.79 3.71 13.61 29.3 134.03 China 10.51 21.04 47.3 1.81 3.73 13.9 29.13 133.53 Columbia 10.43 21.05 46.1 1.82 3.74 13.49 27.88 131.35 Cook Islands 12.18 23.2 52.94 2.02 4.24 16.7 35.38 164.7 Costa Rica 10.94 21.9 48.66 1.87 3.84 14.03 28.81 136.58 Czechoslovakia 10.35 20.65 45.64 1.76 3.58 13.42 28.19 134.32 Denmark 10.56 20.52 45.89 1.78 3.61 13.5 28.11 130.78 Dominican Republic 10.14 20.65 46.8 1.82 3.82 14.91 31.45 154.12 Finland 10.43 20.69 45.49 1.74 3.61 13.27 27.52 130.87 France 10.11 20.38 45.28 1.73 3.57 13.34 27.97 132.3 German (D.R.) 10.12 20.33 44.87 1.73 3.56 13.17 27.42 129.92 German (F.R.) 10.16 20.37 44.5 1.73 3.53 13.21 27.61 132.23 Great Brit.& N. Ireland 10.11 20.21 44.93 1.7 3.51 13.01 27.51 129.13

密炼车间烟气排放成分分析

炼胶工艺 1混炼:通过适当的加工将生胶与配合剂均匀混合在一起,制成质量均一的混合物的工艺过程。 2密炼的混炼:密炼机混炼密炼机通过转子、上下顶栓在密炼室中产生复杂的流动方式和高剪切力,使橡胶配合剂和粒状添加剂很快粉碎和均匀分散,是一种高效的混炼方法。但是高剪切力会使物料温度在混炼中迅速上升,一般会达到130℃。这已超过了大多数硫化系统的活化温度,会使胶料发生早期硫化(焦烧)。一般的做法是将大部分物料在密炼机中混炼,然后将胶料从密炼机排放到开炼机上,在开炼机上加硫化剂或超速促进剂。由于开炼机实际上只在辊缝线上对胶料有挤压作用,而提供了很大的冷却面积,致物料的温度降低。在这一阶段加入硫化剂可以避免胶料发生早期硫化(焦烧)。 密炼机混炼方法主要有一段混炼法、二段混炼法、引料法和逆混法: (1)一段混炼法指经密炼机和压片机一次混炼制成混炼胶的方法。通常加料顺序为:生胶→小料→填充剂或1/2→1/2炭黑→油料软化剂→排料。胶料直接排入压片机,薄通数次后,使胶料降至100℃以下,再加入硫黄和超促进剂,翻炼均匀后下片冷却。此法的优点是比二段混炼法的胶料停放时间短和占地面积小,其缺点是胶料可塑性偏低,填充补强剂不易分散均匀,而且胶料在密炼机中的炼胶时间长,易产生早期硫化(焦烧)。此法较适用于天然橡胶胶料和合成橡胶比例不超过50%的胶料。 (2)二段混炼法将混炼过程分为两个阶段,其中第一段同一段混炼法一样,只是不加硫黄和活性较大的促进剂,首先制成一段混炼胶(炭黑母炼胶),然后下片冷却停放8小时以上。第二段是对第一段混炼胶进行补充加工,待捏炼均匀后排料至压片机加硫化剂、超促进剂,并翻炼均匀下片。为了使炭黑更好地在橡胶中分散,提高生产效率,通常第一段在快速密炼机(40r/min以上)中进行,第二段则采用慢速密炼机,以便在较低的温度加入硫化剂。一般当合成胶比例超过50%时,为改进并用胶的掺合和炭黑的分散,提高混炼胶的质量和硫化胶的物理机械性能,可以采用二段混炼法。 (3)引料法在投料同时投入少量(1.5~2Kg)预混好的未加硫黄的胶料,作为“引胶”或“种子胶”,当生胶和配合剂之间浸润性差、粉状配合剂混入有困难时,这样可大大加快粉状配合剂(填充补强剂)的混合分散速度。例如,丁基橡胶即可采取此法。而且不论是在一段、二段混炼法或是逆混法中,加入“引胶”均可获得良好的分散效果。 (4)逆混法加料顺序与上述诸法加料顺序相反的混炼方法,即先将炭黑等各种配合剂和软化剂按一定顺序投入混炼室,在混炼一段时间后再投入生胶(或塑炼胶)进行加压混炼。其优点是可缩短混炼时间。还可提高胶料的性能。该法适合于能大量添加补强填充剂(特别

SPSS进行主成分分析

实验七、利用SPSS进行主成分分析 【例子】以全国31个省市的8项经济指标为例,进行主成分分析。 第一步:录入或调入数据(图1)。 图1 原始数据(未经标准化) 第二步:打开“因子分析”对话框。 沿着主菜单的“Analyze→Data Reduction→Factor ”的路径(图2)打开因子分析选项框(图3)。 图2 打开因子分析对话框的路径

图3 因子分析选项框 第三步:选项设置。 首先,在源变量框中选中需要进行分析的变量,点击右边的箭头符号,将需要的变量调入变量(Variables)栏中(图3)。在本例中,全部8个变量都要用上,故全部调入(图4)。因无特殊需要,故不必理会“Value ”栏。下面逐项设置。 图4将变量移到变量栏以后 ⒈设置Descriptives描述选项。 单击Descriptives按钮(图4),弹出Descriptives对话框(图5)。

图5 描述选项框 在Stat is tic s 统计 栏中选中U niva riate d escript ives 复选项,则输出结果中将会给出原始数据的抽样均值、方差和样本数目(这一栏结果可供检验参考);选中Initial soluti on 复选项,则会给出主成分载荷的公因子方差(这一栏数据分析时有用)。 在C orrel ation M atri x栏中,选中Coe fficien ts 复选项,则会给出原始变量的相关系数矩阵(分析时可参考);选中Deter minant 复选项,则会给出相关系数矩阵的行列式,如果希望在E xc el中对某些计算过程进行了解,可选此项,否则用途不大。其它复选项一般不用,但在特殊情况下可以用到(本例不选)。 设置完成以后,单击Cont inue 按钮完成设置(图5)。 ⒉ 设置Extra ction 选项。 打开Ext raction 对话框(图6)。因子提取方法主要有7种,在Method 栏中可以看到,系统默认的提取方法是主成分(Pr in ci pa l Compon en ts),因此对此栏不作变动,就是认可了主成分分析方法。 在Ana lyze 栏中,选中Correlatio n ma trix 复选项,则因子分析基于数据的相关系数矩阵进行分析;如果选中Covar iance matri x复选项,则因子分析基于数据的协方差矩阵进行分析。对于主成分分析而言,由于数据标准化了,这两个结果没有分别,因此任选其一即可。 在D isplay 栏中,选中U nrotated factor s olu ti on(非旋转因子解)复选项,则在分析结果中给出未经旋转的因子提取结果。对于主成分分析而言,这一项选择与否都一样;对于旋转因子分析,选择此项,可将旋转前后的结果同时给出,以便对比。 选中Scree P lo t(“山麓”图),则在分析结果中给出特征根按大小分布的折线图(形如山麓截面,故得名),以便我们直观地判定因子的提取数量是否准确。 在Extract 栏中,有两种方法可以决定提取主成分(因子)的数目。一是根据特征根(Eig envalues )的数值,系统默认的是1=c λ。我们知道,在主成分分析中,主成分得分的方差就是对应的特征根数值。如果默认1=c λ,则所有方差大于等于1的主成分将被保留,其余舍弃。如果觉得最后选取的主成分数量不足,可以将c λ值降低,例如取 9.0=c λ;如果认为最后的提取的主成分数量偏多,则可以提高c λ值,例如取1.1=c λ。 主成分数目是否合适,要在进行一轮分析以后才能肯定。因此,特征根数值的设定,要在反复试验以后才能决定。一般而言,在初次分析时,最好降低特征根的临界值(如取

相关主题
文本预览
相关文档 最新文档