当前位置：文档之家› 基于多元统计分析的水质综合评价

基于多元统计分析的水质综合评价

第17卷第4期2006年　8月

水资源与水工程学报

Journal of Water Resources&Water Engineering

Vol.17No.4

Aug.,2006

　基于多元统计分析的水质综合评价

李传哲1,于福亮1,刘佳1,鲍卫锋2,杜子芳3

(1.中国水利水电科学研究院水资源所,北京100044;2.武汉大学水资源与水电工程科学国家重点实验室,

武汉430072;3.中国人民大学统计学院,北京100872)

摘　要:以延河为例,运用因子分析方法和聚类分析方法就各监测断面水质污染程度和污染相似性进行定量化的综合评价。提出水质污染的逐步回归分析方法,并以年水质综合污染指数为例,对其进行逐步回归分析。为合理评价延河水环境状况提供一定的科学依据。

关键词:水质污染;因子分析;聚类分析;逐步回归分析

中图分类号:X824 文献标识码:A 文章编号:16722643X(2006)0420036205

Comprehensive evaluation of water quality based on

multivariate statistical analysis

LI Chuan-zhe1,YU Fu-liang1,LIU Jia1,BAO Wei-feng2,Du Zi-fang3

(1.Department of Water Resources,China Institute of Water Resources and Hydropower Research,Beijing

100044,China;2.State Key Laboratory of Water Resources and Hydropower Engineering Science,Wuhan University,Wuhan430072,China;3.School of Statistics,Renmin University of China,Beijing100872,China) Abstract:Using the methods of factor analysis and cluster analysis,the paper has made the quan2 titative analysis and comprehensive assessment for the polluting status in degrees and in similari2 ties of monitoring sections in Yanhe River.A method of stepwise regression analysis on water polluting is discussed with examples of the comprehensive water polluting index.It can be pro2 vided some scientific bases to assess the water environment situation of Yanhe River.

Key words:water pollution;factor analysis;cluster analysis;stepwise regression analysis

0　引　言

延安市的水资源问题制约着整个城市的发展,影响着整个市区的环境景观和人民的健康。如何科学准确评价母亲河——延河的水质状况,已成为延安市环保和水利等部门的重要课题。水质评价包含两方面内容:一是水质污染相似性的分类研究;二是水质污染程度的评价。水质系统是由多种因子构成的复杂系统,水质质量受到诸多指标(污染物含量或指数)的影响,每项指标从不同角度反映水质污染状况。本文运用因子分析方法将所取断面进行水质污染程度的综合评价、分析,确定影响水质质量状况的综合因子;以聚类分析方法对各断面水质污染相似性进行研究,给出分类处理结果;应用逐步回归的数理统计方法,寻求主要污染指标与水质综合污染指数间的关系。

1　断面和指标的选取

延安市地面水常规监测的主要河流为延河。根据《水环境监测技术规范》的要求,设1号杨家湾断面、2号柳树店断面、3号点四联队断面、4号点七里村断面、5号点王家川断面,共5个断面,均为省控断面,监测河段长80km。本文选取的监测指标为悬浮物、总硬度、高锰酸盐指数、生化需氧量、非离子氨、亚硝酸盐氨、硝酸盐氨、挥发酚、砷、六价铬、石油类等11项。数据资料为2002年这5个监测断面11项监测指标的年平均值,见表1。

收稿日期:2006202215;　修稿日期:2006203216

基金项目:延安市水资源综合规划项目;全国水资源综合规划专题(01-06-02)

作者简介:李传哲(19832),男(汉族),湖北荆州人,硕士研究生,主要从事水资源合理配置、规划评价等方面的研究。

表1　2002年延河各监测断面水质监测结果统计表(综合污染指数除外)

mg L

指标悬浮物

总硬度

高锰酸

盐指数

生化需氧量

非离子氨

亚硝酸盐氨

硝酸盐氨

挥发酚

砷

六价铬

石油类

综合污染指数

断面150.7164.32.532.00.0130.0820.360.0010.0050.0130.1897.18断面247.5141.94.126.00.1330.1340.370.0020.0080.0140.18314.65断面356.7154.94.464.40.1670.1540.360.0030.0100.0140.24717.74断面464.8175.54.204.10.0270.1700.380.0020.0120.0131.26231.01断面5

73.0

187.6

3.96

4.0

0.047

0.182

0.38

0.002

0.013

0.018

0.282

12.68

数据来源:延安市环境保护局2002年水环境保护质量报告书。

2　因子分析法在延河水质污染程度综

合评价中的应用

2.1　因子分析基本原理

因子分析(Factor Analysis )是主成分分析的推广,它是通过原始变量的线性组合,把多个原始指标简化为有代表意义的少数几个指标,以使原始指标能更集中、更典型地表明研究对象特征的一种统计分析方法。研究变量之间的相互关系的因子分析称为R 型因子分析,研究样品之间的相互关系的因子分析称为Q 型因子分析,本文采用研究各变量间相互关系的Q 型因子分析[1]。其基本步骤为:①设有n 个样品,每个样品观测p 个变量。为了对变量进行比较,并消除由观测量纲的差异及数量级所造成的影响,将样本观测数据进行无量纲化或标准化处理,使标准化后的变量的均值为0,方差为1。②计算变量的相关系数矩阵,求出特征值Κ,得到贡献率和累积贡献率,选取前m (m

j=1

Κj ∑p

j=1

Κj ≥85%,然后进行具体分析。随着多

元统计分析理论的逐步完善及相关软件的商品化,

越来越多的人应用统计分析技术研究水环境污染相关问题[2～8]。

本文数据分析借助SPSS for Windows 软件完成[9]。2.2　计算结果

根据断面及各实测指标值(表1)建立5×11的

原始指标矩阵x =(x ij )np 。由于所选指标数据过分悬殊,为消除因此而导致的噪音影响,对原始数据进行标准化处理。根据相关矩阵可知,各因子间的相关性较好,适合用因子分析法提取综合因子。旋转前后各因子的特征值、贡献率和累积贡献率见表2。因子分析中选取因子的两个原则:特征值大于1

的因子;因子的累积贡献率大于或等于85%,即∑

i =1

Κi

≥85%。从表2和图1(因子碎石图)看出,选取前

3个因子满足

∑3

j =1

Κj

∑11j =1

Κj

=93.442%

≥85%,可

以作为综合因子充分反映各污染指标及水环境要素的变化情况。

表2　总方差分解

因子

旋　转　前

初始的特征值

变量贡献率 %累积贡献率 %提取的特征值

变量贡献率 %累积贡献率 %旋转后提取的特征值

变量贡献率 %累积贡献率 %15.28648.05148.0515.28648.05148.0514.59041.72841.72823.58532.58980.6403.58532.58980.6403.93735.79177.51931.40812.80393.4421.408

12.803

93.442

1.752

15.923

93.442

40.7216.558

100.00053.545×10-163.223×10-15100.00061.759×10-161.599×10-15100.0007

7.946×10-17

7.223×10-16

100.0008-1.374×10-17-1.249×10-16100.0009-1.323×10-16-1.203×10-15100.00010-2.183×10-16-1.985×10-15100.00011-4.090×10-16-3.718×10-15

100.000

第4期李传哲,等:基于多元统计分析的水质综合评价

提取的3个因子代表了11个因子的综合信息,因而很难命名。为此需对其旋转,使因子载荷值向两极端趋近,以明确各因子代表的含义。采用Varimax with Kaiser Normalization 因子旋转法对初始因子

载荷矩阵施以25次的正交旋转。计算结果(表3)表明旋转后因子分类极其明确。同时由表2可知旋转前后综合因子代表的信息量始终满足大于或等于85%的要求,可认为旋转前后信息量没有损失。

表3　旋转因子载荷矩阵

指　标因子

3旋转因子

3悬浮物0.855-0.453-0.1740.972-1.79×10-2

0.146总硬度0.579-0.779-0.1550.868-0.4330.160砷0.997-2.30×10-2

8.14×10-3

0.8540.4400.267六价铬0.612-0.145-0.7550.8220.104-0.527亚硝酸盐氨0.9900.1397.31×10

-3

0.7810.5800.231硝酸盐氨0.806-0.3390.1900.7668.43×10

-2

0.454高锰酸盐指数0.7380.6520.168

0.3000.9280.214

挥发酚0.5400.741-2.85×10

-2

0.157

0.902-4.01×10-2

生化需氧量0.4040.7720.107-1.42×10-2

0.8774.71×10-2

非离子氨3.64×10-2

0.977-0.171-0.3240.870-0.352石油类

0.470

-0.303

0.824

0.263

3.40×10-3

0.960

图1　因子碎石图

图2　旋转因子载荷图

由表3和图2可看出,旋转使因子载荷值向两极

端趋近更为明显,利于综合因子的命名。第一主因子代表悬浮物、总硬度、砷、六价铬、亚硝酸盐氨、硝酸盐氨,占原始方差的48.051%,这些污染物多为生

活污水产生的,可命名为生活污染因子,其中砷和六价铬属于重金属污染;第二主因子代表高锰酸盐指数、挥发酚、生化需氧量和非离子氨,占原始方差的32.589%,

命名为有机工业污染因子;第三因子只

代表石油类,可直接称之为石油因子,占原始方差的12.803%。第二主因子和第三主因子所代表的指标

反映的都是有机物对延河的污染。实际上,在所监测的延河河段周围,有大量的石油开采、加工等生产活

动,这些活动加剧了有机物对延河的污染。

3　聚类分析在延河水质污染相似性研

究中的应用

3.1　聚类分析的基本思想

聚类分析(Cluster Analysis )是根据事物本身的特征研究个体分类的方法。聚类分析的基本思想是认为所研究的样品或指标(变量)之间存在着程度不同的相似性。将相似性较大的样品(或指标)聚合为一类,把另外一些相似程度较大的样品(或指标)又聚合为另一类。这样,就将所有样品(或指标)分成许多类别,同一类中的个体有较大的相似性,不同类中的个体差异性很大。

3.2　延河各监测断面水质污染相似聚类分析

由因子分析计算,得到各断面3个综合因子的得分见表4,它说明了不同污染因子对各断面水体的贡献程度。为了更直观地观察结果,对其进行聚类。以断面的因子得分(见表4)为变量,采用分层聚类法

83 水资源与水工程学报 2006年

(hierachical cluster ),在聚类过程中,聚类方法为最远邻近法(Further neighbor );距离测度的方法采用

欧式距离平方作为类间距离(squared euclidean dis 2tance )。

表4　因子得分

监测断面

生活污染因子有机工业污染因子

石油因子

1-0.79344-1.54796-0.345762-0.780670.75042-0.207513-0.348621.00411-0.4590340.33247-0.028771.754015

1.59026

-0.17781

-0.74171

根据聚类分析结果作出直观的聚类树状分类

图,如图3所示。据此,可将断面的水质污染类型分为4类:第1类为断面5,主要受生活污染因子控制;第2类为断面4,石油因子影响稍大,而且生活污染因子对此断面的影响也较大。第3类为断面2和断面3,主要受有机工业污染因子影响,与其他两类综合因子有负相关性;第4类为断面1,各污染因子的贡献都较小,水质相对较好

。

图3　聚类树状分类图

4　逐步回归分析在延河水质污染评价

中的应用

4.1　逐步回归的基本思想

由多元线性回归分析的知识可知,并不是所有的自变量都对因变量y 有显著的影响;其次,多元回归分析没有考虑因子之间的独立性,即包括在方程中的各个因子,很有可能某些因子对于因变量y 的影响是重复的;再次,从衡量拟合精度来看,如果剩余标准差S y 愈小,则拟合精度愈高,反之则愈低。因此如果回归方程中包含了对因变量y 不起作用或作用很小的因子时,那么残差平方和Q 不会由于有了这个因子而减少多少,相反可能使剩余标准差增大很多,从而降低拟合精度。同时,如果这些对因变量

y 影响不显著的因子进入方程也会影响方程的稳定

性。因此,就存在如何挑选出对因变量有显著影响的

自变量问题。目前,最受推崇的是逐步回归法。

逐步回归法就是按自变量对因变量作用的大小,这种作用可用偏回归平方和衡量,由大至小地逐个将自变量引入回归方程,对已被引入方程中的自变量,在新自变量引入后有可能因对因变量的作用不显著而从方程中剔除,已剔除的自变量在新自变量引入后也可重新放回,以便获得具有某种最优性质的回归方程。这个过程直到回归方程中的自变量均不能剔除,即所有引入方程中的自变量,其偏回归平方和均达到了显著水平,同时又不能再引入新自变量,这时逐步回归结束,此时所得最优方程中的自变量对因变量均有显著影响。

4.2　水质污染评价的逐步回归方程

在水环境评价中一般以综合污染指数(如表1最后一列)表征水体的水质类别[10]。综合污染指数为各监测指标污染指数的之和,为评价某一水体,往往需要监测多项指标,不方便也不经济。对于环保部门实时调查河流水体治理情况,仅监测关键的几项污染指标,更快捷经济。应用逐步回归方法,建立综合评价指数和少数几项指标间的回归方程,就能有效的解决上述问题。

计算结果(表5)表明,在所有11个污染指标中,石油类、非离子氨和高锰酸盐指数对综合污染指数有显著影响,因此,由这三个指标构成的回归方程即为逐步回归的“最优回归方程”。

回归方程为:

综合污染指数=-1.071+19.136×石油类+41.225×非离子氨+1.623×高锰酸盐指数4.3　逐步回归方程的应用

通过逐步回归分析,可以更加直观地了解到影响延河水质的最显著的污染因素,有利于在水污染治理过程中有针对性的实施合理的治理方案。此外,由这个建立好的回归方程可以进行分析预测。依据回归方程计算的水质污染综合指数与延安市环境保护局2003年水环境保护质量报告书上按传统方法(需要计算各项指标)计算的综合污染指数对比分析(详见表6)表明,两者相对误差在5%以内,符合拟合要求。

由表中分析可知,在水质评价中引入逐步回归分析,建立综合污染指数与少数几个主要影响污染物指标间的数学方程是科学、有效和可行的。依据此方程计算的结果与传统的综合污染指数计算方法计算出的结果具有高度的一致性,可以应用此方程进行水质预测与评价。

第4期李传哲,等:基于多元统计分析的水质综合评价

表5　回归系数分析

编号

非标准化系数

B偏回归系数标准误差

标准化系数

Β系数t检验

显著性

水平

共线性统计量

指标容忍度膨胀方差因子

1常数9.1092.7193.3500.044

石油类17.4374.5290.9123.8500.0311.0001.000 2常数3.1420.8633.6430.068

石油类20.9020.9681.09321.6020.0020.8331.200非离子氨57.7176.5820.4448.7690.0130.8331.200 3常数-1.0710.242-4.4280.141

石油类19.1360.1231.001155.3090.0040.3123.207非离子氨41.2251.0440.31739.4770.0160.2014.979高锰酸盐指数1.6230.0900.13918.1270.0350.2204.536

表6　回归方程与传统方法计算结果对比分析

断面传统方法

计算值

回归方程

计算值

误差

相对误差

结果

评定

17.357.08-0.27-3.69合格

228.4629.170.712.48合格318.6119.490.884.73合格4110.80105.75-5.05-4.56合格518.7319.100.371.97合格

5　结　论

(1)利用因子分析和聚类分析法对延安市延河水环境状况进行分析,可明确水环境的污染原因,针对不同水体提出相应的治理措施,并能计算出主要污染物的贡献,以便有针对性地减少污染物排放。

(2)应用逐步回归分析方法可建立水质综合污染指数与少数几个主要污染物指标之间的回归方程,该方程拟合程度较高,稳定性好,具有较强的使用价值。

参考文献:

[1]何晓群.现代统计方法与应用[M].北京:中国人民大学

出版社,1998:179-343.

[2]刘元波,高锡芸.太湖北部梅梁湾水域水质因子聚类

[J].湖泊科学,1997,9(3):255-260.

[3]李连科.因子分析法用于近岸海域大气污染来源的判别

[J].海洋环境科学,1998,17(1):30-34.

[4]廖奇志,陆晓华.山丹湖环境水化学特征的主因子分析

[J].华中理工大学学报,1998,26(增刊):65-67.

[5]Marisol V,Rafael P,Enrique B,et al.Assessment of

seasonal and polluting effects on the quality of river wa2 ter by exploratory date analysis[J].Water Resources Research,1998,32:3581-3592.

[6]Perona E,Bonilla I and Mateo P.Spatial and temporal

changes in water quality in a Spanish river[J].The Science of the Total Environment,1999,241:75-90. [7]吕唤春,陈英旭,方志发,等.千岛湖水体营养物质的主

导因子分析[J].农业环境保护,2002,21(4):318-321. [8]王晓鹏,曹广超.基于多元统计分析的湖库水质富营养

化程度评价模型及应用[J].数理统计与管理,2003,22

(2):30-33.

[9]卢纹岱.SPSS for Windows统计分析[M].北京:电子

工业出版社,2000:284-426.

[10]赵毅.环境质量评价[M].北京:中国电力出版社,

1997:105-162.

《水利与建筑工程学报》征订启事

《水利与建筑工程学报》是面向国内外公开发行的水利与建筑工程及相关领域的学术性刊物。主要专业范围:水工建筑、农田水利、水文水资源、水土保持、河流及航道治理、岩土工程、材料与结构及水利水电、土木建筑工程的规划、勘测、设计、科研等。

本刊系中国核心期刊(遴选)数据库收录期刊,CNKI中国期刊全文数据库(CJFD)收录期刊;中国学术期刊综合评价数据库(CAJCED)统计刊源期刊;万方数据-数字化期刊群入网期刊;中国学术期刊(光盘版)首录期刊;中国期刊网入编期刊;中文科技期刊数据库(SWIC)收录期刊。

《水利与建筑工程学报》由教育部主管,西北农林科技大学主办。国内外公开发行,季刊,自办发行。定价10.00元期,全年46元(含邮费)。欢迎各界朋友订阅。

地址:陕西杨凌渭惠路23号　单位:西北农林科技大学水科所校区　《水利与建筑工程学报》编辑部

邮编:712100　电话:029-********　电子邮箱:sjxb@https://www.doczj.com/doc/1616358226.html,

04 水资源与水工程学报 2006年

多元统计分析期末复习试题

第一章：多元统计分析研究的内容（5点） 1、简化数据结构（主成分分析） 2、分类与判别（聚类分析、判别分析） 3、变量间的相互关系（典型相关分析、多元回归分析） 4、多维数据的统计推断 5、多元统计分析的理论基础第二三章：

二、多维随机变量的数字特征 1、随机向量的数字特征随机向量X 均值向量：随机向量X 与Y 的协方差矩阵：当X=Y 时Cov （X ，Y ）=D （X ）；当Cov （X ，Y ）=0 ，称X ，Y 不相关。随机向量X 与Y 的相关系数矩阵： 2、均值向量协方差矩阵的性质 (1).设X ，Y 为随机向量，A ，B 为常数矩阵 E （AX ）=AE （X ）； E （AXB ）=AE （X ）B; D(AX)=AD(X)A ’; Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ，Y 独立，则Cov(X,Y)＝０，反之不成立． (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . )' ,...,,(),,,(2121P p EX EX EX EX μμμ='= )' )((),cov(EY Y EX X E Y X --=q p ij r Y X ?=)(),(ρ) ,(~∑μP N X μ ∑ p X X X ,,,21

特别地，当为对角阵时，相互独立。 (2).若，Ａ为sxp 阶常数矩阵，d 为s 阶向量，ＡＸ＋d ～ . 即正态分布的线性函数仍是正态分布． (3).多元正态分布的边缘分布是正态分布，反之不成立． (4).多元正态分布的不相关与独立等价．例３．见黑板．三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的（简单）样本”的理解---独立同截面． (2)多元分布样本的数字特征---常见多元统计量样本均值向量＝样本离差阵Ｓ＝样本协方差阵Ｖ＝ S ;样本相关阵Ｒ (3) ,Ｖ分别是和的最大似然估计； (4)估计的性质是的无偏估计； ,Ｖ分别是和的有效和一致估计；；Ｓ～，与Ｓ相互独立；第五章聚类分析：一、什么是聚类分析：聚类分析是根据“物以类聚”的道理，对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚，甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法：系统聚类法（直观易懂）、动态聚类法（快）、有序聚类法（保序）...... Q-型聚类分析（样品）R-型聚类分析（变量）变量按照测量它们的尺度不同，可以分为三类：间隔尺度、有序尺度、名义尺度。 μ ) ,(~∑μP N X ) ,('A A d A N s ∑+μ) () 1(,,n X X X )' ,,,(21p X X X )' )(() () (1 X X X X i i n i --∑=n 1 X μ∑μ X ) 1 , (~∑n N X P μ) ,1(∑-n W p X X

应用多元统计分析试题及答案

一、填空题： 1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法. 2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著. 3、聚类分析就是分析如何对样品（或变量）进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。 4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。 5、因子分析把每个原始变量分解为两部分因素：一部分为公共因子，另一部分为特殊因子。 6、若 () (,), P x N αμα ∑=1,2,3….n且相互独立，则样本均值向量x服从的分布为_x~N(μ，Σ/n)_。二、简答 1、简述典型变量与典型相关系数的概念，并说明典型相关分析的基本思想。在每组变量中找出变量的线性组合，使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合，使其配对，并选取相关系数最大的一对，如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量，它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。相应分析，是指对两个定性变量的多种水平进行分析。设有两组因素A和B，其中因素A包含r个水平，因素B包含c个水平。对这两组因素作随机抽样调查，得到一个rc的二维列联表，记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换，使得因素A

和因素B 具有对等性，从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上，从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。从k 个总体中抽取具有p 个指标的样品观测数据，借助方差分析的思想构造一个线性判别函数系数：确定的原则是使得总体之间区别最大，而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出值，然后根据判别一定的规则，就可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤第一，提出待检验的假设和H1；第二，给出检验的统计量及其服从的分布；第三，给定检验水平，查统计量的分布表，确定相应的临界值，从而得到否定域；第四，根据样本观测值计算出统计量的值，看是否落入否定域中，以便对待判假设做出决策（拒绝或接受）。协差阵的检验检验0=ΣΣ 0p H =ΣI ： /2 /21exp 2np n e tr n λ???? =-?? ? ???? S S 00p H =≠ΣΣI ： /2 /2**1exp 2np n e tr n λ???? =-?? ? ???? S S

用模糊数学综合评价法对水质进行评价

用模糊数学综合评价法对水质进行评价付智娟（中山市环境保护科学研究所，中山 542803）摘要：综合评价法作为模糊数学的一种具体应用方法，在很多领域中得到了广泛的运用。由于综合评价法的数学模型简单、容易掌握，更适合于对多因素、多层次的复杂问题的评价。将其应用于对水质的评价能更客观、科学地反映水质情况。关键词：模糊数学；综合评价法；水质评价法 Abstract:As the praxis of fuzzy mathematics,comprehensive evaluation is prevalent used in many fields ,Because it is a simple mathematical model and easy to use,comprehensive evaalution has advantage to solve the complex problem that have more different https://www.doczj.com/doc/1616358226.html,ing it to evaluate the quality of water can get an objective and scientific result. Key words: fuzzy mathematics; comprehensive evaluation; evaluate the quality of water 模糊数学理论是近年来发展起来的科学，水质的好坏具有模糊的概念，因此也可以用它来评价水质，对水质进行综合评价，打破以往仅用一个确定性的指标来评价水质的方法，并可以弥补其中的不足，更客观、科学地对水质进行评价。现引用对某水质进行评价的例子来说明模糊数学综合评价在水质评价中的运用。 1. 基本概念 1. 1隶属度以往的水质分级中多用一个简单的数学指标为界限，造成界限两边分为截然不同的等级.例如参数DO ， I 级水的指标为7mg/L,则7.1mg/L 为I 级水，但DO 若为6.9mg/L 就的定为II 级水。事实上，由于水质的污染程度属于模糊概念,所以这里用隶属概念来描述模糊的水质分级界限。所谓隶属度系指某事物所属某种标准的程度：如:DO=7.1mg/L 时,隶属I 级水的程度为100%;6.9mg/L 时,隶属I 级水的程度达95%。隶属度可用隶属函数表示。为方便起见，取线性函数： 10X X X X --或 11X X X X --，（X 0

多元统计分析课程设计

多元统计分析课程设计题目：《因子分析在环境污染方面的应用》姓名：王厅厅专业班级：统计学2014级2班学院：数学与系统科学学院时间：2016年1月 3 日

目录 1.摘要: (1) 2.引言： (1) 背景 (1) 问题的研究意义 (1) 方法介绍 (2) 3.实证分析 (10) 指标 (10) 原始数据 (10) 数据来源 (13) 分析过程： (13) 4.结论及建议 (25) 5.参考文献 (26)

1.摘要: 中国的环境问题，由于中国政府对环境问题的关注，环境法律日趋完善，执法力度加大，对环境污染治理的投人逐年有较大幅度的增加，中国环境问题已朝着好的方面发展。但是，仍存在着环境问题，主要体现在环境污染问题，其中主要为水污染和大气污染。关键词：环境污染水污染大气污染因子分析2.引言：背景：我国的环境保护取得了明显的成就，部分地区环境质量有所改善。但是，从整体上看，我国的环境污染仍在加剧，环境质量还在恶化。大气二氧化硫含量居高不下，境质量呈恶化趋势，固体废弃物污染量大面广，噪声扰民严重，环境污染事故时有发生。据中国社会科学院公布的一项报告表明：中国环境污染的规模居世界前列。问题的研究意义：为分析比较各地环境污染特点，利用因子分析对环境污染的各个指标进行降维处理并得到影响环境的内在因素，进一步对环境污染

原因及治理措施进行分析，让更多的人认识到环境的重要性，准确把握各地区环境治理方法以及针对不同地区制定不同的政策改善环境问题，这对综合治理环境问题具有重要意义。方法介绍因子分析的意义：变量间的信息的高度重叠和高度相关会给统计方法的应用设置许多障碍。为解决此问题，最简单和最直接的解决方案是削减变量个数，但这必然会导致信息丢失和信息不完全等问题的产生。为此人们希望探索一种更有效地解决方法，它既能大幅减少参与数据建模的变量个数，同时也不会造成信息的大量丢失。因子分析正是这样一种能够有效降低变量维数的分析方法。因子分析的步骤： ·因子分析的前提条件：要求原有变量之间存在较强的相关关系。 ·因子提取：将原有变量综合成少数几个因子是因子分析的核心内容。若存在随机向量 ) (),,(1p q F F F q ≤'=Λ及 ),,(1' =p εεεΛ，使 ??????????+??????????????????? ?=??????????p q pq p q p F F a a a a X X εεM M ΛM M ΛM 1111111 简记为ε+=AF X ，且（1） q I F D F E ==)(,0)(（标准化）；

水质综合污染指数评价方法

水质综合污染指数飞水质综合污染指数的计算水质综合污染指数是在单项污染指数评价的基础上计算得到的。考虑到上海地表水污染特点，在计算水质综合污染指数时通常选择上海市具有代表性的污染物，包括高锰酸盐指数、五日生化需氧量、化学需氧量、氨氮、石油类、挥发酚、总磷和汞。也可以根据需要选择必要的污染物参与评价。 Ci Pi = Si

其中，O-污染物实测浓度; &-相应类别的标准综合污染指数的计算方法: 应该注意到，水质综合污染指数的计算与水质类别标准密切相关，因此综合污染指数的比较只能在同一类别标准基础上进行。 1、水质污染程度的判别根据水质综合污染指数来判别污染程度是相对的，即对应于水体功能要求评判其污染程度。如 II类水体的水质要求明显高于III类、IV类、V类水体，假如不同类别水体的水质相同，则要求越高的水体，其对应的污染程度越严重。根据水质综合污染指数判别水质污染程度必须基于下列条件：（1）污染程度是对应于相应类别的水质要求的。（2）污染程度的分级是为了定性反映水质的现状，水体污染说明该水域原定的功能不能安全、全面地发挥效应，其功能得不到保证。不同功能水体即使达到相同的污染程度，其危害和影响也是各不相同的。

（3）根据水质综合指数的大小可将水体分为合格、基本合格、污染和重污染四类。当采用上述八项污染物进行评价时，不同类型水体相对应的综合指数和水质现状阐述如下：合格：P W0.8各项水质指标基本上能达到相应的功能标准，即使有个别指标超标，但超标倍数较小（1 倍以内），水体功能可以得到充分发挥，没有明显的制约因素。基本合格：0.82.0,各项水体指标的总体均值已超过标准 1 倍

多元统计分析方法在商业企业中的应用_党玮

６５《商场现代化》２００６年１０月（上旬刊）总第４８１期一、引言多元统计分析是统计学中一个非常重要的分支。在国外，从２０世纪３０年代起，已开始在自然科学、管理科学、社会和经济等领域广泛应用。我国自２０世纪８０年代起在许多领域拉开了多元统计分析应用的帷幕，２０多年来在多元统计分析的理论研究和应用上取得了很显著的成绩。在商业企业经营过程中，往往需要对诸如产品销售收入、产品销售成本、产品销售费用、产品销售税金及附加、产品销售利润、管理费用、利润总额、利税总额等变量进行分析和研究，如何同时对多个变量的观测数据进行有效的分析和研究，这就需要利用多元统计分析方法来解决，通过对多个变量观察数据的分析，来研究变量之间的相互关系以及揭示这些变量之间内在的变化规律。实践证明，多元分析是实现做定量分析的有效工具。二、多元统计分析研究的主要内容在当前科技和经济迅速发展的今天，在国民经济许多领域中，特别是对社会现象的分析，只停留在定性分析的基础上是不够的，为提高科学性、可靠性，通常需要定性和定量的分析。如果说一元统计方法是研究一个随机变量统计科学的规律，那么多元统计分析方法是研究多个随机变量之间相互依赖关系以及内在统计规律性的一门统计学科。同时，利用多元统计分析中不同的方法可以对研究对象进行分类和简化。多元统计分析包括的主要内容有：聚类分析、判别分析、主成分分析、因子分析、对应分析、典型相关分析等。三、多元统计分析方法在商业企业中的应用在这里，重点研究聚类分析、判别分析、主成分分析、因子分析方法及其在商业企业中的应用。１．聚类分析随着生产技术和科学的发展，人类的认识不断加深，分类越来越细，要求也越来越高，光凭经验和专业知识是不能确切分类的，往往需要定量和定性的分析结合起来去分类，于是数学工具逐渐被引进分类学中，形成了数值分类学。后来随着多元分析的引进，聚类分析逐渐从数值分类学中脱离出来而形成一个相对独立的分支。聚类分析又称群分析，它是研究分类问题的一种多元统计方法。所谓类，通俗地说，就是指相似元素的集合。聚类分析的基本思想是首先将每个样本当作一类，然后根据样本之间的相似程度并类，并计算新类与其它类之间的距离，再选择相近者并类，每合并一次减少一类，继续这一过程，直到所有样本都并成一类为止。所以，聚类分析依赖于对观测间的接近程度（距离）或相似程度的理解，定义不同的距离量度和相似性量度就可以产生不同的聚类结果。聚类分析内容非常丰富，有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。在企业销售领域，销售商需要考虑对不同生产企业生产的同名称商品的分类问题。例如，某商场对销售的２０种啤酒进行分类，以便对不同类别的啤酒采用不同的销售策略，变量包括啤酒名称、热量卡路里、钠含量、酒精含量、价格。根据以上指标，　利用聚类分析可以实现把同一类型的啤酒企业归到同一类别。再如商业企业制定商品销售价格时，需要对某个大城市的物价指数进行考察，而物价指数很多，有农用生产物价指数、服务项目物价指数、食品消费物价指数、零售价格指数等等。由于要考察的价格指数很多，通常先对这些价格指数利用聚类分析方法进行分类。２．判别分析在生产、科研和日常生活中经常需要根据观测到的数据资料，对所研究的对象进行分类。判别分析是判断样品所属类型的一种多元统计分析方法，其目的是对已知分类的数据，建立由数值指标构成的分类规则，然后把这样的规则应用到未知分类的样本中去分类。判别分析与聚类分析不同。判别分析是已知研究对象分成若干类型并取得各种类型的一批已知样品的观测数据，在此基础上根据某些准则建立判别式，然后对未知类型的样品进行判别分析。判别分析内容很丰富，方法很多。判别分析按判别的组数来区分，有两组判别分析和多组判别分析；按区分不同总体所用的模型来分，有线性判别和非线性判别；按判别式所处理的变量方法不同，又分逐步判别和序贯判别等。判别分析可以从不同角度提出问题，因此有不同的判别准则，如马氏距离最小准则、Ｆｉｓｈｅｒ准则、平均损失最小准则、最小平方准则、最大似然准则、最大概率准则等等。商业企业在市场预测中，往往根据以往所调查的种种指标，用判别分析方法判断下季度是畅销、平销或滞销。当然，判别分析与聚类分析常常联合起来使用。在聚类分析中，某商场对销售的２０种啤酒进行分类，假定分类结果为一级品、二级品及三级品，现在判断某种新商标的啤酒属于哪个级别的产品就需要用判别分析。３．主成分分析在实际问题中，研究多指标（变量）问题是经常遇到的，然而在多数情况下，不同指标之间有一定相关性。由于指标较多，再加上指标之间有一定的相关性，势必增加了分析问题的复杂性。主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标，同时根据实际需要从中可取几个较少的综合指标，尽可能多地反映原来指标的信息，这种将多个指标化为少数相互无关的综合指标的统计方法，叫做主成分分析多元统计分析方法在商业企业中的应用党玮石河子大学商学院［摘要］　随着市场经济的发展和竞争的日益激烈，如何运用科学的分析方法，对收集到的数据做出准确、及时的分析并制定正确的决策，已成为企业极为关注的问题。本文重点介绍了多元统计分析方法中的聚类分析、判别分析、主成分分析、因子分析及其在商业企业中的应用。［关键词］　多元统计分析方法商业企业

综合水质评价方法概述

综合水质评价方法概述目前在综合水质评价中应用较多典型评价方法包括：单因子评价法、污染指数法、模糊数学评价法、灰色系统评价法、层次分析评价法、物源分析评价法、人工神经网络评价法，以及水质标识指数评价法。单因子评价法单因子评价法是分别将各个水质标准规定的水质指标进行对比分析，在所有参与综合水质评价的水质指标中，选择水质最差的单项指标所属类别来确定所属水域综合水质类别；单因子指数评价计算简单，且可清晰判断出主要污染因子及其主要污染区水域。我国在水质监测公报中，便采用了单因子评价水体综合水质。单因子指数P由一位整数、小数点后二位或三位有效数字组成，表示为： X P i3 X X 1 2 式中：X1————第i项水质指标的水质类别； X2————监测数据在X1类水质变化区间中所处位置根据公式按四舍五入的原则计算确定。 X3————水质类别与功能区划设定类别的比较结果，视评价指标的污染程度，X3为一位或两位有效数字。根据Pi的数值可以确定水质类别、水质数据、水环境功能区类别，可以比较水质的污染程度，Pi 越大，水质越差，污染越严重，如果Pi大于6.0，水质劣于V类水。单因子评价法，优点：是简单、易操作。缺点：但单因子评价中污染因子占100％权重，其余因子权重为零，而随水质监测结果不断变化，浓度越大权重越大，随意性较大，不去考虑各因子对水环境影响的差异性，会忽略很多有用的信息，具有一定的局限性。污染指数法污染指数法的基本思想是：①针对单项水质指标，将其实测值与对应的水环境功能区类别与水质标准相比，形成单项污染指数；②对所有参与综合水质评价的单项水质指标，将各指标的单项污染指数通过算数平均、加权平均、连乘及指数等各种数学方法得到一个综合指数，来评价综合水质。优点：指数法综合评价对水质描述是定量的，只要项目、标准、监测结果可靠，综合评价从总体上来讲是能基本反映污染的性质和程度的。并且对于全国流域尺度而言，污染指数法计算简便，便于进行不同水系之间或同一水系不同时问上的基本污染状况和变化的比较。缺点：选择不同的污染因子会使污染指数值出现波动，当水体的某些污染物评价标准值很低，而这些污染物未被检出时，依据数据的填报原则，就将其报为检出限的一半。此时进行污染指数计算就会夸大水污染程度。模糊数学评价法模糊数学理论是美国理论控制专家L.A.Zadeh于1965年提出的。在水环境质量综合评价中，涉及大量的复杂现象和多种因素的相互作用，也存在大量的模糊现象和模糊概念，因此水质评价也可以采用模糊数学的方法进行定量化处理。模糊数学评价法包括模糊综合评判法、模糊聚类法、模糊模式识别法等，其中最典型的方法是模糊综合评判法，其基本思想是：①构造水质指标对各类水质类别的隶属函数；②根据隶属度函数，计算水质指标实测值对各类水质类别的隶属度，构造模糊关系矩阵；③计算各类水质指标的权重，构造权重向量；④将权重向量和模糊关系矩阵相乘，得到综合水质对各类水质类别的隶属度，最终判断出评价样本的综合水质级别。优点：当在水环境质量综合评价中，涉及到大量的复杂现象和多种因素的相互作用时，用模糊关系合成原理，可将一些边界不清、不易定量化的因素定量化。缺点：当水质评

多元统计分析重点归纳.归纳.docx

多元统计分析重点宿舍版第一讲：多元统计方法及应用；多元统计方法分类（按变量、模型、因变量等）多元统计分析应用选择题：①数据或结构性简化运用的方法有：多元回归分析，聚类分析，主成分分析，因子分析 ②分类和组合运用的方法有：判别分析，聚类分析，主成分分析 ③变量之间的相关关系运用的方法有：多元回归，主成分分析，因子分析， ④预测与决策运用的方法有：多元回归，判别分析，聚类分析 ⑤横贯数据：{因果模型(因变量数)：多元回归，判别分析相依模型(变量测度)：因子分析，聚类分析多元统计分析方法选择题：①多元统计方法的分类：1）按测量数据的来源分为：横贯数据（同一时间不同案例的观测数据），纵观数据（同样案例在不同时间的多次观测数据） 2）按变量的测度等级（数据类型）分为：类别（非测量型）变量，数值型（测量型）变量 3）按分析模型的属性分为：因果模型，相依模型 4）按模型中因变量的数量分为：单因变量模型，多因变量模型，多层因果模型第二讲：计算均值、协差阵、相关阵；相互独立性第三讲：主成分定义、应用及基本思想，主成分性质，主成分分析步骤主成分定义：何谓主成分分析就是将原来的多个指标（变量）线性组合成几个新的相互无关的综合指标（主成分），并使新的综合指标尽可能多地反映原来的指标信息。主成分分析的应用：（1）数据的压缩、结构的简化；（2）样品的综合评价，排序主成分分析概述——思想：①（1）把给定的一组变量X1,X2,…XP ,通过线性变换，转换为一组不相关的变量Y1，Y2，…YP 。（2）在这种变换中，保持变量的总方差（X1，X2，…Xp 的方差之和）不变，同时，使Y1具有最大方差，称为第一主成分；Y2具有次大方差，称为第二主成分。依次类推，原来有P 个变量，就可以转换出P 个主

多元统计分析自己写

多元统计分析有哪些应用? 比较关系预测分类评价各种应用对应的多元统计分析方法比较：多元方差分析关系：回归模型预测：回归模型分类：聚类分析与判别分析、回归模型评价：主成分分析与因子分析 ?多元回归、logisitic回归、Cox回归、Poisson回归多元统计分析方法主要内容多元T检验、多元方差分析 ?Hotelling T2 ?multivariate analysis of variance (MANOV A) 多元线性回归(multivariate linear regression) logistic回归(logistic regression) Cox比例风险模型(Cox model) Poisson回归(Poisson regression) 聚类分析(cluster analysis) 判别分析(discriminant analysis) 主成分分析和因子分析生存分析本课程的要求上机做练习，分析实际资料学会看文献，判断统计分析的应用是否正确统计软件SAS，或Stata, SPSS10.01 考试：理论占30%，实验占70% 二、多元统计分析的基本概念研究因素从广义的角度看，所有可以测量的变量都可以成为研究因素，比如：年龄、性别、文化程度、人体的各种生物学特征和生理生化指标环境因素、心理因素等。狭义来看，研究因素是指可能与研究目的有关的影响因素多元统计分析对多变量样本的要求 ①分布：多元正态分布、相互独立、多元方差齐 ②样本含量目前尚没有多元分析的样本含量估计方法，一般认为样本含量应超过研究因素5-10倍以上即可。数值变量→分类成有序分类变量哑变量的数量=K-1（K为分类数）

数学建模多元统计分析

实验报告一、实验名称多元统计分析作业题。二、实验目的（一）了解并掌握主成分分析与因子分析的基本原理和简单解法。（二）学会使用matlab编写程序进行因子分析，求得特征值、特征向量、载荷矩阵等值。（三）学会使用排序、元胞数组、图像表示最后的结果，使结果更加直观。三、实验内容与要求

四、实验原理与步骤（一）第一题： 1、实验原理：因子分析简介： (1) 1.1 基本因子分析模型设p维总体x=(x1,x2,....,xp)'的均值为u=(u1,u2,....,u3)'，因子分析的一般模型为 x1=u1+a11f1+a12f2+........+a1mfm+ε 1 x2=u2+a21f1+a22f2+........+a2mfm+ε 2 ......... xp=up+ap1f1+fp2f2+..........+apmfm+εp 其中，f1,f2,.....,fm为m个公共因子；εi是变量xi(i=1,2,.....,p)所独有的特殊因子，他们都是不可观测的隐变量。称aij(i=1,2,.....,p;j=1,2,.....,m)为变量xi的公共因子fi上的载荷，它反映了公共因子对变量的重要程度，对解释公共因子具有重要的作用。上式可以写为矩阵形式 x=u+Af+ε

其中A=(aij)pxm 称为因子载荷矩阵；f=(f1,f2,....,fm)'为公共因子向量；ε=(ε1,ε2,.....εp)称为特殊因子向量 (2) 1.2 共性方差与特殊方差 xi的方差var(xi)由两部分组成，一个是公共因子对xi方差的贡献，称为共性方差；一个是特殊因子对xi方差的贡献，称为特殊方差。每个原始变量的方差都被分成了共性方差和特殊方差两部分。 (3) 1.3 因子旋转因子分析的主要目的是对公共因子给出符合实际意义的合理解释，解释的依据就是因子载荷阵的个列元素的取值。当因子载荷阵某一列上各元素的绝对值差距较大时，并且绝对值大的元素较少时，则该公共因子就易于解释，反之，公共因子的解释就比较困难。此时可以考虑对因子和因子载荷进行旋转（例如正交旋转），使得旋转后的因子载荷阵的各列元素的绝对值尽可能量两极分化，这样就使得因子的解释变得容易。因子旋转方法有正交旋转和斜交旋转两种，这里只介绍一种普遍使用的正交旋转法：最大方差旋转。这种旋转方法的目的是使因子载荷阵每列上的各元素的绝对值（或平方值）尽可能地向两极分化，即少数元素的绝对值（或平方值）取尽可能大的值，而其他元素尽量接近于0. (4) 1.4 因子得分在对公共因子做出合理解释后，有时还需要求出各观测所对应的各个公共因子的得分，就比如我们知道某个女孩是一个美女，可能很多人更关心该给她的脸蛋、身材等各打多少分，常用的求因子得分的方法有加权最小二乘法和回归法。注意：因子载荷矩阵和得分矩阵的区别：因子载荷矩阵是各个原始变量的因子表达式的系数，表达提取的公因子对原始变量的影响程度。因子得分矩阵表示各项指标变量与提取的公因子之间的关系，在某一公因子上得分高，表明该指标与该公因子之间关系越密切。简单说，通过因子载荷矩阵可以得到原始指标变量的线性组合，如X1=a11*F1+a12*F2+a13*F3,其中X1为指标变量1，a11、a12、a13分别为与变量X1在同一行的因子载荷，F1、F2、F3分别为提取的公因子；通过因子得分矩阵可以得到公因子的线性组合，如F1=a11*X1+a21*X2+a31*X3，字母代表的意义同上。 (5) 1.5 因子分析中的Heywood（海伍德）现象如果x的各个分量都已经标准化了，则其方差=1。即共性方差与特殊方差的和为1。也就是说共性方差与特殊方差均大于0，并且小于1。但在实际进行参数估计的时候，共性方差

水质综合评价的方法

水质综合评价的方法水环境质量评价，就是通过一定的数理方法与手段，对某一水环境区域进行环境要素分析，对其作出定量描述通过水环境质量评价，摸清区域水环境质量发展趋势及其变化规律，为区域环境系统的污染控制规划及区域环境系统工程方案的制定提供依据。 1.指数评价法指数评价法可分为单因子污染指数法和水质综合污染指数法，单因子污染指数表示单项污染物对水质污染影响的程度，水质综合污染指数表示多项污染物对水质综合污染的影响程度。 (1)单因子污染指数法单因子污染指数法是将某种污染物实测浓度与该种污染物的评价标准进行比较以确定水质类别的方法。即将每个水质监测参数与《国家地面水环境质量标准》(GB3838—2002)进行比较，确定水质类别，最后选择其中最差级别作为该区域的水质状况类别。 (2)水质综合污染指数法水质综合污染指数法是指在求出各个单一因子污染指数的基础上，再经过数学运算得到一个水质综合污染指数，据此评价水质，并对水质进行分类的方法。对分指数的处理不同，决定了指数法的不同形式，有诸如简单迭加型指数、算术平均型指数、加权平均型指数、罗斯水质指数、内梅罗指数、黄浦江污染指数、豪顿水质指数等。单因子污染指数只能代表一种污染物对水质污染的程度，不能反映水质整体污染程度：综合污染指数法是对整体水质做出的定量描述，这样的评价结果只能定性地说明污染程度是轻、严重还是非常严重，不能确定其功能类别为几类。但是，只要项目、标准、监测结果可靠，综合评价在总体上是可以基本反映水体污染性质与程度的，而且便于同一水

体在时间上、空间上的基本污染状况和变化的比较，所以现在进行水质污染评价时常采用这种方法。 2.基于模糊理论的水环境评价法由于水体环境本身存在大量的不确定因素，各个项目的级别划分、标准确定都具有模糊性。因此，模糊数学在水质综合评价中得到广泛应用。具有代表性的方法有：模糊综合评判法、模糊概率法、模糊综合指数法等，其中应用较多的是模糊综合评判法，这种方法根据各污染物的超标情况进行加权，但污染物毒性与浓度不成简单的比例关系，因此，这种加权不一定符合实际情况。从理论上讲，模糊评价法体现了水环境中客观存在的模糊性和不确定性，符合客观规律，具有一定的合理性。但从目前的研究情况来看，采用线性加权平均极型得到的评判集易出现失真、失效、跳跃等现象，存在水质类别判断不准或结果不可比的问题，可操作性较差。 3.基于灰色系统理论的水环境评价法由于水环境质量数据都是在有限的时间和空间内监测得到的，信息是不完全的或不确切的，因此，可将水环境系统视为一个灰色系统，即部分信息已知、部分信息未知或不确知的系统，据此对水环境进行综合评价。基于灰色系统理论的水质评价法通过计算评价水质中各因子的实测浓度与各级水质标准的关联度大小确定评价水质的级别。根据同类水体与该类标准水体的关联度大小还可以进行优劣比较，水质综合评价的灰色系统方法有灰色聚类法、灰色贴近度分析法、灰色关联评价法等。灰色评价法体现了水环境系统的不确定性，在理论上是可行的，虽然分辨率低，但具有简单、可比的优点，而且由于影响水环境的变化因素不断增多、不断变化，水环境的不确定性逐渐增加，所以灰色评价法在水环境质量评价中应用日益广泛。 4.基于人工神经网络的水环境评价法

水质综合污染指数评价方法(优推材料)

水质综合污染指数一、水质综合污染指数的计算水质综合污染指数是在单项污染指数评价的基础上计算得到的。考虑到上海地表水污染特点，在计算水质综合污染指数时通常选择上海市具有代表性的污染物，包括高锰酸盐指数、五日生化需氧量、化学需氧量、氨氮、石油类、挥发酚、总磷和汞。也可以根据需要选择必要的污染物参与评价。应该注意到，水质综合污染指数的计算与水质类别标准密切相关，因此综合污染指数的比较只能在同一类别标准基础上进行。二、水质污染程度的判别

根据水质综合污染指数来判别污染程度是相对的，即对应于水体功能要求评判其污染程度。如II类水体的水质要求明显高于III类、IV类、V类水体，假如不同类别水体的水质相同，则要求越高的水体，其对应的污染程度越严重。根据水质综合污染指数判别水质污染程度必须基于下列条件：（1）污染程度是对应于相应类别的水质要求的。（2）污染程度的分级是为了定性反映水质的现状，水体污染说明该水域原定的功能不能安全、全面地发挥效应，其功能得不到保证。不同功能水体即使达到相同的污染程度，其危害和影响也是各不相同的。（3）根据水质综合指数的大小可将水体分为合格、基本合格、污染和重污染四类。当采用上述八项污染物进行评价时，不同类型水体相对应的综合指数

和水质现状阐述如下：合格：P≤0.8，各项水质指标基本上能达到相应的功能标准，即使有个别指标超标，但超标倍数较小（1倍以内），水体功能可以得到充分发挥，没有明显的制约因素。基本合格：0.82.0，各项水体指标的总体均值已超过标

水质评价国标

附件：地表水环境质量评价办法（试行）二○一一年三月 —3—

目录一、基本规定 (6) （一）评价指标 (6) 1.水质评价指标 (6) 2.营养状态评价指标 (6) （二）数据统计 (6) 1.周、旬、月评价 (6) 2.季度评价 (6) 3.年度评价 (6) 二、评价方法 (7) （一）河流水质评价方法 (7) 1.断面水质评价 (7) 2.河流、流域（水系）水质评价 (7) 3.主要污染指标的确定 (8) （二）湖泊、水库评价方法 (9) 1.水质评价 (9) 2.营养状态评价 (10) （三）全国及区域水质评价 (11) 三、水质变化趋势分析方法 (12) （一）基本要求 (12) （二）不同时段定量比较 (12) —4—

（三）水质变化趋势分析 (13) 1.不同时段水质变化趋势评价 (13) 2.多时段的变化趋势评价 (14) 附录一：污染变化趋势的定量分析方法 (15) 附录二：术语和定义 (17) —5—

为客观反映地表水环境质量状况及其变化趋势，依据《地表水环境质量标准》（GB3838-2002）和有关技术规范，制定本办法。本办法主要用于评价全国地表水环境质量状况，地表水环境功能区达标评价按功能区划分的有关要求进行。一、基本规定（一）评价指标 1.水质评价指标地表水水质评价指标为：《地表水环境质量标准》（GB3838-2002）表1中除水温、总氮、粪大肠菌群以外的21项指标。水温、总氮、粪大肠菌群作为参考指标单独评价（河流总氮除外）。 2.营养状态评价指标湖泊、水库营养状态评价指标为：叶绿素a（chla）、总磷（TP）、总氮（TN）、透明度（SD）和高锰酸盐指数（COD Mn）共5项。（二）数据统计 1.周、旬、月评价可采用一次监测数据评价；有多次监测数据时，应采用多次监测结果的算术平均值进行评价。 2.季度评价一般应采用2次以上（含2次）监测数据的算术平均值进行评价。 3.年度评价国控断面（点位）每月监测一次，全国地表水环境质量年度评—6—

生物统计学第九章多元统计分析

第九章多元统计分析简介多元统计分析主要研究多个变量之间的关系以及具有这些变量的个体之间的关系。无论是自然科学还是社会科学，无论是理论研究还是应用决策，多元统计分析都有较广泛的应用。近年来，随着计算机的普及和广泛应用，多元统计分析的应用越来越广泛，越来越深入。生物学研究中，有许多问题要考虑样本与样本之间的关系、性状与性状之间的关系，也要考虑样本与性状之间的关系，为了能够正确处理这些错综复杂的关系，就需要借助于多元统计分析方法来解决这些问题。从应用的观点看，多元统计分析就是要研究多个变量之间的关系，但哪些问题才是多元统计的内容，并无严格的界限。一般认为，典型的多元统计分析主要可以归结为两类问题：第一类是决定某一样本的归属问题：根据某样品的多个性状（特征）判定其所属的总体。如判别分析、聚类分析即属于此类内容。第二类问题是设法降低变量维数，同时将变量变为独立变量，以便更好地说明多变量之间的关系。主成分分析、因子分析和典型相关分析均属于此类问题。此外，多因素方差分析、多元回归与多元相关分析和时间序列分析，均是研究一个变量和多个变量之间的关系的，也是多元统计分析的内容。第一节聚类分析(Cluster Analysis) 聚类分析是研究分类问题的一种多元统计方法，聚类分析方法比较粗糙，但由于这种方法能解决许多实际问题，应用比较方便，因此越来越受到人们的重视。近年来聚类分析发展较快，内容也越来越多。常见的有系统聚类、模糊聚类、灰色聚类、信息聚类、图论聚类、动态聚类、最优分割、概率聚类等方法，本节重点介绍系统聚类法。系统聚类法是目前应用较多的聚类分析方法，这种聚类方法从一批样本的多个观测指标(变量)中，找出能度量样本之间相似程度的统计数，构成一个相似矩阵，在此基础上计算出样本(或变量)之间或样本组合之间的相似程度或距离，按相似程度或距离大小将样本(或变量)逐一归类，关系密切的归类聚集到一个小分类单位，关系疏远的聚集到一个大的分类单位，直到把所有样本(或变量)都聚集完毕，形成一个亲疏关系谱系图，直观地显示分类对象的差异和联系。第二节判别分析(Discriminant Analysis) 判别分析是多元统计分析中较为成熟的一类分类方法，它是根据两个或多个总体的观测结果，按照一定的判别准则和相应的判别函数，来判断某一样本属于哪一类总体。判别分析的内容很多，常见的有距离判别、贝叶斯判别、费歇判别、逐步判别、序贯判别等方法。第三节主成分分析（Principal components analysis）

应用多元统计分析应用报告(DOC)

应用多元统计分析课程报告班级专业:_ 市调0901 _ 学号: 2009***** __ 姓名:__ CYQ _____ 成绩:______________ 2010年10月7日

我国部分城市主要经济指标统计 ——官方与民间数据差异分析一、引言经济指标是反映一定社会经济现象数量方面的名称及其数值。本题主要经济指标包括人均GDP 1x （元）、人均工业产值2x （元）、客运总量3x （万人）、货运总量4x （万吨）、5x （亿元）、固定资产投资总额6x （亿元）、在岗职工占总人口的比例7x （％）、在岗职工人均工资额8x （元）、城乡居民年底储蓄余额9x （亿元）。所以我们借助这一指标体系对我国部分城市的主要经济指标进行分析。二、数据分析过程 1. 在SPSS 窗口中选择Analyze→Classify→Hierachical Cluster ，调出系统聚类分析主界面，并将变量X 1～X 5移入Variables 框中。在Cluster 栏中选择Cases 单选按钮，即对样品进行聚类（若选择Variables ，则对变量进行聚类）。在Display 栏中选择Statistics 和Plots 复选框，这样在结果输出窗口中可以同时得到聚类结果统计量和统计图。

2. 点击Statistics按钮，设置在结果输出窗口中给出的聚类分析统计量。这里我们选择系统默认值，点击Continue按钮，返回主界面。 3. 点击Plots按钮，设置结果输出窗口中给出的聚类分析统计图。选中Dendrogram复选框和Icicle栏中的None单选按钮，即只给出聚类树形图，而不给出冰柱图。单击Continue按钮，返回主界面。 4. 点击Method按钮，设置系统聚类的方法选项。这里我们仍然均沿用系统默认选项。单击Continue按钮，返回主界面。 5. 点击Save按钮，指定保存在数据文件中的用于表明聚类结果的新变量。None表示不保存任何新变量；Single solution表示生成一

多元统计分析的重点和内容和方法

一、什么是多元统计分析 ?多元统计分析是运用数理统计的方法来研究多变量（多指标）问题的理论和方法，是一元统计学的推广。 ?多元统计分析是研究多个随机变量之间相互依赖关系以及内在统计规律的一门统计学科。二、多元统计分析的内容和方法 ?1、简化数据结构（降维问题）将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量，使研究问题得到简化但损失的信息又不太多。（1）主成分分析（2）因子分析（3）对应分析等 ?2、分类与判别（归类问题）对所考察的变量按相似程度进行分类。（1）聚类分析：根据分析样本的各研究变量，将性质相似的样本归为一类的方法。（2）判别分析：判别样本应属何种类型的统计方法。例5：根据信息基础设施的发展状况，对世界20个国家和地区进行分类。考察指标有6个： 1、X1：每千居民拥有固定电话数目 2、X2：每千人拥有移动电话数目 3、X3：高峰时期每三分钟国际电话的成本 4、X4：每千人拥有电脑的数目 5、X5：每千人中电脑使用率 6、X6：每千人中开通互联网的人数 ?3、变量间的相互联系一是：分析一个或几个变量的变化是否依赖另一些变量的变化。（回归分析）二是：两组变量间的相互关系（典型相关分析） ?4、多元数据的统计推断点估计参数估计区间估计统u检验计参数t检验推F检验断假设相关与回归检验卡方检验非参秩和检验秩相关检验 ?1、假设检验的基本原理

小概率事件原理 ? 小概率思想是指小概率事件（P<0.01或P<0.05等）在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0)，再用适当的统计方法确定假设成立的可能性大小，如可能性小,则认为假设不成立；反之，则认为假设成立。 ? 2、假设检验的步骤（1）提出一个原假设和备择假设 ? 例如：要对妇女的平均身高进行检验，可以先假设妇女身高的均值等于 160 cm （u=160cm ）。这种原假设也称为零假设（ null hypothesis ），记为 H 0 。 2.1 均值向量的检验 ? 1、正态总体均值检验的类型 ? 根据样本对其总体均值大小进行检验（ One-Sample T Test ）如妇女身高的检验。 ? 根据来自两个总体的独立样本对其总体均值的检验（ Indepent Two-Sample T Test ）如两个班平均成绩的检验。 ? 配对样本的检验（ Pair-Sample T Test ）如减肥效果的检验。 ? 多个总体均值的检验 ? A 、总体方差已知用u 检验，检验的拒绝域为即 ? B 、总体方差未知用样本方差代替总体方差，这种检验叫t 检验. （2）根据来自两个总体的独立样本对其总体均值的检验 ? 目的是推断两个样本分别代表的总体均数是否相等。其检验过程与上述两种t 检验也没有大的差别，只是假设的表达和t 值的计算公式不同。 ? 两样本均数比较的t 检验,其假设一般为： 12 { }W z u α- =>112 2 {} W z u z u αα - - =<->或2 s 2σ Ⅲ 0μμ= 0μμ< α--<1u z )1(1--<-n t t α

文档之家

基于多元统计分析的水质综合评价

多元统计分析期末复习试题

应用多元统计分析试题及答案

用模糊数学综合评价法对水质进行评价

多元统计分析课程设计

水质综合污染指数评价方法

多元统计分析方法在商业企业中的应用_党玮

综合水质评价方法概述

多元统计分析重点归纳.归纳.docx

多元统计分析自己写

数学建模多元统计分析

水质综合评价的方法

水质综合污染指数评价方法(优推材料)

水质评价国标

生物统计学 第九章 多元统计分析

应用多元统计分析应用报告(DOC)

多元统计分析的重点和内容和方法

生物统计学第九章多元统计分析