当前位置:文档之家› Bayes判别

Bayes判别

第三节Bayes判别

本节内容

贝叶斯公式

最大后验概率准则

最小平均误判代价准则

Bayes判别的基本方法

案例分析

距离判别法的缺点

第一,把总体等同看待,没有考虑到总体会以

1

不同的概率出现,认为判别方法与总体各自出

现的概率的大小无关。

2

第二,判别方法与错判之后所造成的损失无关,

没有考虑误判之后所造成的损失差异。

贝叶斯(Bayes)公式

贝叶斯统计的基本思想:假定对研究的对象已有一定的认

识,常用先验概率分布来描述这种认识,然后我们取得一

个样本,用样本来修正已有的认识(先验概率分布),得

到后验概率分布,各种统计推断都通过后验概率分布进行,

将贝叶斯思想用于判别分析,就得到贝叶斯判别。

某公司新入职雇员小王,小王是好员工还是坏员工大家都在猜测。按人们先验的主观猜测,新人是好员工或坏员工的概率均为0.5。坏员工总是无法按时完成工作,偶尔也可以顺利完成;好员工一般都能按时完成任务,但偶尔也会出现工作失误:一般好员工按时完成工作的概率为0.9,坏员工按时完成工作的概率为0.2。近日,小王按时完成了一项工作任务,请问小王此时是好员工的概率有多大?

“先验概率”是一种权重(比例),所谓“先验”,是指我们在抽

样以前,就已经知道的 ;贝叶斯判别需要研究的“后验概率”,

就是当样本X 已知时,它属于G i 的概率

。()i P G ()i P G X 由此,使用“最大后验概率准则”得到的贝叶斯判别规则为:

1,()max ()

≤≤∈=l l i i k

X G P G X P G X 如果

最大后验概率准则没有涉及误判的代价,因此,在各种误判代价明显不同的场合,该准则就失效了。设有k 个总体

,其各自的分布密度函数 互不相同,假设k 个总体各自出现的概率分别为 (先验概率), , 。假设若将本来属于G i 总体的样品错判到总体G j 时造成的损失为

, 。 在这样的情形下,对于新的样品X 判断其来自哪个总体。

问题

12,,,k G G G ???()()()12,,,k f X f X f X ???12,,,k q q q ???0

≥i q 1

1k

i i q ==∑(|)C j i , 1.2,,=???i j k

显然 、 ,对于任意的 成立。设k 个总体

相应的p 维样本空间为 ,即为一个划分,故我们可以简记一个判别规则为

。12,,,k G G G ???(|)0≥C j i , 1.2,,=???i j k (|)0=C i i 12,,,k R R R ???12(,,,)= k R R R R

故在规则R 下,将属于G i 的样品错判为G j 的后验概率为 如果实属G i 的样品,错判到其它总体 所造成的损失为

,则这种判别规则R 对总体G i 而言,样品错判后所造成的平均损失为 其中 ;

为原本属于总体G i ,但在R 规则下,被误判入总体G i 的概率。

(1|),,(1|),(1|),(|)-+ C i C i i C i i C k i 1,2,,= i k

1(|)(1|)(1|,)(|)(|,)

[(|)(|,)]

==++=∑ k

j r i R C i P i R C k i P k i R C j i P j i R 111,,,,-+ i i k

G G G G (|,)()x x

=?j

i R P j i R f d ,1,2,,=≠ i j k i j

(|)0=C i i (|,)P j i R

由于k 个总体

出现的先验概率分别为 ,则用规则R 来进行判别所造成的总平均损失为

(1)总平均损失

也称为“错判平均损失”(ECM ,Expected Cost of Misclassification )

所谓“最小平均误判代价准则”,就是要选择

,使得总平均损失

达到极小。11(|)(|,)

===∑∑k k

i i j q C j i P j i R ()g R 12,,, k q q q 1

()(|)

k

i i g R q r i R ==∑12,,,k G G G ???12,,,???k R R R ()g R

则误判的总平均损失为:

这样,我们以Bayes 判别的思想得到的划分

,(也即判别准则)为:

具体说来,当抽取了一个未知总体的样本值X ,要判断它属于哪个总体,只要先计算出k 个按先验分布加权的误判平均损失:

然后再比较这k 个误判平均损失

的大小,选取其中最小的,则判定样品X 来自该总体。

12(,,,)= k R R R R 1,2,,= i k

1{|()min ()}

x x x ≤≤==i i j j k

R h h 1()(|)()

x x ==∑k

j i i i h q C j i f 1,2,,= j k

12(),(),,()x x x k h h h

这里我们看一个特殊情形,当k =2时,

同理,有 又因为贝叶斯判别规则为: 所以: 2

111221

22()(1|)()(1|1)()(1|2)()(1|2)()

x x x x x ===+=∑i i i h q C i f q C f q C f q C f 211()(2|1)()x x =h q C f 112{|()()}x x x =≤R h h 12211{|(1|2)()(2|1)()}

x x x =≤R q C f q C f 22211{|(1|2)()(2|1)()}

x x x =>R q C f q C f 212{|()()}

x x x =≥R h h 1()(|)()

x x ==∑k

j i i i h q C j i f

或者表示成:

若令 ,

则判别规则可表示为

12121()(1|2)

{|}

()(2|1)

x x x =≥f q C R f q C 12221()(1|2)

{|}

()(2|1)

x x x =

()()

x x x =f V f 12,(),()x x x x ∈≥??∈

当当21(1|2)(2|1)

=

q C d q C

一般会假设总体的分布密度为正态分布,即:

()1()

1/2

11()exp[()()](2)2

-'=--∑-∑i i i i i f x x x μμπ

某杂志每年会对互联网行业的企业进行排行分类,一般分为上升企业和稳定企业。其分类方法,是按照一定权重将营收、薪资水平等指标求和,计算出一个综合指标。

已知上升型企业的密度函数为1(),稳定企业的密度函数为(),如果分类出现错误,可能会给杂志带来一定的负面影2

响,错判损失(1│2)=4,(2│1)=12。根据以往经验,

=0.4,2=0.6。

1

现在,算得一个新的企业0的两个密度函数分别为1 (

)=0.24,2 (0 )=0.36,判断该企业属于哪类企业

解: 判别规则为:

所以,企业x 0应来自总体G 1,即为稳定企业

21(1|2)0.641(2|1)0.4122?===

?q C d q C 12

1,()21

,()2

x x x x ?

∈≥???

?∈

()()0.3632

x x x ===>

f V f

Bayes 判别分析及应用 201009014119

Bayes 判别分析及应用 班级:计算B101姓名:孔维文 学号201009014119 指导老师:谭立云教授 【摘 要】判别分析是根据所研究个体的某些指标的观测值来推断该个体所属类型的一种统计方 法,在社会生产和科学研究上应用十分广泛。在判别分析之前,我们往往已对各总体有一定了解,样品的先验概率也对其预测起到一定作用,因此进行判别时应考虑到各个总体出现的先验概率;由于在实际问题中,样品错判后会造成一定损失,故判别时还要考虑到预报的先验概率及错判造成的损失,Bayes 判别就具有这些优点;然而当样品容量大时计算较复杂,故而常借助统计软件来实现。本文着重于Bayes 判别分析的应用以及SPSS 的实现。 【关键词 】 判别分析 Bayes 判别 Spss 实现 判别函数 判别准则 Class: calculation B101 name: KongWeiWen registration number 201009014119 Teacher: TanLiYun professor .【Abstract 】Discriminant analysis is based on the study of certain indicators of individual observations to infer that the individual belongs as a type of statistical methods in social production and scientific research is widely used. In discriminant analysis, we often have a certain understanding of the overall sample of the a priori probability of its prediction play a role, it should be taken into account to determine the overall emergence of various prior probability; because of practical problems, samples will result in some loss of miscarriage of justice, so identification must be considered when the prior probability and wrongly predicted loss, Bayes discriminant to have these advantages; However, when the sample is large computing capacity of more complex, often using statistical software Guer to achieve. This article focuses on the application of Bayes discriminant analysis, and implementation of SPSS. 【Key words 】 Discriminant analysis; Bayes discriminant; Spss achieve; Discriminant function; Criteria; 1.1.1 判别分析的概念 在科学研究中,经常会遇到这样的问题:某研究对象以某种方式(如先前的结果或经验)已划分成若干类型,而每一种类型都是用一些指标T p X X X X ),,(21 来表征的,即不同类型的X 的观测值在某种意义上有一定的差异。当得到一个新样品(或

贝叶斯判别习题

1. 办公室新来了一个雇员小王,小王是好人还是 坏人大家都在猜测。按人们主观意识,一个人是好人或坏人的概率均为0.5。坏人总是要做坏事,好人总是做好事,偶尔也会做一件坏事,一般好人做好事的概率为0.9,坏人做好事的概率为0.2,一天,小王做了一件好事,小王是好人的概率有多大,你现在把小王判为何种人。 解:A :小王是个好人 a :小王做好事 B :小王是个坏人 B :小王做坏事 ()(/)(/)()(/)()(/)P A P a A P A a P A P a A P B P a B = +0.5*0.9 0.820.5*0.90.5*0.2==+ ()(/)0.5*0.2 (/)()(/)()(/)0.5*0.90.5*0.2 P B P a B P B b P A P a A P B P a B = =++=0.18 0.82>0.18 所以小王是个好人、 2. 设 m = 1,k = 2 ,X 1 ~ N (0,1) ,X 2 ~ N (3,2 2 ) ,试就C(2 | 1) = 1,C(1 | 2) = 1,且不考虑先验概率的情况下判别样品

2,1 属于哪个总体,并求出 R = (R1, R2 ) 。 解: 2222 121/821 ()()/}1,2 21(2)(20)}0.05421(2)(23)/4}0.176 2i i i P x x i P P μσ--= --== --===--== 由于1(2)P <2(2)P ,所以2属于2π 21/2 121/221(1)(10)}0.242 21(1)(13)/4}0.120 2P P --= --===--== 1(1)P >2(1)P ,所以1属于1π 由 1()P x 22211 }()(3)/4}22x P x x -==-- 即221 exp{}2x -=21exp{(69)}8 x x --+ 2211 ln 2(69)28 x x x -=--+ 解得 1 x =1.42 2 x =-3.14.所以 R=([-3.41,1.42],(-∞,-3.41)U(1.42,+∞)). 3.已知1π,2π的先验分布分别为1q =3 5,2q =25 ,C(2|1)=1,C(1|2)=1,且 11,01()2,120,x x f P x x x <≤??==-<≤???其他 22 (1)/4,13()(5)/4,350,x x f P x x x -<≤?? ==-<≤??? 其他 使判别1x = 95 ,2x =2所属总体。 解:1p (9/5)=2-9/5=1/5 1p (2)=2-2=0 2p (9/5)=(9/5-1)/4=1/5

Bayes判别

§5.2Bayes 判别 1. Bayes 判别的基本思想 假设已知对象的先验概率和“先验条件概率”, 而后得到后验概率, 由后验概率作出判别. 2. 两个总体的Bayes 判别 (1) 基本推导 设概率密度为1()f x 和2()f x 的p 维总体12,G G 出现的先验概率为

1122(),()p P G p P G ==(121p p +=) 先验概率的取法: (i) 121 2 p p == , (ii) 12 121212 ,n n p p n n n n ==++, 一个判别法 = 一个划分=12(,)R R =R 1212,,p R R R R =?=?=?R 距离判别中

112212{|(,)(,)} {|(,)(,)} R d G d G R d G d G =≤=>x x x x x x 判别R 下的误判情况讨论 2 1(2|1,)()d R P f =?R x x , 或 1 2(1|2,)()d R P f =?R x x 代价分别记为 (2|1),(1|2),(1|1)0,(2|2)0c c c c ==,

在得新x 后, 后验概率为 1111122() (|)()()p f P G p f p f = +x x x x 2221122() (|)()() p f P G p f p f = +x x x x (i) 当(1|2)(2|1)c c c ==时, 最优划分是 112212{:(|)(|)} {:(|)(|))} R P G P G R P G P G =≥?? =

典型判别分析与贝叶斯判别的区别

典型判别分析与贝叶斯判别的区别 1.原理不同 典型判别是根据方差分析思想,进行投影,将原来一个维度空间的自变量组合投影到另一维度空间,寻找一个由原始变量组成的线性函数使得组间差异和组内差异的比值最大化。根据样本点计算判别函数,计算判别函数到各类中心的欧式距离,取距离最小的类别。 贝叶斯判别是是利用已知的先验概率去推证将要发生的后验概率,就是计算每个样本的后验概率及其判错率,用最大后验概率来划分样本的分类并使得期望损失达到最小 2.前提条件不同 典型判别不考虑样本的具体分布,只求组间差异和组内差异的比值最大化 贝叶斯判别从样本的多元分布出发,充分利用多元正态分布的概率密度提供的信息计算后验概率,因此需要样本数据服从多元正态分布,方差齐性等。 3.产生的判别函数不同 典型判别根据K类最多产生K-1个判别函数 贝叶斯判别根据K类最多可产生K个判别函数 先验概率在判别分析中的作用 1.所谓先验概率,就是用概率来描述人们事先对所研究的对象的认识的程度,是根据以往经验和分析得到的概率。所谓后验概率,就是根据具体资料、先验概率、特定的判别规则所计算出来的概率。它是对先验概率修正后的结果,它是更接近于实际情况的概率估计。贝叶斯(BAYES)判别思想是根据先验概率求出后验概率,并依据后验概率分布作出统计推断 2.样品的先验概率对预测有一定的作用,反应样本分布的总体趋向性。被判断的个案应该属于先验概率最大总体的概率应该高一些,贝叶斯考虑了先验概率的影响提高判别的敏感度,同时利用先验概率可以求出后验概率(基于平均损失函数)和误判率,从而进行判别分析,充分利用数据的概率密度分布,判别效率高。样品归于概率大的类别。 3.这样使误判平均损失最小。既考虑到不同总体出现机会的差异、各错误判断造成损失的不同,又充分尊重了每个总体的分布状态 判别准则的评价 刀切法:基本思想是每次剔除训练样本中的一个样本,利用其余容量的训练样本建立判别函数,再用所建立的判别函数对删除的那个样本做判别,对训练样本中的每个样品重复上述步骤,已其误判的比例作为误判概率的估计。 判别分析结果 Eigenvalues a First 2 canonical discriminant functions were used in the analysis. 1.判别函数的特征根,方差百分比,累计方差百分比

贝叶斯判别、费希尔判别法的计算机操作及结果分析

贝叶斯判别、费希尔判别法的计算机 操作及结果分析 一、实验内容、目标及要求 (一)实验内容 选取140家上市公司作为样本,其中70家为由于“财务状况异常”而被交易所对其股票实行特别处理(Special Treatment,简称ST)的公司,另外70家为财务正常的公司。为了研究上市公司发生财务困境的可能性,以“是否被ST”为分组变量,选择资产负债率、总资产周转率和总资产利润率几个财务指标作为判别分析变量,这三个指标分别从上市公司的偿债能力、资产管理能力和获利能力三个不同的角度反映了企业的财务状况。 (二)实验目标 贝叶斯判别、费希尔判别法的计算机操作及结果分析。 (三)实验要求 要求学生能熟练应用计算机软件进行判别分析并对结果进行分析,培养实际应用能力。 二、实验准备 (一)运行环境说明 电脑操作系统为Windows XP及以上版本,所需软件为SPSS 16.0。 (二)基础数据设置说明 将数据正确导入SPSS,设置相应的变量值。

三、实验基本操作流程及说明 (一)系统界面及说明 同实验一。 (二)操作步骤 1. 选择菜单项Analyze→Classify→Discriminate,打开Discriminate Analysis对话框,如图4-1。将分组变量st移入Grouping V ariable列表框中,将自变量x1-x3选入Independents 列表框中。 选择Enter independents together单选按钮,即使用所有自变量进行判别分析。若选择了Use stepwise method单选按钮,则可以根据不同自变量对判别贡献的大小进行变量筛选,此时,对话框下方的Method按钮被激活,可以通过点击该按钮设置变量筛选的方法及变量筛选的标准。 图4-1 Discriminate Analysis对话框 2. 单击Define Range按钮,在打开的Define Range子对话框中定义分组变量的取值范围。本例中分类变量的取值范围为0到1,所以在Minimum和Maximum输入框中分别输入0和1。单击Continue按钮,返回主对话框。 3. 如果不想使用全部的样本进行分析,单击Select按钮,则Discriminate Analysis对话框下方会跳出一个Selection Variable列表框,将一个选择变量移入Selection Variable列表框,并单击Rule按钮,设置选择条件。这样,只有满足选择条件的观测才能参与判别分析。 4. 单击Statistics按钮,在跳出的Statistics子对话框中指定输出的描述统计量和判别函数系数。该对话框中各选项的含义如下: Descriptives选项栏:输出原始数据的描述性统计量 ◆Means:输出各类中所有自变量的均值、组内标准差以及总样本的均值和标准差; ◆Univariate ANOV A:进行单因素方差分析,检验的原假设为不同类别中自变量的均 值不存在显著差异; ◆Box’s M:对各类的协方差矩阵是否相等进行检验。 Matrices选项栏:输出各种不同的协差阵和相关系数矩阵 ◆Within-groups correlation matrix:平均组内相关系数矩阵,它是由平均组内协差阵

实验报告Bayes判别

实验报告Bayes判别 部门: xxx 时间: xxx 整理范文,仅供参考,可下载自行编辑

实验十一Bayes判别 实验目的和要求 掌握Bayes判别分析的理论与方法、模型的建立与误差率估计;掌握利用判别分析的SAS 过程解决有关实际问题. 实验要求:编写程序,结果分析. 实验内容:5.4 5.5 选一题 data examp5_4。 input group $ x1-x7 @@。 cards。 G1 6.6 39 1.0 6.0 6 0.12 20 G1 6.6 39 1.0 6.0 12 0.12 20 G1 6.1 47 1.0 6.0 6 0.08 12 G1 6.1 47 1.0 6.0 12 0.08 12 G1 8.4 32 2.0 7.5 19 0.35 75 G1 7.2 6 1.0 7.0 28 0.30 30 G1 8.4 113 3.5 6.0 18 0.15 75 G1 7.5 52 1.0 6.0 12 0.16 40 G1 7.5 52 3.5 7.5 6 0.16 40 G1 8.3 113 0.0 7.5 35 0.12 180 G1 7.8 172 1.0 3.5 14 0.21 45 G1 7.8 172 1.5 3.0 15 0.21 45

G2 8.4 32 2.0 9.0 10 0.35 75 G2 8.4 32 2.5 4.0 10 0.35 75 G2 6.3 11 4.5 7.5 3 0.20 15 G2 7.0 8 4.5 4.5 9 0.25 30 G2 7.0 8 6.0 7.5 4 0.25 30 G2 7.0 8 1.5 6.0 1 0.25 30 G2 8.3 161 1.5 4.0 4 0.08 70 G2 8.3 161 0.5 2.5 1 0.08 70 G2 7.2 6 3.5 4.0 12 0.30 30 G2 7.2 6 1.0 3.0 3 0.30 30 G2 7.2 6 1.0 6.0 5 0.30 30 G2 5.5 6 2.5 3.0 7 0.18 18 G2 8.4 113 3.5 4.5 6 0.15 75 G2 8.4 113 3.5 4.5 8 0.15 75 G2 7.5 52 1.0 6.0 6 0.16 40 G2 7.5 52 1.0 7.5 8 0.16 40 G2 8.3 97 0.0 6.0 5 0.15 180 G2 8.3 97 2.5 6.0 5 0.15 180 G2 8.3 89 0.0 6.0 10 0.16 180 G2 8.3 56 1.5 6.0 13 0.25 180 G2 7.8 172 1.0 3.5 6 0.21 45

Bayes_判别分析及应用论文

Bayes判别分析及应用 班级:计算B101姓名:孔维文学号201009014119 指导老师:谭立云教授 【摘要】判别分析是根据所研究个体的某些指标的观测值来推断该个体所属类型的一种统计方法,在社会生产和科学研究上应用十分广泛。在判别分析之前,我们往往已对各总体有一定了解,样品的先验概率也对其预测起到一定作用,因此进行判别时应考虑到各个总体出现的先验概率;由于在实际问题中,样品错判后会造成一定损失,故判别时还要考虑到预报的先验概率及错判造成的损失,Bayes判别就具有这些优点;然而当样品容量大时计算较复杂,故而常借助统计软件来实现。本文着重于Bayes判别分析的应用以及SPSS的实现。 论文共分三部分。首先简单地介绍了判别分析的意义、主要应用及SPSS的优点;其次详细讲解了Bayes判别分析理论,举例说明利用SPSS实现Bayes判别分析的操作及结果分析;最后,在09年统计年鉴收集到“各地区农村居民家庭平均每人生活消费支出”数据资料,研究各地区经济发展程度说明Bayes判别分析在经济学方面的应用。 【关键词】判别分析Bayes判别Spss实现判别函数判别准则 Class: calculation B101 name: KongWeiWen registration number 201009014119 Teacher: TanLiYun professor .【Abstract】Discriminant analysis is based on the study of certain indicators of individual observations to infer that the individual belongs as a type of statistical methods in social production and scientific research is widely used. In discriminant analysis, we often have a certain understanding of the overall sample of the a priori probability of its prediction play a role, it should be taken into account to determine the overall emergence of various prior probability; because of practical problems, samples will result in some loss of miscarriage of justice, so identification must be considered when the prior probability and wrongly predicted loss, Bayes discriminant to have these advantages; However, when the sample is large computing capacity of more complex, often using statistical software Guer to achieve. This article focuses on the application of Bayes discriminant analysis, and implementation of SPSS. Thesis is divided into three parts. First, a brief overview of the significance of discriminant analysis, the main applications and advantages of Spss; followed by detailed explanation of the Bayes discriminant analysis theory, an example implementation using Spss Bayes discriminant analysis and results of operations; finally, in the 2009 Statistical Yearbook of the collected " all areas of life of rural residents per capita household

贝叶斯判别习题

1. 办公室新来了一个雇员小王,小王是好人还是坏人大家都在猜测。按人们主观意识,一个人是好人或坏人的概率均为0.5。坏人总是要做坏事,好人总是做好事,偶尔也会做一件坏事,一般好人做好事的概率为0.9,坏人做好事的概率为0.2,一天,小王做了一件好事,小王是好人的概率有多大,你现在把小王判为何种人。 解:A :小王是个好人 a :小王做好事 B :小王是个坏人 B :小王做坏事 ()(/) (/)()(/)()(/)P A P a A P A a P A P a A P B P a B = +0.5*0.90.820.5*0.90.5*0.2 ==+ ()(/)0.5*0.2 (/)()(/)()(/)0.5*0.90.5*0.2 P B P a B P B b P A P a A P B P a B = =++=0.18 0.82>0.18 所以小王是个好人、 2. 设 m = 1,k = 2 ,X 1 ~ N (0,1) ,X 2 ~ N (3,2 2 ) ,试就C(2 | 1) = 1,C(1 | 2) = 1,且不考虑先验概率的情况下判别样品2,1 属于哪个总体,并求出 R = (R1, R2 ) 。 解: 2222 121/821 ()()/}1,2 21(2)(20)}0.054 21(2)(23)/4}0.176 2i i i P x x i P P μσ--= --== --===--== 由于1(2)P <2(2)P ,所以2属于2π

21/2 121/221(1)(10)}0.242 21(1)(13)/4}0.120 2P P --= --===--== 1(1)P >2(1)P ,所以1属于1π 由 1()P x 22211 }()(3)/4}22x P x x -==-- 即221 exp{}2 x -=21exp{(69)}8 x x --+ 2211 ln 2(69)28 x x x - =--+ 解得 1 x =1.42 2 x =-3.14.所以 R=([-3.41,1.42],(-∞,-3.41)U(1.42,+∞)). 3.已知1π,2π的先验分布分别为1q =3 5 ,2q =25 ,C(2|1)=1,C(1|2)=1,且 11,01()2,120,x x f P x x x <≤??==-<≤???其他 22 (1)/4,13 ()(5)/4,350,x x f P x x x -<≤?? ==-<≤??? 其他 使判别1x = 95 ,2x =2所属总体。 解:1p (9/5)=2-9/5=1/5 1p (2)=2-2=0 2p (9/5)=(9/5-1)/4=1/5 2p (2)=(2-1/4)=1/4 11q p = 35*15= 325> 22q p = 25*15 =2 25 11q p =0<22q p =25*14=1 10 所以判1x =9 5 属于1π。同理可知2x =2属于2π。

马氏距离判别与贝叶斯判别教学文稿

马氏距离判别与贝叶 斯判别

《马氏距离判别与贝叶斯判别》实验报告 姓名:学号:班级: 一、目的: 1.熟练掌握matlab软件进行距离判别贝叶斯判别的方法与步骤。 2.掌握判别分析的回代误判率与交叉误判率的编程。 3.掌握贝叶斯判别的误判率的计算。 二、内容: 我国山区某大型化工厂,在厂区及邻近地区挑选有代表性的15个大气取样点,每日4次同时抽取大气样品,测定其中含有的6种气体的浓度,前后共4天,每个取样点每种气体实测16次,计算每个取样点每种气体的平均浓度,数据见表1。气体数据对应的污染地区分类见表1中最后一列。现有两个取自该地区的4个气体样本,气体指标见表1中的后4行,试解决一下问题: 1.判别两类总体的协方差矩阵是否相等,然后用马氏距离判别这4个未知气体样本的污染类别,并计算回代误判率与交叉误判率;若两类总体服从正太分布,第一类与第二类的先验概率分别为7/15、8/15,利用贝叶斯判别样本的污染分类。 2.先验概率为多少时,距离判别与贝叶斯判别相同?调整先验概率对判别结果的影响是什么? 3.对第一类与第二类的先验概率分别为7/15、8/15,计算误判概率。

三、程序 马氏距离判别: A=load('shiyan4.txt'); x1=A([1:4 7 8 15],2:7); x2=A([5 6 9:14],2:7); m1=mean(x1);m2=mean(x2);n1=size(x1,1); n2=size(x2,1);s1=cov(x1);s2=cov(x2);p=6; s=((n1-1)*s1+(n2-1)*s2)/(n1+n2-2); Q1=(n1-1)*(log(det(s))-log(det(s1))-p+trace(inv(s)*s1)); Q2=(n2-1)*(log(det(s))-log(det(s2))-p+trace(inv(s)*s2)); if Q10));n22=length(find(d22>0)); p0=(n11+n22)/(n1+n2) %计算交叉误判率 for i=1:n1 B=x1([1:i-1,i+1:n1],:); n1=length(B(:,1));n2=length(x2(:,1)); m1=mean(B);m2=mean(x2); S1=cov(B);S2=cov(x2); S=((n1-1)*S1+(n2-1)*S2)/(n1+n2-2); Q1=(n1-1)*(log(det(S))-log(det(S1))-p+trace(inv(S)*S1)); Q2=(n2-1)*(log(det(S))-log(det(S2))-p+trace(inv(S)*S2)); if Q1

相关主题
文本预览
相关文档 最新文档