当前位置:文档之家› 厦门大学《应用多元统计分析》习题第04章 判别分析

厦门大学《应用多元统计分析》习题第04章 判别分析

厦门大学《应用多元统计分析》习题第04章 判别分析
厦门大学《应用多元统计分析》习题第04章 判别分析

思考与练习

4.1 简述欧氏距离与马氏距离的区别和联系。 4.2 试述判别分析的实质。

4.3 简述距离判别法的基本思想和方法。 4.4 简述Bayes 判别法的基本思想和方法。 4.5 简述Fisher 判别法的基本思想和方法。

4.6 试析距离判别法、Bayes 判别法和Fisher 判别法的异同。 4.7 设有两个二元总体和,从中分别抽取样本计算得到

1G 2G (1)(2)53 5.8 2.1,,12 2.17.6p x x S ??????===?????????????

假设,试用距离判别法建立判别函数和判别规则。样品1=ΣΣ2(6,0)x ′=应属于哪个总体?

4.8 某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。

销售情况 产品序号 销售价格 口味评分 信任度评分

畅销

1 2.

2 5 8 2 2.5 6 7

3 3.0 3 9

4 3.2 8 6 平销

5 2.8 7

6 6 3.5 8

7 7 4.

8

9 8 滞销

8 1.7 3 4 9 2.2 4 2 10 2.7 4 3

⑴ 根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。

1

⑵ 现有一新品牌的饮料在该超市试销,其销售价格为3.0,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。

4.9 银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任),以决定是否给予贷款。可以根据贷款申请人的年龄(1X )、受教育程度(2X )、现在所从事工作的年数(3X )、未变更住址的年数(4X )、收入(5X )、负债收入比例(6X )、信用卡债务(7X )、其它债务(8X )等来判断其信用情况。下表是从某银行的客户资料中抽取的部分数据,⑴根据样本资料分

别用距离判别法、Bayes 判别法和Fisher 判别法建立判别函数和判别规则。⑵某客户的如上情况资料为(53,1,9,18,50,11.20,2.02,3.58),对其进行信用好坏的判别。 目前信用好坏

客户序号

1X 2X 3X 4X 5X 6X 7X 8X

已履行还贷责任

1 23 1 7

2 31 6.600.34 1.71

2 34 1 17

3 59 8.00 1.81 2.91 3 42 2 7 23 41 4.600.9

4 .94 4 39 1 19

5 48 13.10 1.93 4.3

6 5 35 1 9 1 34 5.000.40 1.30 未履行还

贷责任

6 3

7 1 1 3 24 15.10 1.80 1.82 7 29 1 13 1 42 7.40 1.46 1.65

8 32 2 11 6 75 23.307.76 9.72

9 28 2 2 3 23 6.400.19 1.29 10 26 1 4 3 27 10.50

2.47 .36

4.10 从胃癌患者、萎缩性胃炎患者和非胃炎患者中分别抽取五个病人进行四项生化指标的化验:血清铜蛋白()1X 、蓝色反应()2X 、尿吲哚乙酸

(3

)X 和中性硫化物()4

X ,数据见下表。试用距离判别法建立判别函数,并

根据此判别函数对原样本进行回判。

2

类别 病人序号

1X 2X 3X 4X

胃癌患者 1 228 134 20 11 2 245 134 10 40 3 200 167 12 27 4 170 150 7 8 5 100 167 20 14 胃炎患者

萎缩性 6 225 125 7 14 7 130 100 6 12 8 150 117 7 6 9 120 133 10 26 10 160 100 5 10 非胃炎患者 11 185 115 5 19 12 170 125 6 4 13 165 142 5 3 14 135 108 2 12 15 100 117 7 2

3

SPSS操作方法:判别分析报告例题

实验指导之二 判别分析的SPSS软件的基本操作 [实验例题]为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定、分别属于哪个收入类型。判别指标及原始数据见表9-4。 1991年30个省、市、自治区城镇居民月平均收人数据表 单位:元/人 x1:人均生活费收入x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资x7:人均各种津贴(国有+集体) x3:人均来源于国有经济单位标准工资x8:人均从工作单位得到的其他收入 x4:人均集体所有制工资收入x9:个体劳动者收入

6 湖南124.00 84.66 44.05 13.5 7.4 7 19.11 20.49 10.3 1.76 待判1 广东211.30 114.0 41.44 33.2 11.2 48.72 30.77 14.9 11.1 2 西藏175.9 3 163.8 57.89 4.22 3.37 17.81 82.32 15.7 0.00 贝叶斯判别的SPSS操作方法: 1. 建立数据文件 2.单击Analyze→Classify→Discriminant,打开Discriminant Analysis判别分析对话框如图1所示: 图1 Discriminant Analysis判别分析对话框 3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。 从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range 对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。。 选择后点击Continue按钮返回Discriminant Analysis主对话框。 图2 Define Range对话框 4、选择分析方法

应用多元统计分析试题及答案

一、填空题: 1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法. 2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著. 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。 4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。 5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。 6、若 () (,), P x N αμα ∑=1,2,3….n且相互独立,则样本均值向量x服从的分布 为_x~N(μ,Σ/n)_。 二、简答 1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。 相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A

和因素B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。 从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数: 确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 协差阵的检验 检验0=ΣΣ 0p H =ΣI : /2 /21exp 2np n e tr n λ???? =-?? ? ???? S S 00p H =≠ΣΣI : /2 /2**1exp 2np n e tr n λ???? =-?? ? ???? S S

第4章习题答案

思考题: 题4.1.1 按触发方式触发器可分为、和三类。 答:电平触发、主从触发、边沿触发。 题4.1.2 由与非门构成的RS锁存器输入信号不允许同时为。 答:0 题4.1.3 触发器有个稳定状态,它可记录位二进制码,存储8位二进制信息需要个触发器。 答:2、1、8。 题 4.1.4 如果由或非门构成的RS锁存器输入信号同时为1,此时输出的原端Q和非端Q 为。然后改变两输入信号为0,输出原端Q和非端Q为。 答:0、不定(0,1或1,0) 题4.2.1 在图4.2.1(b)中将C1改为C2,当C2有效时,1S、1R和C2 。 答:无关。 题4.2.2 同步RS触发器和RS锁存器主要区别是。 答:触发信号。 题4.2.3 保证同步D触发器的输出稳定,要求输入有效信号的高电平至少需要。答:4t pd。 题4.2.4 同步触发器的缺点是。 (A)抗干扰能力差(B)空翻现象(C)多次翻转(D)约束条件 答:A、B、C、D。 题4.2.5 同步D触发器和同步RS触发器相同之处是,不同之处是。 (A)空翻现象,约束条件(B)同步信号,空翻现象 (C)约束条件,空翻现象(D)时钟,同步信号 答:A 题4.3.1 具有约束条件的触发器有。 (A)主从RS触发器(B)由主从RS触发器组成D触发器 (C)主从JK触发器(D)由主从JK触发器组成D触发器 答:A 题4.3.2 具有一次翻转特性的触发器有。 (A)主从RS触发器(B)由主从RS触发器组成D触发器 (C)主从JK触发器(D)由主从JK触发器组成D触发器 答:C、D 题4.3.3 主从RS触发器不能完全克服多次翻转的原因是。 (A)主从RS触发器的主触发器工作原理和同步RS触发器相同 (B)主从RS触发器的从触发器工作原理和同步RS触发器相同 (C)输入信号R不稳定 1

SPSS操作方法:判别分析例题

为研究1991年中国城镇居民月平均收入状况,按标准化欧氏平方距离、离差平方和聚类方法将30个省、市、自治区.分为三种类型。试建立判别函数,判定广东、西藏分别属于哪个收入类型。判别指标及原始数据见表9-4。 1991年30个省、市、自治区城镇居民月平均收人数据表 单位:元/人 x1:人均生活费收入 x6:人均各种奖金、超额工资(国有+集体) x2:人均国有经济单位职工工资 x7:人均各种津贴(国有+集体) x3:人均来源于国有经济单位标准工资 x8:人均从工作单位得到的其他收入 x4:人均集体所有制工资收入 x9:个体劳动者收入 5

贝叶斯判别的SPSS操作方法: 1. 建立数据文件 2.单击Analyze→ Classify→ Discriminant,打开Discriminant Analysis 判别分析对话框如图1所示: 图1 Discriminant Analysis判别分析对话框 3.从对话框左侧的变量列表中选中进行判别分析的有关变量x1~x9进入Independents 框,作为判别分析的基础数据变量。 从对话框左侧的变量列表中选分组变量Group进入Grouping Variable 框,并点击Define Range...钮,在打开的Discriminant Analysis: Define Range对话框中,定义判别原始数据的类别数,由于原始数据分为3类,则在Minimum(最小值)处输入1,在Maximum(最大值)处输入3(见图2)。。 选择后点击Continue按钮返回Discriminant Analysis主对话框。 图2 Define Range对话框 4、选择分析方法 Enter independent together 所有变量全部参与判别分析(系统默 认)。本例选择此项。 Use stepwise method 采用逐步判别法自动筛选变量。

聚类分析练习题20121105

聚类分析和判别分析练习题 一、选择题 1.需要在聚类分析中保序的聚类分析是( )。 A.两步聚类 B.有序聚类 C.系统聚类 D.k-均值聚类 2.在系统聚类中2R 是( )。 A.组内离差平方和除以组间离差平方和 B.组间离差平方和除以组内离差平方和 C.组间离差平方和除以总离差平方和 D.组间均方除以总均方。 3.系统聚类的单调性是指( )。 A.每步并类的距离是单调增的 B.每步并类的距离是单调减的 C.聚类的类数越来越少 D.系统聚类2R 会越来越小 4.以下的系统聚类方法中,哪种系统聚类直接利用了组内的离差平方和。( ) A.最长距离法 B.组间平均连接法 C.组内平均连接法 D.WARD 法 5.以下系统聚类方法中所用的相似性的度量,哪种最不稳健( )。 A.2 1()p ik jk k x x =-∑ B. 1p ik jk k ik jk x x x x =-+∑ C. 21p k =∑ D. 1()()i j i j -'x -x Σx -x 6. 以下系统聚类方法中所用的相似性的度量,哪种考虑了变量间的相关性( )。A.2 1()p ik jk k x x =-∑ B. 1 p ik jk k ik jk x x x x =-+∑ C. 21 p k =∑ D. 1()()i j i j -'x -x Σx -x 7.以下统计量,可以用来刻画分为几类的合理性统计量为( )? A.可决系数或判定系数2R B. G G W P P -

C.()/(1) /() G G W P G P n G -- - D.() G W P W - 8.以下关于聚类分析的陈述,哪些是正确的() A.进行聚类分析的统计数据有关于类的变量 B.进行聚类分析的变量应该进行标准化处理 C.不同的类间距离会产生不同的递推公式 D.递推公式有利于运算速度的提高。D(3)的信息需要D(2)提供。 9.判别分析和聚类分析所要求统计数据的不同是() A.判别分析没有刻画类的变量,聚类分析有该变量 B.聚类分析没有刻画类的变量,判别分析有该变量 C.分析的变量在不同的样品上要有差异 D.要选择与研究目的有关的变量 10.距离判别法所用的距离是() A.马氏距离 B. 欧氏距离 C.绝对值距离 D. 欧氏平方距离 11.在一些条件同时满足的场合,距离判别和贝叶斯判别等价,是以下哪些条件。 () A.正态分布假定 B.等协方差矩阵假定 C.均值相等假定 D.先验概率相等假定 12.常用逐步判别分析选择不了的标准是() A.Λ统计量越小变量的判别贡献更大 B.Λ统计量越大变量的判别贡献更大 C.判定系数越小变量的判别贡献更大 D.判定系数越大变量的判别贡献更大 二、填空题 1、聚类分析是建立一种分类方法,它将一批样本或变量按照它们在性质上的_______________进行科学的分类。 2.Q型聚类法是按_________进行聚类,R型聚类法是按_______进行聚类。 3.Q型聚类相似程度指标常见是、、,而R型聚类相似程度指标通常采用_____________ 、。 4.在聚类分析中需要对原始数据进行无量纲化处理,以消除不同量纲或数量级的影响,达到数据间

应用多元统计分析习题解答_第五章

第五章 聚类分析 判别分析和聚类分析有何区别 答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有n 个样本,对每个样本测得p 项指标(变量)的数据,已知每个样本属于k 个类别(或总体)中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。 试述系统聚类的基本思想。 答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。 对样品和变量进行聚类分析时, 所构造的统计量分别是什么简要说明为什么这样构造 答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n 个样本看作p 维空间的n 个点。点之间的距离即可代表样品间的相似度。常用的距离为 (一)闵可夫斯基距离:1/1 ()() p q q ij ik jk k d q X X ==-∑ q 取不同值,分为 (1)绝对距离(1q =) 1 (1)p ij ik jk k d X X ==-∑ (2)欧氏距离(2q =) 21/2 1 (2)() p ij ik jk k d X X ==-∑ (3)切比雪夫距离(q =∞) 1()max ij ik jk k p d X X ≤≤∞=- (二)马氏距离 (三)兰氏距离 对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。 将变量看作p 维空间的向量,一般用 2 1()()()ij i j i j d M -'=--X X ΣX X 11()p ik jk ij k ik jk X X d L p X X =-=+∑

大学物理第章习题分析与解答.doc

第八章恒定磁场 8-1均匀磁场的磁感强度B垂直于半径为"KJ圆面.今以该圆周为边线,作一半球面S,则通过S面的磁通量的大小为[]。 (B) nr2 B(C) 0 (D)无法确定 分析与解根据高斯定理,磁感线是闭合曲线,穿过圆平面的磁通量与穿过半球面的磁通量相等。正确答案为(B)。 8-2下列说法正确的是[]。 (A)闭合回路上各点磁感强度都为零时,I口I路内一定没有电流穿过 (B)闭合回路上各点磁感强度都为零时,回路内穿过电流的代数和必定为零 (C)磁感强度沿闭合回路的积分为零时,回路上作点的磁感强度必定为零 (D)磁感强度沿闭合回路的积分不为零时,回路上任意点的磁感强度必定为零 分析与解由磁场中的安培环路定理,磁感强度沿闭合回路的积分为零时,回路上各点的磁感强度不一定为零;闭合回路上各点磁感强度为零时,穿过1口1路的电流代数和一定为零。正确答案为(B)。 8-3磁场中的安培环路定理J B= 口。£七说明稳恒电流的磁场是[]。 i = 1 (A)无源场(B)有旋场(C)无旋场(D)有源场 分析与解磁场的高斯定理与安培环路定理是磁场性质的重要表述,在恒定磁场中B的环流一般不为零,所以磁场是涡旋场;而在恒定磁场中,通过任意闭合曲面的磁通量必为零, 所以磁场是无源场;静电场中E的环流等于零,故静电场为保守场;而静电场中,通过任意闭合面的电通量可以不为零,故静电场为有源场。正确答案为(B)。 8-4 一半圆形闭合平面线圈,半径为R,通有电流/,放在磁感强度为8的均匀磁场中,磁场方向与线圈平面平行,则线圈所受磁力矩大小为[]。 (A) I TI R2B(B) (C) ^I H R2B(D) 0 分析与解对一匝通电平面线圈,在磁场中所受的磁力矩可表示为M = ISe n xB,而且 对任意形状的平面线圈都是适用的。正确答案为(B)o 8-5 —长直螺线管是由直径d=0.2mm的漆包线密绕而成。当它通以/=0. 5A的电流时,其内部的磁感强度B=。(忽略绝缘层厚度,U o=4 n X 10'7N/A2) 分析与解根据磁场中的安培环路定理可求得长直螺线管内部的磁感强度大小为 B = 方向由右螺旋关系确定。正确答安为(3.14X10TT )。 8-6如图所示,载流导线在平面内分布,电流为/,则在圆心。点处的磁感强度大小为 ,方向为。 分析与解根据圆形电流和长直电流的磁感强度公 式,并作矢量叠加,可得圆心。点的总的磁感强度。正 确答案为(也/(1-上),向里)。 2耻以

2020年数学分析高等代数考研试题参考解答

安徽大学2008年高等代数考研试题参考解答 北京大学1996年数学分析考研试题参考解答 北京大学1997年数学分析考研试题参考解答 北京大学1998年数学分析考研试题参考解答 北京大学2015年数学分析考研试题参考解答 北京大学2016年高等代数与解析几何考研试题参考解答 北京大学2016年数学分析考研试题参考解答 北京大学2020年高等代数考研试题参考解答 北京大学2020年数学分析考研试题参考解答 北京师范大学2006年数学分析与高等代数考研试题参考解答北京师范大学2020年数学分析考研试题参考解答 大连理工大学2020年数学分析考研试题参考解答 赣南师范学院2012年数学分析考研试题参考解答 各大高校考研试题参考解答目录2020/04/29版 各大高校考研试题参考解答目录2020/06/21版 各大高校数学分析高等代数考研试题参考解答目录2020/06/04广州大学2013年高等代数考研试题参考解答 广州大学2013年数学分析考研试题参考解答 国防科技大学2003年实变函数考研试题参考解答 国防科技大学2004年实变函数考研试题参考解答 国防科技大学2005年实变函数考研试题参考解答 国防科技大学2006年实变函数考研试题参考解答 国防科技大学2007年实变函数考研试题参考解答 国防科技大学2008年实变函数考研试题参考解答 国防科技大学2009年实变函数考研试题参考解答 国防科技大学2010年实变函数考研试题参考解答 国防科技大学2011年实变函数考研试题参考解答 国防科技大学2012年实变函数考研试题参考解答 国防科技大学2013年实变函数考研试题参考解答 国防科技大学2014年实变函数考研试题参考解答 国防科技大学2015年实变函数考研试题参考解答 国防科技大学2016年实变函数考研试题参考解答 国防科技大学2017年实变函数考研试题参考解答 国防科技大学2018年实变函数考研试题参考解答 哈尔滨工程大学2011年数学分析考研试题参考解答

多元统计分析课后习题解答_第四章知识讲解

第四章判别分析 4.1 简述欧几里得距离与马氏距离的区别和联系。 答:设p维欧几里得空间中的两点X=和Y=。则欧几里得距离为 。欧几里得距离的局限有①在多元数据分析中,其度量不合理。②会受到实际问题中量纲的影响。 设X,Y是来自均值向量为,协方差为 的总体G中的p维样本。则马氏距离为D(X,Y)= 。当 即单位阵时, D(X,Y)==即欧几里得距离。 因此,在一定程度上,欧几里得距离是马氏距离的特殊情况,马氏距离是欧几里得距离的推广。 4.2 试述判别分析的实质。

答:判别分析就是希望利用已经测得的变量数据,找出一种判别函数,使得这一函数具有某种最优性质,能把属于不同类别的样本点尽可能地区别开来。设R1,R2,…,Rk 是p 维空 间R p 的k 个子集,如果它们互不相交,且它们的和集为,则称为的一 个划分。判别分析问题实质上就是在某种意义上,以最优的性质对p 维空间构造一个“划 分”,这个“划分”就构成了一个判别规则。 4.3 简述距离判别法的基本思想和方法。 答:距离判别问题分为①两个总体的距离判别问题和②多个总体的判别问题。其基本思想都是分别计算样本与各个总体的距离(马氏距离),将距离近的判别为一类。 ①两个总体的距离判别问题 设有协方差矩阵∑相等的两个总体G 1和G 2,其均值分别是μ1和μ 2,对于一个新的样品X , 要判断它来自哪个总体。计算新样品X 到两个总体的马氏距离D 2(X ,G 1)和D 2 (X ,G 2),则 X ,D 2 (X ,G 1) D 2(X ,G 2) X ,D 2(X ,G 1)> D 2 (X ,G 2, 具体分析, 2212(,)(,) D G D G -X X 111122111111 111222********* ()()()() 2(2)2()-----------''=-----''''''=-+--+'''=-+-X μΣX μX μΣX μX ΣX X ΣμμΣμX ΣX X ΣμμΣμX ΣμμμΣμμΣμ11211212112122()()()2() 22()2() ---''=-++-' +? ?=--- ?? ?''=--=--X ΣμμμμΣμμμμX ΣμμX μααX μ 记()()W '=-X αX μ 则判别规则为

判别分析练习题1

Fisher判别适用于两组判别分析; Bayes判别适用于多组判别分析。 1. 为明确诊断出小儿肺炎三种类型, 某研究单位测得30名结核性、12名化脓性和18细菌性肺炎患儿共60名的7项生理、生化指标(见下表), 试进行判别分析。 三种类型小儿肺炎7项生理、生化指标观测结果 X1 X2 X3 X4 X5 X6 X7 肺炎 类型 X1 X2 X3 X4 X5 X6 X7 肺炎 类型 (3)现有两个未知类别的小儿肺炎患者,他们的7项指标分别为:4.0、1、0、0、0、7.0、4.571和18.0、1、0、0、0、60.0、1.727,分别判断他们的类别。 3、3

2. 下表是10名健康人(group=1)和6名心肌梗塞患者(group=2)的三个心电图指标(X1,X2,X3)。试进行判别分析。 group X1 X2 X3 1 436.70 49.59 2.32 1 290.67 30.0 2 2.46 1 352.53 36.23 2.36 1 340.91 38.28 2.44 1 332.83 41.9 2 2.28 1 319.97 31.4 2 2.49 1 361.31 37.99 2.02 1 366.5 39.87 2.42 1 292.56 26.07 2.16 1 276.84 16.60 2.91 2 510.47 67.64 1.73 2 510.41 62.71 1.58 2 470.30 54.40 1.68 2 364.12 46.26 2.09 2 416.07 45.37 1.90 2 515.70 84.59 1.75 (3)现有一人,他的3项指标为:420.50、32.42、1.98,判断他是健康人还是心肌梗塞患者?2 心肌梗塞

聚类分析实例分析题(推荐文档)

5.2酿酒葡萄的等级划分 5.2.1葡萄酒的质量分类 由问题1中我们得知,第二组评酒员的的评价结果更为可信,所以我们通过第二组评酒员对于酒的评分做出处理。我们通过excel计算出每位评酒员对每支酒的总分,然后计算出每支酒的10个分数的平均值,作为总的对于这支酒的等级评价。 通过国际酿酒工会对于葡萄酒的分级,以百分制标准评级,总共评出了六个级别(见表5)。 在问题2的计算中,我们求出了各支酒的分数,考虑到所有分数在区间[61.6,81.5]波动,以原等级表分级,结果将会很模糊,不能分得比较清晰。为此我们需要进一步细化等级。为此我们重新细化出5个等级,为了方便计算,我们还对等级进行降序数字等级(见表6)。 通过对数据的预处理,我们得到了一个新的关于葡萄酒的分级表格(见表7):

考虑到葡萄酒的质量与酿酒葡萄间有比较之间的关系,我们将保留葡萄酒质量对于酿酒葡萄的影响,先单纯从酿酒葡萄的理化指标对酿酒葡萄进行分类,然后在通过葡萄酒质量对酿酒葡萄质量的优劣进一步进行划分。 5.2.2建立模型 在通过酿酒葡萄的理化指标对酿酒葡萄分类的过程,我们用到了聚类分析方法中的ward 最小方差法,又叫做离差平方和法。 聚类分析是研究分类问题的一种多元统计方法。所谓类,通俗地说,就是指相似元素的集合。为了将样品进行分类,就需要研究样品之间关系。这里的最小方差法的基本思想就是将一个样品看作P 维空间的一个点,并在空间的定义距离,距离较近的点归为一类;距离较远的点归为不同的类。面对现在的问题,我们不知道元素的分类,连要分成几类都不知道。现在我们将用SAS 系统里面的stepdisc 和cluster 过程完成判别分析和聚类分析,最终确定元素对象的分类问题。 建立数据阵,具体数学表示为: 1111...............m n nm X X X X X ????=?????? (5.2.1) 式中,行向量1(,...,)i i im X x x =表示第i 个样品; 列向量1(,...,)'j j nj X x x =’,表示第j 项指标。(i=1,2,…,n;j=1,2,…m) 接下来我们将要对数据进行变化,以便于我们比较和消除纲量。在此我们用了使用最广范的方法,ward 最小方差法。其中用到了类间距离来进行比较,定义为: 2||||/(1/1/)kl k l k l D X X n n =-+ (5.2.2) Ward 方法并类时总是使得并类导致的类内离差平方和增量最小。 系统聚类数的确定。在聚类分析中,系统聚类最终得到的一个聚类树,如何确定类的个数,这是一个十分困难但又必须解决的问题;因为分类本身就没有一定标准,人们可以从不同的角度给出不同的分类。在实际应用中常使用下面几种

第04章习题分析与解答

第四章 流体力学基础习题解答 4-1 关于压强的下列说确的是( )。 A 、压强是矢量; B 、容器液体作用在容器底部的压力等于流体的重力; C 、静止流体高度差为h 的两点间的压强差为gh P o ρ+; D 、在地球表面一个盛有流体的容器以加速度a 竖直向上运动,则流体深度为h 处的压强为0)(P a g h P ++=ρ。 解:D 4-2 海水的密度为33m /kg 1003.1?=ρ,海平面以下100m 处的压强为( )。 A 、Pa 1011.16?; B 、Pa 1011.15? C 、Pa 1001.16?; D 、Pa 1001.15?。 解:A 4-3 两个半径不同的肥皂泡,用一细导管连通后,肥皂泡将会( )。 A 、两个肥皂泡最终一样大; B 、大泡变大,小泡变小 C 、大泡变小,小泡变大; D 、不能判断。 解:B 4-4 两个完全相同的毛细管,插在两个不同的液体中,两个毛细管( )。 A 、两管液体上升高度相同; B 、两管液体上升高度不同; C 、一个上升,一个下降; D、不能判断。 解:B 4-5 一半径为r 的毛细管,插入密度为ρ的液体中,设毛细管壁与液体接触角为θ,则液体在毛细管中上升高度为h= ( ) 。(设液体的表面力系数为α) 解:gr h ρθα=cos 2 4-6 如图所示的液面。液面下A 点处压强是( ) 。设弯曲液面是球面的一部分,液面曲率半径为R,大气压强是0P ,表面力系数是α。 解:R P P α+ =20 4-7 当接触角2πθ< 时,液体( )固体,0=θ时,液体( )固体;当2π θ>时,液体( )固体,πθ=,液体( )固体。 解:润湿,完全润湿,不润湿,完全不润湿。

应用多元统计分析习题解答-聚类分析

第五章 聚类分析 5.1 判别分析和聚类分析有何区别? 答:即根据一定的判别准则,判定一个样本归属于哪一类。具体而言,设有n 个样本,对每个样本测得p 项指标(变量)的数据,已知每个样本属于k 个类别(或总体)中的某一类,通过找出一个最优的划分,使得不同类别的样本尽可能地区别开,并判别该样本属于哪个总体。聚类分析是分析如何对样品(或变量)进行量化分类的问题。在聚类之前,我们并不知道总体,而是通过一次次的聚类,使相近的样品(或变量)聚合形成总体。通俗来讲,判别分析是在已知有多少类及是什么类的情况下进行分类,而聚类分析是在不知道类的情况下进行分类。 5.2 试述系统聚类的基本思想。 答:系统聚类的基本思想是:距离相近的样品(或变量)先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品(或变量)总能聚到合适的类中。 5.3 对样品和变量进行聚类分析时, 所构造的统计量分别是什么?简要说明为什么这样构造? 答:对样品进行聚类分析时,用距离来测定样品之间的相似程度。因为我们把n 个样本看作p 维空间的n 个点。点之间的距离即可代表样品间的相似度。常用的距离为 (一)闵可夫斯基距离:1/1()()p q q ij ik jk k d q X X ==-∑ q 取不同值,分为 (1)绝对距离(1q =) 1 (1)p ij ik jk k d X X ==-∑ (2)欧氏距离(2q =)

21/2 1 (2)() p ij ik jk k d X X ==-∑ (3)切比雪夫距离(q =∞) 1()max ij ik jk k p d X X ≤≤∞=- (二)马氏距离 (三)兰氏距离 对变量的相似性,我们更多地要了解变量的变化趋势或变化方向,因此用相关性进行衡量。 将变量看作p 维空间的向量,一般用 (一)夹角余弦 (二)相关系数 5.4 在进行系统聚类时,不同类间距离计算方法有何区别?选择距离公式应遵循哪些原则? 答: 设d ij 表示样品X i 与X j 之间距离,用D ij 表示类G i 与G j 之间的距离。 (1). 最短距离法 21()()()ij i j i j d M -'=--X X ΣX X 11()p ik jk ij k ik jk X X d L p X X =-=+∑ cos p ik jk ij X X θ= ∑ ()() p ik i jk j ij X X X X r --= ∑ ij G X G X ij d D j j i i ∈∈= ,min

第4章习题与答案

习题 一、选择题 1.下列描述正确的是_______。 A.汇编语言源程序可直接运行 B.汇编语言属于低级语言 C.汇编程序是用汇编语言编写的程序,运行速度高,阅读方便,属于面向用户的程序语言。 D.汇编语言可以移植 答案:B 2. 分析下面的程序,变量V AR2的偏移地址是______。 DA TA SEGMENT ORG 2 V AR1 DB 2,3,4 ORG $+3 V AR2 DW 1234H DA TA ENDS A.02H B.04H C.05H D.08H 答案:D 3.为了使MOV AX, V AR指令执行后,AX寄存器中的内容为4142H,下面哪一种数据定义会产生不正确的结果? A.V AR DW 4142H B.V AR DW 16706 C.V AR DB 42H, 41H D.V AR DW ‘AB’ 答案:C 4.下列伪指令中______是正确的。 A.ERR1:DW 99 B.ERR2 DB 25*60 C.COUNT EQU 20 D.ONE DB ONE 答案:C 5.执行下列指令后,寄存器CL的值是_______。 STR1 DW ‘AB’ STR2 DB 16 DUP(?) CNT EQU $-STR1 MOV CX, CNT MOV AX, STR1 HLT A.10H B.12H C.0EH D.0FH 答案:B 二、填空题 1.汇编语言的调试过程如下:建立以______为扩展名的源文件;生成以______为扩展名的目标文件;生成以______为扩展名的可执行文件;使用DEBUG调试程序,调试可执行目标程序。 答案:.asm .obj .exe 2.执行下列指令后,(AX)=______,(BL)=_______。

主成分分析法概念及例题

主成分分析法 主成分分析(principal components analysis,PCA)又称:主分量分析,主成分回归分析法 [编辑] 什么是主成分分析法 主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。 在统计学中,主成分分析(principal components analysis,PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。 [编辑] 主成分分析的基本思想

在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。 同样,在科普效果评估的过程中也存在着这样的问题。科普效果是很难具体量化的。在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。如上所述,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。根据这一点,通过对原始变量相关矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。上述想法可进一步概述为:设某科普效果评估要素涉及个指标,这指标构成的维随机向量为。对作正交变换,令,其中为正交阵,的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。的各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中,找出一些主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引向深入。 例如,在对科普产品开发和利用这一要素的评估中,涉及科普创作人数百万人、科普作品发行量百万人、科普产业化(科普示范基地数百万人)等多项指标。经过主成分分析计算,最后确定个或个主成分作为综合评价科普产品利用和开发的综合指标,变量数减少,并达到一定的可信度,就容易进行科普效果的评估。 [编辑] 主成分分析法的基本原理 主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。 [编辑] 主成分分析的主要作用

大学物理 第 章习题分析与解答

第八章 恒定磁场 8-1 均匀磁场的磁感强度B 垂直于半径为r 的圆面.今以该圆周为边线,作一半球面S ,则通过S 面的磁通量的大小为[ ]。 (A) B r 22π (B) B r 2π (C) 0 (D) 无法确定 分析与解 根据高斯定理,磁感线是闭合曲线,穿过圆平面的磁通量与穿过半球面的磁通量相等。正确答案为(B )。 8-2 下列说法正确的是[ ]。 (A) 闭合回路上各点磁感强度都为零时,回路内一定没有电流穿过 (B) 闭合回路上各点磁感强度都为零时,回路内穿过电流的代数和必定为零 (C) 磁感强度沿闭合回路的积分为零时,回路上各点的磁感强度必定为零 (D) 磁感强度沿闭合回路的积分不为零时,回路上任意点的磁感强度必定为零 分析与解 由磁场中的安培环路定理,磁感强度沿闭合回路的积分为零时,回路上各点的磁感强度不一定为零;闭合回路上各点磁感强度为零时,穿过回路的电流代数和一定为零。正确答案为(B )。 8-3 磁场中的安培环路定理∑?=μ=?n L I 1 i i 0d l B 说明稳恒电流的磁场是[ ]。 (A) 无源场 (B) 有旋场 (C) 无旋场 (D) 有源场 分析与解 磁场的高斯定理与安培环路定理是磁场性质的重要表述,在恒定磁场中B 的环流一般不为零,所以磁场是涡旋场;而在恒定磁场中,通过任意闭合曲面的磁通量必为零,所以磁场是无源场;静电场中E 的环流等于零,故静电场为保守场;而静电场中,通过任意闭合面的电通量可以不为零,故静电场为有

习题8-6图 I O R 源场。正确答案为(B )。 8-4 一半圆形闭合平面线圈,半径为R ,通有电流I ,放在磁感强度为B 的均匀磁场中,磁场方向与线圈平面平行,则线圈所受磁力矩大小为[ ]。 (A) B R I 2π (B) B R I 22 1 π (C) B R I 24 1π (D) 0 分析与解 对一匝通电平面线圈,在磁场中所受的磁力矩可表示为 B e M ?=n IS ,而且对任意形状的平面线圈都是适用的。正确答案为(B )。 8-5 一长直螺线管是由直径d =0.2mm 的漆包线密绕而成。当它通以I =0.5A 的电流时,其内部的磁感强度B =_____________。(忽略绝缘层厚度,μ0=4π×10-7N/A 2) 分析与解 根据磁场中的安培环路定理可求得长直螺线管内部的磁感强度大小为nI B 0μ=,方向由右螺旋关系确定。正确答安为(T 1014.33-?)。 8-6 如图所示,载流导线在平面内分布,电流为I ,则在圆心O 点处的磁感强度大小为_____________,方向为_____________ 。 分析与解 根据圆形电流和长直电流的磁感强度公式,并作矢量叠加,可得圆心O 点的总的磁感强度。正确答案为( ?? ? ??π-μ1120R I ,向里)。 8-7 如图所示,平行的无限长直载流导线A 和B ,电流强度均为I ,垂直纸面向外,两根载流导线之间相距为a ,则(1)AB 中点的磁感应强度B P =_____________。 (2)磁感应强度沿图中环路l 的线积分 =??L l B d _____________。 分析与解 根据长直电流的磁感强度公式和电流分布的对称性,P 点的磁感强度是两电流产生的 磁感强 习题8-7图

判别分析例题及SAS程序

判别分析 例题某医院眼科研究糖尿病患者的视网膜病变情况, 视网膜病变分轻、中、重三型。研究者用年龄(age)、患糖尿病年数(time)、血糖水平(glucose)、视力(vision)、视网膜电图中的a波峰时(at)、a波振幅(av)、b波峰时(bt)、b波振幅(bv)、qp波峰时(qpt)及qp波振幅(qpv)等指标建立判别视网膜病变的分类函数, 以判断糖尿病患者的视网膜病变属于轻、中、重中哪一型。为此观察131例糖尿病患者,要求其患眼无其他明显眼前段疾患, 眼底无明显其他视网膜疾病和视神经、葡萄膜等疾患,测定了他们的以上各指标值,并根据统一标准诊断其疾患类型,记分类指标名为group。 见表1 (表中仅列出前5例)。试以此为训练样本, 仅取age,vision,at,bt和qpv 等指标, 求分类函数, 并根据王××的信息: 38岁, 视力1.0, 视网膜图at=14.25, bv=383.39, qpv=43.18判断其视网膜病变属于哪一型。 表1 131例糖尿病患者各指标实测记录(前5例) ──────────────────────────────────例号年龄患病血糖视力a波a波b波b波qp波pq波视网膜年数峰时振幅峰时振幅峰时振幅病变程度 ────────────────────────────────── 1 49 2.00 191 1.5 12.25 235.40 52.50 417.57 78.5 27.43 A1 2 49 2.00 191 1.2 13.50 225.15 52.00 391.20 78.5 46.69 A1 3 63 4.00 200 1.0 14.25 318.92 53.25 616.35 77.5 35.38 A1 4 63 4.00 200 0.6 14.00 361.90 55.00 723.30 77.0 47.01 A1 5 54 10.00 137 0. 6 13.75 269.59 55.50 451.2 7 78.0 33.70 A2 ──────────────────────────────────解假定样本系从总体中随机抽取,则样本中三种疾患类型的样本量可近似地反映先验概率, 利用SAS的Discrim过程可得分类函数 Y1=-181.447+0.473(age)+60.369(vision)+17.708(at)+0.048(bv)+0.364(qpv) Y2=-165.830+0.472(age)+49.782(vision)+17.658(at)+0.034(bv)+0.325(qpv) Y3=-189.228+0.178(age)+43.974(vision)+20.447(at)+0.040(bv)+0.265(qpv) 以王××的观察值代入分类函数, 得 Y1=-181.447+0.473×38+60.369×1.0+17.708×14.25+0.048×383.39+0.364×43.18 =183.36 同样可算得:Y2=180.58, Y3=179.66 其中最大者为Y1, 故判断为轻度病变。 由上例见, Y1, Y2, Y3的数值相差不多,单纯凭分类函数值的大小作决策有时易出偏差。这时, 分别估计该个体属于各总体的概率却能客观地反映该个体的各种可能归属, 而避免武断。令Y*=179, 从而有 P(Y1|X1,X2,…,X5)=e(183.36-180)/(e(183.36-180)+e(180.58-180)+e(179.66-180)) =e4.36/(e4.36+e1.58+e0.66)=0.9202 类似地, 可得:P(Y2|X1,X2,…,X5)=0.0571 P(Y3|X1,X2,…,X5)=0.0227 由此可见王××为轻度病变的概率为0.9202,因此把他判断为轻度病变可靠性较大。

大学物理第07章习题分析与解答备课讲稿

大学物理第07章习题分析与解答

r R r R E O r (D) E ∝1/r 2 22 第七章 静电场 7-1 关于电场强度与电势的关系,描述正确的是[ ]。 (A) 电场强度大的地方电势一定高; (B) 沿着电场线的方向电势一定降低; (C) 均匀电场中电势处处相等; (D) 电场强度为零的地方电势也为零。 分析与解 电场强度与电势是描述静电场的两个不同物理量,电场强度为零表示试验电荷在该点受到的电场力为零,电势为零表示将试验电荷从该点移到参考零电势点时,电场力作功为零;电场强度等于负电势梯度;静电场是保守场,电场线的方向就是电势降低的方向。正确答案为(B )。 7-2 半径为R 的均匀带电球面的静电场中各点的电场强度的大小E 与距球心的距离r 之间的关系曲线为[ ]。 3、下 7-分析与解 根据静电场的高斯定理可以求得均匀带电球面的电场强度分布为 ?????>πε<=R r r Q R r E 2040。正确答案为(B )。 7-3 下列说法正确的是[ ]。 (A )带正电的物体电势一定是正的 (B)电场强度为零的地方电势一定为零 (C )等势面与电场线处处正交 (D)等势面上的电场强度处处相等 分析与解 正电荷在电场中所受的电场力的方向与电场线的切线方向相同,电荷在等势面上移动电荷时,电场力不做功,说明电场力与位移方向垂直。正确答案为(C )。 7-4 真空中一均匀带电量为Q 的球壳,将试验正电荷q 从球壳外的R 处移至无限远处时,电场力的功为[ ]。 (A )24R qQ o πε (B )R Q o πε4 (C ) R q o πε4 (D )R qQ o πε4 分析与解 静电场力是保守力,电场力做的功等电势能增量的负值,也可以表示成这一过程的电势差与移动电量的乘积,由习题7-2可知电场强度分布,由电势定义式?∞?= R r E d V 可得球壳与无限远处的电势差。正确答案为(D )。 7-5 关于静电场的高斯定理有下面几种说法,其中正确的是[ ]。 (A )如果高斯面上电场强度处处为零,则高斯面内必无电荷; (B )如果高斯面内有净电荷,则穿过高斯面的电场强度通量必不为零; (C )高斯面上各点的电场强度仅由面内的电荷产生; (D )如果穿过高斯面的电通量为零,则高斯面上电场强度处处为零

相关主题
文本预览
相关文档 最新文档