当前位置:文档之家› 应用数理统计习题

应用数理统计习题

应用数理统计习题
应用数理统计习题

考试方式:

《应用数理统计》包括(1)在《实用统计方法》教材或这里所列的部分习题中完成5题(题目要至少分散在3章以上)写出计算程序计算结果,用doc 或pdf 文档发送到 zhang-hh@https://www.doczj.com/doc/a8783437.html, ,占30%;(2)结合自己的专业,写一篇统计方法的应用,或介绍一些新的统计方法等小论文,篇幅不限,论文要标注参考文献,占70%。 《数据统计分析》包括(1)在《实用统计方法》教材或这里所列的部分习题中完成5题(题目要至少分散在3章以上)写出计算程序计算结果,用doc 或pdf 文档发送到zhang-hh@https://www.doczj.com/doc/a8783437.html, ,占30%;(2)闭卷或开卷考试,占70%。

参考教材:《实用统计方法》 西安交通大学 梅长林等 科学出版社 2002。 部分习题

第一章 多元回归分析

1.4某种化工产品的得率Y 与反应温度1X ,反应时间2X 及某反应温度3X 有关。设对于给

定的1X ,2X ,3X ,得率Y 服从正态分布且方差为常数。近得实验结果如下,其中1X ,2X ,3X 均为两水平变量且编码形式表达。

(1)对Y ,拟合以1X ,2X ,3X 为自变量的线性回归模型,求出回归参数估计值及残差。 (2)给定显著水平05.0=α,检验回归系数的显著性。 (3)对05.0=α,检验各自变量对Y 的影响的显著性。

1.7为了研究人们对某种品牌食品的喜爱程度Y 和该食品的水分含量1X ,甜度2X 的关系,,

进行了一个完全随机化设计的小规模试验,得到下列数据:

(1) 拟合回归模型

i i i i X X Y εβββ+++=22110,

写出回归方程,问其中的

1

β如何解释。

(2) 求出残差向量,分别作出残差关于拟合值∧

Y , 1X , 2X 及1X 2X 的残差图及残差

的正态概率图。分析这些残差图并给出你的评述。

(3) 设误差项()16,2,1 =i i ε独立同分布于()2

,0σ

N ,

在01.0=α的水平上检验回归

关系的显著性。写出假设、检验准则及结论并求检验的p-值。

(4) 在(3)中关于i ε的假定下,对自变量一组新的观察值 ()4,5=T

new X ,给出Y 的

预报值的99%置信区间。

(5) 拟合Y 关于1X 的一元线性回归模型,写出回归方程。将1X 的回归系数与(1)中

所求得的1X 的回归系数作比较,你有什么结论。

(6) ()1X SSR 和()21X X SSR 是否相等?二者的意义有何不同?

1.8 某科学基金会的管理人员希望估价从事数学研究工作的中等或较高水平的数学家的

年工资额Y 与他们的研究成果(论文、著作等)的质量指标1X ,从事研究工作的时间2X 以及能成功获得资助的指标3X 之间的关系。为此按一定的试验设计方法调查了24位此类型的数学家,得到下列数据:

(1)对Y 关于1X ,2X ,3X ,拟合线性回归模型,写出回归方程。

(2)求出残差向量,分别作出残差关于∧

Y , 1X ,2X ,3X 及两自变量交叉项的残差图及残差的正态概率图。分析这些残差图,评述你的看法。 (3)设误差项i ε独立同分布于()2

,0σN ,对05.0=α

,检验回归关系的显著性,计算复

相关系数2R 值并解释其意义。

(4)在(3)中对误差项分布的假定下,分别给出回归参数321,,βββ的置信度为95%的置信区间。

(5)在(3)中对误差项分布的假定下,对01.0=α,检验假设31ββ=。 (6)对各自变量的观测数据作如下变换(成为相关变换):

????

? ?

?--=

-

Y

i i s Y

Y n Y 11'

, 3,2,1,11'

=???

?

? ?

?--=

-

k s X X n X k k

ik ik 其中 ∑==

n

i i

Y n

Y 1

_

1

, .3,2,1,1

1

_

==

∑=k X n

X n

i ik k

2

1

_2

1

1∑

=??? ??--=

n

i i Y

Y Y n s ,2

1_

2

11∑=??

? ??--=n

i k ik k X X n s

然后,对数据(i Y ',1i X ',2i X ',3i X ')()24,2,1 =i 拟合线性回归模型。此时回归系数估计如何解释?并推导在变换数据下得到的回归参数估计和(1)中得到的相应估计的关系。

1.9 某医院管理工作者希望了解病人对医院工作的满意程度Y 和病人的年龄1X ,病情的严

重程度2X 和忧虑程度3X 之间的关系。她随机地选取了23位病人,得到下列数据:

(1)通过穷举法分别利用准则()2

p R i ,()p MSE ii ,()p C iii 和()p

PRESS

iv 选择最优回归方

程,并作出相应的图以支持你的判断。四个准则下的最优回归方程是否一致?

(2)给定0.3=E F 及 9.2=D F ,试用逐步回归法选择最优回归方程,其结果和(1)中的结果是否相同?

(3)对所选取的回归方程作进一步的精细分析。

第二章 主成分分析及典型相关分析

2.4下表是美国最大的10家工业公司在某时期内的销售额1x 和利润2x 的数据(单位:兆美

元):

??

??

??=292762309x ,

5

1030.1476.25576

.25520.10005??

?????=S , (1) 求1x ,2x 的样本主成分1y 和2y 及主成分的样本方差,计算各样本主成分的贡

献率。

(2) 求第一样本主成分1y 的观测值并予以排序,它是否基本上反映了原数据的特

性?

2.5 变换第4题中的样本协方差矩阵S 为样本相关矩阵R ,

(1)求标准化样本的主成分及其样本方差,各主成分的贡献率。和第4题(1)中的结果相比有何变化?

(2)求标准化样本的第一主成分的观测值并排序,它和第4题(2)中的结果相比有何变化? (3)就所给的数据,你认为从样本协方差矩阵出发求主成分合理呢,还是从样本阵出发求主成分合理?解释你的观点。

2.7 下表是某城市在42天中的中午十二点的空气污染数据:

你的任务是利用尽可能少的变量提取原数据集的信息。分别样本协方差矩阵和样本相关矩阵作主成分分析,二者的结果有何差异?原始数据的变化可否由三个或更少的主成分反映,你能否给所选取的主成分作出解释?

(1)求其样本相关矩阵R 及它的特征值和相应正交单位化特征向量。 (2)求前两个标准化样本主成分及其累计贡献率。

(3)解释(2)中的两个主成分的意义(事实上,第一主成分近似是各变量的等权重之和,他反应了各国家和地区的运动员的优秀程度,第二主成分可用以度量各国家和地区在各径赛项目上的相对实力)。

(4)基于第一样本主成分的观测值对各国家和地区排序,这与你从原始数据中得到的直观看法是否基本吻合?

2.12从某校初一学生中随机选取了40=n 名,考察下列两组指标:

1X :阅读速度, 2X 阅读理解力; :1Y 计算速度, 2Y :计算正确程度.

根据观测数据求得()T

Y Y X X 2121,,,的相关矩阵为

??

???

?

?

???

??--=?

???

??=00.142.007.006.042.000

.106.024.007

.006.000.163.006.024.063.000.122

12

2111R R R R R ,

(1) 求各对样本典型变量和样本典型相关系数。

(2) 给定05.0=α,检验各对典型变量间的相关性是否显著。利用显著相关的典型变量对解

释描述阅读能力的变量()T X

X 2

1,和描述计算能力的变量()T Y Y 21,之间的关系。

2.13 随机抽取70=n 个家庭考察两个“消费”变量, 和三个“人口统计学”变量321,,Y Y Y

之间的关系,其中

1X : 一个家庭每年进餐馆就餐的次数; 2X :一个家庭每年去电影院看电影的次数; 1Y : 家长的年龄

2Y : 家庭年收入

3Y :家长受教育的程度。

由调查数据求得 ()T

Y Y Y X X 32121,,,,的样本相关矩阵为

????

???

?

???

????

?=????

??=00.135

.021

.034

.034.035.000.137.059.067.021.037.000.133.026.034

.059.033.000.180.034.067.026.080.000.122

12

2111R R R R R

1 求各典型变量对的典型相关系数,并检验其相关的显著性(05.0=α)。

2 求显著相关的典型变量对。

3 利用(2)中典型变量的系数解释“消费”变量与“人口统计学变量”的关系。

第三章 判别分析

3.7下表给出了两类公司的有关金融数据,一类是破产公司,表中数据是这些公司在破产前

两年的四个金融指标。一类是未破产公司在和破产公司大约相同时期的四个相同的金融指标。这四个指标是 。纯销售额

当前资产,当前债务

当前资产,总资产

纯收入,总债务

流通资金=

=

=

=

4321X X X X

各公司的数据如下表(表中最后一列“0”表示破产公司,“1”表示非破产):

(1)对211=n 个破产公司和252=n 个非破产公司就二位变量()21,x x x =求两类公司样本均值)

2()

1(,x

x

和样本协方差矩阵21,S S .

(2)假定()T

X X X 21,=对两总体均服从二维正态分布且协方差矩阵不相同,在等先验分布和等误判损失下,建立Bayes 判别准则。

(3)在(2)中判别准则的貌似误判率和刀切法误判比例,评价此判别准则。

(4)在()()下,1221,95.0,05.021c c q q ===重复(2),(3)分析。你认为这里对总体出现的先验概率分布的假定是否正确,解释之。

(5)假定()T

X X X 21,=对两总体均服从协方差矩阵相等的正态分布,重复(2),(3)的分

析并比较两种分类准则的优良性,哪一个较优?

(6)对变量组()()T

X X T X X 4131,,,重复(1)~(4)的分析,你发现哪个变量组的分类效

果较好?

(7)利用所有四个变量,重复(1)~(4)的分析,结果如何?是否用较多的变量建立的判别准则的分类效果一定优于用其中一部分变量所建立的判别准则的分类效果。

2.8 nderson .A E 在1939年收集了 尾属植物中的三个品种的花的形状尺寸。从这三个品

种(记为321,,G G G )中各选择了50株植物,测量了下述四个变量:

花瓣的宽度

花瓣的长度,

花的萼片宽度

花的萼片长度,====432

1X X X

X

数据如下表

(1)只考虑变量()T

X X 42,,假设三个总体对这两个均服从二维正态分布,在协方差

矩阵不等的假定下,构造二次判别函数(3.3.23),并评估相应的判别准则(3.3.24)分类效果。

(2) 假定有新样品()()T

T

x x x 75.1,5.3,420==,利用(1)中的判别准则对0x 分类。

(3) 假定三个总体的协方差矩阵相等,求线性判别函数(3.3.25),并评估相应的判

别准则(3.3.26)分类效果和(1)中的结果作比较。 (4) 利用(3)中的判别准则判别新样品()()T

T

x x x 75.1,5.3,420==的归类,它和

(2)中的结果是否相同?

(5) 利用全部四个变量重复(1)和(3)的分析,并和(1),(3)中的结果作比较,

评述你的发现。

第四章聚类分析4.1考虑下列4个样品的距离矩阵

1234

10210

3112045340D ?????

?=??????

(1) 用最短距离法、最长距离法和类平均法对这4个样品聚类,画出聚类谱系图。 (2) 将D 转化为模糊矩阵,利用模糊聚类法作聚类分析,画出谱系图。 (3) 比较各方法的聚类结果,指出它们之间的异同

4.2设有5个变量4321,,,X X X X 和5X ,它们之间的相关系数矩阵为

1

23

4

5

1234510.643

10.082

0.08610.0450.2110.16410.013

0.328

0.486

0.185

1X X X X X X X R X X X ??

?

??

???=--?

?-????---??

以R 作为各变量间的相似性度量,利用最短距离法、最长距离法及类平均法对这5个变量作聚类分析,画出谱系图并比较这些结果。若利用模糊聚类法,情况又如何?

4.3根据第二章习题8中关于55个国家和地区1984年前在7个竞赛项目上的女子纪录数据作聚类分析:

(1)利用欧式距离计算各国家和地区间在这7个项目上的距离矩阵。

(2)利用最短距离法、最长距离法和类平均法对这55个国家和地区进行聚类,画出谱系图并比较各个方法的聚类结果的异同。

4.4根据第三章习题8中关于 植物花的形状尺寸距离,将第一类1G 和第二类2G 看成变量()T

X X X X X 4321,,,=的100个观测值(即100个样品)

,定义各样品间的距离为欧氏距离,利用某种谱系聚类法(最小距离法,最大距离法或类平均法)作如下聚类分析, (1)以1X X =为指标变量。 (2)以()T

X X X 21,=为指标变量。

(3)以()T

X X X X 321,,=为指标变量。

(4)以()T

X X X X X 4321,,,=为指标变量。

(5)若将这100个样品分为两类,以上4种聚类结果和实际分类相比,效果如何?是否所

用指标变量越多,聚类效果就越好?

第五章 非参数秩方法

5.2为了解一种新的术后护理方法和原护理方法相比是否可以显著缩短病人手术后的回复时间,随机地将作完某种手术的18位病人分为两组,每组9人,按不同方法护理,观测到他们的恢复时间(单位:天)如下:

原方法:20,21,24,30,32,36,40,48,54;

新方法:19,22,25,26,28,29,34,37,38.

在05.0=α下检验新方法是否显著地缩短了病人手术后的恢复时间。如果对新护理方法是否是缩短还是延长了恢复时间事先并不清楚,情况又如何?

5.5为检验维生素1B 对刺激蘑菇生长的作用是否显著,从24朵大小相近的小蘑菇中随机的选出13朵施以维生素1B ,另外11朵不施维生素1B ,其他条件保持相同。一段时间后测得两组蘑菇的重量如下:

使用维生素1B :27,34,20.5,29.5,20,28,19.5,26.5,22,24.5,34,35.5,19, 未用维生素1B :18,14.5,13.5,12.5,23,24,21,17,18.5,9.5,14.

利用正态逼近求Wilcoxon 秩和检验的p 值,在05.0=α下,维生素1B 对刺激蘑菇生长的效果是否显著。

5.6为了比较两种不同的心理咨询方法的效果,将80位接受心理咨询的人随机的划分为两组,每组40人,其中一组接受一般的心理咨询,另一组接受特殊的心理咨询,试验结束后,将每个人的心理调整效果作仔细评估 ,并分为好,较好,较差和差四档,数据如下:

利用Wilcoxon 秩和检验法检验特殊心理咨询方法的效果是否显著优于一般方法(10.0=α)。

5.8利用Smirnov 检验法求第二题中的检验p 值。

5.9从同一工厂的三条不同的白糖包装线上分别抽取5袋、5袋和4袋白糖,测得其净重量如下(单位:克),

第一条包装线:487,492,510,507,488; 第二条包装线:500,498,503,501,512; 第三条包装线:495,494,506,499.

给定10.0=α,利用Kruskal-Wallis 方法检验这三条包装线包装白糖的重量有无显著差异。

5.14为考察两种不同催化剂对某一化工产品得率的影响,作试验9次,测得数据如下:

影响是否显著。用正态逼近情况如何?()

α。

=

.0

05

5.15有两种不同的水稻品种,分别种植在一分为二的10块田地上,得到它们的产量(单位:公斤)如下:

利用Wilcoxon符号秩检验法检验这两种水稻品种的产量是否有显著差异()

α。

=

.0

05

5.16为了研究四种不同药品对治疗咳嗽的效果是否相同,有7位患者参加试验。每位患者在指定的不连续的4天内随机地服用这四种药品,记录这位患者在这4天内咳嗽的次数如下:

利用Friedman检验和改进的Friedman检验法检验这四种药品对咳嗽的疗效是否相同()

α。

=

05

.0

第六章列联表的独立性分析

6.2 为研究患肺癌是否与吸烟量有关,共计调查肺癌患者及其它疾病的患者各1357人,按每天平均吸烟量(单位:支)分类得如下表:

χ统计量被用以检验患肺癌是否与吸烟量有关,求检验的p值。

Pearson 2

第七章试验设计

7.5交沙霉素片剂处方探索试验。

交沙霉素片在1991年事一种新型抗菌素,对多种疾病有确切疗效且毒副作用小,但其原

料很难溶于水,用常规辅料制成片很难崩解,以致药物不能正常释放,长期以来,国内没有片剂制剂。某药厂决定在片剂中很少用的表面活性剂吐温-80和另外三个因素,采用如下表:

三水平进行正交试验,由于没交互作用,用()493L 安排试验,A,B,C,D 分别安排在第1,2,3,4列上,9次试验的崩解时间(min )分别为19,9,7,11,4.5,6,13,9.5,5.

(1) 用直观分析法确定因素的主次和最佳配方。

(2) 用因素离差平方和最小者作为误差离差平方和的处理方法,在05.0=α下用方差分

析法检验各因素对崩解时间有无显著影响? (3) 经(1)的正交试验分析后知,除淀粉对崩解时间没什么影响外,从因素—指标关系

图可见A,B,D 的最佳点都在边界上,所以还有改进的余地,再进行第二批试验,因

素和水平数如下表所示,用()342L 安排正交试验,4次试验的崩解时间分别为5.5,

7.7中医古今名方改革试验。

中医古今名方之多,浩如烟海,《内经》始载13方,《伤寒杂病》发展为314方,时至明初,朱棣等人编写的《普济方》收方6万余首,后经不断的丰富和发展,实难记其数。因此,有必要对中药古今名方进行改革,以期精益求精。使现代科学技术的手段和方法为振兴中医药事业做出贡献。下面研究“五苓散方”的改革方案。 五苓散方功效:利水渗湿,内停水湿。 主治:(1)外有表症,内停水湿。

(2) 水湿内停的水肿,泄泻,小便不利,以及霍乱吐泻等症。

(3) 痰饮,脐不动悸,吐涎沫而头眩,或短气而咳者。

下面研究五苓散方的利尿作用,取五因素2水平如下表所示,用()7

82

L 确定五苓散方方

案,A,B,C,D,E 分别放在第1,2,4,6,7列,不计交互作用。8次试验的尿量增加量分别为7.3,6.3,4.0,4.6,2.6,4.9,3.8,5.8(ml/30min ),求五苓散方的最佳改革方案.

7.8杀灭病毒性肝炎病毒消毒剂的配方试验。

过氧乙酸是广泛应用的一种杀灭病毒性肝炎病毒的主要消毒剂,但其有效成分极不稳定,以致影响消毒效果,现欲通过试验找出有关因素对其稳定性的影响,并找出使过氧乙酸稳定性饿最优条件。试验的因素及水平列表如下:

选用()792L ,表头设计:A,B,A D D A C B ,,,??分别放在第1,2,3,4,6,7列,每次试验重复两次,将两次重复试验结果相加进行分析,8次试验结果(两次重复试验相加)放置24h 过氧乙酸残存量(mg/3ml )分别为11.11,9.55,1.90,2.86,4.05,5.50,0.65,1.20.

《应用数理统计》期末考试-2011

《应用数理统计》期末考试试题 (2011-11-26上午8:30—10:30) 学院: 学号: 姓名: 注意:所有题目答案均做在答题纸上,该试卷最后随答题纸一同上交,否则成绩无效。 1、(20分)设总体X 服从正态分布(0,1)N ,12,X X 为来自总体X 的简单样本,设112212; Y X X Y X X =+=-。 (1)求二维随机变量12(,)Y Y 的联合密度()21,y y f ; (2)分别求12,Y Y 的边缘密度函数()()2121,y f y f Y Y ; (3)12,Y Y 是否独立?说明根据。 (4)叙述2χ分布的构造性定义。能否通过取适当的常数c ,使得2212()c Y Y +服从2χ分布?若可以,求出c ,并写出所服从的2χ分布的自由度。 2、(20分)设12,,,n X X X 是来自正态总体() 2~0,X N σ的简单样本,记 22221 21111??();1n n i i i i X X X n n σσ===-=-∑∑,其中11n i i X X n ==∑, (1)证明:21?σ是2 σ的渐近有效估计量; (2)证明:22?σ是2 σ的有效估计量; (3)试分别以21?σ,22?σ为基础构造2 σ的两种1α-置信区间。你认为你得到的哪个估计区间会更好一些?为什么? 3、(20分)(1)简述假设检验的一般步骤; (2)某厂生产一批产品,质量检查规定:若次品率0.05p ≤,则这批产品可以出厂,否则不能出厂。现从这批产品中抽查400件产品,发现有30件是次品,问:在显著性水平0.05α=下,这批产品能否出厂?若取显著性水平0.02α=,会得出什么结论?α是越小越好吗?对你的答案说明理由。 要求:将此问题转化成统计问题,利用所学知识给出合理的、令人信服的推断,推断过程的每一步要给出理由或公式。分位点定义如下: 若随机变量W ,对任意的()1,0∈α,有()α=≤x W P ,称x 为W 的α分位点,记作αx 。

应用数理统计试题库

一 填空题 1 设 6 21,,,X X X 是总体 ) 1,0(~N X 的一个样本, 26542321)()(X X X X X X Y +++++=。当常数C = 1/3 时,CY 服从2χ分布。 2 设统计量)(~n t X ,则~2X F(1,n) , ~1 2 X F(n,1) 。 3 设n X X X ,,,21 是总体),(~2 σu N X 的一个样本,当常数C = 1/2(n-1) 时, ∑-=+-=1 1 212 )(n i i i X X C S 为2σ的无偏估计。 4 设)),0(~(2σεε βαN x y ++=,),,2,1)(,(n i y x i i =为观测数据。对于固定的0x , 则0x βα+~ () 2 0201,x x N x n Lxx αβσ?? ? ?- ???++ ??? ?????? ? 。 5.设总体X 服从参数为λ的泊松分布,,2,2,, 为样本,则λ的矩估计值为?λ = 。 6.设总体2 12~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的 置信区间为 ()()()()22 2212211,11n S n S n n ααχχ-??--????--???? 。 7.设X 服从二维正态),(2∑μN 分布,其中??? ? ??=∑??? ? ??=8221, 10μ 令Y =X Y Y ???? ??=???? ??202121,则Y 的分布为 ()12,02T N A A A A μ??= ??? ∑ 。 8.某试验的极差分析结果如下表(设指标越大越好): 表2 极差分析数据表

应用数理统计吴翊李永乐第三章假设检验课后作业参考答案

第三章 假设检验 课后作业参考答案 某电器元件平均电阻值一直保持Ω,今测得采用新工艺生产36个元件的平均电阻值为Ω。假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。已知改变工艺前的标准差为Ω,问新工艺对产品的电阻值是否有显著影响(01.0=α) 解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36 /06.064 .261.2/u 00 -=-= -= n X σμ (3)否定域???? ??>=???? ??>?? ??? ??<=--21212 αααu u u u u u V (4)给定显著性水平01.0=α时,临界值575.2575.22 12 =-=- α αu u , (5) 2 αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测 得其寿命平均值为950(小时)。已知这种元件寿命服从标准差100σ=(小时)的正态分布, 试在显著水平下确定这批元件是否合格。 解:

{}01001:1000, H :1000 X 950 100 n=25 10002.5 V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得: 拒绝域: 本题中:0.950.950 u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。 某厂生产的某种钢索的断裂强度服从正态分布( )2 ,σ μN ,其中()2 /40cm kg =σ。现从一 批这种钢索的容量为9的一个子样测得断裂强度平均值为X ,与以往正常生产时的μ相比, X 较μ大20(2/cm kg )。设总体方差不变,问在01.0=α下能否认为这批钢索质量显著提 高 解: (1)提出假设0100::μμμμ>=H H , (2)构造统计量5.13 /4020 /u 00 == -= n X σμ (3)否定域{}α->=1u u V (4)给定显著性水平01.0=α时,临界值33.21=-αu (5) α-<1u u ,在否定域之外,故接受原假设,认为这批钢索质量没有显著提高。 某批矿砂的五个样品中镍含量经测定为(%): 设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为

应用数理统计课后习题参考答案

习题五 1 试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05) 解 根据问题,因素A 表示日期,试验指标为钢锭重量,水平为5. 假设样本观测值(1,2,3,4)ij y j =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= . 检验的问题:01251:,:i H H μμμμ===不全相等 . 计算结果: 表5.1 单因素方差分析表 ‘*’ . 查表0.95(4,15) 3.06F =,因为0.953.9496(4,15)F F =>,或p = 0.02199<0.05, 所以拒绝0H ,认为不同日期生产的钢锭的平均重量有显著差异. 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 试检验在四种不同催化剂下平均得率有无显著差异?(=0.05) 解 根据问题,设因素A 表示催化剂,试验指标为化工产品的得率,水平为4 . 假设样本观测值(1,2,...,)ij i y j n =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= .其中

样本容量不等,i n 分别取值为6,5,3,4 . 检验的问题:012341:,:i H H μμμμμ===不全相等 . 计算结果: 表5.2 单因素方差分析表 查表0.95(3,14) 3.34F =,因为0.952.4264(3,14)F F =<,或p = 0.1089 > 0.05, 所以接受0H ,认为在四种不同催化剂下平均得率无显著差异 . 3 试验某种钢的冲击值(kg ×m/cm2),影响该指标的因素有两个,一是含铜量A , 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(=0.05) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用. 设因素,A B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12. 假设样本观测值(1,2,3,1,2,3,4)ij y i j ==来源于正态总体2 ~(,),1,2,3,ij ij Y N i μσ= 1,2,3,4j = .记i α?为对应于i A 的主效应;记j β?为对应于j B 的主效应; 检验的问题:(1)10:i H α?全部等于零,11 :i H α?不全等于零; (2)20:j H β?全部等于零,21:j H β?不全等于零; 计算结果: 表5.3 双因素无重复试验的方差分析表 查表0.95(2,6) 5.143F =,0.95(3,6) 4.757F =,显然计算值,A B F F 分别大于查表值, 或p = 0.0005,0.0009 均显著小于0.05,所以拒绝1020,H H ,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用. 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:

应用数理统计试题

应用数理统计复习题 1.设总体~(20,3)X N ,有容量分别为10,15的两个独立样本,求它们的样本均值之差的绝对值小于0.3的概率. 解:设两样本均值分别为,X Y ,则1~(0,)2 X Y N - (||0.3)(0.424)(0.424)0.328P X Y -<=Φ-Φ-= 其中(01)θθ<<为未知参数,已知取得了样本值1231,2,1x x x ===,求θ的矩估计和最大似然估计. 解:(1)矩估计:2 2 22(1)3(1)23EX θθθθθ=+?-+-=-+ 14 (121)33 X =++= 令EX X =,得5?6 θ=. (2)最大似然估计: 2 2 5 6 ()2(1)22L θθθθθθθ=??-=- 45ln() 10120d d θθθθ=-= 得5?6 θ= 3. 设某厂产品的重量服从正态分布,但它的数学期望μ和方差2 σ均未知,抽查10件,测得重量为i X 斤10,,2,1Λ=i 。算出 10 11 5.410i i X X ===∑ 10 21 () 3.6i i X X =-=∑ 给定检验水平0.05 α=,能否认为该厂产品的平均重量为5.0斤? 附:t 1-0.025(9)=2.2622 t 1-0.025(10)=2.2281 t 1-0.05(9)=1.8331 t 1-0.05(10)=1.8125 解: 检验统计量为0 | |/X T S n m -=

将已知数据代入,得2t = = 1/2 0.975(1)(9) 2.26222t n t a - -==> 所以接受0H 。 4. 在单因素方差分析中,因素A 有3个水平,每个水平各做4次重复实验,完成下列方差分析表,在显著水平0.05α=下对因素A 是否显著做检验。 解: 0.95(2,9) 4.26F =,7.5 4.26F =>,认为因素A 是显著的. 5. 现收集了16组合金钢中的碳含量x 及强度y 的数据,求得 0.125,45.7886,0.3024,25.5218xx xy x y L L ====,2432.4566yy L =. (1)建立y 关于x 的一元线性回归方程01 ???y x ββ=+; (2)对回归系数1β做显著性检验(0.05α=). 解:(1)1 25.5218 ?84.39750.3024 xy xx l l β== = 01 ??35.2389y x ββ=-= 所以,?35.238984.3975y x =+ (2)1?2432.456684.397525.5218278.4805e yy xy Q l l β=-=-?= 2 278.4805 ?19.8915214 e Q n σ ===- ? 4.46σ ==

北航2010应用数理统计考试题及参考解答

北航2010《应用数理统计》考试题及参考解答 09B 一、填空题(每小题3分,共15分) 1,设总体X 服从正态分布(0,4)N ,而12 15(,,)X X X 是来自X 的样本,则22 110 22 11152() X X U X X ++=++服从的分布是_______ . 解:(10,5)F . 2,?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 3,分布拟合检验方法有_______ 与____ ___. 解:2 χ检验、柯尔莫哥洛夫检验. 4,方差分析的目的是_______ . 解:推断各因素对试验结果影响是否显著. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计?β的协方差矩阵?βCov()=_______ . 解:1?σ-'2Cov(β) =()X X . 二、单项选择题(每小题3分,共15分) 1,设总体~(1,9)X N ,129(,, ,)X X X 是X 的样本,则___B___ . (A ) 1~(0,1)3X N -; (B )1 ~(0,1)1X N -; (C ) 1 ~(0,1) 9X N -; (D ~(0,1)N . 2,若总体2(,)X N μσ,其中2σ已知,当样本容量n 保持不变时,如果置信度1α-减小,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,就检验结果而言,以下说法正确的是____B___ . (A )拒绝和接受原假设的理由都是充分的; (B )拒绝原假设的理由是充分的,接受原假设的理由是不充分的; (C )拒绝原假设的理由是不充分的,接受原假设的理由是充分的; (D )拒绝和接受原假设的理由都是不充分的. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方和,则总有___A___ .

应用数理统计(武汉大学研究生)2009-2010试题

武汉大学2009-2010年度上学期研究生公共课 《应用数理统计》期末考试试题 (每题25分,共计100分) (请将答案写在答题纸上) 1设X 服从),0(θ上的均匀分布,其密度函数为 ?????<<=其它0 01)(θθx x f n X X X ,,,21" 为样本, (1)求θ的矩估计量1?θ和最大似然估计量2 ?θ; (2)讨论1?θ、2?θ的无偏性,1?θ、2?θ是否为θ的无偏估计量?若不是,求使得i c ?i i c θ为θ的无偏估计量,; 1,2i =(3)讨论1?θ、2 ?θ的相合性; (4)比较11?c θ和22?c θ的有效性. 2. 假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X 得到两组数据,经对其作相应运算得 2110.190,0.006,x s == 2220.238,0.008x s == 假设测定结果服从正态分布()()2~,1,2i i X i μσ=, (1).在显著性水平0.10α=下,能否认为2212σσ=? (2).求12μμ?的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。 3.设是来自正态总体的样本, 总体均值n X X X ,,,21"),(2 σμN μ和方差未知,样本均值和方差分别记为2σ2211 11,(1n n i i i i )X X S X X n n ====?∑∑?

(1) 求2211 (n i i X )μσ=?∑的分布; (2)若0μ=,求212212()() X X X X +?的分布; (3)方差的置信度为12σα?的置信区间的长度记为L ,求()E L ; (4)1n X + 的分布。 4.为进行病虫害预报, 考察一只红铃虫一代产卵量Y (单位:粒)与温度x (单位:)的关系, 得到资料如下: C 0x 18 20 24 26 30 32 35 Y 7 11 21 24 66 115 325 假设Y 与x 之间有关系 bx Y ae ε+=, . ),0(~2σεN 经计算:26.43x =,ln 3.612y =,,, 7215125i i x ==∑721(ln )102.43i i y ==∑7 1ln 718.64i i i x y ==∑(1)求Y 对x 的曲线回归方程; x b e a y ???=(2)求的无偏估计; 2σ2?σ (3)对回归方程的显著性进行检验(05.0=α); (4)求当温度0x =33时,产卵量的点估计。 0Y 可能用到的数据: 0.02282z =,()()0.050.057,8 3.50,8,7 3.73F F ==,()0.0515 1.7531t =,,,,0.025(5) 2.5706t =0.05(5) 2.015t =0.025(7) 2.3646t =0.05(7) 1.8946t =,0.05(1,5) 6.61F =, 0.05(1,7) 5.59F =

北航数理统计期末考试题

材料学院研究生会 学术部 2011 年12 月 2007-2008学年第一学期期末试卷 一、(6 分,A 班不做)设x1,x2,?,x n是来自正态总体N( , 2) 的样本,令 2(x1 x2) T (x3 x4)2 (x5 x6)2 , 试证明T 服从t-分布t(2) 二、( 6 分, B 班不做 ) 统计量F-F(n,m) 分布,证明 1的 (0< <1)的分位点x 是1。 F F1 (n,m) 。 三、(8分)设总体X 的密度函数为 其中1,是位置参数。x1,x2,?,x n是来自总体X 的简单样本, 试求参数的矩估计和极大似然估计。 四、(12分)设总体X 的密度函数为 1x exp ,x p(x; ) 0 , 其它 其中, 已知,0, 是未知参数。x1,x2,?,x n 是来自总体X 的简单样本。

1)试求参数的一致最小方差无偏估计; 2) 是否为的有效估计?证明你的结论。 五、(6分,A 班不做)设x1,x2,?,x n是来自正态总体N( 1, 12) 的 简单样本,y1,y2,?,y n 是来自正态总体N( 2, 22) 的简单样本,且两样本相互独立,其中1, 12, 2, 22是未知参数,1222。为检验假设H0 : 可令z i x i y i, i 1,2,..., n ,1 2 , 1 2, H1 : 1 2, 则上述假设检验问题等价于H0 : 1 0, H1: 1 0,这样双样本检验问题就变为单检验问题。基于变换后样本z1,z2,?,z n,在显著性水平下,试构造检验上述问题的t-检验统计量及相应的拒绝域。 六、(6 分,B 班不做)设x1,x2,?,x n是来自正态总体N( 0, 2) 的简单样本,0 已知,2未知,试求假设检验问题 H0: 202, H1: 202的水平为的UMPT。 七、(6 分)根据大作业情况,试简述你在应用线性回归分析解决实际问题时应该注意哪些方面? 八、(6 分)设方差分析模型为 总离差平方和 试求E(S A ) ,并根据直观分析给出检验假设H0 : 1 2 ... P 0的拒绝域形式。 九、(8分)某个四因素二水平试验,除考察因子A、B、C、D 外,还需考察 A B ,B C 。今选用表L8(27 ) ,表头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。

应用数理统计课后习题参考答案

习题五 1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:k g) 日期重旦量 1 5500 5800 5740 5710 2 5440 5680 5240 5600 4 5400 5410 5430 5400 9 5640 5700 5660 5700 10 5610 5700 5610 5400 试检验不同日期生产的钢锭的平均重量有无显著差异? ( =0.05) 解根据问题,因素A表示日期,试验指标为钢锭重量,水平为 5. 2 假设样本观测值y j(j 123,4)来源于正态总体Y~N(i, ),i 1,2,...,5 检验的问题:H。:i 2 L 5, H i : i不全相等. 计算结果: 注释当=0.001表示非常显著,标记为*** '类似地,=0.01,0.05,分别标记为 查表F0.95(4,15) 3.06,因为F 3.9496 F0.95(4,15),或p = 0.02199<0.05 ,所 以拒绝H。,认为不同日期生产的钢锭的平均重量有显著差异 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 解 根据问题,设因素A表示催化剂,试验指标为化工产品的得率,水平为 4 . 2 假设样本观测值y j(j 1,2,..., nJ来源于正态总体Y~N(i, ), i 1,2,...,5 .其中样本容量不等,n分别取值为6,5,3,4 .

日产量 操作工 查表 F O .95(3,14) 3.34,因为 F 2.4264 F °.95(3,14),或 p = 0.1089 > 0.05, 所以接受H 。,认为在四种不同催化剂下平均得率无显著差异 3 试验某种钢的冲击值(kg Xm/cm2 ),影响该指标的因素有两个,一是含铜量 A ,另 一个是温度 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异? ( =0.05 ) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用 设因素A,B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为 12. 2 假设样本观测值y j (i 1,2,3, j 1,2,3,4)来源于正态总体 Y j ~N (j , ),i 1,2,3, j 1,2,3,4 .记i 为对应于A 的主效应;记 j 为对应于B j 的主效应; 检验的问题:(1) H i 。: i 全部等于零,H i — i 不全等于零; (2) H 20 : j 全部等于零,H 21: j 不全等于零; 计算结果: 查表F 0.95(2,6) 5.143 ,局.95(3,6) 4.757 ,显然计算值F A , F B 分别大于查表值, 或p = 0.0005 , 0.0009均显著小于0.05,所以拒绝H i°,H 20,认为含铜量和试验温度 都会对钢的冲击值产生显著影响作用 . 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量: 检验的问题:H 0: 1 计算结果: H i : i 不全相等

应用数理统计试题

应用数理统计复习题 1.设总体,有容量分别为10,15的两个独立样本,求它们的样本均值之差的绝对值小于0.3的概率. 解:设两样本均值分别为,则 2. 设总体具有分布律 1 2 3 其中为未知参数,已知取得了样本值,求的矩估计和最大似然估计. 解:(1)矩估计: 令,得. (2)最大似然估计: 得 3. 设某厂产品的重量服从正态分布,但它的数学期望和方差均未知,抽查10件,测得重量为斤。算出 给定检验水平,能否认为该厂产品的平均重量为5.0斤? 附:t1-0.025(9)=2.2622 t1-0.025(10)=2.2281 t1- 0.05(9)=1.8331 t1-0.05(10)=1.8125 解: 检验统计量为

将已知数据代入,得 所以接受。 4. 在单因素方差分析中,因素有3个水平,每个水平各做4次重复实验,完成下列方差分析表,在显著水平下对因素是否显著做检验。 来源平方和自由度均方和F比 因素 4.2 误差 2.5 总和 6.7 解: 来源平方和自由度均方和F比 因素 4.2 2 2.1 7.5 误差 2.5 9 0.28 总和 6.7 11 ,,认为因素是显著的. 5. 现收集了16组合金钢中的碳含量及强度的数据,求得 ,. (1)建立关于的一元线性回归方程; (2)对回归系数做显著性检验(). 解:(1) 所以, (2)

拒绝原假设,故回归效果显著. 6.某正交试验结果如下 列号 试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 (1)找出对结果影响最大的因素; (2)找出“算一算”的较优生产条件;(指标越大越好) (3)写出第4号实验的数据结构模型。 解: 列号 试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 ⅠⅡR 29.79 25.36 32.0 30.86 35.29 28.65 1.07 9.9 3.35 (1)对结果影响最大的因素是B; (2)“算一算”的较优生产条件为 (3) 4号实验的数据结构模型为 ,

应用数理统计习题答案 西安交大 施雨

应用数理统计答案 学号: 姓名: 班级:

目录 第一章数理统计的基本概念 (2) 第二章参数估计 (14) 第三章假设检验 (24) 第四章方差分析与正交试验设计 (29) 第五章回归分析 (32) 第六章统计决策与贝叶斯推断 (35) 对应书目:《应用数理统计》施雨著西安交通大学出版社

第一章 数理统计的基本概念 1.1 解:∵ 2 (,)X N μσ ∴ 2 (,)n X N σμ ∴ (0,1)N 分布 ∴(1)0.95P X P μ-<=<= 又∵ 查表可得0.025 1.96u = ∴ 2 2 1.96n σ= 1.2 解:(1) ∵ (0.0015)X Exp ∴ 每个元件至800个小时没有失效的概率为: 800 0.00150 1.2 (800)1(800) 10.0015x P X P X e dx e -->==-<=-=? ∴ 6个元件都没失效的概率为: 1.267.2 ()P e e --== (2) ∵ (0.0015)X Exp ∴ 每个元件至3000个小时失效的概率为: 3000 0.00150 4.5 (3000)0.00151x P X e dx e --<===-? ∴ 6个元件没失效的概率为: 4.56 (1)P e -=- 1.4 解:

i n i n x n x e x x x P n i i 1 2 2 )(ln 2121)2(),.....,(1 22 =-- ∏∑ = =πσμσ 1.5证: 2 1 1 2 2)(na a x n x a x n i n i i i +-=-∑∑== ∑∑∑===-+-=+-+-=n i i n i i n i i a x n x x na a x n x x x x 1 2 2 2 2 11) ()(222 a) 证: ) (1111 1+=+++=∑n n i i n x x n x ) (1 1 )(1 1 11n n n n n x x n x x x n n -++=++=++

应用数理统计课后习题 清华大学出版社 杨虎 钟波第三章作业参考答案

第 三 章 作 业 参 考 答 案 2、解:计算矩估计:2 1)1(1 ++= +?= ? αααα dx x x EX , 令 X EX =++= 2 1αα ,解得 1 2-1?1-=X X α ; 计算极大似然估计:α α αα α)()1()1()()(1 1 1 ∏∏∏ ===+=+= = n i i n n i i n i i x x x f L )ln()1ln()(ln 1 ∏=++=?n i i x n L ααα0 )ln(1 )(ln 1 =++= ??? ∏=n i i x n L αα α 解得 ) ) ln(1(?1 2∏=+-=n i i x n α ; 将样本观测值代入,得到估计值分别为0.3077?1=α ,0.2112?2=α。 6、 解:(1)由例3.2.3可知,μ的极大似然估计分别为 X =μ ?, 05.0)(1)(=-Φ-=>μA A X P )645.1(95.0)(Φ==-Φ?μA 645 .1+=?μA ,由46页上极大似然估计的不变性可知645.1??+=μA ; (2)由例3.2.3可知,2 σμ,的极大似然估计分别为 ∑=-= =n i i X X n X 1 2 2 ) (1 ??σ μ,, 05.0)( 1)(=-Φ-=>σ μ A A X P )645.1(95.0)( Φ==-Φ?σ μ A σ μ645.1+=?A ,由46页上极大似然估计的不变性可知σμ?645.1??+=A 。 8、解:计算2 2 2 2222)()()(σσ μC n S CE X E CS X E -+ =-=-,由题意则有 2 2 2 2 μσ σ μ=-+ C n ,解得n C 1= 。

概率数理统计试题及答案

应用数理统计试题 1.设15,,X X 是独立且服从相同分布的随机变量,且每一个()1,2,,5i X i = 都服从()0,1.N (1)试给出常数c ,使得()22 12c X X +服从2χ公布,并指出它的自由度; (2)试给出常数,d 使得 服从t 分布,并指出它的自由度. 2.设总体X 的密度函数为 ???<<+=其他, 01 0,)1();(x x x f ααα 其中1->α是未知参数, ),,(1n X X 是一样本, 试求: (1) 参数α的矩估计量; (2) 参数α的最大似然估计量. 3.有一种新安眠剂,据说在一定剂量下能比某种旧安眠剂平均增加睡眠时间3小时,为了检验新安眠剂的这种说法是否正确,收集到一组使用新安眠剂的睡眠时间(单位:小时): 26.7, 22.0, 24.1, 21.0, 27.2, 25.0, 23.4. 根据资料用某种旧安眠剂时平均睡眠时间为20.8小时,假设用安眠剂后睡眠时间服从正态分布,试问这组数据能否说明新安眠剂的疗效?()0.05.α= 4.若总体X 服从正态分布() 22.1,1N ,样本n X X X ,,,21 来自总体X ,要使样本均值X 满足不等式{}95.01.19.0≥≤≤X P ,求样本容量n 最少应取多少? 5.在某种产品表明进行腐蚀刻线实验,得到腐蚀深度y 与腐蚀时间x 对应的一

(1)预测腐蚀时间75s 时,腐蚀深度的范围(α-1=95%); (2)若要求腐蚀深度在10~20um 之间,问腐蚀时间应如何控制? 6.简述方差分析,主成分分析的基本思想 附:统计查表数据 0.025(6) 2.447t =,0.025(7) 2.365t =,(1.96)0.975Φ= 参考答案: 1.设15,,X X 是独立且服从相同分布的随机变量,且每一个()1,2,,5i X i = 都服从()0,1.N (1)试给出常数c ,使得() 22 12c X X +服从2χ公布,并指出它的自由度; (2)试给出常数,d 使得服从t 分布,并指出它的自由度. 解 (1)由于()()()22 21212~0,1,~0,1, ~2X N X N X X +χ故 因此1c =,1222 X X +服从自由度为2的2χ分布. (2)由于()()~0,11,2,5i X N i = 且独立,则()12~0,2X X N + ()~0,1N 而 ()22223453X X X ++=χ ()~3,t ()~3t 所以d =自由度为3. 2. 设总体X 的密度函数为 ???<<+=其他, 01 0,)1();(x x x f ααα 其中1->α是未知参数, ),,(1n X X 是一样本, 试求:

研究生《应用数理统计基础》庄楚强 四五章部分课后答案

4-45. 自动车床加工中轴,从成品中抽取11根,并测得它们的直径(mm )如下: 10.52,10.41,10.32,10.18,10.64,10.77,10.82,10.67,10.59,10.38,10.49 试用W 检验法检验这批零件的直径是否服从正态分布?(显著性水平05.0=α) (参考数据:) 4-45. 解:数据的顺序统计量为: 10.18,10.32,10.38,10.41,10.49,10.52,10.59,10.64,10.67,10.77,10.82 所以 6131 .0][)()1(5 1 ) (=-= -+=∑k k n k k x x a L , 又 5264.10=x , 得 38197 .0)(11 1 2 =-∑=i i x x 故 984.0) (11 1 2 2 =-= ∑=i i x x L W , 又 当n = 11 时,85.005.0=W 即有 105.0<

北航数理统计期末考试题

北航数理统计期末考试题 2011年2007-2008学年第一学期期末试卷一、(6分,A班不做)设x1,x2,…,xn是来自正态总体的样本,令,试证明T服从t-分布t(2) 二、(6分,B班不做)统计量F-F(n,m)分布,证明。 三、(8分)设总体X的密度函数为其中,是位置参数。x1,x2,…,xn是来自总体X的简单 样本,试求参数的矩估计和极大似然估计。 四、(12分)设总体X的密度函数为,其中是未知参数。x1,x2,…,xn是来自总体X的简 单样本。 (1)试求参数的一致最小方差无偏估计; (2)是否为的有效估计证明你的结论。 五、(6分,A班不做)设x1,x2,…,xn是来自正态总体的简单样本,y1,y2,…,yn是 来自正态总体的简单样本,且两样本相互独立,其中是未知参数,。为检验假设可令则上述假设检验问题等价于这样双样本检验问题就变为单检验问题。基于变换后样本z1,z2,…,zn,在显著性水平下,试构造检验上述问题的t-检验统计量及相应的拒绝域。 六、(6分,B班不做)设x1,x2,…,xn是来自正态总体的简单样本,已知,未知,试求假 设检验问题的水平为的UMPT。 七、(6分)根据大作业情况,试简述你在应用线性回归分析解决实际问题时应该注意哪些方 面八、(6分)设方差分析模型为总离差平方和试求,并根据直观分析给出检验假设的拒绝域形式。 九、(8分)某个四因素二水平试验,除考察因子A、B、C、D外,还需考察,。今选用表,表 头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。 列号试验号ABCD实验数据 12345671111111112.82111222228.23122112226.14122221135.35212121230.5621221214 .37221122133.3822121124.0十、(8分)对某中学初中12岁的女生进行体检,测量四个变量,身高x1,体重x2,胸围x3,坐高x4。现测得58个女生,得样本数据(略),经计算指标的协方差阵V的极大似然估计为且其特征根为。 (1)试根据主成分85%的选择标准,应选取几个主要成分(2)试求第一主成分。 2006级硕士研究生《应用数理统计》试题一、选择题(每小题3分,共12分) 1.统计量T~t(n)分布,则统计量T2的α(0α1)分位点xα(P{T2≤xα}=α)是()

清华大学杨虎应用数理统计课后习题参考答案

习题三 1 正常情况下,某炼铁炉的铁水含碳量2 (4.55,0.108)X N .现在测试了5炉铁水,其含碳量分别为4.28,4.40,4.42,4.35,4.37. 如果方差没有改变,问总体的均值有无显著变化?如果总体均值没有改变,问总体方差是否有显著变化(0.05α=)? 解 由题意知 2 ~(4.55,0.108),5,0.05X N n α==,1/20.975 1.96u u α-==,设立 统计原假设 0010:,:H H μμμμ=≠ 拒 绝 域 为 {} 00K x c μ=->,临界值 1/2 1.960.108/0.0947c u α-==?=, 由于 0 4.364 4.550.186x c μ-=-=>,所以拒绝0H ,总体的均值有显著性 变化. 设立统计原假设 2 2 2 2 0010:,:H H σσσσ=≠ 由于0μμ=,所以当0.05α=时 2 222 0.0250.9751 1()0.03694,(5)0.83,(5)12.83,n i i S X n μχχ==-===∑ 22 10.02520.975(5)/50.166,(5)/5 2.567c c χχ==== 拒绝域为 {} 2222 00201//K s c s c σσ=><或 由于22 0/ 3.167 2.567S σ=>,所以拒绝0H ,总体的方差有显著性变化. 2 一种电子元件,要求其寿命不得低于1000h .现抽测25件,得其均值为 x =950h .已知该种元件寿命2(100,)X N σ,问这批元件是否合格(0.05α=)? 解 由题意知 2 (100,)X N σ,设立统计原假设 0010:,:,100.0.05.H H μμμμσα≥<== 拒绝域为 {} 00K x c μ=-> 临界值为 0.050.0532.9c u u =?=?=- 由于 050x c μ-=-<,所以拒绝0H ,元件不合格.

最新研究生《应用数理统计基础》庄楚强-何春雄编制---课后答案

研究生 习题2: 2-7. 设 )1,0(~N ξ,),,,,,(654321ξξξξξξ为其一样本,而26542321)()(ξξξξξξη+++++=, 试求常数c ,使得随机变量ηc 服从2 χ分布。 2-7解:设3211ξξξη++=,所以 )3,0(~1N η 6542ξξξη++=,所以 )3,0(~2N η 所以 )1,0(~3 1 N η , )1,0(~3 2 N η )2(~)(3 1332 22212 22 1χηηηη+=??? ??+??? ?? 由于 2 22 1ηηη+= 因此 当 3 1=c 时,)2(~2 χηc 。 2-8. 设 ),,,(1021ξξξΛ为)3.0,0(2 N 的一个样本,求 ? ?? ???>∑=101244.1i i P ξ 。(参考数据:) 2-8解:因为 )3.0,0(~),,,(2 1021N ξξξξΛ=, 所以 )1,0(~3 .0N ξ , 即有)10(~3.0210 12 χξ∑=?? ? ??i i 所以 ??? ???>∑=101244.1i i P ξ??????>=∑=1012223.044.13.0i i P ξ??????>=∑=10122163.0i i P ξ ? ?? ???≤-=∑=10122163.01i i P ξ1.09.01=-= 2-14. 设总体)4,1(~N ξ,求{}20≤≤ξP 与{} 20≤≤ξP ,其中ξ是样本容量为16的样 本均值。(参考数据:)

2-14解: {}20≤≤ξP )0()2(F F -=)210()212( -Φ--Φ=)2 1 ()21(-Φ-Φ= 1)2 1 (2-Φ=3830.016915.02=-?= 由于 )4,1(~N ξ , 所以 )1,0(~21 1 16 21N -=-ξξ {} 20≤≤ξP ????? ?-≤-≤-=21122112110ξP ? ?? ???≤-≤-=22112ξP )2()2(-Φ-Φ=9545.019725.021)2(2=-?=-Φ= 2-17. 在总体)20,80(2 N 中随机抽取一容量为100的样本,问样本平均值与总体均值的差的 绝对值大于3的概率是多少?(参考数据:) 2-17解:因为 )20,80(~2 N ξ, 所以 )1,0(~2 80 100 20 80 N -= -ξξ 所以 {}380>-ξP {} 3801≤--=ξP ?? ? ?????? ?≤--=232801ξP ? ?? ???≤ -≤--=23280 231ξP )]5.1()5.1([1-Φ-Φ-= ]1)5.1(2[1-Φ-=1336.0)93319.01(2)5.1(22=-=Φ-= 2-25. 设总体ξ的密度函数为 ?? ?<<=其它 102)(x x x p 取出容量为4的样本),,,(4321ξξξξ,求: (1) 顺序统计量)3(ξ的密度函数)(3x p ;(2))3(ξ的分布函数)(3x F ;(3)??? ? ??>21)3(ξP 。 2-25解:(1)由 ()()[][])()(1)(! !1! )(1)(x p x F x F k n k n x p k n k k -----= ξ 所以 当 10<

2009(上)《数理统计》考试题(A卷)及参考解答

2009(上)《数理统计》考试题(A 卷)及参考解答 一、填空题(每小题3分,共15分) 1,设总体X 和Y 相互独立,且都服从正态分布2(0,3)N ,而129(,,)X X X 和129(,,)Y Y Y 是分别来自X 和Y 的样本,则U = 服从的分布是_______ . 解:(9)t . 2,设1?θ与2?θ都是总体未知参数θ的估计,且1?θ比2?θ有效,则1?θ与2 ?θ的期望与方差满足_______ . 解:1212 ????()(), ()()E E D D θθθθ=<. 3,“两个总体相等性检验”的方法有_______ 与____ ___. 解:秩和检验、游程总数检验. 4,单因素试验方差分析的数学模型含有的三个基本假定是_______ . 解:正态性、方差齐性、独立性. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计是?β=_______ . 解:1?-''X Y β= ()X X . 二、单项选择题(每小题3分,共15分) 1,设12(,,,)(2)n X X X n ≥ 为来自总体(0,1)N 的一个样本,X 为样本均值,2 S 为样本方差,则 ____D___ . (A )(0,1)nX N ; (B )2 2()nS n χ ; (C ) (1)()n X t n S - ; (D )2 12 2 (1)(1,1)n i i n X F n X =--∑ . 2,若总体2(,)X N μσ ,其中2σ已知,当置信度1α-保持不变时,如果样本容量n 增大,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,分别用α,β表示犯第一类错误和第二类错误的概率,则当样本容量n 一定时,下列说法中正确的是____C___ . (A )α减小时β也减小; (B )α增大时β也增大; (C ),αβ其中一个减小,另一个会增大; (D )(A )和(B )同时成立. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方

相关主题
相关文档 最新文档