当前位置:文档之家› 应用数理统计课件(配庄楚强版教材)第四章3

应用数理统计课件(配庄楚强版教材)第四章3

§4.5 分布拟合检验

Test of Distribution Fitting

§4.6 两总体相等的检验

Test for Equality of Two Populations 1

一、χ拟合检验

Example 1.7台自动机床在相同条件下,独立完成

,…,7 .

i i i

() 21χ??

k r

?p n

i

认为不是等可能,故障的发生

暴雨次数i

0 1 2 3 4 5 6 7 8

i

2.9064

H0:F(x)= F0(x),

{x∞<<∞?

x

x

组中值,数据如下:

可以不写)

(H

1

渐进无偏n = 100够大可用)

ξ?

11

2.33)=0.0099 (查表p532(342))

14

计算结果列成表格(p263(157)).

D n = 表中最后两大列中的最大数值= F n (11.01) -F 0(11.00) = 0.1700;

临界值:(查表6,P554(359))

12067

.09.0,1001.01,1001,===??D D D n α|F n (x (1)) -F 0(x (1))|=0.0099,|F n (x (2)) -F 0(x (2))|=0.0072|F n (x (2)) -F 0(x (1))|=0.0201,

………………………

D n = 0.1700 > 0.12067 = D 100, 0.90

观测值超过了临界值,拒绝H 0, 即没有明显的理由认为零件口径服从N (11, (0.03)2). (P298(178)---46)

s α

据如下表:

Solution .

原假设H

: F1(x) = F2(x) (两总体相等)

备择假设H

1

: F1(x) ≠F2(x) (两总体不相等)比较各对数据并记录正负号. 由表中可知:

n+=12, n-=7, n++ n-=19.

查符号检验表(p560):

当n=19,α=0.05 时临界值Sα= 4, 而

S = min(n+, n-) = 7 > 4 =Sα

观测值大于临界值, 接受H

0, 认为两分析结果无显著差异.

17

18

()()

()()()

1

212121

2

121

2

,,,,,,;,,,,,,n n

n n F x F x x x x y y y z z z +L L L ξη三. 秩和检验法(Rank sum test)

两总体:两样本

ξ1, ξ2,…,ξn 1;η1η2,…, ηn 2.

两样本值:重新混合排序:(从小到大)

)

(,,,,,,211

21211

2

1

n n R

T S S S S R R R R n i

n

i i i n i i i <=

==∑假定秩和:可有:在混合排序后的新序号

原来的的秩:可有:在混合排序后的新序号

原来的的秩:L L ηηξξ

x(

全排在左端)

(i

1610 1700 1680 1650 1750 1800 1720

甲材料生产的灯泡寿命

6 7 8.58.510 11 12

8 9)

《应用数理统计》期末考试-2011

《应用数理统计》期末考试试题 (2011-11-26上午8:30—10:30) 学院: 学号: 姓名: 注意:所有题目答案均做在答题纸上,该试卷最后随答题纸一同上交,否则成绩无效。 1、(20分)设总体X 服从正态分布(0,1)N ,12,X X 为来自总体X 的简单样本,设112212; Y X X Y X X =+=-。 (1)求二维随机变量12(,)Y Y 的联合密度()21,y y f ; (2)分别求12,Y Y 的边缘密度函数()()2121,y f y f Y Y ; (3)12,Y Y 是否独立?说明根据。 (4)叙述2χ分布的构造性定义。能否通过取适当的常数c ,使得2212()c Y Y +服从2χ分布?若可以,求出c ,并写出所服从的2χ分布的自由度。 2、(20分)设12,,,n X X X 是来自正态总体() 2~0,X N σ的简单样本,记 22221 21111??();1n n i i i i X X X n n σσ===-=-∑∑,其中11n i i X X n ==∑, (1)证明:21?σ是2 σ的渐近有效估计量; (2)证明:22?σ是2 σ的有效估计量; (3)试分别以21?σ,22?σ为基础构造2 σ的两种1α-置信区间。你认为你得到的哪个估计区间会更好一些?为什么? 3、(20分)(1)简述假设检验的一般步骤; (2)某厂生产一批产品,质量检查规定:若次品率0.05p ≤,则这批产品可以出厂,否则不能出厂。现从这批产品中抽查400件产品,发现有30件是次品,问:在显著性水平0.05α=下,这批产品能否出厂?若取显著性水平0.02α=,会得出什么结论?α是越小越好吗?对你的答案说明理由。 要求:将此问题转化成统计问题,利用所学知识给出合理的、令人信服的推断,推断过程的每一步要给出理由或公式。分位点定义如下: 若随机变量W ,对任意的()1,0∈α,有()α=≤x W P ,称x 为W 的α分位点,记作αx 。

应用数理统计试题库

一 填空题 1 设 6 21,,,X X X 是总体 ) 1,0(~N X 的一个样本, 26542321)()(X X X X X X Y +++++=。当常数C = 1/3 时,CY 服从2χ分布。 2 设统计量)(~n t X ,则~2X F(1,n) , ~1 2 X F(n,1) 。 3 设n X X X ,,,21 是总体),(~2 σu N X 的一个样本,当常数C = 1/2(n-1) 时, ∑-=+-=1 1 212 )(n i i i X X C S 为2σ的无偏估计。 4 设)),0(~(2σεε βαN x y ++=,),,2,1)(,(n i y x i i =为观测数据。对于固定的0x , 则0x βα+~ () 2 0201,x x N x n Lxx αβσ?? ? ?- ???++ ??? ?????? ? 。 5.设总体X 服从参数为λ的泊松分布,,2,2,, 为样本,则λ的矩估计值为?λ = 。 6.设总体2 12~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的 置信区间为 ()()()()22 2212211,11n S n S n n ααχχ-??--????--???? 。 7.设X 服从二维正态),(2∑μN 分布,其中??? ? ??=∑??? ? ??=8221, 10μ 令Y =X Y Y ???? ??=???? ??202121,则Y 的分布为 ()12,02T N A A A A μ??= ??? ∑ 。 8.某试验的极差分析结果如下表(设指标越大越好): 表2 极差分析数据表

应用数理统计课后习题参考答案

习题五 1 试检验不同日期生产的钢锭的平均重量有无显著差异?(=0.05) 解 根据问题,因素A 表示日期,试验指标为钢锭重量,水平为5. 假设样本观测值(1,2,3,4)ij y j =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= . 检验的问题:01251:,:i H H μμμμ===不全相等 . 计算结果: 表5.1 单因素方差分析表 ‘*’ . 查表0.95(4,15) 3.06F =,因为0.953.9496(4,15)F F =>,或p = 0.02199<0.05, 所以拒绝0H ,认为不同日期生产的钢锭的平均重量有显著差异. 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 试检验在四种不同催化剂下平均得率有无显著差异?(=0.05) 解 根据问题,设因素A 表示催化剂,试验指标为化工产品的得率,水平为4 . 假设样本观测值(1,2,...,)ij i y j n =来源于正态总体2 ~(,),1,2,...,5i i Y N i μσ= .其中

样本容量不等,i n 分别取值为6,5,3,4 . 检验的问题:012341:,:i H H μμμμμ===不全相等 . 计算结果: 表5.2 单因素方差分析表 查表0.95(3,14) 3.34F =,因为0.952.4264(3,14)F F =<,或p = 0.1089 > 0.05, 所以接受0H ,认为在四种不同催化剂下平均得率无显著差异 . 3 试验某种钢的冲击值(kg ×m/cm2),影响该指标的因素有两个,一是含铜量A , 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异?(=0.05) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用. 设因素,A B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为12. 假设样本观测值(1,2,3,1,2,3,4)ij y i j ==来源于正态总体2 ~(,),1,2,3,ij ij Y N i μσ= 1,2,3,4j = .记i α?为对应于i A 的主效应;记j β?为对应于j B 的主效应; 检验的问题:(1)10:i H α?全部等于零,11 :i H α?不全等于零; (2)20:j H β?全部等于零,21:j H β?不全等于零; 计算结果: 表5.3 双因素无重复试验的方差分析表 查表0.95(2,6) 5.143F =,0.95(3,6) 4.757F =,显然计算值,A B F F 分别大于查表值, 或p = 0.0005,0.0009 均显著小于0.05,所以拒绝1020,H H ,认为含铜量和试验温度都会对钢的冲击值产生显著影响作用. 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量:

应用数理统计(武汉大学研究生)2009-2010试题

武汉大学2009-2010年度上学期研究生公共课 《应用数理统计》期末考试试题 (每题25分,共计100分) (请将答案写在答题纸上) 1设X 服从),0(θ上的均匀分布,其密度函数为 ?????<<=其它0 01)(θθx x f n X X X ,,,21" 为样本, (1)求θ的矩估计量1?θ和最大似然估计量2 ?θ; (2)讨论1?θ、2?θ的无偏性,1?θ、2?θ是否为θ的无偏估计量?若不是,求使得i c ?i i c θ为θ的无偏估计量,; 1,2i =(3)讨论1?θ、2 ?θ的相合性; (4)比较11?c θ和22?c θ的有效性. 2. 假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X 得到两组数据,经对其作相应运算得 2110.190,0.006,x s == 2220.238,0.008x s == 假设测定结果服从正态分布()()2~,1,2i i X i μσ=, (1).在显著性水平0.10α=下,能否认为2212σσ=? (2).求12μμ?的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显著差异。 3.设是来自正态总体的样本, 总体均值n X X X ,,,21"),(2 σμN μ和方差未知,样本均值和方差分别记为2σ2211 11,(1n n i i i i )X X S X X n n ====?∑∑?

(1) 求2211 (n i i X )μσ=?∑的分布; (2)若0μ=,求212212()() X X X X +?的分布; (3)方差的置信度为12σα?的置信区间的长度记为L ,求()E L ; (4)1n X + 的分布。 4.为进行病虫害预报, 考察一只红铃虫一代产卵量Y (单位:粒)与温度x (单位:)的关系, 得到资料如下: C 0x 18 20 24 26 30 32 35 Y 7 11 21 24 66 115 325 假设Y 与x 之间有关系 bx Y ae ε+=, . ),0(~2σεN 经计算:26.43x =,ln 3.612y =,,, 7215125i i x ==∑721(ln )102.43i i y ==∑7 1ln 718.64i i i x y ==∑(1)求Y 对x 的曲线回归方程; x b e a y ???=(2)求的无偏估计; 2σ2?σ (3)对回归方程的显著性进行检验(05.0=α); (4)求当温度0x =33时,产卵量的点估计。 0Y 可能用到的数据: 0.02282z =,()()0.050.057,8 3.50,8,7 3.73F F ==,()0.0515 1.7531t =,,,,0.025(5) 2.5706t =0.05(5) 2.015t =0.025(7) 2.3646t =0.05(7) 1.8946t =,0.05(1,5) 6.61F =, 0.05(1,7) 5.59F =

统计(名词解释)

统计 第一章绪论 统计学:是研究统计方法和原理,一类是数理统计【以概率论为基础,对统计数据量关系模式加以解释,对统计原理和方法加以数学证明】,一类是应用统计【数理统计的方 法在各个邻域的应用】。 教育统计学:应用数理统计的方法和原理研究教育问题的一门学科。 从具体应用:描述统计:对已获得的数据进行整理概括显现其分布特征的统计 方法 推断统计:根据样本提供的信息,运用概率的理论分析,论证, 在一定可靠程度上对总体分布特征进行推测和估计 其内容包括假设检验和总体参数估计。 基本概念:随机变量:我们把能表示随机现象各个结果的变量称作随机变量。 总体:是我们研究的具有某种共同特性的个体的总和。总体中的每个单位称 作个体 样本:从总体中抽取的作为观察对象的一部分个体。 统计量:样本的数据特征 参数:总体的数据特征 第二章数据统计分类 按数据来源分:点计数据:指计算个数获得的数据 度量数据:指用一定工具或一定测量标准所获得的数据。 按随机变量:间断性随机变量:数据单位是独立的,两个单位之间不能在划分为更细小的单 位 连续性随机变量:取值个数无限。 统计图表:表示间断变量统计图:直条图、圆形图、 表示连续变量统计图:线形图、频数分布图【直方图、多边图、累计频数和累 计百分比】 第三四章集中量差异量【注意每个量的表示】 算数平均数:原始数据计算 频数分布表计算【每一段频数计算组中值,乘以个数求和】 方差标准差:离差平方的算数平均数是方差,开放后为表准差 原始数据的计算,定义式的计算。 中位数:是位于以一定大小顺序排列的一组数据中央位置的数据。 原始数据计算【个数分奇偶】频数计算方式。【大小】 四分位距:第三个四分位数与第一个四分位数的差的一半称之为四分位距 百分位距:两个百分位数之差,通常是90%和10%的差。 众数:理论众数:频数分布曲线最高点对应的横坐标上的一点。 粗略众数:一组数据中频数出现最多的那个数。 皮尔逊经验法、金氏插补法。 平均差:每一个数据和中位数离差的绝对值的算术平均数。 原始数据、频数计算 差异系数:标准差和算术平均数的百分比,【1】可以比较不同单位的差异程度、【2】比较单位相同但平均数差异较大的离散程度、【3】可判断特殊差异情况。 ※平均数、众数、中位数三者之间的关系:

北航应用数理统计考试题及参考解答

北航2010《应用数理统计》考试题及参考解答 09B 一、填空题(每小题3分,共15分) 1,设总体X 服从正态分布(0,4)N ,而12 15(,,)X X X 是来自X 的样本,则22 110 22 11152() X X U X X ++=++服从的分布是_______ . 解:(10,5)F . 2,?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 3,分布拟合检验方法有_______ 与____ ___. 解:2 χ检验、柯尔莫哥洛夫检验. 4,方差分析的目的是_______ . 解:推断各因素对试验结果影响是否显著. 5,多元线性回归模型=+Y βX ε中,β的最小二乘估计?β 的协方差矩阵?βCov()=_______ . 解:1?σ-'2Cov(β) =()X X . 二、单项选择题(每小题3分,共15分) 1,设总体~(1,9)X N ,129(,, ,)X X X 是X 的样本,则___B___ . (A ) 1~(0,1)3X N -; (B )1 ~(0,1)1X N -; (C ) 1 ~(0,1) 9X N -; (D ~(0,1)N . 2,若总体2(,)X N μσ,其中2σ已知,当样本容量n 保持不变时,如果置信度1α-减小,则μ的 置信区间____B___ . (A )长度变大; (B )长度变小; (C )长度不变; (D )前述都有可能. 3,在假设检验中,就检验结果而言,以下说法正确的是____B___ . (A )拒绝和接受原假设的理由都是充分的; (B )拒绝原假设的理由是充分的,接受原假设的理由是不充分的; (C )拒绝原假设的理由是不充分的,接受原假设的理由是充分的; (D )拒绝和接受原假设的理由都是不充分的. 4,对于单因素试验方差分析的数学模型,设T S 为总离差平方和,e S 为误差平方和,A S 为效应平方和,则总有___A___ .

西南财经大学统计学院统计学专业

西南财经大学统计学院统计学专业

西南财经大学统计学院统计学专业 《数理统计学》教学大纲 一、说明 1、本课程教学的目的和任务 本课程是统计专业本科生的一门重要的专业基础课,它具有一定的理论和实用性,对于认识和理解统计基本思想、基本原理和方法具有十分重要的意义。 2、教学要求 要求学生通过本课程的学习,掌握如何有效地分析与解释反映社会和经济管理问题中的数据,认识数据的社会和经济涵义。本课程重在培养学生运用统计基本理论和基本方法,分析社会经济中的一些问题,以提高学生解决问题的能力。 本课程包括的主要内容有:抽样及抽样分布、参数估计、假设检验、方差分析和回归分析。其核心内容是统计推断的三章:抽样分布、参数估计和假设检验。 3、预备知识 学习本课程应先修《微积分》、《线性代数》、《概率论》等课程。 4、本课程3学分,总学时为60学时。学时分配如下: 本着以上教学目的和任务,本课程选择了“九五”国家级统计专业重点教材《概率论与数理统计》,本书由茆诗松、周纪芗编著。同时在授课过程中,主要参考了由本校教师周惠彬、谢小燕、张卫东、刘明杰编著的《概率论与数理统计》一书,并辅之以其它一些参考书籍(详见附录)。 二、讲授大纲 第一章统计量及其分布 目的要求:通过本章的学习,使学生对抽样法及抽样分布意

二、有效性 三、均方误差准则 四、相合性 第三节极大似然估计 一、极大似然估计的思想与概念 二、求极大似然估计的方法 三、极大似然估计的不变原则 四、极大似然估计的渐近正态性 第一节区间估计 一、区间估计的概念 二、枢轴量法 三、正态均值μ的置信区间(σ已知) 四、正态均值μ的置信区间(σ未知) 五、正态方差σ2与标准差σ的置信区间 六、两个正态均值差的置信区间 七、两个正态方差比的置信区间 第二节单侧置信限 一、单侧置信限的概念 二、基于连续分布函数构造置信限 三、基于阶梯分布函数构造置信限 第三节比率p的置信区间 一、小样本场合下的p的置信区间 二、大样本场合下的p的近似置信区间 *第七节贝叶斯估计 一、统计推断中的三种信息 二、贝叶斯公式的密度函数形式 三、共轭先验分布 四、贝叶斯点估计 五、贝叶斯区间估计 思考题 1、用样本指标估计总体参数时,样本指标估计应具备一些什么性 质,才能使估计更有效? 2、矩估计法、极大似然估计法的基本思想是什么? 3、在参数估计中有了点估计,为什么还要引进区间估计?

应用数理统计课程小论文数据,结果,分析过程

1 聚类分析 我们利用Matlab6.5中的cluster 命令实现,具体程序如下 x={ {n,m}=size(x); Stdr=std(x); xx=x./stdr(ones(n,1),;); % 标准化变换 y=pdist(xx); %计算各样本间距离(这里为欧氏距离) z=linkage(y); %进行聚类(这里为最短距离法) h=dendrogram(z); %画聚类谱系图 t=cluster(z,3) % 将全部样本分为3类 find(t==2); %找出属于第2类的样品编号 执行后得到所要结果 聚类谱系图见图1 t={3,1,3,1,1,2,2} 即全部样本分为3类。结果见表1 从图 1可以看出:七条河流中, 二干河、横套河、四干河属于一类, 污染 较重, 主要是CODmn 、BOD5超标多; 华妙河、盐铁塘属于一类, 污染一般, 主要是氨氮、石油类超标; 张家港河、东横河属于一类,污染较轻, 总的来说,各河流都存在不同程度的污染,因此全市应对各河流严格监督管理, 着力实施水污染防治工作, 太湖流域水污染源应限期治理达标排放, 巩固水污染防治工作成果,加大投入,新建或改、 扩建废水治理工程, 确保达标排放。 3.14 5.47 3.1 5.67 6.81 6.21 4.87 8.41 9.57 4.31 9.54 9.05 7.08 8.97 23.78 26.48 21.2 10.23 16.18 21.05 26.54 25.79 23.79 22.48 20.87 24.56 31.56 34.56 4.17 6.42 5.34 4.2 5.2 6.15 5.58 6.47 5.58 6.54 6.8 5.45 8.21 8.07 }

应用数理统计习题答案 西安交大 施雨

应用数理统计答案 学号: 姓名: 班级:

目录 第一章数理统计的基本概念 (2) 第二章参数估计 (14) 第三章假设检验 (24) 第四章方差分析与正交试验设计 (29) 第五章回归分析 (32) 第六章统计决策与贝叶斯推断 (35) 对应书目:《应用数理统计》施雨著西安交通大学出版社

第一章 数理统计的基本概念 1.1 解:∵ 2 (,)X N μσ ∴ 2 (,)n X N σμ ∴ (0,1)N 分布 ∴(1)0.95P X P μ-<=<= 又∵ 查表可得0.025 1.96u = ∴ 2 2 1.96n σ= 1.2 解:(1) ∵ (0.0015)X Exp ∴ 每个元件至800个小时没有失效的概率为: 800 0.00150 1.2 (800)1(800) 10.0015x P X P X e dx e -->==-<=-=? ∴ 6个元件都没失效的概率为: 1.267.2 ()P e e --== (2) ∵ (0.0015)X Exp ∴ 每个元件至3000个小时失效的概率为: 3000 0.00150 4.5 (3000)0.00151x P X e dx e --<===-? ∴ 6个元件没失效的概率为: 4.56 (1)P e -=- 1.4 解:

i n i n x n x e x x x P n i i 1 2 2 )(ln 2121)2(),.....,(1 22 =-- ∏∑ = =πσμσ 1.5证: 2 1 1 2 2)(na a x n x a x n i n i i i +-=-∑∑== ∑∑∑===-+-=+-+-=n i i n i i n i i a x n x x na a x n x x x x 1 2 2 2 2 11) ()(222 a) 证: ) (1111 1+=+++=∑n n i i n x x n x ) (1 1 )(1 1 11n n n n n x x n x x x n n -++=++=++

研究生《应用数理统计基础》庄楚强 四五章部分课后答案

4-45. 自动车床加工中轴,从成品中抽取11根,并测得它们的直径(mm )如下: 10.52,10.41,10.32,10.18,10.64,10.77,10.82,10.67,10.59,10.38,10.49 试用W 检验法检验这批零件的直径是否服从正态分布?(显著性水平05.0=α) (参考数据:) 4-45. 解:数据的顺序统计量为: 10.18,10.32,10.38,10.41,10.49,10.52,10.59,10.64,10.67,10.77,10.82 所以 6131 .0][)()1(5 1 ) (=-= -+=∑k k n k k x x a L , 又 5264.10=x , 得 38197 .0)(11 1 2 =-∑=i i x x 故 984.0) (11 1 2 2 =-= ∑=i i x x L W , 又 当n = 11 时,85.005.0=W 即有 105.0<

应用数理统计课后习题参考答案

习题五 1 某钢厂检查一月上旬内的五天中生产的钢锭重量,结果如下:(单位:k g) 日期重旦量 1 5500 5800 5740 5710 2 5440 5680 5240 5600 4 5400 5410 5430 5400 9 5640 5700 5660 5700 10 5610 5700 5610 5400 试检验不同日期生产的钢锭的平均重量有无显著差异? ( =0.05) 解根据问题,因素A表示日期,试验指标为钢锭重量,水平为 5. 2 假设样本观测值y j(j 123,4)来源于正态总体Y~N(i, ),i 1,2,...,5 检验的问题:H。:i 2 L 5, H i : i不全相等. 计算结果: 注释当=0.001表示非常显著,标记为*** '类似地,=0.01,0.05,分别标记为 查表F0.95(4,15) 3.06,因为F 3.9496 F0.95(4,15),或p = 0.02199<0.05 ,所 以拒绝H。,认为不同日期生产的钢锭的平均重量有显著差异 2 考察四种不同催化剂对某一化工产品的得率的影响,在四种不同催化剂下分别做试验 解 根据问题,设因素A表示催化剂,试验指标为化工产品的得率,水平为 4 . 2 假设样本观测值y j(j 1,2,..., nJ来源于正态总体Y~N(i, ), i 1,2,...,5 .其中样本容量不等,n分别取值为6,5,3,4 .

日产量 操作工 查表 F O .95(3,14) 3.34,因为 F 2.4264 F °.95(3,14),或 p = 0.1089 > 0.05, 所以接受H 。,认为在四种不同催化剂下平均得率无显著差异 3 试验某种钢的冲击值(kg Xm/cm2 ),影响该指标的因素有两个,一是含铜量 A ,另 一个是温度 试检验含铜量和试验温度是否会对钢的冲击值产生显著差异? ( =0.05 ) 解 根据问题,这是一个双因素无重复试验的问题,不考虑交互作用 设因素A,B 分别表示为含铜量和温度,试验指标为钢的冲击力,水平为 12. 2 假设样本观测值y j (i 1,2,3, j 1,2,3,4)来源于正态总体 Y j ~N (j , ),i 1,2,3, j 1,2,3,4 .记i 为对应于A 的主效应;记 j 为对应于B j 的主效应; 检验的问题:(1) H i 。: i 全部等于零,H i — i 不全等于零; (2) H 20 : j 全部等于零,H 21: j 不全等于零; 计算结果: 查表F 0.95(2,6) 5.143 ,局.95(3,6) 4.757 ,显然计算值F A , F B 分别大于查表值, 或p = 0.0005 , 0.0009均显著小于0.05,所以拒绝H i°,H 20,认为含铜量和试验温度 都会对钢的冲击值产生显著影响作用 . 4 下面记录了三位操作工分别在四台不同的机器上操作三天的日产量: 检验的问题:H 0: 1 计算结果: H i : i 不全相等

北航数理统计期末考试题

材料学院研究生会 学术部 2011 年12 月 2007-2008学年第一学期期末试卷 一、(6 分,A 班不做)设x1,x2,?,x n是来自正态总体N( , 2) 的样本,令 2(x1 x2) T (x3 x4)2 (x5 x6)2 , 试证明T 服从t-分布t(2) 二、( 6 分, B 班不做 ) 统计量F-F(n,m) 分布,证明 1的 (0< <1)的分位点x 是1。 F F1 (n,m) 。 三、(8分)设总体X 的密度函数为 其中1,是位置参数。x1,x2,?,x n是来自总体X 的简单样本, 试求参数的矩估计和极大似然估计。 四、(12分)设总体X 的密度函数为 1x exp ,x p(x; ) 0 , 其它 其中, 已知,0, 是未知参数。x1,x2,?,x n 是来自总体X 的简单样本。

1)试求参数的一致最小方差无偏估计; 2) 是否为的有效估计?证明你的结论。 五、(6分,A 班不做)设x1,x2,?,x n是来自正态总体N( 1, 12) 的 简单样本,y1,y2,?,y n 是来自正态总体N( 2, 22) 的简单样本,且两样本相互独立,其中1, 12, 2, 22是未知参数,1222。为检验假设H0 : 可令z i x i y i, i 1,2,..., n ,1 2 , 1 2, H1 : 1 2, 则上述假设检验问题等价于H0 : 1 0, H1: 1 0,这样双样本检验问题就变为单检验问题。基于变换后样本z1,z2,?,z n,在显著性水平下,试构造检验上述问题的t-检验统计量及相应的拒绝域。 六、(6 分,B 班不做)设x1,x2,?,x n是来自正态总体N( 0, 2) 的简单样本,0 已知,2未知,试求假设检验问题 H0: 202, H1: 202的水平为的UMPT。 七、(6 分)根据大作业情况,试简述你在应用线性回归分析解决实际问题时应该注意哪些方面? 八、(6 分)设方差分析模型为 总离差平方和 试求E(S A ) ,并根据直观分析给出检验假设H0 : 1 2 ... P 0的拒绝域形式。 九、(8分)某个四因素二水平试验,除考察因子A、B、C、D 外,还需考察 A B ,B C 。今选用表L8(27 ) ,表头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。

最新研究生《应用数理统计基础》庄楚强-何春雄编制---课后答案

研究生 习题2: 2-7. 设 )1,0(~N ξ,),,,,,(654321ξξξξξξ为其一样本,而26542321)()(ξξξξξξη+++++=, 试求常数c ,使得随机变量ηc 服从2 χ分布。 2-7解:设3211ξξξη++=,所以 )3,0(~1N η 6542ξξξη++=,所以 )3,0(~2N η 所以 )1,0(~3 1 N η , )1,0(~3 2 N η )2(~)(3 1332 22212 22 1χηηηη+=??? ??+??? ?? 由于 2 22 1ηηη+= 因此 当 3 1=c 时,)2(~2 χηc 。 2-8. 设 ),,,(1021ξξξΛ为)3.0,0(2 N 的一个样本,求 ? ?? ???>∑=101244.1i i P ξ 。(参考数据:) 2-8解:因为 )3.0,0(~),,,(2 1021N ξξξξΛ=, 所以 )1,0(~3 .0N ξ , 即有)10(~3.0210 12 χξ∑=?? ? ??i i 所以 ??? ???>∑=101244.1i i P ξ??????>=∑=1012223.044.13.0i i P ξ??????>=∑=10122163.0i i P ξ ? ?? ???≤-=∑=10122163.01i i P ξ1.09.01=-= 2-14. 设总体)4,1(~N ξ,求{}20≤≤ξP 与{} 20≤≤ξP ,其中ξ是样本容量为16的样 本均值。(参考数据:)

2-14解: {}20≤≤ξP )0()2(F F -=)210()212( -Φ--Φ=)2 1 ()21(-Φ-Φ= 1)2 1 (2-Φ=3830.016915.02=-?= 由于 )4,1(~N ξ , 所以 )1,0(~21 1 16 21N -=-ξξ {} 20≤≤ξP ????? ?-≤-≤-=21122112110ξP ? ?? ???≤-≤-=22112ξP )2()2(-Φ-Φ=9545.019725.021)2(2=-?=-Φ= 2-17. 在总体)20,80(2 N 中随机抽取一容量为100的样本,问样本平均值与总体均值的差的 绝对值大于3的概率是多少?(参考数据:) 2-17解:因为 )20,80(~2 N ξ, 所以 )1,0(~2 80 100 20 80 N -= -ξξ 所以 {}380>-ξP {} 3801≤--=ξP ?? ? ?????? ?≤--=232801ξP ? ?? ???≤ -≤--=23280 231ξP )]5.1()5.1([1-Φ-Φ-= ]1)5.1(2[1-Φ-=1336.0)93319.01(2)5.1(22=-=Φ-= 2-25. 设总体ξ的密度函数为 ?? ?<<=其它 102)(x x x p 取出容量为4的样本),,,(4321ξξξξ,求: (1) 顺序统计量)3(ξ的密度函数)(3x p ;(2))3(ξ的分布函数)(3x F ;(3)??? ? ??>21)3(ξP 。 2-25解:(1)由 ()()[][])()(1)(! !1! )(1)(x p x F x F k n k n x p k n k k -----= ξ 所以 当 10<

北航数理统计期末考试题

北航数理统计期末考试题 2011年2007-2008学年第一学期期末试卷一、(6分,A班不做)设x1,x2,…,xn是来自正态总体的样本,令,试证明T服从t-分布t(2) 二、(6分,B班不做)统计量F-F(n,m)分布,证明。 三、(8分)设总体X的密度函数为其中,是位置参数。x1,x2,…,xn是来自总体X的简单 样本,试求参数的矩估计和极大似然估计。 四、(12分)设总体X的密度函数为,其中是未知参数。x1,x2,…,xn是来自总体X的简 单样本。 (1)试求参数的一致最小方差无偏估计; (2)是否为的有效估计证明你的结论。 五、(6分,A班不做)设x1,x2,…,xn是来自正态总体的简单样本,y1,y2,…,yn是 来自正态总体的简单样本,且两样本相互独立,其中是未知参数,。为检验假设可令则上述假设检验问题等价于这样双样本检验问题就变为单检验问题。基于变换后样本z1,z2,…,zn,在显著性水平下,试构造检验上述问题的t-检验统计量及相应的拒绝域。 六、(6分,B班不做)设x1,x2,…,xn是来自正态总体的简单样本,已知,未知,试求假 设检验问题的水平为的UMPT。 七、(6分)根据大作业情况,试简述你在应用线性回归分析解决实际问题时应该注意哪些方 面八、(6分)设方差分析模型为总离差平方和试求,并根据直观分析给出检验假设的拒绝域形式。 九、(8分)某个四因素二水平试验,除考察因子A、B、C、D外,还需考察,。今选用表,表 头设计及试验数据如表所示。试用极差分析指出因子的主次顺序和较优工艺条件。 列号试验号ABCD实验数据 12345671111111112.82111222228.23122112226.14122221135.35212121230.5621221214 .37221122133.3822121124.0十、(8分)对某中学初中12岁的女生进行体检,测量四个变量,身高x1,体重x2,胸围x3,坐高x4。现测得58个女生,得样本数据(略),经计算指标的协方差阵V的极大似然估计为且其特征根为。 (1)试根据主成分85%的选择标准,应选取几个主要成分(2)试求第一主成分。 2006级硕士研究生《应用数理统计》试题一、选择题(每小题3分,共12分) 1.统计量T~t(n)分布,则统计量T2的α(0α1)分位点xα(P{T2≤xα}=α)是()

清华大学-杨虎-应用数理统计课后习题参考答案

习题一 1 设总体X 的样本容量5=n ,写出在下列4种情况下样本的联合概率分布. 1)),1(~p B X ; 2))(~λP X ; 3)],[~b a U X ; 4))1,(~μN X . 解 设总体的样本为12345,,,,X X X X X , 1)对总体~(1,)X B p , 11223344555 11 1 55(1) (,,,,)()(1)(1)i i n x x i i i i x x P X x X x X x X x X x P X x p p p p -==-========-=-∏∏ 其中:5 1 15i i x x ==∑ 2)对总体~()X P λ 11223344555 1 1 555 1 (,,,,)()! ! i x n i i i i i x i i P X x X x X x X x X x P X x e x e x λ λ λλ-==-========== ∏∏ ∏ 其中:5 1 15i i x x ==∑ 3)对总体~(,)X U a b 55 11511 ,,1,...,5 (,,)()0i i i i a x b i f x x f x b a ==?≤≤=?==-??? ∏∏ L ,其他

4)对总体~(,1) X Nμ () ()() 2 555 5/22 2 15 1 11 1 (,,)()=2exp 2 i x i i i i i f x x f x x μ πμ - -- = == ?? ==-- ? ?? ∑ ∏ L 2 为了研究玻璃产品在集装箱托运过程中的损坏情况,现随机抽取20个集装箱检查其产品损坏的件数,记录结果为:1,1,1,1,2,0,0,1,3,1,0,0,2,4,0,3,1,4,0,2,写出样本频率分布、经验分布函数并画出图形. 解设(=0,1,2,3,4) i i代表各箱检查中抽到的产品损坏件数,由题意可统计出如下的样本频率分布表1.1: 经验分布函数的定义式为:

应用数理统计试题

应用数理统计复习题 1.设总体,有容量分别为10,15的两个独立样本,求它们的样本均值之差的绝对值小于0.3的概率. 解:设两样本均值分别为,则 2. 设总体具有分布律 1 2 3 其中为未知参数,已知取得了样本值,求的矩估计和最大似然估计. 解:(1)矩估计: 令,得. (2)最大似然估计: 得 3. 设某厂产品的重量服从正态分布,但它的数学期望和方差均未知,抽查10件,测得重量为斤。算出 给定检验水平,能否认为该厂产品的平均重量为5.0斤? 附:t1-0.025(9)=2.2622 t1-0.025(10)=2.2281 t1- 0.05(9)=1.8331 t1-0.05(10)=1.8125 解: 检验统计量为

将已知数据代入,得 所以接受。 4. 在单因素方差分析中,因素有3个水平,每个水平各做4次重复实验,完成下列方差分析表,在显著水平下对因素是否显著做检验。 来源平方和自由度均方和F比 因素 4.2 误差 2.5 总和 6.7 解: 来源平方和自由度均方和F比 因素 4.2 2 2.1 7.5 误差 2.5 9 0.28 总和 6.7 11 ,,认为因素是显著的. 5. 现收集了16组合金钢中的碳含量及强度的数据,求得 ,. (1)建立关于的一元线性回归方程; (2)对回归系数做显著性检验(). 解:(1) 所以, (2)

拒绝原假设,故回归效果显著. 6.某正交试验结果如下 列号 试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 (1)找出对结果影响最大的因素; (2)找出“算一算”的较优生产条件;(指标越大越好) (3)写出第4号实验的数据结构模型。 解: 列号 试验号A B C 1 2 3 结果 1 2 3 4 1 1 1 1 2 2 2 1 2 2 2 1 13.25 16.54 12.11 18.75 ⅠⅡR 29.79 25.36 32.0 30.86 35.29 28.65 1.07 9.9 3.35 (1)对结果影响最大的因素是B; (2)“算一算”的较优生产条件为 (3) 4号实验的数据结构模型为 ,

重庆大学硕士研究生2010级_应用数理统计_课程(A)试题

重庆大学硕士研究生2010级 应用数理统计 课程(A )试题 请保留小数两位: 20.950.950.9750.96410.72570.99870.950.950.95(16) 1.75, 1.95, 1.96, 1.8,0.6,3,(4)9.49, (3,8) 4.07,(1,14) 4.60, t u u u u u F F χ========= 一、 (12分)设两个独立的样本1212,,,,,n n X X X Y Y Y 是来自总体21(,) N u σ和22(,)N u σ,2111 111,,(),1n n n i i i i i i X X Y Y S X X n n n ======--∑∑∑ ,1 1()()1n X Y i i i S X X Y Y n ==---∑。 (1)当n=17时,求常数k 使得12(0.95P X Y μμ->-+=; (2)求概率22{1}X Y S P S >。 二、 (15分)设总体X 的密度函数为:1,0(;),10,(0,1) x f x x θθ>=>???。(1)求参数θ的矩估计量?θ;(2 )求参数()g θ=的的最大似然估计?g ;(3)试分析?g 的无偏性、有效性、相合性。 三、 (10分) (1)某生产商关心PC 机用的电源和输出电压。假设输出电压服从标准差为0.25V 的正态分布2(,)N u σ ,问样本容量n 为多大时,才能是平均输出电压的置信度为0.95的置信区间长度不超过0.2V 。 (2)设12,,n X X X 是来自总体~(0,)X U θ的样本,()1max n i i n X X ≤≤=。统计假设 01:3,:3H H θθ≥<的拒绝域为(){ 2.5}n K x =<。求假设检验犯第Ⅰ类错误的最大概率max α。 四、 (10分)一药厂生产一种新的止痛片,长方希望验证服用新药片后至开始起作用的时间间隔较原有止痛片至少缩短一片,因此厂方提出检验假设:012:2H μμ=,112:2H μμ>。此处12,μμ分别是服用原有止痛片和新服用

应用数理统计课程感想

浅谈应用数理统计学 一、课程感想 从专业方面考虑,数理统计是一门基础课程,对后面时间序列分析、多元统计分析、计量经济学、Excel与数据分析的学习都有很大的帮助; 从个人方面考虑,数理统计不仅仅是一个门方法论,最主要的是一种思维逻辑能力的培养。比如抽样分布,用样本均值和方差去替代总体的期望和方差,虽然肯定会存在误差,但大体上是可信的。当你对一个事情无从下手时,可以将这个事情分成若干个小事情,挑选几个小事情,从研究小事情的特征或者结果去分析整个事情的特征和结果。 再比如假设检验,假设检验是对参数估计的估计值或者是某个统计量的统计值进行检验,看其值是否显著(指结果并非果然得到的)。其实假设检验的主要思想就是,如果想判断一个东西是否正确,那么去判断它的否命题是否错误,或者说是否能拒绝它的否命题,如果能拒绝,那么就有理由去接受这个东西是正确的命题。当然正确和错误不是百分百肯定的,因此引入了显著性水平的概念,即去接受那个命题是正确的概率是多少,或者说那么命题有多大的概率是正确的。 二、数理统计的应用 数理统计的应用十分广泛,如在经济上,生活上等等。 1、在经济学上的应用 在经济学中,应用最为广泛的是期望和方差,用期望表示收益,用方差去代表风险。 在许许多多的模型和公式中,只要出现了样本,那么必然会用到数理统计中抽样分布的知识,用样本的收益率均值去衡量未来实际收益率的总体水平,样本收益率的方差(或标准差)去衡量收益率的不确定性(风险),用样本的分布特征去分析总体进而替代总体。 在经济学里,有很多指标,如果要了解某些指标的内在联系,那么就会用到数理统计中回归分析的知识。 例如,钢材消费量与国民收入之间的关系,下列出来某地区1990~2005年的数据(见表1), 表1 1990~2005钢材消费量与国民收入

清华大学杨虎应用数理统计课后习题参考答案

习题三 1 正常情况下,某炼铁炉的铁水含碳量2 (4.55,0.108)X N .现在测试了5炉铁水,其含碳量分别为4.28,4.40,4.42,4.35,4.37. 如果方差没有改变,问总体的均值有无显著变化?如果总体均值没有改变,问总体方差是否有显著变化(0.05α=)? 解 由题意知 2 ~(4.55,0.108),5,0.05X N n α==,1/20.975 1.96u u α-==,设立 统计原假设 0010:,:H H μμμμ=≠ 拒 绝 域 为 {} 00K x c μ=->,临界值 1/2 1.960.108/0.0947c u α-==?=, 由于 0 4.364 4.550.186x c μ-=-=>,所以拒绝0H ,总体的均值有显著性 变化. 设立统计原假设 2 2 2 2 0010:,:H H σσσσ=≠ 由于0μμ=,所以当0.05α=时 2 222 0.0250.9751 1()0.03694,(5)0.83,(5)12.83,n i i S X n μχχ==-===∑ 22 10.02520.975(5)/50.166,(5)/5 2.567c c χχ==== 拒绝域为 {} 2222 00201//K s c s c σσ=><或 由于22 0/ 3.167 2.567S σ=>,所以拒绝0H ,总体的方差有显著性变化. 2 一种电子元件,要求其寿命不得低于1000h .现抽测25件,得其均值为 x =950h .已知该种元件寿命2(100,)X N σ,问这批元件是否合格(0.05α=)? 解 由题意知 2 (100,)X N σ,设立统计原假设 0010:,:,100.0.05.H H μμμμσα≥<== 拒绝域为 {} 00K x c μ=-> 临界值为 0.050.0532.9c u u =?=?=- 由于 050x c μ-=-<,所以拒绝0H ,元件不合格.

相关主题
文本预览
相关文档 最新文档