第五章参数估计和假设检验
一、单项选择题
1. 抽样调查的主要目的在于()。
A. 计算和控制误差
B. 了解总体单位情况
C. 用样本来推断总体
D. 对调查单位作深入的研究
2. 抽样调查所必须遵循的基本原则是()。
A. 随意原则
B. 可比性原则
C. 准确性原则
D. 随机原则
3、对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍。抽样平均误差()。
A. 第一工厂大
B. 第二个工厂大
C. 两工厂一样大
D. 无法做出结论
4、在总体方差一定的情况下,下列条件中抽样平均误差最小的是()。
A. 抽样单位数为20
B. 抽样单位数为40
C. 抽样单位数为90
D. 抽样单位数为100
5、某地订奶居民户均牛奶消费量为120公斤,抽样平均误差为2公斤。据此可算得户均牛奶消费量在114-126公斤之间的概率为()。
A. 0.9545
B. 0.9973
C. 0.683
D. 0.900
6、按地理区域划片所进行的区域抽样,其抽样方法属于()。
A. 纯随机抽样
B. 等距抽样
C. 类型抽样
D. 整群抽样
7. 在抽样推断中,样本的容量()。
A. 越多越好
B. 越少越好
C. 由统一的抽样比例决定
D. 取决于抽样推断可靠性的要求
8、在用样本指标推断总体指标时,把握程度越高则()。
A.误差范围越小
B.误差范围越大
C.抽样平均误差越小
D.抽样平均误差越大
9、某乐器厂以往生产的乐器采用的是一种镍合金弦线,这种弦线的平均抗拉强度不超过1035Mpa,现产品开发小组研究了一种新型弦线,他们认为其抗拉强度得到了提高并想寻找证据予以支持。在对研究小组开发的产品进行检验时,应该采取以下哪种形式的假设?
10、在抽样设计中,最好的方案是()。
A. 抽样误差最小的方案
B. 调查单位最少的方案
C. 调查费用最省的方案
D. 在一定误差要求下费用最小的方案
二、计算题
1、从麦当劳餐厅连续三个星期抽查49位顾客,以调查顾客的平均消费额,得样本平均消费额为25.5元。要求:
(1)假如总体的标准差为10.5元,那么抽样平均误差是多少?
(2)在0.95的概率保证下,抽样极限误差是多少?极限误差说明什么问题?(3)总体平均消费额95%的信赖区间是多少?
2、某食品公司销售一种果酱,按标准规格每罐净重为250克,标准差为3克。现该公司从生产该果酱的工厂进了一批货,抽取其中的100罐,测得平均净重为251克。问该批果酱是否符合标准?(α=0.05)
3、从5000名学生中抽查200名测得平均身高为1.65m抽样平均误差为0.05m,试以95%的把握程度推算全部学生平均身高的可能范围。若200名学生中女生数为50名,试以95%的概率,抽样成数平均误差为0.03,估计全部学生数中女生的比重的区间。
4、从某厂生产的一批灯泡中随机重复抽取100只,检查结果是:100只灯泡的平均使用寿命为100小时,标准差为15小时。求:以95.45%概率保证程度对灯泡的平均使用寿命进行区间估计:假定其他条件不变,将抽样极限误差减少到原来的1/2,应抽取多少之灯泡进行检查?
5、最新一次人口普查表明某市老年人口比重为15.7%,为了检验该数据是否真实,普查机构有随机抽选了400名居民,发现其中有62人年龄在65岁以上,问随机调查的结果是否支持该市老年人口比重为15.7%?(α=0.05)
第二讲 非参数检验 1. 实验目的 1.了解非参数假设检验基本思想; 2.会用SAS 软件中的proc npar1way 过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。 2. 实验要求 1.会用SAS 软件建立数据集,并进行统计分析; 2.掌握proc npar1way 过程进行非参数假设检验的基本步骤; 3.掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1 符号检验 0:H 两种方法的处理效果无显著性差异 令10 i i I i ?=? ?第个个体中新方法优于对照方法第个个体中新方法劣于对照方法 1,2,,i N = 统计量1 N N i i S I ==∑ N S 表示新方法的处理效果优于对照方法的配对组总数。若新方法的处理效果显著的优于对 照方法,则N S 的值应明显偏大。因此,若对给定的置信水平α,有 {}N P S c α≥<, 则拒绝0H 。 0H 为真时,(1)N S 服从二项分布1(,)2 b N (),()24 N N N N E S Var S = =。拒绝域为: {}N N S S c > (2) 由中心极限定理可知,当 2 , N N S N - →∞的零分布趋于标准正态分布。
拒绝域为 :N S u α?? ????>???????? 3.2 Wilcoxon 秩和检验 (1)单边假设检验 0:H 两种方法的处理效果无显著性差异 as 1:H :新方法优于对照方法。 用于检验0H 的统计量为:1n s i i W I ==∑ 若对给定的置信水平α,有 {}s P W c α≥<,则拒绝0H 。且s W 的分布列为: 0#{;,}{}H s w n m P W w N n == ?? ??? 根据观测结果计算s W 的观测值0s W ,计算检验的p 值: 00 {}{} s H s s H s k w p P W w P W k ≥=≥= =∑ 然后将p 值与显著水平α作比较,若p α<,则拒绝0H ,否则接受0H 。 (2)双边假设检验 给定的显著水平21,c c 和α应该满足: ε=≥+≤}{}{2100c W P c W P A H A H 仅由上式还不能唯一确定21c c 和,当我们对两种方法谁优谁劣不得而知时,通常取 2 }{}{2100α = ≥=≤c W P c W P A H A H 若利用p 值进行检验,设A A W ω的观测值为 ,计算概率值 }{}{00A A H A A H W P W P ωω≤≥或 由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如
参数估计与假设检验的区别和联系 统计学方法包括统计描述和统计推断两种方法,其中,推断统计又包括参数估计和假设检验。 1.参数估计就是用样本统计量去估计总体的参数,它的方法有点估计和区间估计两种。 点估计是用估计量的某个取值直接作为总体参数的估计值。点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。在区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。统计学家在某种程度上确信这个区间会包含真正的总体参数。 在区间统计中置信度越高,置信区间越大。置信水平为1-a, a为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90%,对应的a为0.01, 0.05,0.1 置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。 一个总体参数的区间估计需要考虑总体是否为正态分布,总体方差是否已知,用于估计的样本是大样本还是小样本等 (1)来自正态分布的样本均值,不论抽取的是大样本还是小样本,均服从正态分布 (2)总体不是正态分布,大样本的样本均值服从正态分布,小样本的服从t 分布 (3)不论已判断是正态分布还是t 分布,如果总体方差未知,都按t 分布来处理 (4)t 分布要比标准正态分布平坦,那么要比标准正态分布离散,随着自由度的增大越接近 (5)样本均数服从的正态分布为N(u a^2/n)远远小于原变量离散程度N (u a^2) 2. 假设检验是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。 假设检验的基本思想:先提出假设,然后根据资料的特点,计算相应的统计量,来判断假设是否成立,如果成立的可能性是一个小概率的话,就拒绝该假设,因此称小概率的反证法。最重要的是看能否通过得到的概率去推翻原定的假设,而不是去证实它<2>统计学中假设检验的基本步骤:(1)建立假设,确定检验水准α--假设有零假设(H0)和备择假设(H1)两个,零假设又叫作无效假设或检验假设。H0和H1的关系是互相对立的,如果拒绝H0,就要接受H1,根据备择假设不同,假设检验有单、双侧检验两种。检验水准用α表示,通常取0.05或0.10,检验水准说明了该检验犯第一类错误的概率。(2)根据研究目的和设计类型选择适合的检验方法 这里的检验方法,是指参数检验方法,有u检验、t检验和方差分析三种,对应于不同的检验公式。 (3)确定P值并作出统计结论 u检验得到的是u统计量或称u值,t检验得到的是t统计量或称t值。方差分析得到的是F统计量或称F值。将求得的统计量绝对值与界值相比,可以确定P值。当α=0.05时,u值要和u界值1.96相比较,确定P值。如果u<1.96,则P>0.05.反之,如u>1.96,则P<0.05.t值要和某自由度的t界值相比较,确定P值。如果t值<t界值,故P>0.05.反之,如t>t 界值,则P<0.05。相同自由度的情况下,单侧检验的t界值要小于双侧检验的t界值,因此有可能出现算得的t值大于单侧t界值,而小于双侧t界值的情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必然会显著。即单侧检验更容易出现阳性结论。当P>0.05时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。当P<0.05时,拒绝零假设,接受备择假设,认为差异有统计学意义,也可以理解为二者存在质的区别。但即使检验结果是P<0.01甚至P<0.001,都不说明差异相差很大,只表示更有把握认为二者存在差异。 3.参数估计与假设检验之间的联系与区别: (1)主要联系:a.都是根据样本信息推断总体参数;b.都以抽样分布为理论依据,建立在概率论基础之上的推断;c.二者可相互转换,形成对偶性。 (2)主要区别:a.参数估计是以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假设是否成立;b.区间估计求得的是求以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;c.区间估计立足于大概率,假设检验立足于小概率。
假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5)非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2 χ检验 2χ检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何 假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2χ检验的方法主要包括适合性检验和独立性检验。 (一)2 χ检验概述 2χ是实得数据与理论数据偏离程度的指标。其基本公式为: ∑-=e e f f f 2 02 )(χ (公式11—9) 式中,0f 为实际观察次数,e f 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2 χ。观察公式可发现,如果实际观察
参数估计和假设检验习题 1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 0.05,α=26,n = 0:1600H μ=, 即,以95%的把握认为这批产品的指标 的期望值μ为1600. 2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为O.973根,各台布机断头数 的标准差为O.162根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为O.994根,标准差为0.16根。问,新工艺上浆率能否推广(α=0.05)? 解: 012112:, :,H H μμμμ≥< 3.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)? 解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2 Z z α>,取0.0252 0.05, 1.96z z αα===, 100,n =由检验统计量 3.33 1.96Z = ==>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响. 4.有一批产品,取50个样品,其中含有4个次品。在这样情况下,判断假设H 0:p ≤0.05是否成立(α=0.05)? 解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==, 50,n =由检验统计量0.9733 Z = ==<1.65,接受H 0:p ≤0.05. 即, 以95%的把握认为p ≤0.05是成立的.
第5章 参数估计与假设检验练习题 1、设随机变量 X 的数学期望为 μ ,方差为 σ2 ,(X 1 ,X 2 ,···,X n )为X 的一个样本, 试比较 ))(1(1 2 ∑=-n i i X n E μ 与 ))(1(12∑=-n i i X X n E 的大小。 ( 前者大于后者 ) 2、设随机变量 X 与Y 相互独立,已知 EX = 3,EY = 4,DX = DY = σ2 ,试问:k 取何值时,Z = k ( X 2 - Y 2 ) + Y 2 是 σ2 的无偏估计 。 ( 16 / 7 ) 3、设正态总体 X ~ N ( μ , σ2 ) ,参数 μ ,σ2 均未知,( X 1 ,X 2 ,… ,X n )( n ≥ 2 ) 为简单随机样本,试确定 C ,使得 ∑-=+-=1 1212 )(?n i i i X X C σ 为 σ2 的无偏估计。 ( ) 1(21 -n ) 4、假设总体 X 的数学期望为 μ ,方差为 σ 2 ,),...,,(21n X X X 为来自总体 X 的一个样本, X 、S 2 分别为样本均值和样本方差,试确定常数 c ,使得 22cS X - 为 μ 2 的无偏估计量. ( 1 / n ) 5、设 X 1 ,X 2 是取自总体 N ( μ , σ2 ) ( μ 未知)的一个样本,试说明下列三个统计量 2114341?X X +=μ ,2122121?X X +=μ ,2132 1 31?X X +=μ 中哪个最有效。 ( 2?μ )
6、设某总体 X 的密度函数为:??? ??><=其它 03),(3 2θθθx x x f ,( X 1 ,X 2 ,… ,X n )为该 总体的样本, Y n = max ( X 1 , X 2 , … , X n ) ,试比较未知参数 θ 的估计量 X 3 4 与 n Y n n 31 3+ 哪个更有效? ( n > 1 时,n Y n n 31 3+ 更有效 ) 7、从某正态总体取出容量为10的样本,计算出 15010 1 =∑=i i x ,272010 1 2=∑=i i x 。求总体期望与 方差的矩估计 μ ? 和 2?σ 。 ( 15 ;47 ) 8、设总体 X 具有密度 ?? ? ??≤>=+-C x C x x C x f 01);()1 1(1???? ,其中参数 0 < ? < 1,C 为已知常数,且C > 0,从中抽得一样本 X 1 ,X 2 ,… ,X n ,求参数 ? 的矩估计量。 ( 1 - C /?X ,其中 ∑==n i i X n X 1 1 ) 9、设总体 X 服从( 0,? )上的均匀分布,其中 ? > 0 是未知参数,( X 1 ,X 2 ,… , X n )为简单随机样本,求出 ? 的矩估计量 ? ? ,并判断 ?? 是否为 ? 的无偏估计量。 ( 2?X ,其中 ∑==n i i X n X 1 1 ;是 ) 10、设( X 1 ,X 2 ,… ,X n )为总体 X 的一组样本,总体 X 密度函数为:
实验六参数估计与假设检验 一、实验目的: 学习利用spss对数据进行参数估计与假设检验(参数估计,单样本、独立样本、配对样本T 检验)。 二、实验内容: 某助眠药物临床实验征集了20位被试,试验后得数据表包含被试的性别、身高、体重、用药前睡眠时长及用药后睡眠时长。试就该数据估计性别对未使用药物时睡眠时长的影响、检验被试总体身高与165差距是否显著、对不同性别的被试的身高和体重变量进行独立样本T 检验、并检验药物是否对被试有用。 三、实验步骤: 参数估计 1、定义变量并输入数据 2、选择菜单“分析→描述统计→探索”弹出“探索”对话框,将对话框左侧的变量框中“用药前睡眠时长”添加到因变量列表,“性别”添加到自变量列表 3、点击“统计量”,弹出“探索:统计量”对话框,勾选描述性并设置均值置信区间为95%,单击“继续” 4、单击“确定”按钮,得到输出结果,对结果进行分析解释。 单样本T检验 1、定义变量并输入数据 2、选择菜单“分析→比较均值→单样本T检验”,弹出“单样本T检验”对话框,将对话框左侧的变量框中的“身高”添加到右侧的“检验变量”框中,将检验值设为165; 3、点击“选项”,弹出“选项”对话框,将置信区间百分比设为95%,点击“继续” 4、单击“确定”按钮,得到输出结果,对结果进行分析解释。 独立样本T检验 1、定义变量并输入数据 2、选择菜单“分析→比较均值→独立样本T检验”,弹出“独立样本T检验”对话框,在对话框左侧的变量列表中选变量“身高”“体重”进入检验变量框,选变量“性别”进入控制列表框 3、点击定义组,在组1(1)中填写1,组2(2)中填写2,点击继续, 4、点击“确定”按钮,得到输出结果。对结果进行分析解释。 配对样本T检验 1.打开一份可用数据。 2.选择分析→比较平均值→配对样本T检验,选择一对配对样本“用药前睡眠时长”和“用 药后睡眠时长”,将“用药前睡眠时长”拖至“variable1”,“用药后睡眠时长”拖至“variable2”,单击“选项”设置置信区间为95%,点击“确定”查看自定义结果。
第二讲非参数检验 1. 实验目的 1. 了解非参数假设检验基本思想; 2. 会用SAS 软件中的proc nparlway 过程进行非参数假设检验和 proc freq 过程 进行列联表的独立性检验。 2. 实验要求 1. 会用SAS 软件建立数据集,并进行统计分析; 2. 掌握proc nparlway 过程进行非参数假设检验的基本步骤; 3. 掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1符号检验 H 0:两种方法的处理效果无显著性差异 令 li = * 1 第i 个个体中新方法优于对照方法 .0 第i 个个体中新方法劣于对照方法 i=1,2,|||,N 统计里S N N =瓦I i i T S N 表示新方法的处理效果优于对照方法的配对组总数。 若新方法的处理效果显著的优于对 照方法,则S N 的值应明显偏大。因此,若对给定的置信水平 [,有 P 「S N - 八 则拒绝H 0。 1 N N (1) S N 服从二项分布b(N ,-) E(S N ) ,Var (S N ) 。拒绝域为: 2 2 4 'S N S N c ; H 。为真时, (2)由中心极限定理可知,当 的零分布趋于标准正态分布