当前位置:文档之家› 第九章 x2检验.

第九章 x2检验.

医学统计学

第九章分类变量资料统计推断

第九章χ2检验

主要内容:

一、四格表资料的χ2检验

二、配对四格表资料的χ2检验

三、R×C列联表资料的χ2检验

第一节率的标准误与总体率的区间估计

一、率的抽样误差与标准误

在抽样调查中,由抽样造成的样本率与总体率之差,称为率的抽样误差,其大小可用率的标准误描述。

联想:抽样误差和均数的标准误

x /

x S

复习

率的标准误的计算公式:

(1)p n

ππσ-=σp 为总体率的标准误,π为总体率, n 为样本含量。

复习

(1)

p p p S n

-= 当π未知时,可用样本率p 作为估计值,计算出样本率的标准误S p ,作为σp 估计值.

例1 为了解某地人群结核菌素试验阳性率情况,某医疗机构在该地人群中随机检测了1773人,结核菌素试验阳性有682人,阳性率为38.47%,试计算其标准误。 %16.10116.01773

3847.03847.0==)-(1=p s 分析:π未知,用p 来估计,s p 为δp 的估计,p=38.47%,1-p=61.53%

二、总体率的区间估计

①点估计:π=p

②区间估计:按一定的概率(1-α),以p来估计π所在的范围。一般α=0.05或0.01。

1、查表法

因其计算比较复杂,统计学家已经编制了总体率可信区间估计用表,可根据样本含量n和阳性数x查阅统计学专著中的附表。

当n较小,如n 50,特别是p接近于0或1时,按二项分布原理估计总体率的可信区间。

例2 某市抽查了20名献血员乙型肝炎表面抗原(HBsAg)携带情况,阳性者4人,求该市献血

员HBsAg阳性率的95%可信区间。

分析:n=20,实际发生数x=4,

查表得上行:6~44(95%),下行4~51(99%)

*如果n=20,实际发生的12(x大于n/2),如何查?先找n=20,1-x=8,查表得a~b,

然后算得(100-b)~(100-a)

2、正态近似法

条件:n 足够大,p 和(1-p)均不太小,且np≥5和n(1-p)≥5时,p 近似服从正态分布。 公式:

α=0.05 u 0.05=1.96

α=0.01 u 0.01=2.58

p 为样本率,S p 为样本率的标准误,

u α是双侧概率为α的u 介值

p p u S α±复习

总体率的95%可信区间:

p±1.96s

p

总体率的99%可信区间:

p±2.58S

p

置信区间的意义

理论上,此范围内包括总体率的可能性为95%(99%)。在100次抽样估计中,

95(99)次正确,5(1)次错误。

3 某地随机抽样368名5岁儿童,检查龋齿患病率为62.50%。估计该地儿童龋齿患病率的95%的置信区间。 0252.0368

)6250.01(6250.0)1(=-?=-=n p p s p p ±1.96s p =0.6250±1.96×0.0252 =0.5756~0.6744

该地儿童龋齿患病率的95%的置信区间为57.56%~67.44%。

复习

第二节率的u检验

应用条件:

当n足够大,p和(1-p)均不太小,且np≥5和n(1-p)≥5时,p近似服从正态分布。

一、样本率与总体率的比较

p 为样本率 π0为总体率

σp 为根据总体率计算的标准误。

0000||||(1)p

p p u n

ππσππ--==-

例4 已知某地一般人群高血压患病率为13.26%,某医师在农村随机抽取460人进行观察,有43人确诊为高血压。问该人群患病率是否低一般人群?

分析:本例,n =,460,属于大样本,同时样本率为p ,np 和n (1-p )均大于5,可采用u 检验。

①假设 H 0:π=π0(该人群患病率与一般人群相同) H 1: π<π0(该人群患病率小于一般人群)

α=0.05 (单侧检验) ②计算u 值 n =460 , X =43 p =43/460=0.0935

()4727.2460/1326.011326.01326.00935.0)1(||=-?-=--=n p u πππ

③确定P值,判断结果

u=2.4727>1.64,P<0.05,按 =0.05的水准拒

绝H

0,接受H

1

。可认为该人群患病率低一般人群。

例5 一般情况下,直肠癌围术期并发症发生率为30%,现某医院手术治疗了385例直肠癌患者,围术期出现并发症有100例,并发症发生率为26%,问该院直肠癌患者围术期并发症发生率与一般情况比较有无统计学差异。

分析:本例,n=385,属于大样本,同时样本率为26%,np和n(1-p)均大于5,可采用u检验。

1. 建立检验假设

H 0: π=π0,H 1: π≠π0,α=0.05

2. 计算u 值

3. 确定P 值,判断结果

本题u =1.713<1.96,P >0.05,按α=0.05的水准不拒绝H 0,差异没有统计学意义,故尚不能认为该院直肠癌患者围术期并发症发生率与一般情况不同。

713.1385

)

3.01(3.026.03.0=--=u

二、两样本率比较

应用条件:

n1与n2均较大

p1、(1-p1)、p2、(1-p2)均不太小,

n1p1、n1(1-p1)、n2p2、n2(1-p2)均≥5

10练习题解答:第十章 交互分类与卡方检验

第十章 交互分类与2χ检验 练习题: 1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示: (1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。 (2) 请根据表10-26的数据完成下面的联合分布的交互分类表。 10-27(4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。 解:(1)Y F (从上到下):50;30;100. X F (从左到右) :115;65. (2)P 11=15/180;P 21=35/180;1 Y F =50/180; P 12=20/180;P 22=10/180;2 Y F N =30/180; P 13=80/180;P 23=20/180;3 Y F N =100/180;

1X F N =115/180;2 X F N =65/180. (3)关于X 的边缘分布: x 分居 不分居 P(x) 115/180 65/180 关于Y 的边缘分布: y 紧张 一般 和睦 P(y) 50/180 30/180 100/180 (4)关于X 的条件分布有三个: y=“紧张” x 分居 不分居 P(x) 15/50 35/50 y=“一般” x 分居 不分居 P(x) 20/30 10/30 y=“和睦” x 分居 不分居 P(x) 80/100 20/100 关于y 的条件分布有两个: X=“分居” y 紧张 一般 和睦 P(y) 15/115 20/115 80/115 X=“不分居” y 紧张 一般 和睦 P(y) 35/65 10/65 20/65 2. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示:

卫生统计学 案例版丁元林课后思考题答案

第一章:ECDBB 第二章:BDABC 第三章:DEBCD AEA 第四章:DCCDD DCBD 第五章:DCBDB AEEEC 第六章:CBEDC DDDDA 第七章:ACCBB DACEA 第八章:ABCDD BDADB 第九章:DDBCD AEA 第十章:BDCCE BDAEA 第十一章:CAEDC DBCCD 第十二章:BCAEE BA 第十三章:DDBCC BCDE 第十四章:无 第十五章:无 第十六章:无 第十七章:DBABC BDE 第十八章:无 第十九章:BDCDC CCADC 《卫生统计学》思考题参考答案 第一章绪论 1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的? 答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。 2、统计工作可分为那几个步骤? 答:设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。 答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。 第二章调查研究设计 1、调查研究有何特点? 答:(1)不能人为施加干预措施 (2)不能随机分组 (3)很难控制干扰因素 (4)一般不能下因果结论 2、四种常用的抽样方法各有什么特点? 答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。 (2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。 (3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。

第九章统计学基础课后习题答案

第九章假设检验 一、填空题 1.第一类错误 2.Z统计量、标准正态分布 3.t统计量、t 4.P值 5.TDIST 6.≥30 7.正相关、负相关 二、单选题 1.A 2.D 3.A 4.C 5.C 三、简答题 1.小概率原理:在一个已知假设下,如果某个事件发生的概率非常小,我们通常认为这个假设可能是不成立的。小概率原理包含了两方面的意思:一是认为小概率事件在一次观察中是不会出现的,二是如果在一次观察中出现了小概率事件,那么合理的解释是原有事件具有小概率的说法不成立。 2.建立假设时应注意以下问题: (1)原假设和备择假设是相互对立的,在一项假设检验中,只能有一个假设成立。 (2)原假设必须包含等号。 (3)建立假设时,往往先确立备择假设,然后在确立原假设。 (4)备择假设的形式不同,相应的检验方法也不同。 (5)假设检验的没保底是搜集充分证据来拒绝原假设。 3.在原假设成立的条件下,检验统计量在某样本中至少达到相应值的概率称为P值。4.双侧检验(two-sided test)的备择假设中包含不等号(如m≠m0),实际上包括两种情况:m>m0或mm0或者m

非参数检验

非参数检验 SPSS(中文版)统计分析实用教程(第版)电子工业出版社*第五章非参数检验SPSS(中文版)统计分析实用教程(第版)电子工业出版社*主要内容参数检验与非参数检验的比较单样本的非参数检验独立样本非参数检验相关样本的非参数检验SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较参数检验和非参数检验的区别参数检验和非参数检验最本质的区别:参数检验需要事先确定或假定总体的分布非参数检验则不需要假定总体的分布而是直接用样本来推断总体的分布。 可以通过是否假定总体的分布来区分参数检验和非参数检验除此之外二者之间还可以从很多方面来区分。 ()研究的对象和目标不同。 参数检验研究的是总体的参数不涉及总体的分布检验一旦总体的参数确定总体的分布也就确定了非参数检验的目标是直接从样本推导总体的分布或两个总体的分布是否相同。 ()研究的统计量有所不同。 参数检验中很少用到秩来构造统计量无论样本量大小都能对总体进行推断非参数检验中常用秩、秩和等来构造统计量且常要求样本量较大。 SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较非参数检验的优点()它对总体分布一般不做过多的限制性假设任何分布都可以用非参数检验进行研究从应用范围

看其应用范围大于参数检验。 ()由于非参数检验不依赖于总体的分布形式因而它天然具有稳健性特征。 ()对资料的测量水平要求不高这给资料的搜集带来了很大的方便可以大大减轻统计资料的搜集工作量。 同时也为属性资料研究提供了广泛的基础。 ()非参数检验比较直观很容易理解不需要太多数学知识和统计理论。 多数非参数检验的运算比较简单可以较快地取得统计结果。 非参数检验的上述优点表明在实际问题的研究中它是一种比较有用的统计方法。 SPSS(中文版)统计分析实用教程(第版)电子工业出版社*参数检验与非参数检验的比较非参数检验的缺点有些人主张用非参数检验取代参数检验这种看法有点偏激因为非参数检验毕竟存在着一些自身难以克服的不足表现在:()两者的效率有差距。 非参数检验主要处理定序资料这类资料的测量尺度比较低如果把那些能够用参数检验处理的资料转化为定类和定序资料必然会丢失检验数据的一部分信息因此非参数检验的有效性或检验效率不如参数检验。 ()当样本容量比较大时非参数检验的计算也比较繁杂、困难。 ()参数检验与非参数检验各有各的特点并非所有的参数检验都能转用非参数检验。

spss实验报告

专业统计软件应用 实验报告 实验课程专业统计软件应用 上课时间2013 学年上半学期 14 周( 2013 年 5 月 27 日— 31 日)学生姓名杨守玲学号2011211432 班级0361102 所在学院经管上课地点金融实验指导教师唐兴艳

第五章思考与练习 3.表5.20 是某班级学生的高考数学成绩,试分析该班的数学成绩与全国的平均成绩70 分之间是否有显著性差异(数据文件:data5-16.sav)。 解:解决问题的原理:独立T样本检验 提出原假设和备择假设: Ho:p<0.05,该班的数学成绩与全国的平均成绩70 分之间不存在显著相关性;H1:p>0.05,该班的数学成绩与全国的平均成绩70 分之间存在显著相关性。 第1步单样本T 检验分析设置 (1)选择菜单:“分析”→“比较均值”→“单样本T 检验(S)”,打开“单样本T 检验主对话框”,确定要进行T 检验的变量并输入检验值,按如图所示进行设置。将“成绩”选入“检验变量”中,输入待检验的值“70”,用来检验产生的样本均值与检验值有无显著性差异。 第2步“选项”对话框设置:指定置信水平和缺失值的处理方法。

第3步主要结果及分析 完成以上的操作步骤后,点击“确定”按钮,运行结果如下所示,具体分析如下:下表给出了单样本T 检验的描述性统计量,包括样本数(N)、均值、标准差、均值的标准误差。 当置信水平为95%时,显著性水平为0.05,从表5.2 中可以看出,双尾检测概率P 值为0.002,小于0.05,故接受原假设,也就是说该班的数学成绩与全国的平均成绩70 分之间不存在显著相关性,即班的数学成绩与全国的平均成绩70 分之间存在显著性差异。 4. 在某次测试中,随机抽取男女同学的成绩各10 名,数据如下: 男:99 79 59 89 79 89 99 82 80 85 女:88 54 56 23 75 65 73 50 80 65 假设样本总体服从正态分布,比较置信度为95%的情况下男女得分是否有显著性

第九章 卡方检验

第九章卡方检验习题 一、是非题 1.比较两个独立样木的四格表资料,用Pearson 2χ检验,则Pearson2χ统计量近似服从自由度为1的2χ分布. 2.当H0成立时,两样本四格表资料中a的理论数T a与实际数a的差异可以理解为抽样误差. 3.当n<40时,对某个四格表资料用Fisher检验,其P=0.01,则认为这是一个小概率事件. 4.比较两个独立样本的两分类资料所构成的四格表资料,用Pearson 2 χ,则可以拒绝H0,但还有可能犯第二类错误. χ检验,2χ>2 0.05,1 5.对于比较两个独立样本的四格表资料.用Pearson2χ检验.样本量越大,P≤0.05的可能性就越大. 二、选择题 1.配对设计的两个总体率的比较.若用四格表专用公式,设检验水平为α,则() A.实际发生第一类错误的概率为α,发生第二类错误的概率β增大 B.实际发生第一类错误的概率>α.发生第二类错误的概率β不变 C.实际发生第一类错误的概率≠α D.实际发生第一类错误的概率和第二类错误的概率均不变 2.某成组设计的四格表资料用2χ检验的基本公式算得为a,用专用公式算得为b,则() A.a>b B.a=b C.a比b准确D.b比a准确

χ,可认为() 3.进行四个样本率比较的2χ检验,如2χ>2 0.01,3 A.各总体率不同或不全相同B.各总体率均不相同 C.各样木率均不相同D.各样本率不同或不全相同 4.当四格表的周边合计不变时,如果某个格的实际频数有变化,则其理沦频数() A.增大B.减小C.不变D.随该格实际频数的增减而增减 5.四格表资料的2χ检验的自向度() A.不一定等1 B.一定等于l C.等于格子数减l D.等于样本含量减l 三、筒答题 1.两个独立样本的四格表资料在哪种情况下需要校正?为什么? 2.行×列表资料2χ检验的注意事项是什么? 3.配对四格表和普通四格表有何区别?分析方法有何异同?

第9章-假设检验答案

第九章 《假设检验》测验题 班级: 姓名: 学号: 成绩: 一、填空题(每空3分,共18分) 1. 若假设0H 是正确的,但做出了拒绝0H 的结论,则称这种错误为 ; 若假设0H 是错误的,但做出了接受0H 的结论,则称这种错误为 . 答 弃真; 取伪. 2. 在总体均值μ假设检验中,如果2σ已知,则要构造统计量 ;如果2σ未知,则要构造统计量 ; 答 ;X U μ σ -= ;X T S μ-= 3. 在总体均值μ假设检验中,若是右单侧检验,则原假设0H 为 ;若是左单侧检验,则原假设0H 为 ; 答 0;μμ≤ 0;μμ≥ 二、简答题(每题10分,共30分) 1. 简述假设检验的基本思想. 答 假设检验是根据“小概率”原理,设有原假设0H 需要检验.先假设0H 是正确的,在此“假设”下,构造某一事件A ,它在0H 为正确的条件下发生的概率很小(通常为0.01,0.05),现在进行一次试验,如果事件A 发生了,就说一个小概率事件在一次试验中居然发生了,这就不能不怀疑0H 的正确性,认为拒绝假设0H 是比较合理的.在相反情况下,就接受假设0H . 2. 什么是假设检验?简述假设检验的一般步骤. 假设检验就是根据样本对所提出的假设作出判断:是接受,还是拒绝 (1) 根据实际问题的要求,提出原假设0H 及备择假设1;H (2) 根据假设确定检验统计量; (3) 查表; (4) 按{} 00,P H H α=拒绝为真求出拒绝域或接受域; (5) 根据样本值作出拒绝还是接受0H 的判断. 3. 简述期望μ的假设检验的步骤.(2σ未知) (1) 检验假设00:H μμ=;备择假设: 10:H μμ≠

第十章 卡方检验..

第十章χ2检验 χ检验的原理 第一节2 χ检验的假设 一、2 (一)分类相互排斥,互不包容 2 χ检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别或另一个类别之中。此外,分类必须互不包容,这样,就不会出现某一观测值同时划分到更多的类别当中去的情况。 (二)观测值相互独立 各个被试的观测值之间彼此独立,这是最基本的一个假定。如一个被试对某一品牌的选择对另一个被试的选择没有影响。当同一被试被划分到一个以上的类别中时,常常会违反这个假定。 当讨论列联表时,独立性假定是指变量之间的相互独立。这种情况下,这种变量的独立性正在被检测。而观测值的独立性则是预先的一个假定。 (三)期望次数的大小 每一个单元格中的期望次数应该至少在5以上。一些更加谨慎的统计学家提出了更严格 χ检验时,每一个单元格的期望次数至少不应低于的标准,当自由度等于1时,在进行2 10,这样才能保证检验的准确性。 另外,在许多分类研究中会存在这样一种情况,如自由度很大,有几个类别的理论次数虽然很小,但在给以接受的标准范围内,只有一个类别的理论次数低于1。此时,一个简单的处理原则是设法使每一个类别的理论次数都不要低于1,分类中不超过20%的类别的理论次数可以小于5。在理论次数较小的特殊的四格表中,应运用一个精确的多项检验来避免使χ检验。 用近似的2 χ检验的类别 二、2 (一)配合度检验 配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种2 χ检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时,这种检验又可称为正态吻合性检验。 (二)独立性检验 独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立 χ检验适用于探讨两个变量之间是否具有关联(非独立)或无关(独性的问题。这种类型的2

第九章第二节U检验法

第九章 第二节 正态总体均值和方差的假 设检验 设总体()2 ,~σμN X , n x x x ,,,2 1 为X 的样本. U 检验法 一:单个正态总体均值的假设检验 1. 已知方差2 σ, 检验假设:0 :μμ=H . 分析:由于x 比较集中地反映了总体均值μ的信息,所以检验函数可以从x 着手考虑。 2 11~(,)n i i x x N n n σμ==∑ 。 由于)1,0(~N n x U σ μ-=, 因此很自然地选用统计量: n x U σ μ0 0-= 作为检验函数,

在0 H 为真的条件下, ) 1,0(~0 0N n x U σ μ-= 且()00=U E ,因此,n x U σ μ0 0-= 应当在0 的周围随机摆动,远离0的可能性较小,所以拒绝域可选在双边区域。 基于以上分析,可得检验方法步骤如下: (1)先提出假设0 :μμ=H ; (2)选取检验用的统计量 )1,0(~0 N n x U σ μ-= ; (3)确定检验水平(或显著性水平)和拒绝域, 给定检验水平α, 查()1,0N 表得2 1α - z ,这里2 1α - z 为由 ()1,0N 表得到的2 1α - 分位点, 2 1}{)(2 12 1α α α - =≤=Φ- - z U P z ,

于是有 12 {||}1P U z α α- ≤=-, 12 {}P U z α - >12 1{||}1(1)P U z ααα- =-≤=--=, 即得 12 {| |}x P z α α- ->=, 这就是说事件}|{| 2 10 α σ μ - >-z n 是一 个小概率事件,从而拒绝域 =D ?? ????∞???? ??-∞-- - ,,2 12 1α α z z ; (4)根据样本的试验值n x x x ,,,2 1 , 算得U 的值n x u σ μ0 0-= , 比较判断下结论, 若2 10 α - >z u ,(小概率事件在一次试 验中发生),则拒绝原假设0 H , 若2 10α-

次数资料分析卡方检验

第五章 次数资料分析 ——2χ检验本章将分别介绍对次数资料、等级资料进行统计分析的方法。

第节χ2统计量与χ2分布 第一节 一、χ2统计量的意义 为了便于理解现结合实例说明( 为了便于理解,现结合一实例说明χ2读作卡方) 统计量的意义。根据遗传学理论,动物的性别比例是1:1。统计某羊场一年所产的876只羔羊中有公羔只母羔只按11只羔羊中,有公羔428只,母羔448只。按1:1性别例计算公母均应为只 的性别比例计算,公、母羔均应为438只。以A表示实际观察次数,T 表示理论次数,可将上述情况列成表5‐1。

表5‐1 羔羊性别实际观察次数与理论次数

从表5‐1看到,实际观察次数与理论次数存在一定的差异,这里公、母各相差10只。这个差异是属于抽样误差(把对该羊场一年所生羔羊 羔的性别统计当作是次抽样调查)、还是羔羊性的性别统计当作是一次抽样调查还是羔羊性别比例发生了实质性的变化? 要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度 度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。

为了度量实际观察次数与理论次数偏离的程 度,最简单的办法是求出实际观察次数与理论次 数的差数。从表51看出:A1T1=10,A2T2=10, ‐‐‐‐ 由于这两个差数之和为0,显然不能用这两个差 数之和来表示实际观察次数与理论次数的偏离程 度了免负抵将两个数 度。为了避免正、负抵消,可将两个差数A‐T、 11 A2‐T2 平方后再相加,即计算∑(A‐T)2,其值越大,实际观察次数与理论次数相差亦越大,反实际观察次数与理论次数相差亦越大 之则越小。但利用∑(A‐T)2表示实际观察次数与 理论次数的偏离程度尚有不足。例如某一组 实际观察次数为

09练习题解答:第九章 两总体假设检验

第九章 双总体假设检验 练习题: 1. 某电信运营商对某市居民的电话费进行了调查,随机抽取了180名男性和 200名女性,其月电话费的平均值、标准差如下表所示:(单位:元) 男性 女性 1n =180 2n =200 1x =140 2x =160 1s =30 2s =48 (1)为了分析男性和女性的月电话费是否有显著差异,请陈述研究假设1H 和虚无假设0H 。 (2)若显著性水平为0.05,请判断该市男性和女性居民的月电话费是否有显著差异? 解:(1)研究假设1H :12μμ≠ 虚无假设0H :2μμ= (2)大样本采用Z 检验: 4.92X X Z = = =- 研究假设方向不明,采用二端检验,否定域0Z ≥1.96或0Z ≤-1.96,检验统计值Z =-4.92<-1.96,落在否定域中,因此可以否定虚无假设,接受研究假设,即在0.05的显著性水平下,男性与女性居民的电话费有显著差异。 2. 某旅游景区随机抽取了40名游客进行调查,其中散客有24人,跟团游客有 16人,他们在景区消费的金额如下表所示: 散客 跟团游客 1x =360 2x =310 1s =80 2s =48 (1)为了分析散客和跟团游客的消费额是否有显著差异,请陈述研究假设1H 和 虚无假设0H 。 (2) 若显著性水平为0.05,请判断散客和跟团游客在该景区的消费额是否有显

著差异。 (3)若是要分析散客的消费额是否高于跟团游客,该如何构造研究假设1H 和虚 无假设0H 。 (4)若显著性水平为0.05,请判断散客的消费额是否高于跟团游客? 解:(1)研究假设1H :12μμ≠ 虚无假设0H :2μμ= (2)小样本(独立样本),采用t 检验: 124n =,216n = 1212(1)(1)2df n n n n =-+-=+- =24+16-2=38 2.19 x x t = = = 研究假设方向不明,采用二端检验,否定域0 2.021t ≤-或0 2.021t ≥(按自由度为40查表得到的结果),可见检验统计值落在否定域中,因此否定虚无假设,接受 研究假设,即在0.05的显著性水平下,散客的消费额不同于跟团游客。 (3)研究假设1H :12μμ> 虚无假设0H :2μμ≤ (4)采用t 检验: 2.19 x x t = = = 研究假设方向明确,采用一端检验,0 1.684t ≥(按自由度为40查表得到的结果),可见检验统计值落在否定域中,因此否定虚无假设,接受研究假设,即在0.05 的显著性水平下,散客的消费额高于跟团游客。 3. 某市最近开展了综合治安整治行动,为了对东西两个城区进行比较,随机在 东城区抽取了100名市民,在西城区抽取了90名市民,认为城区治安明显好转的市民的百分比如下表所示:

第九章 假设检验

第九章假设检验 一、思考题 1.假设检验的特征是什么?假设检验一般有哪些步骤? 2.举例说明假设检验的两类错误。如何协调弃真概率α和取伪概率β的大小? 3.如何区别双侧检验和单侧检验,左侧检验和右侧检验? 4.区间估计和假设检验有何区别与联系?如何根据置信区间进行假设检验? 5.在假设检验中,什么是显著性水平和检验临界值,试举例说明。 二、练习题 (一)填空题 1.陈述的假设包括和。 2.假设检验的三种形式是指、和。 3.在假设检验中,在原假设为真的前提下,拒绝原假设所犯的错误称为 ___________。 4.的选择和的事先指定共同决定了任何一个特定假设检验问题的拒绝域。 5.进行一个总体均值的假设检验时,大致需要考虑两种情况:一是,检验统计量服从标准分布;二是总体方差未知,检验统计量服从分布。 6.参数估计和________是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断。 (二)判断题 1()原假设与备选假设一定是对立的。 H为假时,被2()α错误又称为显著性水平、第一类错误,即原假设 0我们接受所犯这类错误的概率。 3()假设检验中要使α和β同时减少的唯一方法是减少样本容量。

4( )显著性水平越小,犯β错误的可能性越小。 5( )对总体比例的检验一般采用z 检验法。 6( )在拒绝原假设的前提下,若增大α的水平,有可能变为接受原假设。7( )对一个总体均值进行检验,在α=0.01的显著性水平上拒绝了原假设,这表示原假设为真的概率小于0.01。 8( )右侧检验中,如果P 值<α,则拒绝0H 。 (三)单项选择题 1.在假设检验中,若500:,500:10 μμH H ≥,则此检验是( ) A 、左侧检验 B 、右侧检验 C 、双侧检验 D 、以上都不对 2.下面有关小概率原则说法中正确的是( )。 A 、小概率事件就是不可能事件 B 、它是指当一个事件的概率不大于充分小的界限α(0<α<1)时, 可认为该事件为不可能事件 C 、基于“小概率原理”完全可以对某一事件发生与否作出正确判断 D 、总体推断中可以不予考虑的事件 3.假设检验中的第一类错误也叫( )。 A 、弃真错误 B 、纳伪错误 C 、假设错误 D 、判断错误 4.利用总体方差未知的大样本对总体均值进行检验,应该采用( )。 A 、t 检验 B 、z 检验 C 、2χ检验 D 、以上都不对 5.假设检验和参数估计的联系与区别:(甲)都是对总体某一数量特征的推断,都是运用概率估计来得到自己的结论;(乙)前者则需要事先对总体参数做出某种假设,然后根据已知的抽样分布规律确定可以接受的临界值;(丙)后者无须事先对总体数量特征做出假设,它是根据已知的抽样分布规律找出恰当的区间,给出总体参数包含在这一区间的概率。( ) A.(甲) B.(甲) (丙) C.(乙) (丙) D.(甲) (乙) (丙) 6、一个好的假设检验,理想的情况是:( )。 A . α与β都大 B. α与β都小 C. α小,β大 D.α大,β小

10练习题解答:第十章 交互分类与卡方检验

第十章 交互分类与2χ检验 练习题: 1. 为了研究婆媳分居对于婆媳关系的影响,在某地随机抽取了180个家庭,调查结果如下表所示: (1) 计算变量X 与Y 的边际和(即边缘和)X F 和Y F 并填入上表。 (2) 请根据表10-26的数据完成下面的联合分布的交互分类表。 10-27(4) 根据表10-27指出关于X 的条件分布和关于Y 的条件分布。 ~ 解:(1)Y F (从上到下):50;30;100. X F (从左到右):115;65.

(2)P 11=15/180;P 21=35/180;1 Y F N =50/180; P 12=20/180;P 22=10/180;2 Y F N =30/180; P 13=80/180;P 23=20/180;3Y F N =100/180; 1 X F N =115/180;2 X F N =65/180. (3)关于X 的边缘分布: x 分居 不分居 ! P(x) 115/180 65/180 关于Y 的边缘分布: y 紧张 一般 和睦 P(y) 》 50/180 30/180 100/180 (4)关于X 的条件分布有三个: y=“紧张” x 分居 不分居 P(x) 15/50 . 35/50 y=“一般” x 分居 不分居 P(x) 20/30 10/30 y=“和睦” x : 分居 不分居 P(x) 80/100 20/100 关于y 的条件分布有两个: X=“分居” y 紧张 · 一般 和睦 P(y) 15/115 20/115 80/115 X=“不分居”

y 紧张 一般 * 和睦 P(y) 35/65 10/65 20/65 2. 一名社会学家关于“利他主义”的研究中,对被调查者的宗教信仰情况进行 了分析,得到的结果如下表所示: 10-29。 (2)根据表10-28和表10-29计算2χ,计算公式为 2 ()2 o e e f f f χ-=∑ 。 (3)若要对有无宗教信仰的人的利他主义程度有无显著性差异进行检验,请陈 * 述研究假设1H 和虚无假设0H 。 (4)本题目中的自由度为多少若显著性水平为,请查附录的2χ分布表, 找出相对应的临界值。并判断有无宗教信仰的人的利他主义程度有无显著性差 异。 (5)若变量“宗教信仰”和“利他主义程度”存在相关关系,请计算C 系数。

假设检验参考答案

第九章 假设检验 (练习及习题标准答案) 一、单项选择题 1.当总体服从正态分布,但总体方差未知小样本的情况下, 0100:;:μμμμ?≥H H ,则0H 的拒绝域为( ) A.)1(-≤n t t α B. )1(--≤n t t α C. )1(--?n t t α D. )1(/2--≤n t t α 2.在假设检验中,原假设 0H ,备选假设1H ,则称( )为犯第二类错误。 A.0H 为真,不拒绝1H B. 0H 为真,拒绝1H C. 0H 不真,不拒绝0H D. 0H 不真,拒绝0H 3.假设检验是对未知总体某个特征提出某种假设,而验证假设是否成立的资料是( )。 A.样本资料 B.总体全部资料 C.重点资料 D.典型资料 4.下列对总体特征值θ的假设,哪一种写法是正确的?( )。 A. 0100:;:θθθθ?≥H H B. 0100:;:θθθθ≤≥H H C.0100:;:θθθθ?≤H H D.0100:;:θθθθ≥=H H 5. 一家食品生产企业声称,它们生产的某种食品的合格率在95%以上。为检验这一说法是否属实,某食品安全检测部门打算抽取部分食品进行检验,该检验的原假设和备择假设为( ) A. %95:%;95:10?≤ππH H B. %95:%;95:10≠=ππH H C. %95:%;95:10?≥ππH H D. %95:%;95:10≥?ππH H 6.对于非正态总体,使用统计量/x z s n μ-= 估计总体均值的条件是( ) A .小样本 B .总体方差已知 C .总体方差未知 D .大样本 7.在假设检验中,原假设和备选假设( ) A .都有可能成立 B .都有可能不成立 C .只有一个成立而且必有一个成立 D .原假设一定成立,备选假设不一定成立 8.一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( ) A . 0:5H μ=,1:5H μ≠ B .0:5H μ≠,1:5H μ>

9卡方检验

第九章χ2检验 1. 下列哪项检验不适用于χ2检验: A.两样本均数的比较 B.两样本率的比较 C.多个样本构成比的比较 D.拟合优度检验 2. 四格表χ2检验中,χ2 <χ20.05(v) , 可以认为: A. 两样本率不同 B. 两样本率相同 C. 两总体率不同 D. 两总体率相同 3. χ2值的取值范围: A. ﹣∞<χ2<﹢∞ B. ﹣∞<χ2<0 C. 0<χ2<﹢∞ D. ﹣1<χ2<1 E. χ2≤1 4. 假定有两种检测方法,两者检测结果的假阳性率和假阴性率都很低。现有50 份血样用甲法检测结果为阳性的有25份,用乙法检测结果为阳性的有35份,其中两法检测结果同为阳性和同为阴性的分别有23份和13份。为检验两种方法检查结果之间的差别是否有显著性意义,应选用: A. 配对t检验 B. 四格表χ2检验 C. 配对χ2检验 D. U检验 5. R×C列联表χ2检验的自由度为: A. R-1 B. C-1 C. R+C-1

D. R×C-1 E. (R-1)(C-1) 8. 某医院内科治疗一般类型胃溃疡病患者82例,治愈64人;治疗特殊类型胃 溃疡病患者98例,治愈30人。问该医院内科疗法对两种类型胃溃疡病人治愈率有无不同? 答:采用四格表专用卡方检验公式,χ2=40.26,υ=1,P<0.005 9. 某医生用复合氨基酸胶囊治疗肝硬化病人,观察其对改善实验室指标的效果 见下表。试对两组的改善及恢复正常率进行比较。 表复合氨基酸胶囊对改善实验室指标的效果 分组改善未改善合计 试验组23 2 25 对照组11 6 17 合计34 8 42 答:采用四格表卡方检验校正公式,χ2=3.2790,υ=1,P>0.05 10. 为比较两种检验方法(中和法与血凝法)检测关节痛病人抗“O”结果,观测105 例关节痛患者,结果见下表。问:两种检验方法有无相关?其检验结果有无差别? 表中和法与血凝法检验结果的比较 中和法血凝法合计

统计分析与SPSS的应用第五版课后练习答案doc1

《统计分析与SPSS的应用(第五版)》课后练习答案 第一章练习题答案 1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案) 英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions) 2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。 ●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据; ●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。 3、SPSS的数据集: ●SPSS运行时可同时打开多个数据编辑器窗口。每个数据编辑器窗口分别显示不同 的数据集合(简称数据集)。 ●活动数据集:其中只有一个数据集为当前数据集。SPSS只对某时刻的当前数据集 中的数据进行分析。 4、SPSS的三种基本运行方式: ●完全窗口菜单方式、程序运行方式、混合运行方式。 ●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按 钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简 洁和直观。 ●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工 编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。该方式适用 于大规模的统计分析工作。 ●混合运行方式:是前两者的综合。 5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名 .spv是结果查看器窗口中的SPSS分析结果文件的扩展名 .sps是语法窗口中的SPSS程序 6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。 7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。 ●简单随机抽样(simple random sampling):从包括总体N个单位的抽样框中随机地 抽取n个单位作为样本,每个单位抽入样本的概率是相等的。是最基本的抽样方法,是其它抽样方法的基础。优点:简单、直观,在抽样框完整时,可直接从中抽取样 本,用样本统计量对总体参数进行估计比较方便。局限性:当N很大时,不易构造 抽样框,抽出的单位很分散,给实施调查增加了困难。 ●分层抽样(stratified sampling):将抽样单位按某种特征或某种规则划分为不同 的层,然后从不同的层中独立、随机地抽取样本。优点:保证样本的结构与总体的 结构比较相近,从而提高估计的精度,组织实施调查方便(当层是以行业或行政区 划分时),既可以对总体参数进行估计,也可以对各层的参数进行估计。 ●整群抽样(cluster sampling):将总体中若干个单位合并为组(群),抽样时直接抽 取群,然后对选中群中的所有单位全部实施调查。优点:抽样时只需群的抽样框, 可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施。缺点:估

第九章 假设检验习题

第九章 假设检验习题 一、填空题 1.假设检验的统计思想是概率很小的事件在一次试验中可以认为基本上是不会发生的,该原理称为 。 2.在作假设检验时容易犯的两类错误是 3. 设n X X X ,,,21 是来自总体),(~2 σμN X 的样本,样本均值为X ,(无偏)样 本方差为2S ,要检验假设.:;:20212020σσσσ≠=H H 则要用检验统计量为 ,给定显著性水平α,则检验的拒绝域为 4.设两正态总体),(~211σμN X 和),(~2 22σμN Y 有两组相互独立的样本 n n Y Y Y X X X ,,,,,,2121 及,均值为Y X ,,(无偏)样本方差为2221,S S 。21μμ及未知,要对2221σσ=作检验假设,统计假设为.:;:20212020σσσσ≠=H H 则要用检验统计量为 ,给定显著性水平α,则检验的拒绝域 为 。 二、选择题 1.假设检验中,显著水平α表示( ) (A )0H 为假,但接受0H 的假设的概率;(B )0H 为真,但拒绝0H 的假设的概率; (C )0H 为假,但拒绝0H 的假设的概率;(D )可信度 2.假设检验时,若增大样本容量,则犯两类错误的概率( ) (A )都增大 (B )都减少 (C )都不变 (D )一个增大一个减少 3. 设n X X X ,,,21 是来自总体),(~2 σμN X 的一个样本,设∑==n i i X n X 11 2 12)(1∑=-=n i i X X n S ,其中参数σμ和未知 ,则下面结论正确的是( )

(A ) 若提出假设检验00:μμ=H ,则选用统计量n S X 0μ-; (B ) 若提出假设检验00:μμ=H ,则选用统计量n S X 0 μ- (C ) 若提出假设检验00:μμ=H ,则选用统计量1 0--n S X μ; (D ) 若提出假设检验00:μμ=H ,则选用统计量10 --n S X μ 4. 某工厂所生产的某种细纱支数服从正态分布20 0200,),,(σμσμN 为已知,现从某日生产的一批产品中,随机抽16缕进行支数测量,求得样本均值及方差为2,S X ,要检验纱的均匀度是否优劣,则提出假设( ) (A );:;:010μμμμ≠=H H (B );:;:010μμμμ>=H H (C )20212020:;:σσσσ>=H H (D )20 212020:;:σσσσ≠=H H 三、计算题 1. 某种零件的尺寸方差为2 σ=1.21,对一批这类零件检查6件得尺寸数据(毫米): 32.56,29.66,31.64,30.00,21.87,31.03。设零件尺寸服从正态分布,问这批零件的平均尺寸能否认为是32.50毫米(05.0=α) 2. 啤酒厂罐装啤酒平均每瓶750ml ,每天开工时,需检验罐装生产线工作是否正常。 根据经验知道,啤酒容量服从正态分布,且标准差为ml 5.5=σ。某天开工后,抽测了9瓶啤酒,容量为:748,752,755,747,753,755,745,744,758。试问此生产线工作是否正常?(取显著水平05.0=α) 3.正常人的脉搏平均为72次/分,某医生测得10例慢性四乙基铅中毒患者的脉搏(次/分):54,67,68,78,70,66,67,70,65,69。已知脉搏服从正态分布,问在显著水平05.0=α条件下,四乙基铅中毒者和正常人的脉搏有无显著性差异? 4.设某次考试的考生成绩服从正态分布,从中随机地抽取36位考生的成绩,得平均成绩为66.5分,标准差为15分,问在显著性水平0.05下是否可以认为这次考试成绩平均为70分?

《应用统计学》网上复习题库

《应用统计学》课程网上考试题库 第一章数据与统计学 一、单项选择题 1、统计学具有()特点 A.数量性和总体性 B.数量性和差异性 C.总体性和差异性 D.数量性和 答案:A 2、“统计”作为社会经济生活中经常使用的名词,以下哪项不是其含义() A.统计工作 B.统计资料 C.统计数据 D.统计科学 答案:C 3、专业、性别属于以下哪项统计数据的计量尺度()。 A.定类尺度 B.定序尺度 C.定距尺度 D.定比尺度 答案:A 4、在对工业企业的生产设备进行普查时,调查对象是()。 A . 所有工业企业 B. 每一个工业企业 C . 工业企业的所有生产设备 D. 工业企业的每台生产设备 答案:C 5、统计有三种涵义,其中()是基础、是源。 A. 统计学 B. 统计资料 C. 统计工作 D. 统计方法 答案:C 6、要了解 100 个学生的学习情况,则总体单位()。 A. 100 个学生 B. 100 个学生的学习情况 C. 每一个学生 D. 每一个学生的学习情况 答案:C 二、多项选择题 1、下列哪项可以归于无限总体内。()

A.中国目前居民 B.电脑内所有零件 C.某快递公司所有订单 D.报警电话 E.美国现在的农业科研所数 答案:CD 2、要了解 100 个工业企业的生产情况,则统计指标有()。 A. 100 个工业企业的工业总产值 B. 每一个工人的月工资 C. 全部工业企业 D. 一个工业企业的工资总额 E.全部工业企业的劳动生产率 答案:AE 3、下面哪些属于变量()。 A、可变品质标志 B、质量指标 C、数量指标 D、可变的数量标志 E、某一指标数值 答案:BCD 三、判断题 1、总体性是统计研究的前提。() 答案:错 2、总体单位是构成统计总体的个别事物。() 答案:对 3、推断统计学是研究在一定的概率下,如何用样本资料去推断总体数量特征的方法。() 答案:对 4、全国人口数量是统计总体。() 答案:错 答案: 5、人口的性别是说明总体的品质标志。() 答案:错 6、人的年龄是离散变量。() 答案:错

概率论与数理统计公式总结【已整理 可直接打印】

第一章 P(A+B)=P(A)+P(B)- P(AB) 特别地,当A 、B 互斥时, P(A+B)=P(A)+P(B) 条件概率公式 概率的乘法公式 全概率公式:从原因计算结果 Bayes 公式:从结果找原因 第二章 二项分布(Bernoulli 分布)——X~B(n,p) 泊松分布——X~P(λ) 概率密度函数 怎样计算概率 均匀分布X~U(a,b) 指数分布X~Exp (θ) 分布函数 对离散型随机变量 对连续型随机变量 分布函数与密度函数的重要关系: 二元随机变量及其边缘分布 分布规律的描述方法 联合密度函数 联合分布函数 联合密度与边缘密度 离散型随机变量的独立性 连续型随机变量的独立性 第三章 数学期望 离散型随机变量,数学期望定义 连续型随机变量,数学期望定义 ● E(a)=a ,其中a 为常数 ● E(a+bX)=a+bE(X),其中a 、b 为常数 ● E(X+Y)=E(X)+E(Y),X 、Y 为任意随机变量 随机变量g(X)的数学期望 常用公式 ) () ()|(B P AB P B A P =)|()()(B A P B P AB P =) |()(A B P A P =∑ ==n k k k B A P B P A P 1)|()()(∑ ==n k k k i i k B A P B P B A P B P A B P 1 )|()()|()()|() ,...,1,0()1()(n k p p C k X P k n k k n =-==-,,...) 1,0(! )(== =-k e k k X P k ,λλ 1)(=? +∞ ∞ -dx x f )(b X a P ≤≤?=≤≤b a dx x f b X a P )()() 0(1 )(/≥= -x e x f x θ θ ∑≤==≤=x k k X P x X P x F ) ()()(? ∞ -=≤=x dt t f x X P x F )()()(? ∞ -=≤=x dt t f x X P x F )()()() ,(y x f ) ,(y x F 0 ),(≥y x f 1),(=?? +∞∞-+∞ ∞ -dxdy y x f 1),(0≤≤y x F } ,{),(y Y x X P y x F ≤≤=?+∞ ∞ -=dy y x f x f X ),()(?+∞ ∞ -=dx y x f y f Y ),()(} {}{},{j Y P i X P j Y i X P =====) ()(),(y f x f y x f Y X =∑+∞ -∞ =?= k k k P x X E )(? +∞ ∞ -?=dx x f x X E )()(∑ =k k k p x g X g E )())((∑∑=i j ij i p x X E )(dxdy y x xf X E ??=),()() (1 )(b x a a b x f ≤≤-= ) ()('x f x F =

相关主题
文本预览
相关文档 最新文档