当前位置:文档之家› 统计学教案习题04总体均数的估计和假设检验

统计学教案习题04总体均数的估计和假设检验

统计学教案习题04总体均数的估计和假设检验
统计学教案习题04总体均数的估计和假设检验

第四章 总体均数的估计和假设检验

一、教学大纲要求

(一) 掌握内容

1. 抽样误差、可信区间的概念及计算; 2. 总体均数估计的方法;

3. 两组资料均数比较的方法,理解并记忆应用这些方法的前提条件; 4. 假设检验的基本原理、有关概念(如I 、II 类错误)及注意事项。 (二) 熟悉内容 两样本方差齐性检验。 (三) 了解内容

1. t 分布的图形与特征;

2. 总体方差不等时的两样本均数的比较; 3. 等效检验。

二、教学内容精要

(一) 基本概念 1. 抽样误差

抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error )。统计上用标准误(standard error ,SE )来衡量抽样误差的大小。不同的统计量,标准误的表示方法不同,如均数的标准误用X S 表示,率的标准误用S P 表示,回归系数的标准误用S b 表示等等。均数的标准误与标准差的区别见表4-1。

表4-1 均数的标准误与标准差的区别

意义 反映的抽样误差大小 反映一组数据的离散情况 记法

X σ(样本估计值X S )

σ(样本估计值S )

计算

X σ=

n

σ X S =

n

S

σ =

n

X 2

)(∑

S=

1

)(2

--∑

n X X

控制方法

增大样本含量可减小标准误。 个体差异或自然变异,不能通过统计方法来控制。

2.可信区间

(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval ,CI )。它的确切含义是:CI 是随机的,总体参数是固定的,所以,CI 包含总体参数的可能性是1-α。不能理解为CI 是固定随机的,总体参数是随机固定的,总体参数落在CI 范围内可能性为1-α。当0.05α=时,称为95%可信区间,记作95%CI 。当0.01α=时,称为99%可信区间,记作99%CI 。

(2)可信区间估计的优劣:一定要同时从可信度(即1-α的大小)与区间的宽度两方面来衡量。 (二) t 分布与正态分布

t 分布与标准正态分布相比有以下特点:①都是单峰、对称分布;②t 分布峰值较低,而尾部较高;③随自由度增大,t 分布趋近与标准正态分布;当ν→∞时,t 分布的极限分布是标准正态分布。

(三)总体均数的估计

参数估计有点估计和区间估计两种方式。总体均数的估计,见表4-2。

表4-2 总体均数的估计

意义

直接用样本统计量代替总体参数。

用统计量和x 确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。 估计 方法

以X 作为估计值

①小样本(x S t X να,2/-,x S t X να,2/+)

②大样本(x S u X 2/α-,x S u X 2/α+) ③两总体均数差值的可信区间

(21,2/21x x S t X X ---να,21,2/21x x S t X X -+-να)

(四)两均数差别的比较

1. 样本均数和总体均数比较的t 检验 前提:服从正态分布

0H :0μμ=;1H :0μμ≠

X

S X t 0

μ-=

,1-=n ν (4-1)

2. 配对设计的t 检验 前提:差值服从正态分布

0H :0=d μ;1H :0≠d μ

d

d

S d t μ-=

, 1-=n ν (4-2)

3. 成组设计的两样本均数比较的t 检验

前提:两组数据均服从正态分布;两组总体方差相等 0H :21μμ=;1H :21μμ≠

2

1

2

1X

X S X X t --=

,221-+=n n ν (4-3)

其中,21X X S -=????

??+21

211n n S c , ()()211212

222112

-+-+-=n n S n S n S c (4-4) 2

1

X X S -表示两样本均数差值的标准误。

4. 单样本u 检验

前提:当样本较大(如n >50)或总体0σ已知时

n S X u /0μ-=

(n 较大时) (4-5)

n

X u /00

σμ-=

(0σ已知时) (4-6)

5. 大样本均数比较的u 检验 前提:样本足够大

成组设计的两样本均数比较可用:

222

121x x S S X X u +-=

(4-7) 6. 要推断组间没有差别或差别很小,应采用等效检验(squivalence test )。

(五)假设检验的步骤及有关概念

1. 基本思想:把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。

2. 步骤:①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P 值并作出推断结论。

3. I 类错误:0H 为真(实际无差别),假设检验结果拒绝0H ,接受1H (推论有差别)所犯的错误称为I 类

错误(type I error ),I 类错误的概率记作α。

II 类错误:1H 为真(实际有差别),假设检验结果拒绝1H ,接受0H (推论无差别)所犯的错误称为II 类错误(type II error ),II 类错误的概率记作β。

4. 1-β称为检验效能,过去称把握度(power of test ),即两总体确有差别,按α水准能发现该差别的能力。

三、典型试题分析

(一) 单项选择题

1.当样本含量增大时,以下说法正确的是( ) A. 标准差会变小 B. 样均数标准误会变小 C. 均数标准误会变大 D .标准差会变大

答案:B

[评析] 本题考点:这道题是考察均数标准误的概念。

从均数标准误的定义讲,它反映的是均数抽样误差的大小,那么样本含量越大,抽样误差应该越小。从均数标准误的计算公式n S S x /=来看,也应是n 越大,x S 越小。

2.区间X ±2.58x S 的含义是( )

A .99%的总体均数在此范围内

B .样本均数的99%可信区间

C .99%的样本均数在此范围内

D .总体均数的99%可信区间 答案:D

[评析] 本题考点:可信区间的含义。

可信区间的确切含义指的是:总体参数是固定的,可信区间包含了总体参数的可能性是α-1,而不是总体参数落在CI 范围的可能性为α-1。本题B 、D 均指样本均数,首先排除。A 说总体均数在此范围内,显然与可信区间的含义相悖。因此答案为D 。

(二) 是非题

1.进行两均数差别的假设检验时,当P ≤0.05时,则拒绝0H ;当P >0.05时,则接受0H ,认为两总体均数无差别。

[评析] 答案:错误。当P ≤0.05,拒绝0H 时,我们是依据α这一小概率来下结论的。而当P >0.05时,我们对两总体均数无差别这一结论无任何概率保证,因此不能贸然下无差别的结论。正确的说法是,按所取检验水准α,接受1H 的统计证据不足。

2.通常单侧检验较双侧检验更为灵敏,更易检验出差别,应此宜广泛使用。

[评析] 答案:错误。根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,当两种可能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或者研究者仅关心其中一种可能时,可选用单侧。一般来讲,双侧检验较为稳妥。单侧检验,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出率高,但应慎用。

3.只要增加样本含量到足够大,就可以避免I 和II 型错误。

[评析] 答案:错误。因为通过假设检验推断出的结论具有概率性,因此出现错误判断的可能性就一定存在,无论用任何方法也不能消除这一可能。但是,我们可以使错误判断的可能性尽量地小,比如样本含量越大,犯I 和II 类错误的可能性越小。

(三) 简答题

1. 简述可信区间在假设检验问题中的作用。

[评析]可信区间不仅能回答差别有无统计学意义,而且还能提示差别有无实际意义。可信区间只能在预先规定的概率即检验水准α的前提下进行计算,而假设检验能够获得一较为确切的概率P 值。故将二者结合起来,才

是对假设检验问题的完整分析。

2.某医生就4-3资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前、后血清抗体的变化。

表4-3 328名农民血清抗体滴度及统计量

X S x s

0 20 40 80 160 320 640 1280

免疫前人数 211 27 19 24 25 19 3 0 76.1 111.7 6.17 免疫后人数

2

16

57 76 75 54

25 23 411.9 470.5 25.90

t =(411.91-76.10)/2217.690.25+=12.6,按14ν=查t 界值表P <0.01,说明接种后血清抗体有增长。

问该医生在整理资料和分析资料过程中有何不妥?

答: ①资料整理不当,未整理成配对资料;②统计描述指标使用不当,对于滴度的倒数不宜用算术均数、标准差,有“0”出现,也不宜算几何均数。比较免疫前后抗体滴度的倒数,应计算中位数和四分位数间距;③不宜用t 检验。可将抗体滴度的倒数经对数或平方根转换后,做配对t 检验(ν=327)。

(四) 计算题

1. 某医院用新药与常规药物治疗婴幼儿贫血,将20名贫血患儿随机等分两组,分别接受两种药物治疗,测得血红蛋白增加量(g/L )见表4-4。问新药与常规药的疗效有无差别?

表4-4 两种药物治疗婴幼儿贫血结果

治疗药物

血红蛋白增加量(g/L ) 新药组 24

36 25 14 26 34 23 20 15 19 解:本题属成组设计资料。

210:μμ=H 211:μμ≠H 05.0=α

2

12

1x x S X X t --=

,221-+=n n ν

t =

019.16485

.27

.2=,18=ν

P >0.05

因此,根据现有资料尚不能认为新药与常规药的疗效有差别。

2.将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前后的血沉(mm/h )见表4-5。问:(1)甲、乙两药是否均有效?(2)甲、乙两药疗效是否有别?

表4-5 甲、乙两药治疗某病情况

序号 1 2 3 4 5 6 7 8 9 10 甲药 治疗前 30 33 26 31 30 27 28 28 25 29 治疗后 26 29 23 30 30 24 22 25 23 23 序号 11 12 13 14 15 16 17 18 19 20 乙药

治疗前 29 30 29 33 28 26 30 31 30 30 治疗后

26

23

25

23

23

25

28

22

27

24

(1)解:对甲、乙两药治疗数据分别采用配对t 检验,得

甲药:t ==d S d / 3.2/0.611=5.237 乙药:t ==d S d / 5.0/0.9428=5.303

v =9,P <0.001,按α=0.05水准,拒绝H 0,接受H 1,故可认为甲乙两药治疗前后均有差别。

(2)解:由表中资料分别求得治疗前后差值,再做两组比较。

t =

2

1

2

1d

d S d d --=-1.602,v =18,得0.2>P >0.1,按α=0.05水准,不拒绝H 0,尚不能认为甲、乙两药疗效有差别。 3.测得某地90名正常成年女性红细胞数(104/mm 3)的均值418、标准差为29。试求: (1) 该地95%的正常成年女性红细胞数所在的范围; (2) 该地正常成年女性红细胞数总体均数的95%可信区间。

解:(1)用正态分布法估计正常值范围。因红细胞过多或过少均为异常,故此参考值范围应是双侧范围。

上限:X +1.96S =418+1.96?29=474.84(104/mm 3)

下限:X -1.96S =418-1.96?29=361.16(104/mm 3)。

即(361.16,474.84)(104/mm 3

)。

(2)由于n=90>50,故可近似为正态分布。

上限:X +1.96X S =418+1.96?29/90=423.99(104/mm 3) 下限:X -1.96X S =418-1.96?29/90=412.01(104/mm 3)。 即(412.01,423.99)(104/mm 3)。

四、习 题

(一) 单项选择题

1. 标准误的英文缩写为:

A .S

B .SE

C .X S

D .SD 2. 通常可采用以下那种方法来减小抽样误差:

A .减小样本标准差

B .减小样本含量

C .扩大样本含量

D .以上都不对 3. 配对设计的目的:

A .提高测量精度

B .操作方便

C .为了可以使用t 检验

D .提高组间可比性 4. 以下关于参数估计的说法正确的是:

A . 区间估计优于点估计

B . 样本含量越大,参数估计准确的可能性越大

C . 样本含量越大,参数估计越精确

D .对于一个参数只能有一个估计值 5. 关于假设检验,下列那一项说法是正确的

A .单侧检验优于双侧检验

B .采用配对t 检验还是成组t 检验是由实验设计方法决定的

C .检验结果若P 值大于0.05,则接受H 0犯错误的可能性很小

D .用u 检验进行两样本总体均数比较时,要求方差齐性

6. 两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小

A .α=0.05

B .α=0.01

C .α=0.10

D .α=0.20 7. 统计推断的内容是

A .用样本指标推断总体指标

B .检验统计上的“假设”

C .A 、B 均不是

D .A 、B 均是

8.当两总体方差不齐时,以下哪种方法不适用于两样本总体均数比较 A .t 检验 B .t ’检验 C .u 检验(假设是大样本时) D .F 检验

9.甲、乙两人分别从随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得1X ,21S ,2X ,

2

2S ,则理论上

A .1X =2X ,21S =2

2S

B .作两样本t 检验,必然得出无差别的结论

C .作两方差齐性的F 检验,必然方差齐

D .分别由甲、乙两样本求出的总体均数的95%可信区间,很可能有重叠 10.以下关于参数点估计的说法正确的是

A .CV 越小,表示用该样本估计总体均数越可靠

B .X σ越小,表示用该样本估计总体均数越准确

C .X σ越大,表示用该样本估计总体均数的可靠性越差

D .S 越小,表示用该样本估计总体均数越可靠

(二) 名词解释 1. 统计推断 2. 抽样误差 3. 标准误及X σ 4. 可信区间 5. 参数估计

6. 假设检验中P 的含义 7. I 型和II 型错误 8. 检验效能 9. 检验水准 (三) 是非题

1.若两样本均数比较的假设检验结果P 值远远小于0.01,则说明差异非常大。 2.对同一参数的估计,99%可信区间比90%可信区间好。 3.均数的标准误越小,则对总体均数的估计越准确。 (四) 简答题

1.假设检验时,当P ≤0.05,则拒绝H 0,理论依据是什么? 2.假设检验中α与P 的区别何在? (五) 计算题

1. 治疗10名高血压病人,对每一种病人治疗前、后的舒张压(mmHg )进行了测量,结果见(表4-6),问治疗前后有无差异?

表4-6 10名高血压病人治疗前后的舒张压(mmHg )

病例编号 1 2 3 4 5 6 7 8 9 10 治疗前 117 127 141 107 110 114 115 138 127 122 治疗后

123

108

120

107

100

98 102

152

104

107

2.某医院病理科研究人体两肾的重量, 20例男性尸解时的左、右肾的称重记录见表4-7,问左、右肾重量有无不同?

表4-7 20例男性尸解时左、右肾的称重记录 编号 左肾(克)

右肾(克)

1 170 150

2 155 145

3 140 105

4 11

5 100 5 235 222

6 125 115

7 130 120 8

145

105

9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 140 15 120 90 16 130 120 17 105 100 18 95 100 19 100 90 20 105 125

3.有13例健康人,11例克山病人的血磷测定值(mg%)如表4-8所示,问克山病人的血磷是否高于健康人?

表4-8 健康人与克山病人的血磷测定值(mg%)

健康人 170 155 140 115 235 125 130 145 105 145 患 者

150

125

150

140

90

120 100

100

90

125

2. 某生化实验室测定了几组人的血清甘油三酯含量(mg%)见表4-9,试分析比较工人与干部,男与女的该项血酯水平。

表4-9 正常成人按不同职业、性别分类的的血清甘油三酯含量(mg%)

人数 平均数 标准差 工人 112 106.49 29.09 干部 106 95.93 26.63 男 116 103.91 27.96 女

102

97.93

28.71

五、习题答题要点

(一) 单项选择题

1.B

2.C

3.D

4.B

5.B

6.D

7.D

8.A

9.D 10.C (二) 名词解释

1. 统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statistical inference )。

2. 抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差(sampling error )。 3. 标准误及X σ:通常将样本统计量的标准差称为标准误。许多样本均数的标准差X σ称为均数的标准误(standard error of mean ,SEM ),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。

4. 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval ,CI )。它的确切含义是:可信区间包含总体参数的可能性是1-α,而不是总体参数落在该范围的可能性为1-α。

5. 参数估计:指用样本指标值(统计量)估计总体指标值(参数)。参数估计有两种方法:点估计和区间估计。

6. 假设检验中P 的含义:指从H 0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。

7. I 型和II 型错误:I 型错误(type I error ),指拒绝了实际上成立的H 0,这类“弃真”的错误称为I 型错误,其概率大小用α表示;II 型错误(type II error ),指接受了实际上不成立的H 0,这类“存伪”的误称为II 型错误,其概率大小用β表示。

8. 检验效能:1-β称为检验效能(power of test ),它是指当两总体确有差别,按规定的检验水准α所能发现

该差异的能力。

9.检验水准:,是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准(level of a test),记为α。

(三)是非题

1.错。P值的大小只能说明差异是否有统计学意义,同样的差异,例数越多,P值越小。

2.错。可信区间的优劣要通过两点衡量:区间的可信度;区间的宽度。因此不能笼统的通过区间可信度的大小来评价优劣。

3.正确。标准误越小,可信区间越窄,对总体均数估计的准确程度越高。

(四)简答题

1.答:P值系由H0所规定的总体做随机抽样,获得等于及大于(或等于及小于)依据现有样本信息所计算得的检验统计量的概率。

当P≤0.05时,说明在H0成立的条件下,得到现有检验结果的概率小于α,因为小概率事件几乎不可能在一次试验中发生,所以拒绝H0。同时,下“有差别”的结论的同时,我们能够知道可能犯错误的概率不会大于α,也就是说,有了概率保证。

2.答:以t检验为例,α与P都可用t分布尾部面积大小表示,所不同的是:α值是指在统计推断时预先设定的一个小概率值,就是说如果H0是真的,允许它错误的被拒绝的概率。P值是由实际样本获得的,是指在H0成立的前提下,出现等于或大于现有检验统计量的概率。

(五)计算题

1.解:本题属配对设计资料,故应用配对t检验方法计算。t=2.484,v=9,P<0.05,按α=0.05水准拒绝H0,认为治疗前后有差别(注:此类研究是非随机的自身前后对比研究,要确认疗效,应设立平行对照)。

2.解:本题属配对设计资料,故应用配对t检验方法计算。t=2.157,v=19,P<0.05,按α=0.05水准拒绝H0,认为左、右肾重量差别有统计学意义,右较左肾轻。

3.解:本题属成组设计资料,故应用成组t检验方法计算。t=2.539,v=22,P<0.05,按α=0.05水准拒绝H0,认为二者血磷含量差别有统计学意义,克山病人的血磷高于健康人。(注:此类研究是非随机化的对比研究,如果病人与健康人不具可比性,如居住地不同、性别不同、年龄不同,则不能保证结论正确。

4.解:本题可通过计算两均数差值的95%或99%可信区间来判断两总体均数的差别。

工人与干部均数差值的95%和99%可信区间分别为:(3.10,18.02),(0.73,20.39),均不包含0在内,故可认为工人与干部血清甘油三酯含量的总体均属有差别。

男性与女性均数差值的95%和99%可信区间分别为:(-1.60,13.56),(-4.01,15.97),均包含0在内,故尚不能认为男性与女性血清甘油三酯含量的总体均属有差别。

(潘晓平马跃渊)

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%( 104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如下: 64.43(件/人) (55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下:

根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下: 试分析:(1)哪个单位工人的生产水平高? (2)哪个单位工人的生产水平整齐? % 3.33V %7.44V /8 .1x /5.1x ====乙甲乙甲人)(件人)(件9.在 计算平均数里,从每个标志变量中减去75个单位,然后将每个差数 缩小10倍,利用这个变形后的标志变量计算加权算术平均数,其中各个变量的权数扩大7倍,结果这个平均数等于0.4个单位。试计算这个平均标志变量的实际平均数,并说明理由。79 10.某地区1998~1999年国内生产总值资料如下表:(单位:亿元)

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

统计学第七章假设检验

第七章 假设检验 Ⅰ.学习目的 假设检验包括参数检验与非参数检验,是一种最能体现统计推断思想和特点的方法。通过本章学习,要求:1.掌握统计检验的基本原理,理解该检验的规则及犯两类错误的性质;2.熟练掌握总体均值、总体成数及总体方差指标的各种检验方法,包括:z 检验、t 检验和p 值检验;3.掌握2 检验、符号检验、秩和检验及游程检验四种基本的非参数检验方法。 Ⅱ.课程内容要点 第一节 假设检验的基本原理 一、假设检验的基本原理 “小概率原理”:小概率事件在一次试验中几乎是不会发生的。 事先所做的假设,是假设检验中关键的一项工作。它包括原假设和备选假设两部分。原假设是建立在假定原来总体参数没有发生变化的基础之上的。备选假设是原假设的对立,是在否认原假设之后所要接受的,通常这是我们真正感兴趣的一个判断。 二、假设检验的规则与两类错误 1、假设检验的规则 假设检验的步骤: (1)首先根据实际应用问题确定合适的原假设0H 和备选假设1H ; (2)确定检验统计量,通过数理统计分析确定该统计量的抽样分布;

(3)给定检验的显著性水平α。在原假设成立的条件下,结合备选假设的定义,由检验统计量的抽样分布情况求出相应的临界值,该临界值为原假设的接受域与拒绝域的分界值; (4)从样本资料计算检验的样本统计量,并将其与临界值进行比较,判断是否接受或拒绝原假设。 从检验程序我们可以看出,统计量的取值范围可以分为接受域和拒绝域两个区域。拒绝域正是统计量取值的小概率区域。按照我们将这个拒绝域安排在所检验统计量的抽样分布的某一侧还是两端,可以将检验分为单侧检验或双侧检验。双侧检验中,又可以根据拒绝域,是在左侧还是在右侧而分为左侧检验和右侧检验。对于这些双侧、左、右单侧检验,我们要结合备选假设来考虑。 在检验规则中,我们经常碰到两种重要的检验方法:z检验与t检验。 p值检验的原理:给出原假设后,在假定原假设正确的情况下,参照备选假设,可以计算出检验统计量超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)由样本所计算的检验统计量的数值的概率,这便是p值;而后将此概率值跟事先给出的显著性水平值α进行比较。如果该值小于α,否定原假设,取对应的备选假设。如果该值大于α,我们不就能否定原假设。 2、两类错误 H实际为真,但我们却依据样本信息,做出拒绝的错误结论当原假设 时,称为“弃真”错误;当原假设实际为假,而我们却错误接受时,称为“纳伪”错误。通常记显著性水平α为犯“弃真”错误的可能性大小,β为犯“纳伪”错误的可能性大小。由于两类错误是一对矛盾,在其他条件不变得情况下,减少犯“弃真”错误的可能性大小(α),势必增大犯“纳伪”错误的可能性大小(β),也就是说,β的大小和显著性水平α的大小成相反方向变化。 三、检验功效 -可以用来表明所做假设检验工作好坏的一个指标,我们称之为检1β

统计学计算题例题及计算分析

计算分析题解答参考 1.1.某厂三个车间一季度生产情况如下: 计算一季度三个车间产量平均计划完成百分比和平均单位产品成本。 解:平均计划完成百分比=实际产量/计划产量=733/(198/0.9+315/1.05+220/1.1) =101.81% 平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10.75(元/件) 1.2.某企业产品的有关资料如下: 试分别计算该企业产品98年、99年的平均单位产品成本。 解:该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27.83(元/件) 该企业99年平均单位产品成本x=∑xf /∑(m/x)=101060/(24500/25+28560/28+48000/32) =28.87(元/件) 年某月甲、乙两市场三种商品价格、销售量和销售额资料如下: 1.3.1999 解:三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件) 三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件) 2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为 3.5件;乙组工人日产量资料:

试比较甲、乙两生产小组中的哪个组的日产量更有代表性? 解:∵X 甲=22件 σ甲=3.5件 ∴V 甲=σ甲/ X 甲=3.5/22=15.91% 列表计算乙组的数据资料如下: ∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件) σ乙= √[∑(x-x)2 f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17.65% 由于V 甲<V 乙,故甲生产小组的日产量更有代表性。 2.2.有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为998斤,标准差为162.7斤;乙品种实验的资料如下: 试研究两个品种的平均亩产量,确定哪一个品种具有较大稳定性,更有推广价值? 解:∵x 甲=998斤 σ甲=162.7斤 ∴V 甲=σ甲/ x 甲=162.7/998=16.30% 列表计算乙品种的数据资料如下:

统计学练习题——计算题

统计学练习题——计算题 1、某企业工人按日产量分组如下: 单位:(件) 试计算7、8月份平均每人日产量,并简要说明8月份比7月份平均每人日产量变化的原因。 7月份平均每人日产量为:37360 13320 == = ∑∑f Xf X (件) 8月份平均每人日产量为:44360 15840 == = ∑∑ f Xf X (件) 根据计算结果得知8月份比7月份平均每人日产量多7件。其原因是不同组日产量水平的工人所占比重发生变化所致。7月份工人日产量在40件以上的工人只占全部工人数的40%,而8月份这部分工人所占比重则为66.67%。

2、某纺织厂生产某种棉布,经测定两年中各级产品的产量资料如下: 解: 2009年棉布的平均等级= 250 10 3 40 2 200 1? + ? + ? =1.24(级) 2010年棉布的平均等级= 300 6 3 24 2 270 1? + ? + ? =1.12(级) 可见该厂棉布产品质量2010年比2009年有所提高,其平均等级由1.24级上升为1.12级。质量提高的原因是棉布一级品由80%上升为90%,同时二级品和三级品分别由16%及4%下降为8%及2%。

试比较和分析哪个企业的单位成本高,为什么? 解: 甲企业的平均单位产品成本=1.0×10%+1.1×20%+1.2×70%=1.16(元) 乙企业的平均单位产品成本=1.2×30%+1.1×30%+1.0×40%=1.09(元) 可见甲企业的单位产品成本较高,其原因是甲企业生产的3批产品中,单位成本较高(1.2元)的产品数量占70%,而乙企业只占30%。

[汇总]统计学假设检验练习题

[汇总]统计学假设检验练习题 例3.7.9 从一大批相同型号的金属线中,随机选取10根,测得它的直径(单位:mm)为: 1.23 1.24 1.26 1.29 1.20 1.32 1.23 1.23 1.29 1.28 2(1)如果金属线直径X,N(μ,0.04),试求平均直径μ的置信度为95%的置信区间. 22(2)如果金属线直径X,N(μ, σ),σ未知,试求平均直径μ的置信度为95%的置信区间. 例3.7.10 随机取某牌香烟8支,其尼古丁平均含量为3.6mg,标准差为 0.9mg(试求此牌香烟尼古丁平均含量μ的95,的置信区间((假设尼古丁含量服从正态分布)( 4.某种袋装食品的重量服从正态分布.某一天随机地抽取9袋检验,重量(单位:g)为 510 485 505 505 490 495 520 515 490 22(1) 若已知总体方差σ=8.6,求μ的置信度为90%的置信区间; (2) 若已知总体方差未知,求μ的置信度为95%的置信区间. 5.为了估计在报纸上做一次广告的平均费用,抽出了20家报社作随机样本,样本的均值和标准差分别为575(元)和120(元),假定广告费用近似服从正态分布,求总体均值的95%的置信区间. 6.从某一班中随机抽取了16名女生进行调查.她们平均每个星期花费13元吃零食,样本标准差为3元,求此班所有女生每个星期平均花费在吃零食上的钱数的95%的置信区间.(假设总体服从正态分布)

7.一家轮胎工厂在检验轮胎质量时抽取了400条轮胎作试验,其检查结果这些轮胎的平均行驶里程是20000km,样本标准差为6000km.试求这家工厂的轮胎的平均行驶里程的置信区间,可靠度为95%. 8.为了检验一种杂交作物的两种新处理方案,在同一地区随机地选择8块地段.在各试验地段,按两种方案处理作物,这8块地段的单位面积产量是(单位:kg) 一号方案产量: 86 87 56 93 84 93 75 79 二号方案产量: 80 79 58 91 77 82 74 66 222假设两种产量都服从正态分布,分别为N(μ, σ) ,N(μ, σ), σ未知,求μ-μ的置信度1212为95%的置信区间. 9.为了比较两种型号步枪的枪口速度,随机地取甲型子弹10发,算得枪口子弹的平均值 =500(m/s), 标准差s=1.10(m/s); 随机地取乙型子弹20发,得枪口速度平均值=496(m/s),标1 准差s=1.20(m/s). 设两总体近似地服从正态分布,并且方差相等,求两总体均值之差的置信水2 平为95%的置信区间. 10.为了估计参加业务训练的效果.某公司抽了50名参加过训练的职工进行水平测验,结果是平均得分为4.5,样本方差为1.8;抽了60名未参加训练的职工进行水平测验,其平均得分为3.75,样本方差为2.1. 试求两个总体均值之差的95%的置信区间.(设两个总体均服从正态分布). 11、风驰汽车制造厂的装配车间安装车门仍需人工操作,不同工人的装配时间不同,同一工人的装配时间也有差异,为测定安装车门所需时间,每隔一定时间抽选一个样本,共抽取了10个样本,其数据如下(单位:秒):

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

人大版统计学 习题加答案第四章 假设检验

第四章 假设检验 填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、 填空 1、在做假设检验时容易犯的两类错误是 和 2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为 3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。 4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。 5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。 6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为 7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。(用H 0,H 1表示) 8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β 9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。 KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验 3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受 4、显著性水平 5、小概率事件 6、1.25>2 1α-z 7、H 0:t≥1000 H 1:t <1000 8、增大 9、有

统计学假设检验习题答案

1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。采用t 分布的检验统计量n x t /0σμ-=。查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。667.116/60800820=-= t 。因为t <2.131<2.947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量n x z /0σμ-=。查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3100 /5001000010150=-=z 。因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。 3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2 Z z α>,

统计学计算题例题学习资料

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。 7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%(104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如 下: 率。64.43(件/人)

(55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下: 根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成 103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下:

统计学假设检验习题答案

资料收集于网络,如有侵权 请联系网站删除只供学习与交流 1.假设某产品的重量服从正态分布,现在从一批产品中随机抽取16件,测得平均重量为820克,标准差为60克,试以显著性水平α=0.01与α=0.05,分别检验这批产品的平均重量是否是800克。 解:假设检验为800:,800:0100≠=μμH H (产品重量应该使用双侧 检验)。采用t 分布的检验统计量n x t /0σμ-=。查出α=0.05和0.01两个水平下的临界值(df=n-1=15)为2.131和2.947。667.116/60800820=-= t 。因为t <2.131<2.947,所以在两个水平下都接受原假设。 2.某牌号彩电规定无故障时间为10 000小时,厂家采取改进措施,现在从新批量彩电中抽取100台,测得平均无故障时间为10 150小时,标准差为500小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)? 解:假设检验为10000:,10000:0100>=μμH H (使用寿命有无显著增加,应该使用右侧检验)。n=100可近似采用正态分布的检验统计量n x z /0σμ-=。查出α=0.01水平下的反查正态概率表得到临界值2.32到2.34之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以2,再查到对应的临界值)。计算统计量值3100 /5001000010150=-=z 。因为z=3>2.34(>2.32),所以拒绝原假设,无故障时间有显著增加。 3.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600?

统计学计算习题

第四章 六、计算题 月工资(元) 甲单位人数(人) 乙单位人数比重(%) 400以下 400~600 600~800 800~1000 1000以上 4 25 84 126 28 2 8 30 42 18 合 计 267 100 工资更具有代表性。 1、(1) 430025500267 x f x f ?+?+ == = ∑∑甲工资总额 总人数 3002%5008%7003%f x x f =? =?+?+?+ ∑∑乙 (2) 计算变异系数比较 ()2 x x f f σ-=∑∑甲甲 甲甲 () 2 x x f f σ-∑∑乙乙 乙乙 V x σσ= 甲 甲 甲 V x σσ= 乙乙乙 根据V σ甲 、V σ乙 大小判断,数值越大,代表性越小。 甲品种 乙品种 田块面积(亩) 产量(公斤) 田块面积(亩) 产量(公斤) 1.2 0.8 1.5 1.3 600 405 725 700 1.0 1.3 0.7 1.5 500 675 375 700 4.8 2430 4.5 2250 假定生产条件相同,试研究这两个品种的收获率,确定那一个品种具有稳定性和推广价值。 2、(1) 收获率(平均亩产) 2430 528.254.8 x = ==甲总产量总面积 2250 5004.5 x = =乙 (2) 稳定性推广价值(求变异指标) 2 2 2 2 600405725700506 1.25060.8506 1.5506 1.31.20.8 1.5 1.34.8 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=甲

2 2 2 2 500675375700500 1.0500 1.35000.7500 1.51.0 1.30.7 1.54.5 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=乙 求V σ甲 、V σ乙 ,据此判断。 8.某地20个商店,1994年第四季度的统计资料如下表4-6。 表4-6 按商品销售计划完成情 况分组(%) 商店 数目 实际商品销售额 (万元) 流通费用率 (%) 80-90 90-100 100-110 110-120 3 4 8 5 45.9 68.4 34.4 94.3 14.8 13.2 12.0 11.0 试计算 (1)该地20个商店平均完成销售计划指标 (2)该地20个商店总的流通费用率 (提示:流通费用率=流通费用/实际销售额) 8、(1) () 101%1 % f f x = = =?∑∑ 20实际销售额计划销售额 实际销售额 计划完成 (2) 据提示计算:2012.7%x = 品 种 价格 (元/公斤) 销售额(万元) 甲市场 乙市场 甲 乙 丙 0.30 0.32 0.36 75.0 40.0 45.0 37.5 80.0 45.0 13、提示:= 销售额 平均价格销售量 企业序号 计划产量(件) 计划完成程度(%) 实际一级品率 (%) 1 2 3 4 5 350 500 450 400 470 102 105 110 97 100 98 96 90 85 91

假设检验 练习题 统计学

第八章假设检验 练习题 一、填空 1、在做假设检验时容易犯的两类错误是和 2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为,若提出的 原假设是总体参数大于或小于某一数值,这种假设检验称为 3、假设检验有两类错误,分别是也叫第一类错误,它是指原假设H0 是的,却由于样本缘故做出了H0的错误;和叫第二类错误,它是指原假设H0是的, 却由于样本缘故做出H0的错误。 4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称 为。 5、假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生 的,该原理称为。 6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm,标准差为1.6cm, 在显着性水平α=下,这批零件的直径是否服从标准直径5cm (是,否) 7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时 间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为。(用H0,H1表示) 8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概 率为β,若减少α,则β 9、某厂家想要调查职工的工作效率,工厂预计的工作效率为至少制作零件20 个/小时,随机抽样36位职工进行调查,得到样本均值为19,样本标准差为6,试在显着水平为的要求下,问该工厂的职工的工作效率(有,没有)达到该标准。 10、刚到一批货物,质量检验员必须决定是否接受这批货物,如不符合要求,将 退还给货物供应商,假定合同规定的货物单件尺寸为6,请据此建立原假设_ _ 和备择假设。 σ已知,应采用统计量检验总体均值。 11、总体为正态总体,且2 σ未知,应采用统计量检验总体均值。 12、总体为正态总体,且2 二、选择 1、假设检验中,犯了原假设H0实际是不真实的,却由于样本的缘故而做出的接

统计学计算题(有答案)

1、甲乙两班同时参加《统计学原理》课程的测试,甲班平均成绩为81分,标准差为9.5分,乙 班的成绩分组资料如下: 按成绩分组学生人数(人) 60以下 4 60~70 10 70~80 25 80~90 14 90~100 2 计算乙班学生的平均成绩,并比较甲乙两班,哪个班的平均成绩更有代表性? 2、某车间有甲乙两个生产组,甲组平均每个人的日产量为36件,标准差为9.6件,乙组工人产 量资料如下: 日产量(件)工人数(人) 15 15 25 38 35 34 45 13 要求:(1)计算乙组平均每个工人的日产量和标准差 (2)比较甲乙两生产小组的日产量更有代表性 3 月份 1 2 3 4 5 6 8 11 12

库存额60 55 48 43 40 50 45 60 68 又知1月1日商品库存额为63万元,试计算上半年,下半年和全年的平均商品库存额。 4 品名单位销售额2002比2001销售量增长(%) 2001 2002 电视台5000 8880 23 自行车辆4500 4200 -7 合计9500 13080 (2)计算由于销售量变动消费者增加或减少的支出金额 5、某商店两种商品的销售额和销售价格的变化情况如下:(万元) 商品单位销售额1996比1995年销售价格提高(%) 1995 1996 甲米120 130 10 乙件40 36 12 要求:(1)计算两件商品销售价格总指标和由于价格变动对销售额的影响绝对值(2)计算销售量总指数,计算由于销售变动消费者增加或减少的支出金额

6、某企业上半年产品量和单位成本资料如下: 要求:(1)计算相关系数, 说明两个变量相关的密切程度 (2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? 月份 产量(千克) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

生物统计学期末复习题库及答案

生物统计学期末复习题 库及答案 https://www.doczj.com/doc/3718104624.html,work Information Technology Company.2020YEAR

第一章 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 第二章 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 122--∑∑n n x x )(

判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1.下列变量中属于非连续性变量的是( C ). A.身高 B.体重 C.血型 D.血压 2.对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A.条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). A.正态分布的算术平均数和几何平均数相等. B.正态分布的算术平均数和中位数相等. C.正态分布的中位数和几何平均数相等. D.正态分布的算术平均数、中位数、几何平均数均相等。 4. 如果对各观测值加上一个常数a,其标准差(D)。 A.扩大√a倍 B.扩大a倍 C.扩大a2倍 D.不变 5. 比较大学生和幼儿园孩子身高的变异度,应采用的指标是(C)。 A.标准差 B.方差 C.变异系数 D.平均数 第三章 填空

医学统计学练习

1.假设检验在设计时应确定的是 A.总体参数B.检验统计量C.检验水准 D.P值E.以上均不是 2.如果t≥2,υ,,可以认为在检验水准α=处。 A.两个总体均数不同B.两个总体均数相同C.两个样本均数不同D.两个样本均数相同E.样本均数与总体均数相同 3. 计量资料配对t检验的无效假设(双侧检验)可写为。 A.μd=0 B.μd≠0 C.μ1=μ2 D.μ1≠μ2E.μ=μ0 4.两样本均数比较的t检验的适用条件是。 A.数值变量资料B.资料服从正态分布C.两总体方差相等 D.以上ABC都不对E.以上ABC都对 5.在比较两组资料的均数时,需要进行t/检验的情况是: A.两总体均数不等B.两总体均数相等C.两总体方差不等D.两总体方差相等E.以上都不是 6.有两个独立的随机样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度为。 A.n1+n2 B.n1+n2-1 C.n1+n2+1 D.n1+n2-2 E.n1+n2+2 7. 已知某地正常人某定量指标的总体均值μ0=5,今随机测得该地特殊人群中的30人该指标的数值。若用t检验推断该特殊人群该指标的总体均值μ与μ0之间是否有差别,则自由度为。 A.5 B.28 C.29 D.4 E.30 8. 两大样本均数比较,推断μ1=μ2是否成立,可用。 A.t检验B.u检验C.方差分析 D.ABC均可以E.χ2检验 9.关于假设检验,下列说法中正确的是 A.单侧检验优于双侧检验 B.采用配对t检验还是成组t检验由实验设计方法决定

C.检验结果若P值大于,则接受H0犯错误的可能性很小 D.用Z检验进行两样本总体均数比较时,要求方差齐性 E.由于配对t检验的效率高于成组t检验,因此最好都用配对t检验 10. 为研究新旧两种仪器测量血生化指标的差异,分别用这两台仪器测量同一批样品,则统计检验方法应用。 A.成组设计t检验B.成组设计u检验C.配对设计t检验 D.配对设计u检验E.配对设计χ2检验 11. 阅读文献时,当P=,按α=水准作出拒绝H0,接受H1的结论时,下列说法正确的是。A.应计算检验效能,以防止假“阴性”结果 B.应计算检验效能,检查样本含量是否足够 C.不必计算检验效能D.可能犯Ⅱ型错误 E.推断正确的概率为1-β 12.两样本均数假设检验的目的是判断 A. 两样本均数是否相等B. 两样本均数的差别有多大 C.两总体均数是否相等D. 两总体均数的差别有多大 E. 两总体均数与样本均数的差别有多大 13.若总例数相同,则成组资料的t检验与配对资料的t检验相比: A.成组t检验的效率高些B.配对t检验的效率高些 C.两者效率相等D.两者效率相差不大E.两者效率不可比 15. 两个总体均数比较的t的检验,计算得t>2,n1+n2-2时,可以认为。 A.反复随机抽样时,出现这种大小差异的可能性大于 B.这种差异由随机抽样误差所致的可能性小于 C.接受H0,但判断错误的可能性小于 D.拒绝H0,但犯第一类错误的概率小于 E.拒绝H0,但判断错误的概率未知 16. 为研究两种仪器测量血生化指标的差异,分别用这两台仪器测量同一批血样,则统计检验方法应用。 A.配对设计t检验B.成组设计u检验C.成组设计t检验 D.配对设计u检验E.配对设计χ2检验 17. 在两组资料的t检验中,结果为P<,差别有统计学意义,P愈小,则: 。

统计学计算题整理

: 典型计算题一 1、某地区销售某种商品的价格和销售量资料如下: 根据资料计算三种规格商品的平均销售价格。 解: 36== ∑∑ f f x x (元) 点评: 第一,此题给出销售单价和销售量资料,即给出了计算平均指标的分母资料,所以需采用算术平均数计算平均价格。第二,所给资料是组距数列,因此需计算出组中值。采用加权算术平均数计算平均价格。第三,此题所给的是比重权数,因此需采用以比重形式

表示的加权算术平均数公式计算。 2、某企业1992年产值计划是1991年的105%,1992年实际产值是1991的的116%,问1992年产值计划完成程度是多少? 解: %110% 105% 116=== 计划相对数实际相对数计划完成程度。即1992年计划完成程度为 110%,超额完成计划10%。 点评:此题中的计划任务和实际完成都是“含基数”百分数,所以可以直接代入基本公式计算。 3、某企业1992年单位成本计划是1991年的95%,实际单位成本是1991年的90%,问1992年单位成本计划完成程度是多少? 解: 计划完成程度 %74.94% 95% 90==计划相对数实际相对数。即92年单位成本计划完成程度是 94.74%,超额完成计划5.26%。 点评:本题是“含基数”的相对数,直接套用公式计算计划完成程度。 4、某企业1992年产值计划比91年增长5%,实际增长16%,问1992年产值计划完成程度是多少? 解: 计划完成程度%110% 51% 161=++= 点评:这是“不含基数”的相对数计算计划完成程度,应先将“不含基数”的相对数还原成“含基数”的相对数,才能进行计算。 5、某企业1992年单位成本计划比1991年降低5%,实际降低10%,问1992年单位成

统计学计算例题及答案

计算题例题及答案: 1、某校社会学专业同学统计课成绩如下表所示。 社会学专业同学统计课成绩表 学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求: (1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+……+96+97)÷42 =3490÷42 =83.095 (2) 按成绩 分组频数频率(%) 向上累积向下累积 频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

第5章 统计假设检验练习题及答案

实验报告——第5章统计假设检验 姓名杨秀娟班级人力10001学号 【实验1】 某外企对员工英语水平进行调查,开发部门总结该部门员工英语水平很高,如果按照英语六级考试标准考核,一般平均分为75分。现从开发部门雇员中随机选出11人参加考试,得分如下:80,81,72,60,78,65,56,79,77,87,76 ^ 请问该开发部门的英语水平是否真的很高(即高于75分,且差异显著) 【解】 (1)数据和变量说明 本题所用数据是:外企英语六级考试成绩样本 该文件为11个样本,1个变量,如变量视图 (2)操作方法 (3)结果报告

, 上图为单样本t检验表,第一行注明了用于比较的已知的总体均数为75,下面从左到右依次为t值(t)、自由度(df)、P值(Sig)、两均数的差值、差值的95%可信区间。 由上表可知,t= , P=, P>,接受Ho,与平均成绩75相等,无显著差异,因此,该开发部门的英语水平不是真的很高。 【实验2】 以下是对某产品促销团队进行培训前后的销售业绩数据,试分析该培训是否产生了显著效果。 表5-20 培训前后销售业绩数据 56789 序号123' 4 7488827185 培训前677074~ 97 7687867895 培训后786778{ 98 【解】 (1)数据和变量说明 本文件有2个变量,9个数据 (2)操作方法 *

(3)结果报告 由上表可知,P=, P<,不接受无效假设,有显著差异,所以该培训产生了显著效果。 【实验3】 饲养队制定了两种喂养方案喂猪,希望通过试验了解一下不同喂养方案的喂养效果。

方案一:用一只猪喂不同的饲料所测得的体内钙留存量数据如下: 表 5-21 方案一喂养数据 序号! 1 23456789 饲料1" 饲料2/ 方案二:甲队有11只猪喂饲料1,乙队有9只猪喂饲料2,所得的钙留存量数据如下: ; 表5-22方案二喂养数据 序号12345678· 9 1011甲队饲料1; 乙队饲料2\ 请选用恰当方法对上述两种方案所获得的数据进行分析,研究不同饲料是否使小猪体内钙留存量有显著不同。 【解】 方案一 (1)《 (2)数据和变量说明 答:9个数据,2个变量 (3)操作方法

相关主题
文本预览
相关文档 最新文档