当前位置:文档之家› 大学统计学第七章练习题及答案讲解

大学统计学第七章练习题及答案讲解

大学统计学第七章练习题及答案讲解
大学统计学第七章练习题及答案讲解

第7章 参数估计

练习题

7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少?

解:⑴已知25,40,5===x n σ

样本均值的抽样标准差79.04

10

40

5≈=

=

=

n

x σ

σ ⑵已知5=σ,40=n ,25=x ,4

10

=

x σ,%951=-α 96.1025.02

==∴Z Z α

边际误差55.14

10

*

96.12

≈==n

Z E σ

α

7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客

组成了一个简单随机样本。

(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求边际误差;

(3) 如果样本均值为120元,求总体均值μ的95%的置信区间。

解.已知.根据查表得2/αz =1.96 (1)标准误差:14.249

15==

=n

X σ

σ

(2).已知2/αz =1.96

所以边际误差=2/αz *

=n

s 1.96*49

15=4.2

(3)置信区间:)(2.124,8.11596.149

151202

=*±

=±n

s Z x α

7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差

85414=σ,构建总体均值μ的95%的置信区间。

96.12

=?Z

144.16741100

85414*

96.12

==?

?n

Z σ

856.87818144.16741104560.

2

=-=-?n

Z x σ

144.121301144.16741104560.

2

=+=+?n

Z x σ

置信区间:(87818.856,121301.144)

7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。

(1) 构建μ的90%的置信区间。 (2) 构建μ的95%的置信区间。 (3) 构建μ的99%的置信区间。 解;由题意知100=n , 81=x ,12=s .

(1)置信水平为%901=-α,则645.12

=αZ .

由公式n

s z x ?

±2

α974.181100

12645.181±=?

±=

即(),974.82,026.79974.181=± 则的的%90μ置信区间为79.026~82.974 (2)置信水平为%951=-α, 96.12

=αz

由公式得n

s z x ?

±2

α=81352.281100

12

96.1±=?

± 即81352.2±=(78.648,83.352), 则μ的95%的置信区间为78.648~83.352

(3)置信水平为%991=-α,则576.22

=αZ .

由公式±x n

s z ?

2

α=096.381100

12576.281±=?

±=

即81 3.1±

则的的%99μ置信区间为

7.5 利用下面的信息,构建总体均值的置信区间。

(1)25=x ,5.3=σ,60=n ,置信水平为95%。

(2)6.119=x ,89.23=s ,75=n ,置信水平为98%。 (3)419.3=x ,974.0=s ,32=n ,置信水平为90%。 ⑴,60,5.3,25===n X σ置信水平为95% 解:,96.12

=αZ

89.060

5.39

6.12

=?

=n

Z σ

α

置信下限:-X 11.2489.0252

=-=n

Z σ

α

置信上限:+X 89.2589.0252

=+=n

Z σ

α

),置信区间为(89.2511.24∴

⑵。,置信水平为,%9875n 89.23s ,6.119===X 解:33.22

=αZ

43.67589.2333.22

=?

=n

s Z α

置信下限:-X 17.11343.66.1192

=-=n s Z α

置信上限:+X 03.12643.66.1192

=+=n

s Z α

),置信区间为(03.12617.113∴

⑶x

=3.419,s=0.974,n=32,置信水平为90%

根据t=0.1,查t 分布表可得645.1)31(05.0=Z .283.0)(2/=?n

s Z

所以该总体的置信区间为

x ±2/?Z (

)n

s =3.419±0.283

即3.419±0.283=(3.136 ,3.702) 所以该总体的置信区间为3.136~3.702.

7.6 利用下面的信息,构建总体均值μ的置信区间。

(1) 总体服从正态分布,且已知500=σ,15=n ,8900=x ,置信水平为95%。 (2) 总体不服从正态分布,且已知500=σ,35=n ,8900=x ,置信水平为95%。 (3) 总体不服从正态分布,σ未知,35=n ,8900=x ,500=s ,置信水平为

90%。

(4) 总体不服从正态分布,σ未知,35=n ,8900=x ,500=s ,置信水平为

99%。

(1)解:已知500=σ,15=n ,8900=x ,1-95=α%,96.12

=αz

)9153,8647(15

50096.189002

=?

±=±n

z x σ

α

所以总体均值μ的置信区间为(8647,9153)

(2)解:已知500=σ,35=n ,8900=x ,1-95=α%,96.12

=αz

)9066,8734(35

50096.189002

=?

±=±n

z x σ

α

所以总体均值μ的置信区间为(8734,9066)

(3)解:已知35=n ,8900=x ,s=500,由于总体方差未知,但为大样本,

可用样本方差来代替总体方差

∵置信水平1—α=90% ∴645.12

=αz

∴置信区间为)9039,8761(35

500645.1812

=?

±=±n

s z x α

所以总体均值μ的置信区间为(8761,9039)

(4)解:已知35=n ,8900=x ,500=s ,由于总体方差未知,但为大样

本,可用样本方差来代替总体方差

置信水平1—α=99% ∴58.22

=αz

∴置信区间为)9118,8682(35

50058.289002

=?

±=±n

s z x α

所以总体均值μ的置信区间为(8682,9118)

7.7 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽

取36人,调查他们每天上网的时间,得到的数据见Book7.7(单位:h )。求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。 解:已知:3167.3=x 6093.1=s n=36 1.当置信水平为90%时,645.12

=?z ,

4532.03167.336

6093.1645

.13167.32

±=±=±?

n

s z x

所以置信区间为(2.88,3.76)

2.当置信水平为95%时,96.12

=?z ,

所以置信区间为(2.80,3.84)

3.当置信水平为99%时,58.22

=?z ,

7305.03167.336

6093.158

.23167.32

±=±=±?

n

s z x

所以置信区间为(2.63,4.01)

7.8 从一个正态总体中随机抽取样本量为8的样本,各样本值见Book7.8。求总体均值95%

的置信区间。

已知:总体服从正态分布,但σ未知,n=8为小样本,05.0=α,365.2)18(2

05.0=-t

根据样本数据计算得:46.3,10==s x

5445

.03167.336

6093.196

.13167.32

±=±=±?

n

s z x

总体均值μ的95%的置信区间为: 89.2108

46.3365.2102

±=?

±=±n

s t x α

,即(7.11,

12.89)。

7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样

本,他们到单位的距离(单位:km )数据见Book7.9。求职工上班从家里到单位平均距离95%的置信区间。

已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,131.2)116(2/05.0=-t 根据样本数据计算可得:375.9=x ,s=4.113 从家里到单位平均距离得95%的置信区间为:

191.2375.914

113.4131.2375.92

/±=?

±=±n

s t x α,

即(7.18,11.57)。

7.10 从一批零件中随机抽取36个,测得其平均长度为149.5cm ,标准差为1.93cm 。

(1) 试确定该种零件平均长度95%的置信区间。

(2) 在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。 解:已知,103=σn=36, x =149.5,置信水平为1-α=95%,查标准正态分布表得

2/αZ =1.96.

根据公式得: x ±2

/αZ n σ=149.5±1.9636

103

? 即149.5±1.9636

103?

=(148.9,150.1)

答:该零件平均长度95%的置信区间为148.9~150.1

(3) 在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。

答:中心极限定理论证。如果总体变量存在有限的平均数和方差,那么,不论这

个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。在现实生活中,一个随机变量服从正态分布未必很多,但是多个随即变量和的分布趋于正态分布则是普遍存在的。样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近正态分布,这位抽样误差的概率估计理论提供了理论基础。

7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100g 。现从某天生产的

一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:g )见Book7.11。 已知食品重量服从正态分布,要求:

(1) 确定该种食品平均重量的95%的置信区间。

(2) 如果规定食品重量低于100g 属于不合格,确定该批食品合格率的95%的置信区

间。 (1)已知:总体服从正态分布,但σ未知。n=50为大样本。α=0.05,2/05.0Z =1.96 根据样本计算可知 X =101.32 s=1.63 该种食品平均重量的95%的置信区间为

45.032.10150/63.1*96.132.101/2/±=±=Z ±X n s α

即(100.87,101.77)

(2)由样本数据可知,样本合格率:9.050/45==p 。该批食品合格率的95%的置信区间为: 2

/αZ ±p n p p )1(-=0.950

)

9.01(9.096.1-±=0.9±0.08,即(0.82,0.98) 答:该批食品合格率的95%的置信区间为:(0.82,0.98)

7.12 假设总体服从正态分布,利用Book7.12的数据构建总体均值μ的99%的置信区间。

根据样本数据计算的样本均值和标准差如下;

x =16.13 σ=0.8706 E= Z 2

α

n

σ=2.58*58706

.0=0.45

置信区间为x ±E 所以置信区间为(15.68,16.58)

7.13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18

名员工,得到他们每周加班的时间数据见Book7.13(单位:h )。假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。

解:已知x =13.56 =σ7.80 1.0=α n=18

E=2

αZ *n σ

置信区间=[x -2

αZ n σ

, x +2

αZ n σ

]

所以置信区间=[13.56-1.645*(7.80/18), 13.56+1.645*(7.80/18)] =[10.36, 16.76] 7.14 利用下面的样本数据构建总体比例π的置信区间。

(1)44=n ,51.0=p ,置信水平为99%。 (2)300=n ,82.0=p ,置信水平为95%。 (3)1150=n ,48.0=p ,置信水平为90%。 (1)44=n ,51.0=p ,置信水平为99%。 解:由题意,已知n=44, 置信水平a=99%, Z 2/a =2.58 又检验统计量为: P ±Z

n

p p )

1(-,故代入数值计算得, P ±Z n

p p )

1(-=(0.316,0.704), 总体比例π的置信区间为(0.316,0.704)

(2)300=n ,82.0=p ,置信水平为95%。 解:由题意,已知n=300, 置信水平a=95%, Z 2/a =1.96 又检验统计量为: P ±Z

n

p p )

1(-,故代入数值计算得, P ±Z n

p p )

1(-=(0.777,0.863), 总体比例π的置信区间为(0.777,0.863)

(3)1150=n ,48.0=p ,置信水平为90%。 解:由题意,已知n=1150, 置信水平a=90%, Z 2/a =1.645 又检验统计量为: P ±Z

n

p p )

1(-,故代入数值计算得,

P ±Z

n

p p )

1(-=(0.456,0.504), 总体比例π的置信区间为(0.456,0.504) 7.15 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电

视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。

解:由题意可知n=200,p=0.23

(1)当置信水平为1-α=90%时,Z 2/α=1.645

所以=-±n p p z p )1(2

/α200

)

23.01(23.0645.123.0-?±=0.23±0.04895 即0.23±0.04895=(0.1811,0.2789), (2)当置信水平为1-α=95%时,Z 2/α=1.96 所以=-±n p p z p )1(2

/α200

)

23.01(23.096.123.0-?±=0.23±0.05832 即0.23±0.05832=(0.1717,0.28835);

答:在居民户中拥有该品牌电视机的家庭在置信水平为90%的置信区间为(18.11%,27.89%),在置信水平为95%的置信区间为(17.17%,28.835%)

7.16 一位银行的管理人员想估计每位顾客在该银行的月平均存款额。他假设所有顾客月存

款额的标准差为1000元,要求估计误差在200元以内,应选取多大的样本? 解:已知

1000=σ,E=1000,%991=-α,58.22/=αz

由公式2

2

2/2*E

z n σα=可知n=(2.58*2.58*1000*1000)/(200*200)=167 答:置信水平为99%,应取167个样本。 7.17 要估计总体比例π,计算下列个体所需的样本容量。

(1)02.0=E ,40.0=π,置信水平为96%。 (2)04.0=E ,π未知,置信水平为95%。 (3)05.0=E ,55.0=π,置信水平为90%。

(1)解:已知02.0=E , ,40.0=π, 2/αZ =2.05 由

22

2//)1(E -Z =ππαn 得

2

2

02.0)4.01(40.005.2÷-?=n =2522 答:个体所需的样本容量为2522。

(2)解:已知04.0=E , 2/αZ =1.96 由

22

2//)1(E -Z =ππαn 得

=÷?=22204.05.096.1n 601

答:个体所需的样本容量为601。

(3)解:已知05.0=E ,

55.0=π, 2/αZ =1.645

22

2//)1(E -Z =ππαn 得

2205.045.055.0645.1÷??=n =268

答:个体所需的样本容量为268。

7.18 某居民小区共有居民500户,小区管理者准备采取一向新的供水设施,想了解居民是

否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 (1) 求总体中赞成该项改革的户数比例的置信区间,置信水平为95%。 (2) 如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查? (1)已知:n=50 96.12

=αZ

根据抽样结果计算的样本比例为P=32/50=60% 根据(7.8)式得: 50

%)

641%(64)1(96

.1%64--±=±

n

P P P

即 %)63.76%,37.51(%63.12%64=± 答:置信区间为(51.37%,76.63%)

(2)已知%80=π %10=E 96.12

=αZ

则有:621

.0)

8.01(8.0*96.1)1(*2

2222≈-=E -=ππαZ n 答:应抽取62户进行调查

7.19 根据下面的样本结果,计算总体标准差σ的90%的置信区间。

(1)21=x ,2=s ,50=n 。 (2)3.1=x ,02.0=s ,15=n 。 (3)167=x ,31=s ,22=n 。 解:已知%901=-α,95.02

1,05.02

%,10=-

==α

α

α

1) 查表知67)1(2

2=-n αχ,34)1(2

2

1=--

n α

χ

由公式

22

12

2

2

2

2

)1()1(α

α

χ

σχ-

-≤

≤-s n s n

得34

2*)150(672*)150(2

2-≤

≤-σ,解得(1.72,2.40) 2) 查表知6848.23)1(2

2=-n αχ,57063.6)1(22

1=--

n α

χ

由公式

22

12

2

2

2

2

)1()1(α

α

χσχ--≤

≤-s n s n

得57063

.602.0*)115(6848.2302.0*)115(2

2-≤

≤-σ,解得(0.015,0.029) 3) 查表知6705.32)1(2

2=-n αχ,5913.11)1(22

1=--

n α

χ

由公式

22

12

2

2

2

2

)1()1(α

α

χ

σχ-

-≤

≤-s n s n

得5913

.1131*)122(6705.3231*)122(2

2-≤

≤-σ,解得(24.85,41.73)

7.20 顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与许多因素有关,

比如,银行的业务员办理业务的速度,顾客等待排队的方式等等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取了10名顾客,他们在办理业务时所等待的时间(单位:min )见Book7.20。

(1) 构建第一种排队方式等待时间标准差的95%的置信区间。 (2) 构建第二种排队方式等待时间标准差的95%的置信区间。 (3) 根据(1)和(2)的结果,你认为哪种排队方式更好? 7.21 从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:

来自总体1的样本

来自总体2的样本

141=n 72=n

2.531=x 4.432=x

8.9621=s

0.1022

2=s

(1) 求21μμ-的90%的置信区间。 (2) 求21μμ-的95%的置信区间。 (3) 求21μμ-的99%的置信区间。

7.22 从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:

来自总体1的样本

来自总体2的样本

251=x 232=x

1621=s

202

2=s

(1) 设10021==n n ,求21μμ-95%的置信区间。

(2) 设1021==n n ,2

22

1σσ=,求21μμ-的95%的置信区间。 (3) 设1021==n n ,2

22

1σσ≠,求21μμ-的95%的置信区间。 (4) 设20,1021==n n ,2

22

1σσ=,求21μμ-的95%的置信区间。 (5) 设20,1021==n n ,2

22

1σσ≠,求21μμ-的95%的置信区间。

7.23 Book7.23是由4对观察值组成的随机样本。

(1) 计算A 与B 各对观察值之差,再利用得出的差值计算d 和d s 。

(2) 设1μ和2μ分别为总体A 和总体B 的均值,构造21μμμ-=d 的95%的置信区

间。

7.24 一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得

到的自信心测试分数见Book7.24。构建两种方法平均自信心得分之差21μμμ-=d 的95%的置信区间。

7.25 从两个总体中各抽取一个25021==n n 的独立随机样本,来自总体1的样本比例为

%401=p ,来自总体2的样本比例为%302=p 。

(1) 构造21ππ-的90%的置信区间。 (2) 构造21ππ-的95%的置信区间。

7.26 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进以

减小方差。两部机器生产的袋茶重量(单位:g )的数据见Book7.26。构造两个总体

方差比2

22

1σσ的95%的置信区间。

7.27 根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求

边际误差不超过4%,应抽取多大的样本?

解:已知P=2% E=4% 当置信区间1-α为95%时

2

αZ =

n

p p )1(-?P n=

2

22

)

1(p

p p ?

-?Z α

1-α=0.95 2

αZ =025.0Z =1.96

N=

222

)

1(p

p p ?-?Z α=2

204.098

.002.096.1??=47.06

答:所以应取样本数48。

7.28 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为

120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求边际误差不超

过20元,应抽取多少个顾客作为样本?

解:已知120=σ,20=E ,当05.0=a 时,96.12/05.0=z 。

应抽取的样本量为:13920

120*96.1)(2

2

22222/≈==E z n σα

7.29 假定两个总体的标准差分别为121=σ,152=σ,若要求误差范围不超过5,相应的

置信水平为95%,假定21n n =,估计两个总体均值之差21μμ-时所需的样本量为多大。

7.30 假定21n n =,边际误差05.0=E ,相应的置信水平为95%,估计两个总体比例之差

为21ππ-时所需的样本量为多大。

梁前德《统计学》(第二版)学习指导与习题训练答案:07第七章 假设检验与方差分析 习题答案

旗开得胜 1 第七章 假设检验与方差分析 习题答案 一、名词解释 用规范性的语言解释统计学中的名词。 1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。 2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。 3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。 4. 单侧检验:备择假设符号为大于或小于时的假设检验。 5. 显著性水平:原假设为真时,拒绝原假设的概率。 6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。 二、填空题 根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。 1. u , n x σμ0 -,标准正态; ),( ),(2/2/+∞- -∞n z n z σσααY 2. 参数检验,非参数检验 3. 弃真,存伪 4. 方差

旗开得胜 2 5. 卡方, F 6. 方差分析 7. t ,u 8. n s x 0μ-,不拒绝 9. 单侧,双侧 10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异 12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r 18. 正态,独立,方差齐

三、单项选择 从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。 1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C 四、多项选择 从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。1.AC 2.A 3.B 4.BD 5. AD 五、判断改错 对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。 1. 在任何情况下,假设检验中的两类错误都不可能同时降低。( ×) 样本量一定时 2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。( √) 3

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学计算例题及答案

计算题例题及答案: 1、某校社会学专业同学统计课成绩如下表所示。 社会学专业同学统计课成绩表 学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求: (1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+……+96+97)÷42 =3490÷42 =83.095 (2) 按成绩 分组频数频率(%) 向上累积向下累积 频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

统计学第七章、第八章课后题包括答案.docx

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏 估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总 体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数, 这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间 95%仅仅描述用来构造该区间上下界的统计量(是随机的 )覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有 95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个 95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1.估计总体均值时样本量 n 为 ( z22 2) 22 E z n22其中:2 E 2n 2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为

《统计学》-第7章-习题答案

第七章思考与练习参考答案 1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。 2.答:相关和回归都是研究现象及变量之间相互关系的方法。相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。 3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数 ,样本相关系数 。复相关系数是多元线性回归分 析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。 4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。根据样本数据拟合的方程,就是样本回归函数,以一元线 性回归模型的样本回归函数为例可表示为:t t X Y 10???ββ+=。总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。第二,总体回归函数中 的0β和1β是未知的参数,表现为常数;而样本回归直线中的0 ?β和1?β是随机变量,其具体数值随所抽取的样本观测值不同而变动。 5.最小二乘法是在根据样本数据估计样本回归方程时,采用残差平方和作为衡量总偏 差的尺度,找到使得残差平方和最小的回归系数0 ?β和1?β的取值的估计方法。根据微积分中

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学计算题答案..

第 1 页/共 12 页 1、下表是某保险公司160名推销员月销售额的分组数据。书p26 按销售额分组(千元) 人数(人) 向上累计频数 向下累计频数 12以下 6 6 160 12—14 13 19 154 14—16 29 48 141 16—18 36 84 112 18—20 25 109 76 20—22 17 126 51 22—24 14 140 34 24—26 9 149 20 26—28 7 156 11 28以上 4 160 4 合计 160 —— —— (1) 计算并填写表格中各行对应的向上累计频数; (2) 计算并填写表格中各行对应的向下累计频数; (3)确定该公司月销售额的中位数。 按上限公式计算:Me=U- =18-0.22=17,78 2、某厂工人按年龄分组资料如下:p41 工人按年龄分组(岁) 工人数(人) 20以下 160 20—25 150 25—30 105 30—35 45 35—40 40 40—45 30 45以上 20 合 计 550 要求:采用简捷法计算标准差。《简捷法》 3、试根据表中的资料计算某旅游胜地2004年平均旅游人数。P50 表:某旅游胜地旅游人数 时间 2004年1月1日 4月1日 7月1日 10月1日 2005年1月1 日 旅游人数(人) 5200 5000 5200 5400 5600 4、某大学2004年在册学生人数资料如表3-6所示,试计算该大学2004年平均在册学生人数. 时间 1月1日 3月1日 7月1日 9月1日 12月31日 在册学生人数(人) 3408 3528 3250 3590 3575

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是( C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( B)个变量 A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意 D盲目 7.总体标准差未知时总体均值的假设检验要用到( A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、 1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括( ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有( BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有( ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中( BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错) 5、区间估计就是直接用样本统计量代表总体参数。(错) 6、在假设检验中,方差已知的正态总体均值的检验要计算Z统计量。(错)

统计学基本知识第七章课后知识题及答案解析

第七章 相关和回归 一、单项选择题 1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。 (1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。 (1)小于0 (2)大于0 (3)等于0 (4)等于1 3.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。 (1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。 (1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。 (1)严格的关系 (2)不严格的关系 (3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示: 其相关系数计算出来放在四个备选答案之中,它是( )。 (1)0.29 (2)-0.88 (3)1.03 (4)0.99 7.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。 (1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知 2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2 ()y y -∑的1.2倍, 则相关系数r=( )。 (1) 21.22 (3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。 (1)明显因果关系 (2)自身相关关系 (3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。 (1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。 (1)相关系数 (2)回归系数 (3)回归参数 (4)估计标准误差 12.确定回归方程时,对相关的两个变量要求( )。 (1)都是随机变量 (2)都不是随机变量

统计学课后习题参考问题详解

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

统计学计算题例题及计算分析报告

计算分析题解答参考 1.1.某厂三个车间一季度生产情况如下: 计算一季度三个车间产量平均计划完成百分比和平均单位产品成本。 解:平均计划完成百分比=实际产量/计划产量=733/(198/0.9+315/1.05+220/1.1) =101.81% 平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10.75(元/件) 1.2.某企业产品的有关资料如下: 试分别计算该企业产品98年、99年的平均单位产品成本。 解:该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27.83(元/件) 该企业99年平均单位产品成本x=∑xf /∑(m/x)=101060/(24500/25+28560/28+48000/32) =28.87(元/件) 年某月甲、乙两市场三种商品价格、销售量和销售额资料如下: 1.3.1999 解:三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件) 三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件) 2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为 3.5件;乙组工人日产量资料:

试比较甲、乙两生产小组中的哪个组的日产量更有代表性? 解:∵X 甲=22件 σ甲=3.5件 ∴V 甲=σ甲/ X 甲=3.5/22=15.91% 列表计算乙组的数据资料如下: ∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件) σ 乙=√[∑(x-x)2 f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17.65% 由于V 甲<V 乙,故甲生产小组的日产量更有代表性。 2.2.有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为998斤,标准差为162.7斤;乙品种实验的资料如下: 试研究两个品种的平均亩产量,确定哪一个品种具有较大稳定性,更有推广价值? 解:∵x 甲=998斤 σ甲=162.7斤 ∴V 甲=σ甲/ x 甲=162.7/998=16.30% 列表计算乙品种的数据资料如下:

大学统计学第七章练习题及答案概要

第7章 参数估计 练习题 7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少? 解:⑴已知25,40,5===x n σ 样本均值的抽样标准差79.04 10 40 5≈= = = n x σ σ ⑵已知5=σ,40=n ,25=x ,4 10 = x σ,%951=-α 96.1025.02==∴Z Z α 边际误差55.14 10 * 96.12 ≈==n Z E σ α 7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客 组成了一个简单随机样本。 (1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求边际误差; (3) 如果样本均值为120元,求总体均值μ的95%的置信区间。 解.已知.根据查表得2/αz =1.96 (1)标准误差:14.249 15== =n X σ σ (2).已知2/αz =1.96 所以边际误差=2/αz * =n s 1.96* 49 15=4.2 (3)置信区间:)(2.124,8.11596.149 151202 =*± =±n s Z x α

7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差 85414=σ,构建总体均值μ的95%的置信区间。 96.12 =?Z 144.16741100 85414* 96.12 ==? ?n Z σ 856.87818144.16741104560. 2 =-=-?n Z x σ 144.121301144.16741104560. 2 =+=+?n Z x σ 置信区间:(87818.856,121301.144) 7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。 (1) 构建μ的90%的置信区间。 (2) 构建μ的95%的置信区间。 (3) 构建μ的99%的置信区间。 解;由题意知100=n , 81=x ,12=s . (1)置信水平为%901=-α,则645.12 =αZ . 由公式n s z x ? ±2 α974.181100 12645.181±=? ±= 即(),974.82,026.79974.181=± 则的的%90μ置信区间为79.026~82.974 (2)置信水平为%951=-α, 96.12 =αz 由公式得n s z x ? ±2 α=81352.281100 12 96.1±=? ± 即81352.2±=(78.648,83.352), 则μ的95%的置信区间为78.648~83.352 (3)置信水平为%991=-α,则576.22 =αZ .

统计学第四版第七章课后题最全答案

第七章 练习题参考答案 (1)已知σ=5,n=40,x =25,α=, z 2 05.0= 样本均值的抽样标准差 σ x =n σ= 79.0405 = (2)估计误差(也称为边际误差)E=z 2 α n σ =*= (1)已知σ=15,n=49,x =120,α=, z 2 05.0= (2)样本均值的抽样标准差 σ x =n σ= =4915 估计误差E= z 2 α n σ=* =4915 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±*=±,即(,) (1)已知σ=85414,n=100,x =104560,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =100 85414±.144即(,) (1)已知n=100,x =81,s=12, α=, z 1.0= 由于n=100为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (2)已知α=, z 2 05.0= 由于n=100为大样本,所以总体均值μ的95%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (3)已知α=, z 2 01.0= 由于n=100为大样本,所以总体均值μ的99%的置信区间为:

n s x z 2 α±=±* =100 12±,即(,) (1)已知σ=,n=60,x =25,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =60 .53±,即(,) (2)已知n=75,x =,s=, α=, z 02.0= 由于n=75为大样本,所以总体均值μ的98%的置信区间为: n s x z 2 α±=± =75 9.823±,即(,) (3)已知x =,s=,n=32,α=, z 2 1.0= 由于n=32为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=± =32 74.90±,即(,) (1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=,z 2 05.0= 由于总体服从正态分布,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =15 500±,即(,) (2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=, z 2 05.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =35 500±,即(,) (3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 1.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =35 500±,即(,) (4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 2 01.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

应用统计学试题及答案

北京工业大学经济与管理学院2007-2008年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设 备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为

A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053- 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间 D. 时间每减少一个单位,产品成本平均下降个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公

斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=件乙车间: x=90件, σ=件哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何

《统计学概论》第七章课后练习题答案

《统计学概论》第七章课后练习题答案 一、思考题 1.抽样推断的意义和作用是什么? 2.抽样推断的特点是什么? 3.为什么抽样调查要遵循随机原则? 4.总体参数与样本统计各有什么特点? 5.为什么区间估计比点估计优越? 6.抽样平均误差的定义是什么?它有什么重要意义? 7.影响抽样平均误差的因素有哪些? 8.优良估计量的衡量标准有哪些? 9置信区间、置信度、概率度之间的关系怎样? 10.区间估计的原理是什么? 11.为什么说在n固定的情况下参数区间估计的精确度和可靠性是此消彼长的?12.怎样同时改善区间估计的精确度和可靠性? 13.影响抽样极限误差的因素有哪些? 14.怎样正确理解抽样极限误差的概念? 15.确定样本容量的因素有哪些? 16.抽样方案设计的基本原则是什么? 17.怎样理解类型抽样的原理和意义? 18.等距抽样的原理和意义是什么? 19.整群抽样的原理以及与类型抽样的区别是什么? 二、单项选择题 1.以()为基础理论的统计调查方法是抽样调查法。 A.高等代数B.微分几何 C.概率论D.博弈论 2.典型调查与抽样调查的相同之处为()。 A.均遵守随机原则B.以部分推断总体 C.误差均可估计D.误差均可控制 3.抽样推断必须遵守的首要原则是()。 A.大量性原则B.随机原则

C .可比性原则 D .总体性原则 4.既可进行点估计又可进行区间估计的是( )。 A .重点调查 B .典型调查 C .普查 D .抽样调查 5.误差可以计算并加以控制的是( )。 A .抽样调查 B .普查 C .典型调查 D .重点调查 6.( )可以对于某种总体的假设进行检验。 A .回归分析法 B .抽样推断法 C .综合指数法 D .加权平均法 7.以下正确的是( )。 A .总体指标与样本指标均为随机变量 B .总体指标与样本指标均为常数 C .总体指标是常数而样本指标是随机变量 D .总体指标是随机变量而样本指标是常数 8.总体属性变量平均数恰等于( )。 A .1-P B .P C .P (1-P ) D .)(P 1P - 9.总体属性变量的方差等于( )。 A .1-P B .P C .P (1-P ) D .)(P 1P - 10.点估计的理论依据是( )。 A .中心极限定理 B .抽样分布定理 C .小数定律 D .大数定律 11.频率稳定性的必要条件是( )。 A .同质性 B .大量性 C .随机性 D .社会性 12.样本指标的标准差就是( )。 A .抽样极限误差 B .抽样平均误差

统计学答案第七章

1 估计量的含义是指()。 A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为()。 A.无偏性 B.有效性 C.一致性 D.充分性 3 根据一个具体的样本求出的总体均值的95%的置信区间()。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 4 无偏估计是指()。 A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。 A.样本均值的抽样标准差 B.样本标准差 C.样本方差 D.总体标准差 6 当样本量一定时,置信区间的宽度()。 A.随着置信系数的增大而减小 B.随着置信系数的增大而增大 C.与置信系数的大小无关 D.与置信系数的平方成反比 7 当置信水平一定时,置信区间的宽度()。 A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 8 一个95%的置信区间是指()。 A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数

相关主题
文本预览
相关文档 最新文档