当前位置:文档之家› 统计学第五版课后练答案

统计学第五版课后练答案

统计学第五版课后练答案(7-8

章)(总11页)

-本页仅作为预览文档封面,使用时请删除本页-

第七章 参数估计

(1)

x σ=

=

(2)

2x z α∆= 1.96=

某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差。

x σ==

(2)在95%的置信水平下,求估计误差。

x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=×=

(3)如果样本均值为120元,求总体均值 的95%的置信区间。

置信区间为:

22

x z x z αα⎛

-+ ⎝

=()120 4.2,120 4.2-+=(,)

22

x z x z αα⎛

-+ ⎝

=104560±=(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求:

大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭或2,s x N n μ⎛⎫

⎪⎝⎭

置信区间为:

22x z x z αα⎛

-+ ⎝

= (1)构建μ的90%的置信区间。

2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(,)

(2)构建μ的95%的置信区间。

2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(,) (3)构建μ的99%的置信区间。

2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(,)

(1)

2x z α±=25 1.96±=(,) (2)

2x z α±=119.6 2.326±=(,)

(3)

2x z α±=3.419 1.645±=(,)

(1)

2x z α±=8900 1.96±=(,)

(2)

2x z α±=8900 1.96±=(,)

(3

)2x z α±

=8900 1.645±=(,) (4

)2x z α±

=8900 2.58±=(,)

某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36

解:

(1)样本均值x =,样本标准差s=

1α-=,t=2z α=0.05z =

,2x z α±=3.32 1.645±=(,)

1α-=,t=2z α=0.025z =,2x z

α±

3.32 1.96±=(,)

1α-=,t=2z α=0.005z =,2

x z α±

3.32 2.76±(,)

x t α

±=10 2.365±

某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是: 10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2

假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。

解:小样本,总体方差未知,用t 统计量x t =()1t n -

均值=,样本标准差s=, 1α-=,n=16,(1t n α-=()0.02515t =

置信区间:(

)()2211x t n x t n αα⎛

--+- ⎝

=9.375 2.13 2.13⎛

-+ ⎝=(,)

(1) 2x z α±=149.5 1.96±(,)

(2)中心极限定理

7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g 。现从某天生产

(1)确定该种食品平均重量的95%的置信区间。

解:大样本,总体方差未知,用z 统计量:x z =

()0,1N

样本均值=,样本标准差s=,1α

-=,2z α

=0.025z =

置信区间:22x z x z

αα⎛

-

+ ⎝

=101.4 1.96 1.96⎛

-+ ⎝

=

(,)

(2)如果规定食品重量低于l00g 属于不合格,确定该批食品合格率的95%的置信区间。

解:总体比率的估计。大样本,总体方差未知,用z 统计量:z =()0,1N

样本比率=(50-5)/50=,1α

-=,2z α=0.025z

=

置信区间:22p z p z αα⎛

-+

⎝ =0.9 1.96 1.96⎛ -+

⎝=(,)

正态分布,大样本,方差未知

2x z α±16.128 2.576±(,)

7.13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取

的置信区间。

解:小样本,总体方差未知,用t 统计量:x t =

()1t n

-

均值=,样本标准差s=,1α-=,n=18,(21t n α-=()0.0517t = 置信区间:

()()22

11x t n x t n αα⎛

--+- ⎝

=13.56 1.7369 1.7369⎛

-+ ⎝

=(,)

(1)2p z α±0.51 2.576±=(,)

(2)

2p z α±

0.82 1.96±(,) (3

)2p z α±

0.48 1.645±(,) 7.15 在一项家电市场调查中.随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。 解:总体比率的估计

大样本,总体方差未知,用z 统计量:

z =()0,1N

样本比率=,1α-=,2z α=0.025z =

置信区间:

22p z p z αα⎛ -+ ⎝

=

0.23 1.645 1.645⎛ -+ ⎝=(,) 1α-=,2z α=0.025z =

22p z p z αα⎛ -+ ⎝

=

0.23 1.96 1.96⎛ -+ ⎝=(,) 2222

()z s n E α==22

22.5761000200=166

(1)222

()(1)z n E

αππ-==222.050.4(10.4)

0.02-=2522 (2)222

()(1)z n E

αππ-==221.960.5(10.5)

0.04-=601 (当π未知是,取) (3)2

22

()(1)z n E αππ-==221.6450.55(10.55)

0.05-=328

(1

)2p z α±

0.64 1.96±(,) (2)222

()(1)z n E

αππ-==221.960.8(10.8)

0.1-=62

7.20 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的

时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:

要求:

(1)构建第一种排队方式等待时间标准差的95%的置信区间。

解:估计统计量:()()222

1~1n S n χσ-- 经计算得样本标准差2

2s =,1α-=,n=10,

()221n αχ-=()20.0259χ=,()2121n αχ--=()20.9759χ=

置信区间:()()()()22222

211111n S n S n n αασχχ---≤≤--=90.227290.2272,19.02 2.7⨯⨯⎛⎫ ⎪⎝⎭

=(,) 因此,标准差的置信区间为(,)

(2)构建第二种排队方式等待时间标准差的95%的置信区间。

解:估计统计量:()()222

1~1n S n χσ

-- 经计算得样本标准差21s =,1α

-=,n=10,

()221n αχ-=()20.0259χ=,()2121n αχ--=()20.9759χ=

置信区间:()()()()22222211111n S n S n n αασχχ---≤≤--=9 3.3189 3.318,19.02

2.7⨯⨯⎛⎫ ⎪⎝⎭=(,) 因此,标准差的置信区间为(,)

(3)根据(1)和(2)的结果,你认为哪种排队方式更好 第一种方式好,标准差小。

正态总体,独立小样本,方差未知但相等:

12()x x -±22

2

1122

12(1)

(1)2

p n s n s s n n -+-=

+-,12(2)df n n +-)

(1)()2121t n n

α+-=()0.051472t +-=,代入略 (2)()2121t n n α+-=()0.0251472t +-=,代入略 (3)()2121t n n α+-=()0.051472t +-=,代入略

(1)正态或非正态总体,独立大样本,方差未知

12(

)x x -±(2)正态总体,独立小样本,方差未知但12σσ=:

12()x x -±22

2

1122

12(1)(1)2

p n s n s s n n -+-=

+-,12(2)df n n +-)

(3)正态总体,独立小样本,方差未知12σσ≠但12n n =,122df n n =+-

12()x x -±(4)正态总体,独立小样本,方差未知但12σσ=,12n n ≠:

12()x x -±22

2

1122

12(1)(1)2

p n s n s s n n -+-=

+-,12(2)df n n +-)

(5)正态总体,独立小样本,方差未知但12σσ≠,12n n ≠

12()x x -±(其中22

212122222

112212()()()

11

s s n n df s n s n n n +=+--)

d d =,d s =

(2)设12μμ和分别为总体A 和总体B 的均值,构造1

2d μμμ=-的95%的置信区间。

解:小样本,配对样本,总体方差未知,用t 统计量

d d t =

()1t n - 均值=,样本标准差s=,1α-

=,n=4,(

)21t n α-=()0.0253t =

置信区间:()()211d t n d t n

αα⎛

--+- ⎝

=1.75 3.182 3.182⎛

-+ ⎝

=(,)

小样本,配对样本,总体方差未知:()21t n α-=()0.025101t -=

()1d t n α±-

=11 2.2622±=(,) 7.25 从两个总体中各抽取一个12n n ==250的独立随机样本,来自总体1的样本比例为1p =40%,来自总体2的样本比例为2p =30%。要求: (1)构造12ππ-的90%的置信区间。 (2)构造12π

π-的95%的置信区间。 解:总体比率差的估计

大样本,总体方差未知,用z 统计量:

p p z ---=()0,1N

样本比率p1=,p2=,

置信区间: 122122p p z p p z αα⎛ ---+ ⎝

1α-=,2z α=0.025z =

122122p p z p p z αα⎛ ---+ ⎝ =

0.1 1.645 1.645⎛ -+ ⎝ =(%,%)

1α-=,2z α=0.025z =

122122p p z p p z αα⎛ ---+ ⎝ =

0.1 1.96 1.96⎛ -+ ⎝ =(%,%)

生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对序进行改进以减小

1σ2σ解:统计量:

212

122

22

s s σσ()121,1F n n --

置信区间:22

112222

121212,1,11,1s s s s F n n F n n αα-⎛⎫ ⎪ ⎪---- ⎪ ⎪⎝⎭

21s =,2

2

s =,n1=n2=21,1α-=,()121,1F n n α--=()0.02520,20F =, ()12121,1F n n α---=

()

2211

1,1F n n α--

()12121,1F n n α---=()0.97520,20F =

()

0.0251

20,20F =

()()22

112222

121212,1,11,1s s s s F n n F n n αα-⎛⎫ ⎪ ⎪---- ⎪ ⎪⎝⎭

=(,)

7.27 根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求估计误差(边际误差)不超过4%,应抽取多大的样本

解:

2z α∆=,()222

1p

z p p n α⋅⋅-=∆, 1α-=,2z α=0.025z = ()222

1p

z p p n α⋅⋅-=∆=221.960.020.980.04⨯⨯=,取n=48或者50。

7.28 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本

解:2222x z n ασ

⋅=∆,1α-=,2z α=0.025z =,

222

2x

z n ασ⋅=

∆22

2

1.9612020⨯=

=,取n=139或者140,或者150。

第八章 假设检验

提出假设:H 0:μ=;H 1:μ≠

构建统计量(正态,小样本,方差已知):x z =

= 求临界值:α=,2z α=0.025z =

决策:因为2z z α>-,所有,不拒绝H 0

结论:可以认为现在生产的铁水平均含碳量是

8.2 一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服从正态分布,σ=60小时,试在显著性水平0.05下确定这批元件是否合格。 解:提出假设:H 0:μ≥700;H 1:μ<700

构建统计量(正态,

大样本,方差已知):x z =

=-2

求临界值:当α=,查表得z α=。

决策:因为z <-z α,故拒绝原假设,接受备择假设 结论:说明这批产品不合格。

提出假设:H 0:H 0:μ≤250;H 1:μ>250

构建统计量(正态,小样本,方差已知):x z =

求临界值:α=,z α=0.05z = 决策:因为2z z α>,所有,拒绝H 0

结论:明显增产

8.4 糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下: 99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5 已知包重服从正态分布,试检验该日打包机工作是否正常(a =0.05) 解:提出假设:H 0:μ=100;H 1:μ≠100

构建统计量(正态, 小样本,方差未知):

x t =

求临界值:当α=,自由度n -1=9时,查表得()29t α=。

决策:因为t <2t α,样本统计量落在接受区域,故接受原假设,拒绝备择假设 结论:说明打包机工作正常。

8.5 某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问该批食品能否出厂(a =0.05)

解:提出假设: H 0:π≤;H 1:π>

构建统计量:

Z =

求临界值:当α=,查表得z α=。

决策:因为z >z α,样本统计量落在拒绝区域,故拒绝原假设,接受备择假设 结论:说明该批食品不能出厂。 提出假设:H 0:μ≤25000;H 1:μ>25000

构建统计量(正态,小样本,方差已知):x t =

求临界值:当α=,查表得z α=。 决策:因为z <z α,故不能拒绝原假设

结论:没有充分证据证明该厂家的广告是真实的

8.7 某种电子元件的寿命x(单位:小时)服从正态分布。现测得16只元件的寿命如下: 159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170

问是否有理由认为元件的平均寿命显著地大于225小时(a =0.05) 解:提出假设:H 0:μ≤225;H 1:μ>225

构建统计量(正态,小样本,方差已知):x t =

求临界值:当α=,自由度n -1=15时,查表得()15t α=

决策:因为t <t α,样本统计量落在接受区域,故接受原假设,拒绝备择假设 结论:说明元件寿命没有显著大于225小时。

8.10 装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取12件产品,记录各自的装配时间(单位:分钟)如下:

甲方法:31 34 29 32 35 38 34 30 29 32 31 26 乙方法:26 24 28 29 30 29 32 26 31 29 32 28

两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同 (a =0.05) 解:提出假设:H 0:μ1-μ2=0;H 1:μ1-μ2≠0

构建统计量(总体正态,小样本抽样,方差未知,方差相等):

x x t -= 根据样本数据计算,得1n =12,2n =12,1x =,1s =,2x =,2s =。

()()22

1112212112

p

n s n s s

n n -+-=

+-=()()221210.922161210.7106712122

-⨯+-⨯+-=

x x t -=

= 求临界值:α=时,临界点为()2122t n n α+-=()0.02522t = 决策:此题中t >2t α,故拒绝原假设 结论:认为两种方法的装配时间有显著差异

8.11 调查了339名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎”这种观点(a =0.05)

解:提出假设:H 0:π1≤π2;H 1:π1>π2

p 1=43/205= n1=205 p 2=13/134= n2=134

构建统计量:

p p d z --=

0.20980.0970

--3

求临界值:当α=,查表得z α=

决策:因为z >z α,拒绝原假设 结论:说明吸烟者容易患慢性气管炎

8.12 为了控制贷款规模,某商业银行有个内部要求,平均每项贷款数额不能超过60万元。随着经济的发展,贷款规模有增大的趋势。银行经理想了解在同样项目条件下,贷款的平均规模是否明显地超过60万元,故一个n=144的随机样本被抽出,测得x =68.1万元,s=45。用a =0.01的显著性水平,采用p 值进行检验。 解:提出假设:H 0:μ≤60;

H 1:μ>60

构建统计量(大样本,方差未知):

x z ==

求临界值:由于x >μ,因此P 值=P (z ≥)=1-()2.16φ,查表的()2.16φ=,P 值= 决策:由于P >α=,故不能拒绝原假设

结论:说明贷款的平均规模没有明显地超过60万元。

8.13 有一种理论认为服用阿司匹林有助于减少心脏病的发生,为了进行验证,研究人员把自愿参与实验的22 000人随机平均分成两组,一组人员每星期服用三次阿司匹林(样本1),另一组人员在相同的时间服用安慰剂(样本2)持续3年之后进行检测,样本1中有104人患心脏病,样本2中有189人患心脏病。以a =0.05的显著性水平检验服用阿司匹林是否可以降低心脏病发生率。

解:提出假设:H 0:π1≥π2;H 1:π1<π2

p 1=104/11000= n1=11000 p 2=189/11000= n2=11000

构建统计量:p p d

z --=

0.009450.017180

--=-5

求临界值:当α=,查表得z α=

决策:因为z <-z α,拒绝原假设

结论:说明用阿司匹林可以降低心脏病发生率。

8.15 有人说在大学中男生的学习成绩比女生的学习成绩好。现从一个学校中随机抽取了25名男生和16名女生,对他们进行了同样题目的测试。测试结果表明,男生的平均

成绩为82分,方差为56分,女生的平均成绩为78分,方差为49分。假设显著性水平α=0.02,从上述数据中能得到什么结论 解:方差比检验:

提出假设:H 0:21σ=22σ;H 1:21σ≠2

(已知:n1=25,21s =56,n2=16,2

2s =49)

构建统计量:2

122

s F s ==5649=

求临界值:当α=时,()224,15F α=,()1224,15F α-=。

决策:由于()1224,15F α-<F <()224,15F α,检验统计量的值落在接受域中,所以接受原假设

结论:说明总体方差无显著差异。

检验均值差:

提出假设:H 0:μ1-μ2≤0;H 1:μ1-μ2>0

构建统计量(总体正态,小样本抽样,方差未知,方差相等):

x x t -=

根据样本数据计算,得1n =25,2n =16,1x =82,21s =56,2x =78,2

2s =49

()()22

11122

12112

p

n s n s s

n n -+-=

+-

=;x x t -==

求临界值:α=时,临界点为(122t n n α+-=()0.0239t =,t <t α,故不能拒绝原假设 结论:不能认为大学中男生的学习成绩比女生的学习成绩好。

统计学第五版课后习题答案(完整版)

统计学(第五版)课后习题答案(完整版) 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。 第二章思考题 2.1什么是二手资料?使用二手资料应注意什么问题 与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。 2.2比较概率抽样和非概率抽样的特点,指出各自适用情况

统计学(第五版)课后答案

4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求:(1)计算汽车销售量的众数、中位数和平均数。(2)根据定义公式计算四分位数。 (3)计算销售量的标准差。(4)说明汽车销售量分布的特征。 解: Statistics 汽车销售数量 N Valid 10 Missing 0 Mean 9.60 Median 10.00 Mode 10 Std. Deviation 4.169 Percentiles 25 6.25 50 10.00 75 12.50 4.2 随机抽取25个网络用户,得到他们的年龄数据如下: 19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23 要求;(1)计算众数、中位数: 1、排序形成单变量分值的频数分布和累计频数分布: 网络用户的年龄

从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。 (2)根据定义公式计算四分位数。 Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25 和27都只有一个,因此Q3也可等于25+0.75×2=26.5。 (3)计算平均数和标准差; Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773 (5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。 为分组情况下的直方图: 为分组情况下的概率密度曲线: 分组: 1、确定组数:()lg 25lg() 1.398 111 5.64lg(2)lg 20.30103 n K =+ =+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5 3、分组频数表

统计学第五版课后练答案(7-8章)

第七章 参数估计 7.1 (1) x σ= = (2) 2x z α∆= 1.96=1.5495 7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = (2)在95%的置信水平下,求估计误差。 x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: 2x z x z αα⎛ -+ ⎝ =()120 4.2,120 4.2-+=(115.8,124.2) 7.3 2 2 x z x z αα⎛-+ ⎝ =104560±(87818.856,121301.144) 7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭ 或2,s x N n μ⎛⎫ ⎪⎝⎭ 置信区间为: 22x z x z αα⎛ -+ ⎝ =1.2 (1)构建μ的90%的置信区间。 2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97) (2)构建μ的95%的置信区间。 2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35) (3)构建μ的99%的置信区间。 2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(77.91,84.09) 7.5 (1) 2x z α±=25 1.96±=(24.114,25.886) (2) 2x z α±119.6 2.326±=(113.184,126.016) (3) 2x z α± 3.419 1.645±(3.136,3.702) 7.6 (1) 2x z α±=8900 1.96±=(8646.965,9153.035) (2) 2x z α±8900 1.96±=(8734.35,9065.65) (3) 2x z α±8900 1.645±=(8761.395,9038.605)

统计学第五版贾俊平课后思考题和练习题答案完整版

统计学(第五版)贾俊平课后思考题与练习题答案(最终完整版) 第一部分思考题 第一章思考题 1、1什么就是统计学 统计学就是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1、2解释描述统计与推断统计 描述统计;它研究的就是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它就是研究如何利用样本数据来推断总体特征的统计方法。 1、3统计学的类型与不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它就是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也就是有类别的,但这些类别就是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:就是通过调查或观测而收集到的数据,这类数据就是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。1、4解释分类数据,顺序数据与数值型数据 答案同1.3 1、5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就就是样本,这一千个灯泡的寿命的平均值与标准差还有合格率等描述特征的数值就就是参数,这一百个灯泡的寿命的平均值与标准差还有合格率等描述特征的数值就就是统计量,变量就就是说明现象某种特征的概念,比如说灯泡的寿命。 1、6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量与非随机变量。经验变量与理论变量。 1、7举例说明离散型变量与连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析与政府分析还有物理,生物等等各个领域。

统计学第五版课后练答案

统计学第五版课后练答案(7-8 章)(总11页) -本页仅作为预览文档封面,使用时请删除本页-

第七章 参数估计 (1) x σ= = (2) 2x z α∆= 1.96= 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ== (2)在95%的置信水平下,求估计误差。 x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=×= (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: 22 x z x z αα⎛ -+ ⎝ =()120 4.2,120 4.2-+=(,) 22 x z x z αα⎛ -+ ⎝ =104560±=(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭或2,s x N n μ⎛⎫ ⎪⎝⎭ 置信区间为: 22x z x z αα⎛ -+ ⎝ = (1)构建μ的90%的置信区间。 2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(,) (2)构建μ的95%的置信区间。 2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(,) (3)构建μ的99%的置信区间。 2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(,) (1) 2x z α±=25 1.96±=(,) (2) 2x z α±=119.6 2.326±=(,) (3) 2x z α±=3.419 1.645±=(,) (1) 2x z α±=8900 1.96±=(,) (2) 2x z α±=8900 1.96±=(,)

统计学第五版课后题答案

第一章导论 1.1 (1)数值型变量。 (2)分类变量。 (3)离散型变量。 (4)顺序变量。 (5)分类变量。 1.2 (1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。 (2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。 1.3 (1)总体是所有IT从业者的集合。 (2)数值型变量。 (3)分类变量。 (4)截面数据。 1.4 (1)总体是所有在网上购物的消费者的集合。 (2)分类变量。 (3)参数是所有在网上购物者的月平均花费。 (4)参数 (5)推断统计方法。 第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。 2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体

参数的置信区间,就使用概率抽样。 非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法? 实验式、观察式等。 4. 自填式、面方式、电话式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。 面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员的作用。缺点:成本比较高,对调查过程的质量控制有一定难度。对于敏感问题,被访者会有压力。 电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。 5.请举出(或设计)几个实验数据的例子。 不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。 6.你认为应当如何控制调查中的回答误差? 对于理解误差,要注意表述中的措辞,学习一定的心里学知识。对于记忆误差,尽量缩短所涉及问题的时间范围。对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。 7.怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。 对于随机误差,可以通过增加样本容量来控制。对于系统误差,做好预防,在调查前做好各方面的准备工作,尽量把无回答率降到最低程度。无回答出现后,分析武回答产生的原因,采取补救措施。比如要收回一百份,就要做好一百二十份或一百三十份问卷的准备,当被调查者不愿意回答时,可以通过一定的方法劝服被访者,还可以通过馈赠小礼品等的方式提高回收率。 第三章数据的图表搜集 一、思考题 3.1数据的预处理包括哪些内容? 答:审核、筛选、排序等。 3.2分类数据和顺序数据的整理和显示方法各有哪些?

统计学第五版课后答案(贾俊平)之欧阳术创编

第四章统计数据的概括性度量 4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 2 4 7 10 10 10 12 12 14 15 要求: (1)计算汽车销售量的众数、中位数和平均数。 (2)根据定义公式计算四分位数。 (3)计算销售量的标准差。 (4)说明汽车销售量分布的特征。 解: Statistics Missing0 Mean9.60 Median10.00 Mode10 Std. Deviation 4.169 Percentiles25 6.25 5010.00 7512.50 4.2 随机抽取25个网络用户,得到他们的年龄数据如下: 单位:周岁 19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23 要求; (1)计算众数、中位数: 排序形成单变量分值的频数分布和累计频数分布: 网络用户的年龄

数Me=23。 (2)根据定义公式计算四分位数。 Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。 (3)计算平均数和标准差; Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773 (5)对网民年龄的分布特征进行综合分析: 分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。 为分组情况下的直方图: 为分组情况下的概率密度曲线: 分组: 1、确定组数: ()lg 25lg() 1.398 111 5.64lg(2) lg 2 0.30103 n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 最小值)÷ 组数=(4115)÷6=4.3,取5 3、分组频数表

统计学第五版课后练答案

第七章 参数估计 (1) x σ= = (2) 2x z α?==1.96= 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = = (2)在95%的置信水平下,求估计误差。 x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=z α 因此,x x t σ?=?x z ασ=?0.025x z σ=?=×= (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: 2x z x z αα?-+ ? =()120 4.2,120 4.2-+=(, ) 2 x z x z αα?-+ ? =104560±(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ?? ???:或2,s x N n μ?? ???: 置信区间为: 22x z x z αα? -+ ? , (1)构建μ的90%的置信区间。 2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(,) (2)构建μ的95%的置信区间。 2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(,) (3)构建μ的99%的置信区间。 2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(,) (1) 2x z α±=25 1.96±(,) (2) 2x z α±=119.6 2.326±=(,) (3) 2x z α±=3.419 1.645±(,) (1) 2x z α±=8900 1.96±=(,) (2) 2x z α±=8900 1.96±=(,) (3) 2x z α±=8900 1.645±=(,)

《统计学》(贾俊平,第五版)分章习题及答案

《统计学》分章习题及答案 (贾俊平,第五版) 主编:杨群

目录 习题部分 (2) 第1章导论 (3) 第2章数据的搜集 (4) 第3章数据的整理与显示 (5) 第4章数据的概括性度量 (6) 第5章概率与概率分布 (9) 第6章统计量及其抽样分布 (10) 第7章参数估计 (11) 第8章假设检验 (12) 第9章分类数据分析 (13) 第10章方差分析 (15) 第11章一元线性回归 (17) 第12章多元线性回归 (19) 第13章时间序列分析和预测 (22) 第14章指数 (25) 答案部分 (29) 第1章导论 (29) 第2章数据的搜集 (29) 第3章数据的图表展示 (29) 第4章数据的概括性度量 (30) 第5章概率与概率分布 (31) 第6章统计量及其抽样分布 (32) 第7章参数估计 (32) 第8章假设检验 (33) 第9章分类数据分析 (33) 第10章方差分析 (35) 第11章一元线性回归 (35) 第12章多元线性回归 (37) 第13章时间序列分析和预测 (38) 第14章指数 (40)

习题部分 第1章导论 一、单项选择题 1.指出下面的数据哪一个属于分类数据() A.年龄 B.工资 C.汽车产量 D.购买商品的支付方式(现金、信用卡、支票) 2.指出下面的数据哪一个属于顺序数据() A.年龄 B.工资 C.汽车产量 D.员工对企业某项制度改革措施的态度(赞成、中立、反对) 3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这 项研究的统计量是() A.2000个家庭 B.200万个家庭 C.2000个家庭的人均收入 D.200万个家庭的人均收入 4.了解居民的消费支出情况,则() A.居民的消费支出情况是总体 B.所有居民是总体 C.居民的消费支出情况是总体单位 D.所有居民是总体单位 5.统计学研究的基本特点是() A.从数量上认识总体单位的特征和规律 B.从数量上认识总体的特征和规律 C.从性质上认识总体单位的特征和规律 D.从性质上认识总体的特征和规律 6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000 元以上,50%的回答他们的消费支付方式是使用信用卡。这里的“月收入”是() A.分类变量 B.顺序变量 C.数值型变量 D.离散变量 7.要反映我国工业企业的整体业绩水平,总体单位是() A.我国每一家工业企业 B.我国所有工业企业 C.我国工业企业总数 D.我国工业企业的利润总额 8.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上 购物的主要原因是“价格便宜”。这里的参数是() A.1000个消费者 B.所有在网上购物的消费者 C.所有在网上购物的消费者的平均消费额 D.1000个消费者的平均消费额 9.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属 于() A.分类数据 B.顺序数据 C.截面数据 D.时间序列数据 10.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他注意到,雇员要么从 家里带饭,要么在公司餐厅就餐,要么在外面的餐馆就餐。他收集数据的方法属于() A.访问调查 B.邮寄调查 C.个别深度访问 D.观察调查 二、多项选择题 1.欲了解某地高等学校科研情况() A.该地所有高等学校所有的科研项目是总体 B.该地所有的高等学校是总体 C.该地所有高等学校的每一科研项目是总体单位 D.该地每一所高等学校是总体单位 E.该地所有高等学校的所有科研人员是总体 2.下表是《财富》杂志提供的按销售额和利润排列的500强公司的一个样本数据:

统计学人教版第五版7,8,10,11,13,14章课后题答案

统计学复习笔记 第七章 参数估计 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

袁卫 曾五一 贾俊平统计学第五版课后习题 答案

各章练习题答案第2章统计数据的描述 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: (2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0

合计40 100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 2.5 (1)属于数值型数据。 (2)分组结果如下: 分组天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60 (3)直方图(略)。 2.6 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 2.7 (1)茎叶图如下:

统计学教材(贾俊平版)课后习题详细答案

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版) 第一部分思考题 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。

统计学第五版袁卫课后答案第七章思考与练习

统计学第五版袁卫课后答案第七章思考与练习 一、单项选择题 1要进行一项调查,调查者在马路上随机拦截部分人进行调查,这种方式属于()。[河海大学2020研] A.简单随机抽样 B.分层抽样 C.自愿抽样 D.方便抽样 【答案】D 袁卫统计学第5版课后题及答案【解析】 方便抽样是调查过程中由调查员依据方便的原则,自行确定入样的单位的非概率抽样方法。例如,调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售产品的柜台前对路过的顾客进行调查,等等。 2对于大批量的数据,最适合描述其分布的图形是()。[中国海洋大学2018研;山东师范大学2018研] A.条形图 B.茎叶图 C.直方图 D.饼图 【答案】C 袁卫统计学第5版课后题及答案【解析】

在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。 3如果回归模型中存在多重共线性,则()。[中国海洋大学2018研] A.整个回归模型的线性关系不显著 B.肯定有一个回归系数通不过显著性检验 C.肯定导致某个回归系数的符号与预期的相反 D.肯定导致某些回归系数通不过显著性检验 【答案】D 袁卫统计学第5版课后题及答案【解析】 当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。如果出现下列情况,暗示存在多重共线性:①模型中各对自变量之间显著相关;②当模型的线性关系检验(F检验)显著时,几乎所有回归系数βi的t检验却不显著;③回归系数的正负号与预期的相反。 495%置信水平的区间估计中95%的置信水平是指()。[山东大学2019研;山东师范大学2018研;湘潭大学2015研;厦门大学2014研;江苏大学2012研;北京工业大学2012研;中央财经大学2011研]

袁卫-曾五一-贾俊平统计学第五版课后习题-答案

袁卫-曾五一-贾俊平统计学第五版课后习题 -答案 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

各章练习题答案第2章统计数据的描述 2.1(1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布服务质量等 级家庭数(频率) 频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2(1)频数分布表如下: 按销售收入分组(万 元) 企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 合计40 2.3频数分布表如下: 某百货公司日商品销售额分组表按销售额分组(万 元) 频数(天)频率(%)

25~30 30~35 35~40 40~45 45~50 4 6 1 5 9 6 合计40 直方图(略)。 2.4(1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小 时)灯泡个数 (只) 频率(%) 650~66022 660~67055 670~68066 680~6901414 690~7002626 700~7101818 710~7201313 720~7301010 730~74033 740~75033 合计100100直方图(略)。 2.5 (2)分组结果如下: 分组天数(天) -25~-206 -20~-158 -15~-1010 -10~-513 -5~012 0~54

5~107 合计60 (3)直方图(略)。 2.6(1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 布比A班分散, 且平均成绩较A班低。 2.8箱线图如下:(特征请读者自己分析) 2.9(1)x=(万元);Me= ;Q L=;Q U=。 (2)17 s(万元)。 = . 21 2.10(1)甲企业平均成本=(元),乙企业平均成本=(元);原因:尽管 两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 2.11x=(万元);48 = s(万元)。 116 . 2.12(1)女生的体重差异大,因为女生其中的离散系数为大于男生体重的离 散系数。 (2)男生:x=(磅),27 .2 s(磅); = 女生:x=(磅),27 s(磅); .2 = (3)68%; (4)95%。

统计学(贾俊平等)第五版课后习题答案(完整版)人大出版社

by _kiss-ahuang 3.1为评价家电行业售后服务得质量,随机抽取了由100个家庭构成得一个样本。服务 质量得等级 分别表示为:A ・好:B .较好;C -般:D ・较差;E 、差。调査结果如卞: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: U)指出上而得数据属于什么类型。 顺序数据 (2) 用Excel 制作一张频数分布表。 用数据分析一一直方图制作: —— (3)绘制一张条形图仮映评价等级得分布。 ——用数据分析一一直方图制作: 16 17 32 21 14 (4) 绘制评价等级得帕累托图0 逆序排序后,制作累计频数分布表: 接收频数频率(知累讣频率(知 第二部分:直方图 D B A C 接 收 40 緊20 E 接收 E D C B A

C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 100 3・2某行业管理局所属40个企业2002年得产品销售收入数据如下: 152 124 129 H6 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 H9 138 112 146 113 126 要求: (1)根摇上而得数据进行适当得分组,编制频数分布表,并计算出累积频数与累积频率。 1、确定组数: 2 +髓-罟十蹤心2心 2、 确定组距: 组距=(最大值-最小值)+组数={152-87)4-6=10. 83,取10 3、 分组频数表 (2)按规世,销售收入在125万元以上为先进企业,115-125万元为良好企业,105〜115万 元为一般企 业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行 ■频数 T 一累计频率(%)

相关主题
文本预览
相关文档 最新文档