当前位置:文档之家› 统计学(第五版)课后答案

统计学(第五版)课后答案

4.1一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:

24710101012121415

要求:(1)计算汽车销售量的众数、中位数和平均数。(2)根据定义公式计算四分位数。

(3)计算销售量的标准差。(4)说明汽车销售量分布的特征。

解:

Statistics

汽车销售数量

N

Valid 10

Missing

0 Mean

9.60 Median

10.00 Mode

10 Std.Deviation

4.169 Percentiles

25 6.25 50

10.00

75

12.50

19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27

22 34 24 41

20

31

17

23

要求;(1)计算众数、中位数:

1、排序形成单变量分值的频数分布和累计频数分布

Histogram

3

4.2随机抽取25个网络用户,得到他们的年龄数据如下:

vcneuoeKT

22 2 8.12 48.0 23 3 12.0 15 60.0 24 2 8.17 68.0 25 1 4.18 72.0 27 1 4.19 76.0 29 1 4.20 80.0 30 1 4.21 84.0 31 1 4.22 88.0 34 1 4.23 92.0 38 1 4.24 96.0 41

1 4.25

100.0

Total

25

100.0

从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。

(2) 根据定义公式计算四分位数。Q1位置=25/4=6.25,因此Q1=19,Q3位置=3X 25/4=18.75,因此Q3=27,或者,由于25

和27都只有一个,因此Q3也可等于25+0.75X 2=26.5。 (3) 计算平均数和标准差;Mean=24.00;Std.Deviation=6・652 (4) 计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773

(5) 对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。为分组情况下的直方图:

2、确定组距:组距=(最大值-最小值片组数=(41-15)三6=4.3,取5

3、分组频数表

1、确定组数:

lg(n)

lg (25) lg2

1.398

0.30103

二5.64 ,取k=6

分组:

网络用户的年 三龄(Binned)

Frequency

Percent

CumulativeFrequency

CumulativePercent

Valid

<=15 1 4.0 1 4.0 16-20 8 32.0 9 36.0 21-25

9 36.0 18 72.0 26-30 3 12.0 21 84.0 31-35 2 8.0 23 92.0 36-40 1 4.0 24 96.0 41+

1 4.0

25

100.0

Total

25 100.0

分组后的均值与方差:

Mean

23.3000 Std.Deviation 7.0237

7

Variance 49.333

Skewness 1.163 Kurtosis

1.302

按利润额分组(万元)

企业数(个)

200~300 19 300~400 30 400~500 42 500~600 18 600以上 11 合计

120

4.6在某地区抽取120家企业,按利润额进行分組,结果如下:

解:

Statistics

企业利润组中值Mi (万元) N

Valid 120

Missing

Mean

426.6667 Std.Deviation

116.48445

Skewness

0.208

分组后的直方图:

要求:(1)计算120家企业利润额的平均数和标准差。(2)计算分布的偏态系数和峰态系数。

Std.ErrorofSkewness Kurtosis

Std.ErrorofKurtosis0.438

20000300.00

企业利润纟中值Mi(万元)

4.9一家公司在招收职员时,首先要通过两项能力测试。在A 项测试中,其平均分数是100分,标准差是15分;在B 项测试中,其平均分数是400分,标准差是50分。一位应试者在A 项测试中得了115分,在B 项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?

解:应用标准分数来考虑问题,该应试者标准分数高的测试理想。

x -x115-100x -X425-400

Z A ===1;Z B ===0.5因此,A 项测试结果理想。

A

s15B

s50

4.11对10名成年人和10名幼儿的身高进行抽样调査,结果如下: 成年组

166

169

172

177

180

170

172

174

168

173

幼儿组 68 69 68 70 71 73 72 73 74 75

要求:(1)如果比较成年组和幼儿组的身高差异,你会采用什么样的统计量?为什么?

幼儿组的身高差异大。

7・3从一个总体中随机抽取n=100的随机样本,得到x=104560,假定总体标准差a =86414,构建总体均值p 的95%的置信区间

由于是正态总体,且总体标准差已知。总体均值在1-a 置信水平下的置信区间为

104560±1.96X 85414WJ100=104560±16741.144

7・4从总体中抽取一个n=100的简单随机样本,得到X =81,s=12。

0.221 -0.625

均值不相等,用离散系数衡量身高差异。 (2)比较分析哪一组的身高差异大?

成年组

幼儿组

平均 172.1 平均 71.3 标准差

4.201851 标准差

2.496664 离散系数

0.024415 离散系数

0.035016

解: 已知n=100,

X =104560,u=85414,1-a =95%,

样本均值服从正态分布:x 口 (a2、N

卩,一

I n 丿

(

置信区间为」元-

Z a 2-

s '真=而=1・2

12

(1)构建卩的90%的置信区间。 Z a2=Z 0.05T ・645,置信区间为:⑻-1.645".2,8"1.645*1.2)=(理03,观97) (2)构建卩的95%的置信区间。 z f =z 0025=1.96,置信区间为:(81-1.96X 1.2,81+1.96X 1.2)=(78.65,83.35)

a20.025

(3)构建卩的99%的置信区间。 Z a2=z 0.005吆576,置信区间为:(81-2.576X 1・2,81+2・576X 1・2)=(77・91,84・09) 7・5利用下面的信息’构建总体均值的置信区间

Histogram

(1)x =25,a =3.5,n=60,置信水平为95%(2)x =119.6,s=23.89,n=75»置信水平为95%

2) 1-a =98%,则a =0.02,a /2=0.01,1-a /2=0.99,查标准正态分布表,可知:2.33

其置信区间为:119.6±2.33X23.89mJ75=119.6土6.345

Z a n=

3) 1-a =90%,1.65其置信区间为:3.149土1.65X0.974+^32=3.149±0.284

7.7某大学为了解学生每天上网的时间,在全校7500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得 到下面的数据 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1

1・9

1.2

5.1

4.3

4.2

3.6

0.8

1.5 4.7 1.4 1.2

2.9

3.5 2.4 0.5 3.6 2.5

求该校大学生平均上网时间的置信区间,置信水平分别为95%。 解:(1)样本均值x

=3.32,样本标准差s=1・61;

b s

(2)抽样平均误差:重复抽样:b -=沁=1.61/6=0.268

x

Vn 寸n

b

b x

盲飞N -1〜真*N -1=亍36飞7500-1

=0.268X \°.995=0.268X 0.998=0.267

(3)置信水平下的概率度:

1

-a

=0.95,t=

z

a 2=z

0025=1.96

其置信区间为:25±1.96X 3.5160=25±0.885

不重复抽样:

(4)边际误差(极限误差):A-二

t

-二z ;■2*b

-

xx a2x

1-a

=0.95,A-=t b --z P-=z b -

xx a2x 0.025x

重复抽样:A -二z .■-2P-=z 0025P-=1.96X 0.268=0.525

x a2x 0.025x

不重复抽样:A -二春p -=z P-=1.96X 0.267=0.523

x a

2x 0.025x

5)置信区间:

重复抽样

1-

a

=0.95,

(x -A_,x +A_)=(3.32—0.525,3.32+0.525)=(2.79,3.85)

xx

不重复抽样:

(

--A

-,-+A

_)=

(3.32-

O.441,3.32+°.441)=(2.80,3.84)

xx

7.8从一个正态总体中随机抽取样本量为8的样本,各样本值分别为:10、8、12、15、6、13、5、11.,求总体均值p 的95%的置信区间

解:本题为一个小样本正态分布,o ■未知。 先求样本均值: =80+8=10

(3)x =3.419,s=0.974,n=32,置信水平为90%

・•・1)l —a=95%

已知1-a =25,n=8,则a =0.05,a/2=0.025,査自由度为n-1=7的'分布表得临界值空=2.45 所以,置信区间为:10±2.45X3.464imJ7

711某企业生产的袋装食品采用自动打包机包装,每袋标准重量为10Og 。现从某天生产的一批产品中按重复抽样随机抽取50

包进行检査,测得 每包重量(g ) 包数 96~98 2 98~100 3 100~102 34 102~104 7 104~106

4 合计

50

已知食品包重量服从正态分布,要求: (1) 确定该种食品平均重量的95%的置信区间。解:大样本,总体方差未知,用z 统

计量

样本均值=101.4,样本标准差s=1.829

1

—a

=0・95,Z a2=Z 0.025

1.8291.829]

50,101.4+L96X 50I =(100.89,101.91)

(2)

如果规定食品重量低于l00g 属于不合格,确定该批食品合格率的95%的置信区间。

解:总体比率的估计大样本,总体方差未知,用z 统计量

7.18某小区共有居民500户,小区管理着准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户其中

有32户赞成,18户反对。

(1) 求总体中赞成该项改革的户数比例的置信区间

(2) 若小区管理者预计赞成的比例能达到80%,估计误差不超过10%,应抽取多少户进行调査?

再求样本标准差: J84/7=3.4641

于是,p 的置信水平为1-a 的置信区间是

置信区间:

=1.96

z

=云口

N

(04)

n

样本比率=(50-5)/50=0.9

置信区间:

ip (

1—p )

ip (

1—p

)

p —z f .J,p +z .•

a na 1

—a

=0.95,

z

a2=z

0.025

=1.96

(1-p )

n

(1-p )

n

0.9—1.96X

;0.9(1-0.9)'50

,0.9+1.96X

[0.9(1-0.9)、 V50

丿

=(0.8168,0.9832)

解:1)已知N=50,P=32/50=0.64,a=0.05,a/2=0.025,则1.96

计算检验统计量:

=(4.484-4.55)/(0.108/V9)=-1.833

决策:TZ 值落入接受域,.•.在a =0.05的显著性水平上接受H0。结论:有证据表明现在牛产的铁水平均含碳量与以前没有显著差异,

可以认为现在牛产的铁水平均含碳量为4.55。

8.2—种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均寿命为680小时。已知该元件寿命服

从正态分布,G =60小时,试在显著性水平0.05下确定这批元件是否合格。 解:H :“M 700;H 『“V 700已知:x

=680G =60

x —卩680一700

Z

二=60<36=-2

当a =0.05,查表得z a =1.645。因为z V -z a ,故拒绝原假设,接受备择假设,说明这批

产品不合格。

8.3某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤,先用一种花费进行试验,从25个小区抽样,平均产量为270公斤。

这种化肥是否便小麦明显增产?

解:已知p0=250,o=30,N=25,X =270这里是小样本分布,o 已知,用Z 统计量。右侧检验,a=0.05,则Za=1.645

提出假设:假定这种化肥没使小麦明显增产。即H0:pW250H1:p>250 计算统计量:Z=(X -p0)/(o/"N )=(270-250)/(30/"25)=3.33

结论:Z 统计量落入拒绝域,在a=0.05的显著性水平上,拒绝H0,接受H1。决策:有证据表明,这种化肥可以使小麦明显增产。

10..1从3个总体中各抽取容量不同的样本数据,结果如下。检验3个总体的均值之间是否有显著差异方差分析:单因素方差分析

SUMMARY

观测数

求和 平均

方差

样本1 5 790 158 61.5 样本2

4 600 150 36.66667

样本3

3

507

169

121

方差分析

Z n

置信区间:P 土呵V{P (1-P )/N}=0.64±1.96"0.64X0.36/50=0.64±1.96X0.48/7.07=0.64±0.133

2)已知丌=0.8,E=0.1,a=0.05,a/2=0.025,则 1.96

Z n

N=呵2丌(1-丌)/E2=1.962X0.8X0.2^0.12^62

8・1已知某炼铁厂的含碳量服从正态分布N(4・55,0.1082),现在测定了9炉铁水,其平均含碳量为4・484,如果估计方差没有变化,可

否认为现在牛产的铁水平均含碳量为4.55? 解:已知p0=4.55,a2=0.1082,

N=9,=4.484,

这里采用双侧检验,小样本, a 已知,使用Z 统计。假定现在生产的铁水平均含碳量与以前无显著差异。则, H0:p=4.55;H1:p 工4.55a=0.05,a/2=0.025,査表得临界值为

1.96

由于n=36>30,大样本,因此检验统计量:

差异源

SSdfMS P-value Fcrit

组间618.9167 组内598

2309.45834.65740.0408778.021517 966.44444

总计1216.917

11

10・。2下面是来自5个总体的样本数据 方差分析:单因素方差分析

SUMMARY

观测数

求和

平均 方差 样本1 3 37 12.33333

4.333333

样本2 5 50 10

1.5 样本3 4 48 12 0.666667

样本

5 80 1

6 1.5 样本5

6

78

13

0.8

方差分析

120.434822

台机器中抽取的样本数据:

取显著性水平a =O ・01,检验4台机器的装填量是否相同? 解:不相同。

ANOVA

差异源 组间 组内

SS dfMS

93.76812423.44203 26.66667181.481481

FP-valueFcrit

15.823371.02E-054.579036

总计

北京 22460 7326 辽宁 11226 4490 上海 34547 11546 江西 4851 2396 河南 5444 2208 贵州 2662 1608 陕西

4549

2035

要求:

⑴人均GDP 作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。

(5)检验回归方程线性关系的显著性(a=0.05)。

(6)如果某地区的人均GDP 为5000元,预测其人均消费水平。

(7)求人均GDP 为5000元时,人均消费水平95%的置信区间和预测区间。

2)相关系数:有很强的线性关系。

相关性

人均GDP (元)人均消费水平(元)

人均GDP (元)

Pearson 相关性 1

.998(**) 显著性(双侧)

0.000

N

7

7 人均消费水平(元)

Pearson 相关性 .998(**) 1

显著性(双侧) 0.000

N

7

7

**.在.01水平(双侧)上显著相关。

(3)回归方程:回归系数的含义:人均GDP 没增加1元,人均消费增加0.309元。系数(a )

模型 非标准化系数

标准化系数

t 显著性 B 标准误 Beta

1

(常量) 734.693

139.54

5.2650.003

人均GDP (元

0.309

0.008

0.998 36.4920.000

a.因变量:人均消费水平(元)

解:(1)

可能存在线性关系。

40000

0 30000 1000020000 人均GDP(元)

a.预测变量:(常量)人均GDP(元)。

(5)F检验:

a.预测变量:(常量)人均GDP(元)

b.因变量:人均消费水平(元)

回归系数的检验:t检验

(6)某地区的人均GDP为5000元,预测其人均消费水平为2278.10657元。

(7)人均GDP为5000元时,人均消费水平95%的置信区间为[1990.74915,2565.46399],预测区间为[1580.46315,2975.74999]。

统计学第五版课后答案(贾俊平)

第四章统计数据的概括性度量 4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15 要求: (1)计算汽车销售量的众数、中位数和平均数。 (2)根据定义公式计算四分位数。 (3)计算销售量的标准差。 (4)说明汽车销售量分布的特征。 解: Statistics 10 Missing 0 Mean 9.60 Median 10.00 Mode 10 Std. Deviation 4.169 Percentiles 25 6.25 50 10.00 75 单位:周岁 19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23 要求; (1)计算众数、中位数: 排序形成单变量分值的频数分布和累计频数分布: 网络用户的年龄

(2)根据定义公式计算四分位数。 Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。 (3)计算平均数和标准差; Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773 (5)对网民年龄的分布特征进行综合分析: 分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。

1、确定组数: ()l g 25l g () 1.398 111 5.64l g (2)l g 20.30103 n K =+ =+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取5 3、分组频数表 网络用户的年龄 (Binned) 分组后的直方图:

统计学第五版课后习题答案(完整版)

统计学(第五版)课后习题答案(完整版) 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。 第二章思考题 2.1什么是二手资料?使用二手资料应注意什么问题 与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。使用时要进行评估,要考虑到资料的原始收集人,收集目的,收集途径,收集时间使用时要注明数据来源。 2.2比较概率抽样和非概率抽样的特点,指出各自适用情况

统计学第五版贾俊平课后思考题和练习题答案完整版

统计学(第五版)贾俊平课后思考题与练习题答案(最终完整版) 第一部分思考题 第一章思考题 1、1什么就是统计学 统计学就是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1、2解释描述统计与推断统计 描述统计;它研究的就是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它就是研究如何利用样本数据来推断总体特征的统计方法。 1、3统计学的类型与不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它就是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也就是有类别的,但这些类别就是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:就是通过调查或观测而收集到的数据,这类数据就是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。1、4解释分类数据,顺序数据与数值型数据 答案同1.3 1、5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就就是样本,这一千个灯泡的寿命的平均值与标准差还有合格率等描述特征的数值就就是参数,这一百个灯泡的寿命的平均值与标准差还有合格率等描述特征的数值就就是统计量,变量就就是说明现象某种特征的概念,比如说灯泡的寿命。 1、6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量与非随机变量。经验变量与理论变量。 1、7举例说明离散型变量与连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析与政府分析还有物理,生物等等各个领域。

统计学第五版课后练答案

统计学第五版课后练答案(7-8 章)(总11页) -本页仅作为预览文档封面,使用时请删除本页-

第七章 参数估计 (1) x σ= = (2) 2x z α∆= 1.96= 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ== (2)在95%的置信水平下,求估计误差。 x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=×= (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: 22 x z x z αα⎛ -+ ⎝ =()120 4.2,120 4.2-+=(,) 22 x z x z αα⎛ -+ ⎝ =104560±=(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ⎛⎫ ⎪⎝⎭或2,s x N n μ⎛⎫ ⎪⎝⎭ 置信区间为: 22x z x z αα⎛ -+ ⎝ = (1)构建μ的90%的置信区间。 2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(,) (2)构建μ的95%的置信区间。 2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(,) (3)构建μ的99%的置信区间。 2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-⨯+⨯=(,) (1) 2x z α±=25 1.96±=(,) (2) 2x z α±=119.6 2.326±=(,) (3) 2x z α±=3.419 1.645±=(,) (1) 2x z α±=8900 1.96±=(,) (2) 2x z α±=8900 1.96±=(,)

统计学第五版课后题答案

第一章导论 1.1 (1)数值型变量。 (2)分类变量。 (3)离散型变量。 (4)顺序变量。 (5)分类变量。 1.2 (1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。 (2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。 1.3 (1)总体是所有IT从业者的集合。 (2)数值型变量。 (3)分类变量。 (4)截面数据。 1.4 (1)总体是所有在网上购物的消费者的集合。 (2)分类变量。 (3)参数是所有在网上购物者的月平均花费。 (4)参数 (5)推断统计方法。 第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。 2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体

参数的置信区间,就使用概率抽样。 非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法? 实验式、观察式等。 4. 自填式、面方式、电话式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。 面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员的作用。缺点:成本比较高,对调查过程的质量控制有一定难度。对于敏感问题,被访者会有压力。 电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。 5.请举出(或设计)几个实验数据的例子。 不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。 6.你认为应当如何控制调查中的回答误差? 对于理解误差,要注意表述中的措辞,学习一定的心里学知识。对于记忆误差,尽量缩短所涉及问题的时间范围。对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。 7.怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。 对于随机误差,可以通过增加样本容量来控制。对于系统误差,做好预防,在调查前做好各方面的准备工作,尽量把无回答率降到最低程度。无回答出现后,分析武回答产生的原因,采取补救措施。比如要收回一百份,就要做好一百二十份或一百三十份问卷的准备,当被调查者不愿意回答时,可以通过一定的方法劝服被访者,还可以通过馈赠小礼品等的方式提高回收率。 第三章数据的图表搜集 一、思考题 3.1数据的预处理包括哪些内容? 答:审核、筛选、排序等。 3.2分类数据和顺序数据的整理和显示方法各有哪些?

统计学人教版第五版7,8,10,11,13,14章课后题答案

统计学复习笔记 第七章 参数估计 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

袁卫 曾五一 贾俊平统计学第五版课后习题 答案

各章练习题答案第2章统计数据的描述 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: (2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0

合计40 100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 2.5 (1)属于数值型数据。 (2)分组结果如下: 分组天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60 (3)直方图(略)。 2.6 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 2.7 (1)茎叶图如下:

统计学(第五版)课后答案

4.1一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下: 24710101012121415 要求:(1)计算汽车销售量的众数、中位数和平均数。(2)根据定义公式计算四分位数。 (3)计算销售量的标准差。(4)说明汽车销售量分布的特征。 解: Statistics 汽车销售数量 N Valid 10 Missing 0 Mean 9.60 Median 10.00 Mode 10 Std.Deviation 4.169 Percentiles 25 6.25 50 10.00 75 12.50 19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23 要求;(1)计算众数、中位数: 1、排序形成单变量分值的频数分布和累计频数分布 Histogram 3 4.2随机抽取25个网络用户,得到他们的年龄数据如下: vcneuoeKT

22 2 8.12 48.0 23 3 12.0 15 60.0 24 2 8.17 68.0 25 1 4.18 72.0 27 1 4.19 76.0 29 1 4.20 80.0 30 1 4.21 84.0 31 1 4.22 88.0 34 1 4.23 92.0 38 1 4.24 96.0 41 1 4.25 100.0 Total 25 100.0 从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。 (2) 根据定义公式计算四分位数。Q1位置=25/4=6.25,因此Q1=19,Q3位置=3X 25/4=18.75,因此Q3=27,或者,由于25 和27都只有一个,因此Q3也可等于25+0.75X 2=26.5。 (3) 计算平均数和标准差;Mean=24.00;Std.Deviation=6・652 (4) 计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773 (5) 对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。如需看清楚分布形态,需要进行分组。为分组情况下的直方图: 2、确定组距:组距=(最大值-最小值片组数=(41-15)三6=4.3,取5 3、分组频数表 1、确定组数: lg(n) lg (25) lg2 1.398 0.30103 二5.64 ,取k=6 分组:

统计学教材(贾俊平版)课后习题详细答案

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版) 第一部分思考题 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。

统计学第五版袁卫课后答案第七章思考与练习

统计学第五版袁卫课后答案第七章思考与练习 一、单项选择题 1要进行一项调查,调查者在马路上随机拦截部分人进行调查,这种方式属于()。[河海大学2020研] A.简单随机抽样 B.分层抽样 C.自愿抽样 D.方便抽样 【答案】D 袁卫统计学第5版课后题及答案【解析】 方便抽样是调查过程中由调查员依据方便的原则,自行确定入样的单位的非概率抽样方法。例如,调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售产品的柜台前对路过的顾客进行调查,等等。 2对于大批量的数据,最适合描述其分布的图形是()。[中国海洋大学2018研;山东师范大学2018研] A.条形图 B.茎叶图 C.直方图 D.饼图 【答案】C 袁卫统计学第5版课后题及答案【解析】

在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。 3如果回归模型中存在多重共线性,则()。[中国海洋大学2018研] A.整个回归模型的线性关系不显著 B.肯定有一个回归系数通不过显著性检验 C.肯定导致某个回归系数的符号与预期的相反 D.肯定导致某些回归系数通不过显著性检验 【答案】D 袁卫统计学第5版课后题及答案【解析】 当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。如果出现下列情况,暗示存在多重共线性:①模型中各对自变量之间显著相关;②当模型的线性关系检验(F检验)显著时,几乎所有回归系数βi的t检验却不显著;③回归系数的正负号与预期的相反。 495%置信水平的区间估计中95%的置信水平是指()。[山东大学2019研;山东师范大学2018研;湘潭大学2015研;厦门大学2014研;江苏大学2012研;北京工业大学2012研;中央财经大学2011研]

统计学第五版陈珍珍课后答案

统计学第五版陈珍珍课后答案 【篇一:统计学(第一章)】 >一、使用说明 (一)课程性质 统计学是关于的数据的科学,它是研究客观现象总体数量特征的方法论的科学,是高等院校财经类专业的必修课、核心课之一。(二)教学目的 通过本课程的教学,使学生能够在理论联系实际的基础上,比较系统地掌握统计学的基本思想、基本理论、基础知识和基本方法;理解并识记统计学的有关基本概念和范畴;掌握并能运用统计基本方法和技术进行统计设计、统计调查、统计整理和一定的统计分析,使学生掌握并应用该工具为自己所学专业服务,以提高学生科学研究和实际工作能力。 (三)教学时数 本课程计划课时为45学时。 (四)教学方法 本课程采用板书、幻灯片、多媒体课件等教学手段,以课堂讲授为主,统计调查实践、上机实验、课堂讨论、案例等多种教学方法配合使用。 (五)面向专业 财经类各专业。 (六)教学内容 第一章绪论 第二章统计数据的搜集与整理 第三章数据分布特征的描述 第四章抽样与抽样估计 第五章假设检验 第六章相关与回归分析 第七章时间序列分析 第八章统计指数 (七)参考教材 1、袁卫、庞皓、曾五一、贾俊平:《统计学》,高等教育出版社,2005年8月第二版。

2、贾俊平:《统计学》,中国人民大学出版社,2007年6月第一版。 3、钱伯海、黄良文:《统计学》,四川人民出版社,2001年第一版。 4、陈珍珍,罗乐勤:《统计学》,厦门大学出版社,2002第一版。 5、徐国祥:《统计学》,上海财经大学出版社,2001年11月第一版。 6、董逢谷:《统计学案例集》上海财经大学出版社,2004年4月 第一版 (八)考试要求 1、平时分占10%,期中考试占20%,期末考试70%。总成绩=平 时成绩+期中考试+期末考试 2、考勤、平时作业、课堂提问、课堂讨论、实际操作等均为平时分 的考察内容。 第一章绪论 本章的重点与难点 重点: 1、统计学的涵义 2、统计学的研究对象 3、统计学的研究方法 4、统计研究的基本环节 5、统计学的基本概念 难点: 统计学与有关学科的关系 第一节什么是统计 一、无处不在的统计 2010年3月10日,笔者利用“百度” 对互联网进行搜索,得到的结 果是:包含“统计”这一词汇的网页高达100,000,000项,包含“粮食”这一词汇的网页有 82,900,000项,前者比后者多18,100,000项。 在诺贝尔经济学获奖者中,三分之二以上的研究成果与统计和定量 分析有关。因此,著名经济学家萨缪尔森在其经典的教科书,《经 济学》12版中特别提到:“在许多与经济学有关的学科中,统计学是 特别重要的”。

袁卫-曾五一-贾俊平统计学第五版课后习题-答案

袁卫-曾五一-贾俊平统计学第五版课后习题 -答案 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

各章练习题答案第2章统计数据的描述 2.1(1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布服务质量等 级家庭数(频率) 频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2(1)频数分布表如下: 按销售收入分组(万 元) 企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 合计40 2.3频数分布表如下: 某百货公司日商品销售额分组表按销售额分组(万 元) 频数(天)频率(%)

25~30 30~35 35~40 40~45 45~50 4 6 1 5 9 6 合计40 直方图(略)。 2.4(1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小 时)灯泡个数 (只) 频率(%) 650~66022 660~67055 670~68066 680~6901414 690~7002626 700~7101818 710~7201313 720~7301010 730~74033 740~75033 合计100100直方图(略)。 2.5 (2)分组结果如下: 分组天数(天) -25~-206 -20~-158 -15~-1010 -10~-513 -5~012 0~54

5~107 合计60 (3)直方图(略)。 2.6(1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 布比A班分散, 且平均成绩较A班低。 2.8箱线图如下:(特征请读者自己分析) 2.9(1)x=(万元);Me= ;Q L=;Q U=。 (2)17 s(万元)。 = . 21 2.10(1)甲企业平均成本=(元),乙企业平均成本=(元);原因:尽管 两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 2.11x=(万元);48 = s(万元)。 116 . 2.12(1)女生的体重差异大,因为女生其中的离散系数为大于男生体重的离 散系数。 (2)男生:x=(磅),27 .2 s(磅); = 女生:x=(磅),27 s(磅); .2 = (3)68%; (4)95%。

统计学第五版(贾俊平)课后习题答案

统计学 第五版(贾俊平)课后题答案 第4章 数据的归纳性气宇 (1)众数:100=M 。 中位数:5.52 11021=+=+=n 中位数位置,10210 10=+=e M 。 平均数:6.910 96 101514421 ==++++= = ∑= n x x n i i 。 (2)5.24 10 4=== n Q L 位置 ,5.5274=+=L Q 。 5.74 10 343=⨯== n Q U 位置,1221212=+=U Q 。 (3) 2.49 4 .1561 10)6.915()6.914()6.94()6.92(1)(2 2221 2 == --+-++-+-= --=∑= n x x s n i i (4)由于平均数小于中位数和众数,所以汽车销售量为左偏散布。 (1)从表中数据能够看出,年龄出现频数最多的是19和23,所以有两个众数,即19 0=M 和 23 0=M 。 将原始数据排序后,计算的中位数的位置为:132 12521=+=+=n 中位数位置,第13个位置 上的数值为23,所以中位数23=e M 。 (2)25.64 254=== n Q L 位置,19)1919(25.019=-⨯+=L Q 。 75.184 25 3=⨯= 位置U Q ,56.252-7257.052=⨯ +=)(U Q 。

(3)平均数2425 600 25231715191 ==++++= = ∑= n x x n i i 。 65.61 251062 1 25)2423()2417()2415()2419(1)(2 2221 2 =-= --+-++-+-= --=∑= n x x s n i i (4)偏态系数:() 08.165 .6)225)(125(24253 3 =⨯---= ∑i x SK 。 峰态系数:[] 77.065 .6)325)(225)(125() 125()24(3)24()125(254 2 24=⨯-------+= ∑∑i i x x K 。 (5)分析:从众数、中位数和平均数来看,网民年龄在23~24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大不同。从偏态系数来看,年龄散布为右偏,由于偏态系数大于1,所以偏斜程度专门大。由于峰态系数为正值,所以为尖峰散布。 (1)茎叶图如下: 茎 叶 数据个数 5 5 1 6 6 7 8 3 7 1 3 4 8 8 5 (2)79 63 98.78.76.65.5==++++= x 。 714.08 08 .419)78.7()78.7()76.6()75.5(2222==--+-++-+-= s 。 (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。 第一种排队方式:274.02.797.11== v ;102.07 714.02==v 。由于21v v >,表明第一种排队方式的离散程度大于第二种排队方式。 (4)选方式二,因为第二种排队方式的平均等待时刻较短,且离散程度小于第一种排队方式。 (1)1.27430 8223 1 == = ∑=n x x n i i 。 5.152 130=+=中位数位置,5.2722273272=+= e M 。 (2)5.74 30 ==位置L Q ,5.2592261258=+= L Q 。 5.224 30 3=⨯=位置U Q ,5.2872291284=+= U Q 。

统计学(贾俊平等)第五版课后习题答案(完整版)人大出版社

by _kiss-ahuang 3.1为评价家电行业售后服务得质量,随机抽取了由100个家庭构成得一个样本。服务 质量得等级 分别表示为:A ・好:B .较好;C -般:D ・较差;E 、差。调査结果如卞: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: U)指出上而得数据属于什么类型。 顺序数据 (2) 用Excel 制作一张频数分布表。 用数据分析一一直方图制作: —— (3)绘制一张条形图仮映评价等级得分布。 ——用数据分析一一直方图制作: 16 17 32 21 14 (4) 绘制评价等级得帕累托图0 逆序排序后,制作累计频数分布表: 接收频数频率(知累讣频率(知 第二部分:直方图 D B A C 接 收 40 緊20 E 接收 E D C B A

C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 100 3・2某行业管理局所属40个企业2002年得产品销售收入数据如下: 152 124 129 H6 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 H9 138 112 146 113 126 要求: (1)根摇上而得数据进行适当得分组,编制频数分布表,并计算出累积频数与累积频率。 1、确定组数: 2 +髓-罟十蹤心2心 2、 确定组距: 组距=(最大值-最小值)+组数={152-87)4-6=10. 83,取10 3、 分组频数表 (2)按规世,销售收入在125万元以上为先进企业,115-125万元为良好企业,105〜115万 元为一般企 业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行 ■频数 T 一累计频率(%)

相关主题
文本预览
相关文档 最新文档