当前位置:文档之家› 人大统计学第四版部分答案

人大统计学第四版部分答案

人大统计学第四版部分答案
人大统计学第四版部分答案

4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=

5.5,M e =10;平均数:6

.910

96==

=∑n

x

x i

(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.49

4.1561

)

(2

==

-=

∑-n i s x x

(4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。 将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23

(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5 (3)平均数==

∑n

x

x i

600/25=24,标准差65.61

2510621

)

(2

=-=

-=

∑-n i s x x

(4)偏态系数SK=1.08,峰态系数K=0.77

(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。 4.3 (1)茎叶图如下:

茎 叶 频数 5 6 7 5 6 7 8 1 3 4 8 8 1 3 5 (2)==

∑n

x

x i

63/9=7,714.08

08.41

)

(2

==

-=

∑-n i s x x

(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。

第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。

(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。 4.4 (1)==

∑n

x

x i

8223/30=274.1

中位数位置=n+1/2=15.5,M e =272+273/2=272.5

(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5 (3) 17.211

307.130021

)

(2

=-=

-=

∑-n i s x x

4.5 (1)甲企业的平均成本=总成本/总产量=41.19340

660030

150020

300015

2100150030002100==++++

乙企业的平均成本=总成本/总产量=

29.18342

625530

150020

150015

3255150015003255==

++++

原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

4.6 (1)(计算过程中的表略),==

∑n

M x f

i

i

51200/120=426.67

48.1161

1207.16146661

)

(2

=-=

-=

∑-n f i s i

x M

SK=0.203 K=-0.688 4.7 (1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。 (2)两位调查人员所得到身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。

(3)具有较大样本的调查人员有更大的机会取得最高或最低者,因为样本越大,变化的范围就可能越大。 4.8 (1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为v 女=5/50=0.1,男生体重的离散系数为v 男=5/60=0.08,所以女生的体重差异大。 (2)男生:=x 60×2.2=132(磅),s=5×2.2=11(磅)

女生:=x 50×2.2=110(磅),s=5×2.2=11(磅) (3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg-65kg 之间。 (4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,男生中大约有95%的人体重在40kg-60kg 之间。 4.9 通过计算标准分数来判断:

;115

100

115=-=

-=

A

A

A A

s x x z

;150

400

425=-=

-=

B

B

B B

s x x z

该测试者在A 项测试中比平均分数高出1个标准差,而在B 项测试中只高出平均分数0.5个标准差,由于A 项测试的标准分数高于B 项测试,所以,A 项测试比较理想。 4.9 通过标准分数来判断,各天的标准分数如下表:

日期 周一 周二 周三 周四 周五 周六 周日

标准分数Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0

周一和周六两天失去了控制。 4.11

(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。 (2)成年组身高的离散系数:024

.01

.1722.4==

s v

幼儿组身高的离散系数:035

.03

.715.2==

s v

由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。 4.12

(1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,应该采用离散系数。

(2)下表给出了各种方法的主要描述统计量。

方法A 方法B 方法C 平均 165.6 中位数 165 众数 164 标准差 2.13 极差 8 最小值 162 最大值 170

平均 128.73 中位数 129 众数 128 标准差 1.75 极差 7 最小值 125 最大值 132 平均 125.53 中位数 126 众数 126 标准差 2.77 极差 12 最小值 116 最大值 128 从三种方法的集中趋势来看,方法A 的平均产量最高,中位数和众数也都高于其他两种方法。从离散程度来看,三种方法的离散系数分别为:013.0.6

1653.12A ==

v ,014

.0.73

1285.71B ==

v ,

022

.0.53

125.772C ==

v 。方法A 的离散程度最小,因此,应选择方法A 。

4.13

(1)用方差或标准差来评价投资的风险。

(2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。

(3)从投资风险角度看,应该选择风险较小的商业类股票。当然,选择哪类股票还与投资者的主观判断有很大关系。

第7章 参数估计

●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差x σ等于多少?

(2) 在95%的置信水平下,允许误差是多少?

解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25,

(1)样本均值的抽样标准差x σ=

n

σ=

40

5=0.7906

(2)已知置信水平1-α=95%,得 α

/2

Z =1.96,

于是,允许误差是E =n

α/2

σZ =1.96×0.7906=1.5496。

●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差;

(5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σ=

n

σ=

49

15=2.1429

(2)已知置信水平1-α=95%,得 α

/2

Z =1.96,

于是,允许误差是E =n

α/2

σZ =1.96×2.1429=4.2000。

(3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2

Z =1.96, 这时总体均值的置信区间为 n

±α/2

σx Z =120±4.2=

124.2115.8

可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●7.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):

3.3 3.1 6.2 5.8 2.3

4.1

5.4 4.5 3.2 4.4 2.0 5.4 2.6

6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。

解:⑴计算样本均值x :将上表数据复制到Excel 表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x =3.316667,

⑵计算样本方差s :删除Excel 表中的平均值,点击自动求值→其它函数→STDEV →选定计算数据列→确定→确定,得到s=1.6093

也可以利用Excel 进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=(a7-3.316667)^2”,回车,即得到各数据的离差平方,在最下行求总和,得到:

2

i (x -x )=90.65

再对总和除以n-1=35后,求平方根,即为样本方差的值

s=

1

n -∑

2

i

(x -x )=

90.6535

=1.6093。

⑶计算样本均值的抽样标准误差:

已知样本容量 n =36,为大样本, 得样本均值的抽样标准误差为 x σ=

n

s =

36

1.6093=0.2682

⑷分别按三个置信水平计算总体均值的置信区间:

① 置信水平为90%时:

由双侧正态分布的置信水平1-α=90%,通过2β-1=0.9换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 α

/2

Z =1.64,

计算得此时总体均值的置信区间为

n

±α

/2

s

x Z =3.3167±1.64×0.2682=

3.75652.8769

可知,当置信水平为90%时,该校大学生平均上网时间的置信区间为(2.87,3.76)小时;

② 置信水平为95%时:

由双侧正态分布的置信水平1-α=95%,得 α

/2

Z =1.96,

计算得此时总体均值的置信区间为

n

±α

/2

s

x Z =3.3167±1.96×0.2682=

3.84232.7910

可知,当置信水平为95%时,该校大学生平均上网时间的置信区间为(2.79,3.84)小时;

③ 置信水平为99%时:

若双侧正态分布的置信水平1-α=99%,通过2β-1=0.99换算为单侧正态分布的置信水平β=0.995,查单侧正态分布表得 α

/2

Z =2.58,

计算得此时总体均值的置信区间为

n

±α

/2

s

x Z =3.3167±2.58×0.2682=

4.00872.6247

可知,当置信水平为99%时,该校大学生平均上网时间的置信区间为(2.62,4.01)小时。 8. 从一个正态总体中随机抽取容量为8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。 解:(7.1,12.9)。

9.某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(公里)分别是:

10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2

求职工上班从家里到单位平均距离95%的置信区间。 解:(7.18,11.57)。

●15. 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比率的置信区间,置信水平分别为90%和95%。 解:已知样本容量n =200,为大样本,拥有该品牌电视机的家庭比率p =23%,

拥有该品牌电视机的家庭比率的抽样标准误差为

p σ=

(1)p p n

-=

0.230.77

200

?=2.98%

⑴双侧置信水平为90%时,通过2β-1=0.90换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 α/2Z =1.64,

此时的置信区间为 (1)p p p n

-±α/2

Z =23%±1.64×2.98%=

27.89%18.11%

可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为(18.11%,27.89%)。

⑵双侧置信水平为95%时,得 α/2

Z =1.96,

此时的置信区间为 (1)p p p n

-±α/2

Z =23%±1.96×2.98%=

28.8408%17.1592%

可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为 ;(17.16%,28.84%)。

●18.某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 (1)求总体中赞成该项改革的户数比率的置信区间,置信水平为95%;

(2)如果小区管理者预计赞成的比率能达到80%,应抽取多少户进行调查? 解: 已知总体单位数N =500,重复抽样,样本容量n =50,为大样本,

样本中,赞成的人数为n 1=32,得到赞成的比率为 p = n

1n =

3250

=64%

(1)赞成比率的抽样标准误差为

(1)p p n

-=

0.640.36

50

?=6.788%

由双侧正态分布的置信水平1-α=95%,得 α

/2

Z =1.96,

计算得此时总体户数中赞成该项改革的户数比率的置信区间为 (1)p p p n

-±α/2

Z = 64%±1.96×6.788%=

77.304%50.696%

可知,置信水平为95%时,总体中赞成该项改革的户数比率的置信区间为

(50.70%,77.30%)。

(2)如预计赞成的比率能达到80%,即 p =80%,

(1)p p n

-=6.788%,即

0.80.2

n

?=6.788%

得样本容量为 n =2

0.80.2(6.788%)

?= 34.72 取整为35,

即可得,如果小区管理者预计赞成的比率能达到80%,应抽取35户进行调查。

21.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:

来自总体1的样本 来自总体2的样本

141=n 72=n 2.531=x

4.432=x

8.962

1=s

0.1022

2=s

(1) 求21μμ-90%的置信区间;

(2) 求21μμ-95%的置信区间。

解:(1.86,17.74);(0.19,19.41)。

22.从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:

来自总体1的样本 来自总体2的样本

251=x

232=x

16

2

1=s 20

2

2=s

(1)设10021==n n ,求21μμ-95%的置信区间;

(2)设1021==n n ,2

221σσ=,求21μμ-95%的置信区间; (3)设1021==n n ,2

221σσ≠,求21μμ-95%的置信区间; (4)设20,1021==n n ,2

221σσ=,求21μμ-95%的置信区间;

(5)设20,1021==n n ,2

221σσ≠,求21μμ-95%的置信区间。 解:(1)2±1.176;(2)2±3.986;(3)2±3.986;(4)2±3.587;(5)2±3.364。 23.下表是由4对观察值组成的随机样本:

配对号 来自总体A 的样本 来自总体B 的样本 1 2 0 2 5 7 3 10 6 4 8 5

(1)计算A 与B 各对观察值之差,再利用得出的差值计算d 和d s ;

(2)设1μ和2μ分别为总体A 和总体B 的均值,构造)(21μμμ-d 95%的置信区间。 解:(1)75.1=d ,63.2=d s ;(2)1.75±4.27。

25.从两个总体中各抽取一个25021==n n 的独立随机样本,来自总体1的样本比率为%401=p ,来自总体2的样本比率为%302=p 。

(1)构造21ππ-90%的置信区间;

(2)构造21ππ-95%的置信区间。 解:(1)10%±6.98%;(2)10%±8.32%。

26.生产工序的方差是共需质量的一个重要度量。当方差较大时,需要对共需进行改进以减小方差。下面是两部机器生产的袋茶重量(克)的数据:

机器1 机器2

3.45 3.22 3.90 3.22 3.28 3.35 3.20 2.98 3.70 3.38 3.19 3.30 3.22 3.75 3.28 3.30 3.20 3.05 3.50 3.38 3.35 3.30 3.29 3.33 2.95 3.45 3.20 3.34 3.35 3.27 3.16 3.48 3.12 3.28 3.16 3.28 3.20 3.18 3.25 3.30 3.34 3.25

构造两个总体方差比22

2

σ95%的置信区间。

解:(4.06,14.35)。

●27.根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?

解:已知总体比率π=2%=0.02,由置信水平1-α=95%,得置信度α/2Z =1.96,允许误差E ≤ 4%

即由允许误差公式 E=/2

Z n

p ασ整理得到样本容量n 的计算公式:

n=2

()E

α/2P

Z σ=2

(

)E

α/2

Z π(1-π)=

2

E

2α/2

Z

π(1-π)

2

0.020.98

0.04

??2

1.96=47.0596

由于计算结果大于47,故为保证使“≥”成立,至少应取48个单位的样本。

●28.某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求允许误差不超过20元,应抽取多少个顾客作为样本?

解:已知总体标准差x σ=120,由置信水平1-α=95%,得置信度α/2Z =1.96,允许误差E ≤ 20

即由允许误差公式 E=/2

Z n

x ασ整理得到样本容量n 的计算公式:

n=2

()E

α/2x

Z σ≥2

(

)

20

?1.96120

=138.2976

由于计算结果大于47,故为保证使“≥”成立,至少应取139个顾客作为样本。

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

统计学原理第二次作业及答案

统计学原理第二次作业及答案 题目 总指数的基本形式是() 选择一项: a. 个体指数 b. 平均指数 c. 综合指数 d. 平均指标指数 正确答案是:综合指数 题目 重点调查所选的重点单位,必须是在调查对象中() 选择一项: a. 具有较大标志值的那一部分调查单位 b. 具有代表性的调查单位 c. 按随机原则选出的调查单位 d. 填报调查数据的填报单位 正确答案是:具有较大标志值的那一部分调查单位 题目 连续变量数列、其末组为开口组,下限为1000,其相邻组的组中值为950,则末组的组中值为()(单选) 选择一项: a. 1025 b. 1050 c. 1100 d. 1150 正确答案是:1050

题目 零售物价指数为103%,商品零售量指数为106%,则商品零售额指数为()(单选)选择一项: a. 109% b. 110% c. 103% d. 109.18% 正确答案是:109.18% 题目 下列不属于强度相对指标的指标有() 选择一项: a. 平均单位成本 b. 人口出生率 c. 人口死亡率 d. 人口密度 正确答案是:平均单位成本 题目 时间序列由两个基本要素构成()(多选) 选择一项或多项: a. 时间,即现象所属的时间 b. 指标数值,即表现现象特点的各项指标数值 c. 指标名称 d. 计量单位 e. 计算公式 正确答案是:时间,即现象所属的时间, 指标数值,即表现现象特点的各项指标数值

题目 以下分组标志中属于品质标志的是()(多选) 选择一项或多项: a. 性别 b. 年龄 c. 职业 d. 月收入 e. 职称 正确答案是:性别, 职业, 职称 题目 在时间序列中,各指标值相加后无意义的有()(多选)选择一项或多项: a. 时期数列 b. 时点数列 c. 绝对数时间序列 d. 相对数时间序列 e. 平均数时间序列 正确答案是:时点数列, 相对数时间序列, 平均数时间序列 题目 我国财政收入,比上年增加2787亿元,这是()(单选)选择一项: a. 发展水平 b. 增长量 c. 发展速度 d. 增长速度

医学统计学第七版课后答案及解析知识分享

医学统计学第七版课后答案及解析

医学统计学第七版课后答案 第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析

统计学第二次作业答案讲课教案

《统计学》第二次作业 注:本次作业主要针对4、6、8章相关知识点。 一、单选题(共11个) 1. 直接反映总体规模大小的指标是( C )。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 2.计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和( C )。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 3.下列相对数中,属于不同时期对比的指标有( B )。 A、结构相对数 B、动态相对数 C、比较相对数 D、强度相对数 4. 2010年某市下岗职工已安置了13.7万人,安置率达80.6%,安置率是( D )。 A、总量指标 B、变异指标 C、平均指标 D、相对指标 5.根据同一资料计算的数值平均数通常是各不相同的,他们之间的关系是( D )。 A. 算术平均数≥几何平均数≥调和平均数 B. 几何平均数≥调和平均数≥算术平均数 C. 调和平均数≥算术平均数≥几何平均数 D. 没有关系 6.指数是表明现象变动的( B ) A. 绝对数 B. 相对数 C. 平均数 D. 抽样数 7.编制数量指标指数一般是采用( A )作为同度量因素。 A. 基期质量指标 B. 报告期质量指标 C. 基期数量指标 D. 报告期数量指标 8.价格下降后,花同样多的钱可以多购买基期商品的10%,则物价指数为( B ) A. 90% B. 90.9% C. 110% D. 111.1% 9.消费价格指数反映了( D ) A. 城乡商品零售价格的变动趋势 B. 城乡居民购买生活消费品价格的变动趋势 C. 城乡居民购买服务项目价格的变动趋势 D. 城乡居民购买生活消费品和服务项目价格的变动趋势 10.变量x与y之间的负相关是指( C ) A. x数值增大时y也随之增大 B. x数值减少时y也随之减少 C. x数值增大(或减少)y随之减少(或增大) D. y的取值几乎不受x取值的影响 11.如果相关系数为0,表明两个变量之间( C ) A. 相关程度很低 B. 不存在任何关系 C. 不存在线性相关关系 D. 存在非线性相关关系 二、多选题(共7个) 1.时期指标的特点是指标的数值( ADE )。

人民大学统计学在职题库统计综述答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学 考试科目:统计思想综述 课程代码:123201 考题卷号:1

除不能导致SSE显著减小为止。 逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除。如此反复, 直到增加变量不能导致SSE显著减少为止。 五、(20分)如果一个时间序列包含趋势、季节成分、随机波动, 适用的预测方法有哪些?对这些方法做检验说明。 可以使用Winter指数平滑模型、引入季节哑变量的多元回归和分解 法等进行预测。 (1)Winter指数平滑模型 包含三个平滑参数,即(取值均在0~1),以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。 L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更新是t期的季节调整因子, 是用于预测的模型。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,

而且需要有四个以上的季节周期(4年以上的数据)。 (2)引入季节哑变量的多元回归 对于以季度记录的数据,引入3个哑变量 ,其中=1(第1季度)或0(其他季度),以此类推,则季节性多元回归模型表示为: 其中b0是常数项,b1是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第1季度的平均差值。(3)分解预测 第1步,确定并分离季节成分。计算季节指数,然后将季节成分从 时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。 第2步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。 第3步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。

医学统计学第七版课后答案及解析

医学统计学第七版部分课后答案及解析 第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、 及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q=Q U-Q L,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance,CV)亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,它是对比的最简单形式。其计算公式为比=A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千

统计学-基于R第3版习题答案(第二章)

习题 2.1 (1)简单频数分布表: > load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_1.RData") > summary(exercise2_1) 行业性别满意度 电信业:38 男:58 不满意:75 航空业:19 女:62 满意 :45 金融业:26 旅游业:37 二维列联表: > mytable1<-table(exercise2_1$行业,exercise2_1$满意度) > addmargins(mytable1) # 增加边界和 不满意满意 Sum 电信业 25 13 38 航空业 12 7 19 金融业 11 15 26 旅游业 27 10 37 Sum 75 45 120 三维列联表: > mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业 性别满意度 男不满意 11 7 7 11 满意 6 3 7 6 女不满意 14 5 4 16 满意 7 4 8 4 (2) 条形图: > count1<-table(exercise2_1$行业) > count2<-table(exercise2_1$性别) > count3<-table(exercise2_1$满意度) > par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8) > barplot(count1,xlab="行业",ylab="频数") > barplot(count2,xlab="性别",ylab="频数") > barplot(count3,xlab="满意度",ylab="频数")

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

医学统计学第七版课后答案及解析

练习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 1.常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是:

(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校 正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正, 但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素 造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳 压器、恒温装置等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本 均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引 起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。 2.抽样中要求每一个样本应该具有哪三性? [参考答案] 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测 总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出 其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生 困难,所以应以“足够”为准。需要作“样本例数估计”。 3.什么是两个样本之间的可比性? [参考答案] 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 (马斌荣) 第二章集中趋势的统计描述 练习题 一、单项选择题 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是

人大版_贾俊平_统计学_第三版_课后习题答案

第3章 概率与概率分布——练习题(全免) 1 .解:设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6 (4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2 4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。 解:设A =第1发命中。B =命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。 )|()()|()()(A B P A P A B P A P B P += =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1 或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 8.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少? 解: 设A =活到55岁,B =活到70岁。所求概率为: ()()0.63(|)0.75()()0.84 P AB P B P B A P A P A ==== 9.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策? 解:这是一个计算后验概率的问题。 设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。 P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为: 6115.050612 .030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P + 决策者会倾向于采用新的生产管理流程。 10. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。这三个企业产品的次品率分别为4%、5%、3%。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少? 解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:

统计学原理第七版李洁明-课后选择判断题习题及答案

) 统计学原理第七版李洁明-课后选择判断题习题及答案 一、单项选择题 1.统计有三种含义,其基础是()。 (1)统计学(2)统计活动(3)统计方法(4)统计资料 2.一个统计总体()。 (1)只能有一个标志(2)只能有一个指标(3)可以有多个标志(4)可以有多个指标3.下列变量中,()属于离散变量。 (1)一包谷物的重量(2)一个轴承的直径(3)在过去一个月中平均每个销售代表接触的期望客户数(4)一个地区接受失业补助的人数 < 4.某班学生数学考试成绩分别为65分、71分、80分和87分,这四个数字是()。(1)指标(2)标志(3)变量(4)标志值 5.下列属于品质标志的是()。 (1)员工年龄(2)员工性别(3)员工体重(4)员工工资 6.现要了解某机床企业的生产经营情况,该企业的产量和利润是() (1)连续变量(2)离散变量(3)前者是连续变量,后者是离散变量 (4)前者是离散变量,后者是连续变量

7.劳动生产率是() | (1)动态指标(2)质量指标(3)流量指标(4)强度指标 8.统计规律性主要是通过运用()方法经整理、分析后得出的结论(1)统计分组法(2)大量观察法(3)综合指标法(4)统计推断法 9.()是统计的基础功能。 (1)管理功能(2)咨询功能(3)信息功能(4)监督功能 10.()是统计的根本准则,是统计的生命线。 (1)真实性(2)及时性(3)总体性(4)连续性 11.构成统计总体的必要条件是() 《 (1)差异性(2)综合性(3)社会性(4)同质性 12.数理统计学的奠基人是()。 (1)威廉·配第(2)阿亨瓦尔(3)凯特勒(4)恩格尔 13.统计研究的数量必须是()。 (1)抽象的量(2)具体的量(3)连续不断的量(4)可直接相加的量14.最早使用统计学这一学术用语的是() (1)政治算术学派(2)社会统计学派(3)国势学派(4)数理统计学派

统计学第二次作业答案

《统计学》第二次作业 注:本次作业主要针对4、6、8章相关知识点。 一、单选题(共11个) 1、直接反映总体规模大小得指标就是( C )。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 2、计算结构相对指标时,总体各部分数值与总体数值对比求得得比重之与( C )。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 3、下列相对数中,属于不同时期对比得指标有( B )。 A、结构相对数 B、动态相对数 C、比较相对数 D、强度相对数 4、 2010年某市下岗职工已安置了13、7万人,安置率达80、6%,安置率就是( D )。 A、总量指标 B、变异指标 C、平均指标 D、相对指标 5、根据同一资料计算得数值平均数通常就是各不相同得,她们之间得关系就是( D )。 A、算术平均数≥几何平均数≥调与平均数 B、几何平均数≥调与平均数≥算术平均数 C、调与平均数≥算术平均数≥几何平均数 D、没有关系 6、指数就是表明现象变动得( B ) A、绝对数 B、相对数 C、平均数 D、抽样数 7、编制数量指标指数一般就是采用( A )作为同度量因素。 A、基期质量指标 B、报告期质量指标 C、基期数量指标 D、报告期数量指标 8、价格下降后,花同样多得钱可以多购买基期商品得10%,则物价指数为( B ) A、 90% B、 90、9% C、 110% D、 111、1% 9、消费价格指数反映了( D ) A、城乡商品零售价格得变动趋势 B、城乡居民购买生活消费品价格得变动趋势 C、城乡居民购买服务项目价格得变动趋势 D、城乡居民购买生活消费品与服务项目价格得变动趋势 10、变量x与y之间得负相关就是指( C ) A、 x数值增大时y也随之增大 B、 x数值减少时y也随之减少 C、 x数值增大(或减少)y随之减少(或增大) D、 y得取值几乎不受x取值得影响 11、如果相关系数为0,表明两个变量之间( C ) A、相关程度很低 B、不存在任何关系 C、不存在线性相关关系 D、存在非线性相关关系 二、多选题(共7个) 1、时期指标得特点就是指标得数值( ADE )。

统计学第一章课后习题及答案

第一章 练习题 一、单项选择题 1.统计的含义有三种,其中的基础是() A.统计学B.统计方法 C.统计工作D.统计资料 2.对30名职工的工资收入进行调查,则总体单位是() A.30名职工B.30名职工的工资总额 C.每一名职工D.每一名职工的工资 3.下列属于品质标志的是() A.某人的年龄B.某人的性别 C.某人的体重D.某人的收入 4.商业企业的职工人数,商品销售额是() A.连续变量B.离散变量 C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量5.了解某地区工业企业职工的情况,下列哪个是统计指标() A.该地区每名职工的工资额B.该地区职工的文化程度 C.该地区职工的工资总额D.该地区职工从事的工种 二、多项选择题 1.社会经济统计的特点,可概括为() A.数量性B.同质性 C.总体性D.具体性 E.社会性 2.统计学的研究方法是() A.大量观察法B.归纳推断法 C.统计模型法D.综合分析法 E.直接观察法 3.下列标志哪些属于品质标志() A.学生年龄B教师职称C企业规模D企业产值 4.下列哪些属于离散型变量 A年龄B机器台数C人口数D学生成绩 5.总体,总体单位,标志,指标这几个概念间的相互关系表现为() A.没有总体单位就没有总体,总体单位也离不开总体而独立存在 B.总体单位是标志的承担者 C.统计指标的数值来源于标志 D.指标是说明统计总体特征的,标志是说明总体单位特征的 E.指标和标志都能用数值表现 6.指标和标志之间存在着变换关系,是指() A.在同一研究目的下,指标和标志可以对调 B.在研究目的发生变化时,指标有可能成为标志

统计学第四版第七章课后题最全答案

第七章 练习题参考答案 (1)已知σ=5,n=40,x =25,α=, z 2 05.0= 样本均值的抽样标准差 σ x =n σ= 79.0405 = (2)估计误差(也称为边际误差)E=z 2 α n σ =*= (1)已知σ=15,n=49,x =120,α=, z 2 05.0= (2)样本均值的抽样标准差 σ x =n σ= =4915 估计误差E= z 2 α n σ=* =4915 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±*=±,即(,) (1)已知σ=85414,n=100,x =104560,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =100 85414±.144即(,) (1)已知n=100,x =81,s=12, α=, z 1.0= 由于n=100为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (2)已知α=, z 2 05.0= 由于n=100为大样本,所以总体均值μ的95%的置信区间为: n s x z 2 α±=±* =100 12±,即(,) (3)已知α=, z 2 01.0= 由于n=100为大样本,所以总体均值μ的99%的置信区间为:

n s x z 2 α±=±* =100 12±,即(,) (1)已知σ=,n=60,x =25,α=, z 05.0= 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α 2 ± =±* =60 .53±,即(,) (2)已知n=75,x =,s=, α=, z 02.0= 由于n=75为大样本,所以总体均值μ的98%的置信区间为: n s x z 2 α±=± =75 9.823±,即(,) (3)已知x =,s=,n=32,α=, z 2 1.0= 由于n=32为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=± =32 74.90±,即(,) (1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=,z 2 05.0= 由于总体服从正态分布,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =15 500±,即(,) (2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=, z 2 05.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为: n x z σ α2 ±=±* =35 500±,即(,) (3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 1.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=±* =35 500±,即(,) (4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=, z 2 01.0= 虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间

统计学原理作业2答案(新)

统计学原理作业2答案(新)

《统计学原理》作业(二) (第四章) 一、判断题 1、总体单位总量和总体标志总量是固定不变的,不能互相变换。(×) 2、相对指标都是用无名数形式表现出来的。(×) 3、能计算总量指标的总体必须是有限总体。(×) 4、按人口平均的粮食产量是一个平均数。(×) 5、在特定条件下,加权算术平均数等于简单算术平均数。(√) 6、用总体部分数值与总体全部数值对比求得的相对指标。说明总体内部的组成状况,这个相对指标是比例相对指标。(×) 7、国民收入中积累额与消费额之比为1:3,这是一个比较相对指标。(×) 8、总量指标和平均指标反映了现象总体的规模和一般水平。但掩盖了总体各单位的差异情况,因此通过这两个指标不能全面认识总体的特征。(√)

9、用相对指标分子资料作权数计算平均数应采用加权算术平均法。(×) 10、标志变异指标数值越大,说明总体中各单位标志值的变异程度就越大,则平均指标的代表性就越小。(√) 二、单项选择 1、总量指标数值大小(A) A、随总体范围扩大而增大 B、随总体范围扩大而减小 C、随总体范围缩小而增大 D、与总体范围大小无关 2、直接反映总体规模大小的指标是(C) A、平均指标 B、相对指标 C、总量指标 D、变异指标 3、总量指标按其反映的时间状况不同可以分为(D) A、数量指标和质量指标 B、实物指标和价值指标

C、总体单位总量和总体标志总量 D、时期指标和时点指标 4、不同时点的指标数值(B) A、具有可加性 B、不具有可加性 C、可加或可减 D、都不对 5、由反映总体各单位数量特征的标志值汇总得出的指标是(B) A、总体单位总量 B、总体标志总量 C、质量指标 D、相对指标 6、计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和(C) A、小于100% B、大于100% C、等于100% D、小于或大于100% 7、相对指标数值的表现形式有( D ) A、无名数 B、实物单位与货币单位 C、有名数 D、无名数与有名数 8、下列相对数中,属于不同时期对比的指标有

贾俊平统计学 第七版 课后思考题

第一章导论 1.什么是统计学? 统计学是搜集、处理、分析、解释数据并从中得出结论的科学。 2.解释描述统计与推断统计。 描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。推 断统计研究的是如何利用样本数据来推断总体特征的统计方法。 3.统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可 以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据 和时间序列数据。 4.解释分类数据、顺序数据和数值型数据的含义。 分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的 数值。 5.举例说明总体、样本、参数、统计量、变量这几个概念。 总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合, 参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。 6.变量可分为哪几类? 变量可分为分类变量、顺序变量和数值型变量。分类变量是说明书屋类别的一个名 称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序 数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。 7.举例说明离散型变量和连续型变量。 离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断 开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。 第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二 手资料。使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用 时要注明数据来源。 2.比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么 情况下适合采用非概率抽样。 概率抽样:指遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入 样本。当用样本对总体进行估计时,要考虑每个单位样本被抽中的概率。技术含量 和成本都比较高。如果调查目的在于掌握和研究对象总体的数量特征,得到总体参 数的置信区间,就使用概率抽样。 非概率抽样:指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求, 采用某种方式从总体中抽取部分单位对其进行实施调查。操作简单、时效快、成本

统计学原理第二次作业及答案

统计学原理第二次作业及答案 题目1 总指数的基本形式是() 选择一项: a. 个体指数 b. 平均指数 c. 综合指数 d. 平均指标指数 正确答案是:综合指数 题目2 重点调查所选的重点单位,必须是在调查对象中() 选择一项: a. 具有较大标志值的那一部分调查单位 b. 具有代表性的调查单位 c. 按随机原则选出的调查单位 d. 填报调查数据的填报单位 正确答案是:具有较大标志值的那一部分调查单位 题目3 连续变量数列、其末组为开口组,下限为1000,其相邻组的组中值为950,则末组的组中值为()(单选) 选择一项: a. 1025 b. 1050 c. 1100 d. 1150 正确答案是:1050 题目4 零售物价指数为103%,商品零售量指数为106%,则商品零售额指数为()(单选)

选择一项: a. 109% b. 110% c. 103% d. 109.18% 正确答案是:109.18% 题目5 下列不属于强度相对指标的指标有() 选择一项: a. 平均单位成本 b. 人口出生率 c. 人口死亡率 d. 人口密度 正确答案是:平均单位成本 题目6 时间序列由两个基本要素构成()(多选) 选择一项或多项: a. 时间,即现象所属的时间 b. 指标数值,即表现现象特点的各项指标数值 c. 指标名称 d. 计量单位 e. 计算公式 正确答案是:时间,即现象所属的时间, 指标数值,即表现现象特点的各项指标数值题目7 以下分组标志中属于品质标志的是()(多选) 选择一项或多项: a. 性别

b. 年龄 c. 职业 d. 月收入 e. 职称 正确答案是:性别, 职业, 职称 题目8 在时间序列中,各指标值相加后无意义的有()(多选) 选择一项或多项: a. 时期数列 b. 时点数列 c. 绝对数时间序列 d. 相对数时间序列 e. 平均数时间序列 正确答案是:时点数列, 相对数时间序列, 平均数时间序列 题目9 我国财政收入,2003年比上年增加2787亿元,这是()(单选)选择一项: a. 发展水平 b. 增长量 c. 发展速度 d. 增长速度 正确答案是:增长量 题目10 相关关系是社会经济现象之间客观存在的()(单选) 选择一项: a. 在数量上不确定的相互依存关系 b. 在数量上确定的函数关系

统计学第五章课后题及答案解析

第五章 练习题 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查B.了解样本的基本情况 C.了解总体的基本情况D.推断总体指标2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数B.总体方差 C.抽样比例D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大B.二年级较大 C.误差相同D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差B.低估误差 C.恰好相等D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2 ,则样本容量() A.扩大到原来的2倍B.扩大到原来的4倍 C.缩小到原来的1/4D .缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样B.纯随机抽样 C.分层抽样D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差B.层内方差 C.总方差D.允许误差二、多项选择题 1.抽样推断的特点有() A .建立在随机抽样原则基础 上 B.深入研究复杂的专门问 题 C .用样本指标来推断总体指 标 D.抽样误差可以事先计算 E .抽样误差可以事先控制 2.影响抽样误差的因素有() A .样本容量的大小B.是有限总体还是无限总 体 C .总体单位的标志变动度D.抽样方法 E .抽样组织方式 3.抽样方法根据取样的方式不同分为() A .重复抽样 B .等距抽样 C .整群抽样 D .分层抽样 E .不重复抽样 4.抽样推断的优良标准是() A .无偏性 B .同质性 C .一致性 D .随机性 E .有效性 5.影响必要样本容量的主要因素有() A . 总体方差的大小B.抽样方法

人大统计学第四版部分答案

4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2= 5.5,M e =10;平均数:6 .910 96== =∑n x x i (2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.49 4.1561 ) (2 == -= ∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。 4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。 将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23 (2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5 (3)平均数== ∑n x x i 600/25=24,标准差65.61 2510621 ) (2 =-= -= ∑-n i s x x (4)偏态系数SK=1.08,峰态系数K=0.77 (5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。 4.3 (1)茎叶图如下: 茎 叶 频数 5 6 7 5 6 7 8 1 3 4 8 8 1 3 5 (2)== ∑n x x i 63/9=7,714.08 08.41 ) (2 == -= ∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。 第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。 (4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。 4.4 (1)== ∑n x x i 8223/30=274.1 中位数位置=n+1/2=15.5,M e =272+273/2=272.5 (2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5 (3) 17.211 307.130021 ) (2 =-= -= ∑-n i s x x 4.5 (1)甲企业的平均成本=总成本/总产量=41.19340 660030 150020 300015 2100150030002100==++++

相关主题
文本预览
相关文档 最新文档