当前位置:文档之家› 统计学课后题答案

统计学课后题答案

统计学课后题答案
统计学课后题答案

第二章

3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108

97 88 123 115 119 138 112 146 113 126

要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。

(2)制作茎叶图,并与直方图进行比较。

解:(1)频数分布表

或:

(2)茎叶图

第三章

1. 已知下表资料:

试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870

34.35200

xf x f =

==∑∑(件) 根据频率计算工人平均日产量:34.35f

x x f

=

=∑∑g

(件)

结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。

2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表:

试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f

x x

f

=

∑∑

=13.74(元)

3.某专业统计学考试成绩资料如下:

试计算众数、中位数。 解:众数的计算:

根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9,

()()

1

11m m o m m m m f f M L d f f f f --+-=+

?-+-

()()

2014

801083.532014209-=+

?=-+-(分)

中位数的计算: 根据

60

302

2

f

=

=∑和向上累积频数信息知,中位数在80~90这一组。 12

m e me

f

S M L d f --=+

?∑3026

80108220

-=+

?=(分) 4.利用练习题1题资料计算200名工人日产量的标准差,并计算离散系数。(只按照频数计算即可)

解: 计算表

()2

25465.5

27.3275200

x x f

f

σ-=

=

=∑∑

5.23σ===

5.23

100%100%15.23%34.35

v x

σσ

=

?=

?= 5.一家公司在招收职员时,首先要通过两项能力测试。在A 项测试中,平均分数是80分,标准差是15分;在B 项测试中,平均分数是200分,标准差是50分。一位应试者在A 项测试中得了95分,在B 项测试中得了225分。与平均分数相比,该位应试者哪一项测试更为理想?

解:计算各自的标准分数:9580115A z -=

=,225200

0.550

B Z -== 因为A 测试的标准分数高于B 测试的标准分,所以该测试者A 想测试更理想。

第四章

3.解:已知:100n , 200

==μ,2500502

2==σ,同时由于样本量很大,可以看作重臵抽样来处理。

根据公式4.5可以得到: (1)200)(E ===μx x

(2)25100

25002

2==

=

n

x

σσ,52

==x

x σσ (3)根据中心极限定理,x 近似服从均值为200,标准差为5的正态分布。 4.解:已知:005n , 4.0==π,同时由于样本量很大,可以看作重臵抽样来处理。 根据公式4.7可以得到: (1)4.0)(E ==πp (2)00048.0)

1(2

=-=

n

p ππσ,0219.02

==p p σσ;

(3)根据中心极限定理,p 近似服从均值为0.4,标准差为0.0219的正态分布。

第五章 1.解:(1)已知49n 15==,σ,故:1429.27

15

==

=

n

x σ

σ; (2)由题目可知:05.0=α,故查表可知:96.1025.02

==Z Z α 估计误差 4.22.142996.12

=?=x Z σα;

(3)由题目可知:120=x ,由臵信区间公式可得: )2.124,8.115(2.41202

=±=±x Z x σα

即快餐店所有顾客午餐平均花费金额的95%的臵信区间为(115.8,124.2)元。 2.解:

(1)总体服从正态分布,96.1025.02

==Z Z α,则μ的95%臵信区间为:

)9153.0348,8646.9652(129.099496.189002

=?±=±x Z x σα

(2)总体不服从正态分布,且样本属于大样本,96.1025.02

==Z Z α,则μ的95%臵信区间

为:

)6502.0659,3498.7348(5154.4896.189002

=?±=±x Z x σα

(3)总体不服从正态分布,σ未知,因此使用样本方差代替总体方差,645.105.02

==Z Z α,

则μ的90%臵信区间为:

)0278.0399,9722.7608(5154.48645.189002

=?±=±n

s

Z x α

(4)总体不服从正态分布,σ未知,因此使用样本方差代替总体方差, 96.1025.02

==Z Z α,则μ的95%臵信区间为:

)6502.0659,3498.7348(5154.4896.189002

=?±=±n

s

Z x α

3.解:整理数据可以得到36=n ,3167.3==

∑n

x x ,6093.11

)

(2

=--=∑n x x s ,由于

36=n 属于大样本,所以使用正态分布来构建臵信区间。

当645.105.02

==Z Z α,该校大学生平均上网时间的90%臵信区间为:

)7579.3,8755.2(2682.0645.13167.32

=?±=±n

s

Z x α

小时 当96.1025.02

==Z Z α,该校大学生平均上网时间的95%臵信区间为:

)8424.3,7910.2(2682.096.13167.32

=?±=±n

s

Z x α

小时 当58.2025.02

==Z Z α,该校大学生平均上网时间的95%臵信区间为:

)0089.4,6244.2(2682.058.23167.32

=?±=±n

s

Z x α

小时 4.解:

(1)由题目可知:50=n ,64.05032

==

p ,0679.0)

1(=-=n

p p p σ,由于抽取的样

本属于大样本,所以96.1025.02

==Z Z α,总体中赞成新措施的户数比例的95%臵信区间为:

,(0.77310.50690.067996.164.0)

1(2

=?±=-±n

p p Z p α

(2)由题目可知:估计误差1.0%10)

1(2

=≤-=n p p Z d α

,8.0=p ,96.1025.02

==Z Z α,得到:

1.0)

1(2

≤-n p p Z α

0.10.8-10.896.1≤?

n

n ≤5385.61

即样本个数至少为62户。

或直接将1.0=d 带入n 确定的公式,即,

6254.611

.0)8.01(8.096.1)1()(2

2222/≈=-??=-=d z n ππα 7.一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得到的自信心测试分数如下:

构建两种方法平均自信心得分之差21-μμμ=d 的95%的臵信区间。 解:由样本数据计算得到:

1110

110

==

d ,53.6110384

1

)(1

2

=-=

--=∑=d n

i i

d n d d

s ,262.2)110(2

=-αt

则自信心得分之差21-μμμ=d 的95%的臵信区间为:

)67.15,33.6(67.41110

53

.6262.211)

9(025.0=±=?±=±n s t d d 结论:

8.从两个总体中各抽取一个25021==n n 的独立随机样本,来自总体1的样本比例为

%401=p ,来自总体2的样本比例为%302=p 。

构造)-(21ππ的臵信区间,臵信水平分别为90%和95%。 解:由题目可以得到:25021==n n ,4.01=p ,3.02=p , 当0.052

1.645Z Z α==,)-(21ππ的90%臵信区间为:

%)98.16%,021.3()

1()1(2

2211195

.021=-+-±-n p p n p p Z p p 当0.0252

1.96Z Z α==,)-(21ππ的95%臵信区间为:

%)32.18%,684.1()1()1(2

22111975

.021=-+-±-n p p n p p Z p p 结论:

第六章

1.解:由题目可以得到:200=n ,5.2=σ;

提出原假设与备择假设:7.6:0≤μH ,7.6:1>μH ;

该检验属于右侧单边检验,因此得到拒绝域为:}3263.2{99.01==≥=-z z z W α; 在大样本条件下检验统计量为:32563.21113.30

>=-=

n

x z σ

μ,落入拒绝域中,因

此拒绝原假设,认为如今每个家庭每天收看电视的平均时间较十年前显著增加了。

(或利用Excel 的“1-NORMSDIST(3.1113)”函数得到检验P=0.0009<0.01,则拒绝原假设)

2.解:由题目可以得到:32=n ,根据样本数据计算得到:1979.9=s ,10625.78=x ; 提出原假设与备择假设:82:0≥μH ,82:1<μH ;

该检验属于左侧单边检验,因此得到拒绝域为:}3264.2{01.0-==≤=z z z W α;

在大样本且总体方差未知条件下检验统计量为:325.23949.20

<-=-=

n

x z μ,落入拒绝域中,因此拒绝原假设,认为该城市空气中悬浮颗粒的平均值显著低于过去的平均值。 (或利用Excel 的“NORMSDIST(-2.3949)”函数得到检验P=0.0083<0.01,则拒绝原假设)

3.解:由题目可以得到:20=n ,计算样本数据得到1933.2=s ,51.25=x ; 提出原假设与备择假设:25:0=μH ,25:1≠μH ;

该检验属于双边检验,因此得到拒绝域为:0.0252

{(1)(19) 2.093}W t t n t α=≥-==;

在服从正态分布的小样本且总体方差未知条件下检验统计量为:

1.0399

2.093x t s μ

-=

=<,落入接受域中,因此不能拒绝原假设,没有证据表明该企业生产的金属板不符合要求。

(或利用“TDIST(1.04,19,2)”函数得到检验P=0.3114>0.05,则不能拒绝原假设) 4.解:由题目可以得到:550=n ,计算样本数据得到%91.20550

1150===

n n p ; 提出原假设与备择假设:%17:0≤πH ,%17:1>πH ;

该检验属于右侧单边检验,因此得到拒绝域为:0.0252

{ 1.645}W z z z α=≥==;

在大样本条件下检验统计量为: 2.4412 1.645z =

=>,落入拒绝域中,因此

拒绝原假设,认为生产商的说法属实,该城市的人早餐饮用牛奶的比例高于17%。 (或利用“1-NORMSDIST(2.4412)”函数得到检验P=0.0073<0.05,则拒绝原假设) 5.某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:

在05.0=α的显著性水平下检验平均装配时间之差是否等于5分钟。

5.解:提出原假设与备择假设:5:210=-μμH ,5:211≠-μμH ;

在大样本条件下检验统计量为:1450.5)

()(2

22

121

2121-=+---=

n s

n s x x z μμ

利用“2*(1-NORMSDIST(5.1450))”函数,得到双尾P 值为7

106752.2-?,由于

05.0=<αP ,拒绝原假设,认为两种装配操作的平均装配时间之差不等于5分钟。

第七章

1.从某市的三个小学中分别抽若干名5年级男生,测量其身高,数据如下,

试检验不同小学5年级男生身高有无显著差别(=0.05) 解:设三个小学的5年级男生的平均身高分别为321,,μμμ。

提出假设:0123:H μμμ== 1123:,,H μμμ不全相等 由Excel 输出的方差分析表如下:

没有证据表明该市3所小学5年级的男生身高有显著差异。

2.某家电制造公司准备购进一批5#电池,现有A 、B 、C 三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经试验得其寿命(小时)数据见下表:

试分析三个企业生产的电池的平均寿命之间有无显著差异?如果有差异,用LSD 方法检验哪些企业之间有差异? (α =0.05)

解:A 、B 、C 三个企业生产的电池的平均寿命分别为3

2

1

,,μμ

μ。

提出假设:0123:H μμμ== 1123:,,H μμμ不全相等 由Excel 输出的方差分析表如下: 方差分析

差异源 SS df

MS

F

P-value

F crit

组间 615.6 2 307.8 17.06839 0.00031 3.885294 组内 216.4 12 18.03333 总计

832

14

P-value=0.00031<α =0.05(或F=17.06839>F crit=3.885294),拒绝原假设。表明

电池的平均寿命之间有显著差异。

为判断哪两家企业生产的电池平均寿命之间有显著差异,首先提出如下加红色:

检验1:012112:;:H H μμμμ=≠ 检验2:013113:;:H H μμμμ=≠ 检验3:023123:;:H H μμμμ=≠

然后计算检验统计量:

4.14304.442

1

=-=-x x

8.16.424.443

1

=-=-x x

6.126.42302

2

=-=-x x

计算LSD 。根据方差分析表可知,MSE=18.03333.根据自由度=n-k=15-3=12.查t 分布表得.179.2025

.02

/==t

t

α计算的LSD 如下:

85

.5)5

151(033.18179.2=+??=LSD

作出决策。

4.14304.442

1

=-=-x x >LSD=5.85,拒绝原假设。企业A 与企业B 电池的平均

使用寿命之间有显著差异。

8.16.424.443

1

=-=-x x <LSD=5.85,不拒绝原假设。没有证据表明企业A 与企

业C 电池的平均使用寿命之间有显著差异。

6.126.42302

2

=-=-x x >LSD=5.85,拒绝原假设。企业B 与企业C 电池的平均

使用寿命之间有显著差异。

3.某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,平均分为三组,并指定每组使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果。

要求:(1)完成上面的方差分析表。

(2)检验三种方法组装的产品数量之间是否有显著差异? (α=0.05) 解:(1)

(2)由方差分析表可知:P-value=0.245946>=0.05,(或F=1.478<F crit=3.354131=,不能拒绝原假设。没有证据表明三种方法组装的产品数量之间有显著的差异。

第八章

1.从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下:

要求:

(1) 绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2) 计算产量与生产费用之间的相关系数。

(3) 对相关系数的显著性进行检验(

α=0.05),并说明二者之间的关系强度。 解:(1)

散点图表明产量与生产费用两变量之间为正线性相关。 (2)设产量为X ,生产费用为Y ,

22

12,1025,1921,101835,

310505,170094

n x y x y

xy ======∑∑∑∑∑

产量与生产费用之间的相关系数:

92.078353

72103

1921310505121025101835121921102517009412)

()(2

2

2

2

2

2

==-?-??-?=---=

∑∑∑∑∑∑∑y y n x x n y

x xy n r

两变量为高度正相关关系。 (3)相关系数的显著性检验如下: 第1步,提出假设。

原假设0:0H ρ=;备择假设1:0H ρ≠ 第2步,计算检验统计量。

94.1892

.012

1292.0122

2

=--?=--=r n r

t

第3步,给定显著性水平0.05α=,查表确定临界值=-)212(2

/05.0t 2.228。

第4步,做出统计决策。由于)10(025

.0t t ≥,则拒绝原假设,说明产量与生产费用之间

的线性关系显著。

2.设36,4,18SSR SSE n ===。 要求:

(1)计算判定系数2

R ,并解释其意义。 解:2

R =

%

904

3636=+=+SSE SSR SSR

其意义为: 2

R =90%表示,在因变量y 取值的变差中,有90%可以由x 和y 之间的线性关系来解释。

(2)计算估计标准误差e s ,并解释其意义。

5.02

1842=-=-=

n SSE s e

其意义:e s =0.5表示,当用x 来预测y 时,平均的预测误差为0.5.

5.某公司想了解广告支出对销售收入的影响,收集了12年的有关数据。计算得到方差分析

表结果:

参数估计表

(1)完成上面的方差分析表。

(2)销售收入的变差中有百分之多少是由于广告支出的变动引起的? 由于21602708.6

97.6%1642866.7

SSR R SST =

==,即销售收入的变差中有97.6%是由于广告支出的变动引起的。

(4) 销售收入与广告支出之间的相关系数是多少? 相关系数r=0.988

(5) 写出估计的回归方程并解释回归系数的实际意义。

?363.6891+1.4202y

x = 回归系数1

? 1.4202β=表示广告支出每增加1万元,销售收入平均增加1.4202万元。 (6) 检验线性关系的显著性(α=0.05)。

检验统计量F

对应的P 值=2.17E-09<α=0.05,拒绝原假设,表明线性关系显著。

第九章 1.某工业企业某年第二季度的总产值和工人数资料如下表:

要求计算:(1)第二季度各个月的工人劳动生产率;

(2)第二季度月平均工人劳动生产率; (3)第二季度的工人劳动生产率。 解:(1)月工人劳动生产率=

月平均工人数

总产值

4月:

()6337.22

6156001600

=÷+(万元);

5月:

()6506.22

6306151650

=÷+(万元)

6月:

()8682.22

6606301850

=÷+(万元)

(2)17003

51003

185016501600==++==

∑n

a a (万元)

6253

187532660

6306152

600==+

++=b (人) 72.2625

1700===b a c (万元)

(3)第二季度的工人劳动生产率=2.72×3=8.16(万元) 2.某地区2007~2010年工业总产值资料如下:

要求:(1)计算表中所缺数字;

(2)以2007年为基期计算该地区2008~2010年工业总产值的年平均发展速度; (3)如果2010年后继续按照这样的速度发展,预测2013年该地区工业总产值。 解:(1)

(2)2008~2010年工业总产值的年平均发展速度=%125%31.1953= (3)2013年该地区工业总产值=125×1.253

=244.14(亿元)

3.某地区粮食产量2007~2009年平均发展速度是 1.03,2010~2011年平均发展速度是1.05,粮食产量2012年比2011年增长6%,试求2007~2012年这六年粮食产量的平均发展速度。

解:%16.10406.105.103.16

23=??=R

4.党的十八大报告中指出,确保到2020年全面建成小康社会,实现国内生产总值和城乡居民人均收入比2010年翻一番的目标。其中2010年国内生产总值现价总量为401202亿元,以2010年为价格基期,按不变价格来计算:为实现翻一番的目标,2020年的国内生产总值将至少达到多少?平均每年的经济增长速度应达到多少? 解:2020年的国内生产总值=401202×2=802404(亿元)

5.某公司2004~2012年的某种家电产品销售额数据如下:

要求:(1)应用三年和四年移动平均法计算趋势值;

(2)应用最小二乘法配合趋势直线,并计算出各年的趋势值,并说明平均每年增加的销售额是多少;

(3)预测2013年销售额将达到的水平。 解:(1)移动平均法趋势值:

(2)设家电产品销售额的趋势直线为?t y

a bt =+

由以上计算得∑∑∑∑====4684,285,875,452

ty t

y t ,

根据最小二乘法参数求解公式:

()

=-??-?=

--=

∑∑∑∑∑2

2

2452859875

4546849t t n y t ty n b 5.15

=-=t b y a 71.47

所以,直线趋势方程为:?71.47 5.15t y

t =+ 平均每年的销售额为97.22万元。平均每年增加的销售额为5.15万元。 (3)预测2013年销售额=71.47+5.15×10=122.97(万元)

第十章

1.某地三种商品的价格和销售量资料如下:

试根据上表资料计算三种商品的派氏价格总指数和因价格变动而增减的销售额。 解:%61.105116240

122764

1040404320122850810403843202.1328502.91

011==?+?+??+?+?=

=

∑∑q

p q

p I p

65241162401227641011

=-=-=?∑∑q p q p p (元)

即由于价格的上涨使销售额增加了6524元。 2.某厂生产情况如下表:

试根据表中资料计算该厂的产量总指数和因产量变动而增减的产值。 解

%

44.1001500

6

.1506150022588.067596.032008.1280125.10

00

0==?+?+?+?=

=

∑∑q

p q

p k I q q

6.615006.1506=-=?q (万元)

即由于产量增长而增加了6.6万元的产值。 3.某地五种商品的销售情况如下:

试根据表中资料计算五种商品的价格总指数和因价格变动而增减的销售额。 解:ABCDE五种商品的价格个体指数分别为:1.05,1.1,1.12,1.08,0.9 五种商品的价格总指数:

%74.103194050

201300

9

.04347008.11323012.1420001.13960005.163004347013230420003960063001

111==++++++++=

=

∑∑p

p k

q p q

p I

7250194050201300=-=?p (元)

即因价格上涨而增加的销售额为7250元。

6.某管理局下属三个工厂生产三种不同的产品的有关资料如下:

要求:运用指数因素分析法分析该管理局生产费用受单位成本和产量影响的变动情况。 解: 总成本计算表

(1)%44.842461480

2078460

01

1==

=

∑∑z q z q I qz

生产费用变动额=2078460-2461480=-383020(元) (2)%38.1012461480

2495500

001==

=

∑∑z q z q I q

产量变动对生产费用的影响额=2495500-2461480=34020(元) (3)%29.832495500

2078460

11

1==

=

∑∑z

q z q I z

单位成本变动对生产费用的影响额=2078460-2495500=-417040(元) (4)指数体系

84.44%=101.38%×83.29% -383020=34020+(-417040) 分析略。

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

统计学(第三版课后习题答案

Hah 和网速是无形的 1:各章练习题答案 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: 40个企业按产品销售收入分组表 按销售收入分组(万元)企业数 (个) 频率 (%) 向上累积向下累积 企业数频率企业数频率 100以下100~110 110~120 120~130 130~140 140以上 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计40 100.0 ————(2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0

2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%) 650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 (3)茎叶图如下: 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

统计学各章节课后习题答案

统计学各章练习题答案第1章绪论(略) 第2章统计数据的描述 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: (2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。

2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 2.5 (1)属于数值型数据。 (2)分组结果如下: 分组天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60 (3)直方图(略)。 2.6 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 2.7 (1

统计学课后习题和答案

第一章 1*.下面的列联表是根据一个小城市的居民教育水平(以获得了高中文凭和没有获得高中文凭分类)和就业状况(以全职和非全职分类)所做出 如果原假设即在教育水平和工作状态之间没有联系为真,那么下列哪一个选项表明了获得了高中文凭并且是全职工作的期望值? A. 9252157g B. 9282157g C.528292g D. 655292g E. 9252 82 g 1*. Answer :B Analysis :本题考查二维表中两个变量的独立性,如果原假设独立成立,那么cell “earned at least a high school diploma ”和“ employed full time ”的期望值为: 92829282 (,)()()157157157157 P Earned Employed Total P Earned P Employed Total == = g g g g g g 2*.一次实验中,每一个随机样本中的成人都有他的最喜爱的颜色,下表展示了按年龄分组 的试验结果。 如果对于颜色的偏好是同年龄组相互独立,下列哪一个选项表明了年龄组30到50岁,喜爱 绿色的人数的期望值? A. (99)(108)314 B. (69)(108)314 C. (99)(35)108 D. (35)(108)314 E. (99)(35) 314 2*. Answer :A Analysis :本题考查二维表中两个变量的独立性,如果两个变量独立,那么cell “aged 30 to 50”和“prefer green ”的期望值为: 1089999108 (3050,)(3050)()314314314314 P green Total P P green Total -=-= = g g g g g g 第二章 1*.下面的直方图代表了五种不同的数据集的分布,每个都包含28个整数,从1到7,水平和垂直比例对所有图形都是相同的。下面哪个图代表了有最大标准差的数据集?

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;

统计学课后第一章习题答案.doc

第1章导论 1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度。经估计,森林公园生长着25000颗成年松树,该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究的总体是() A、250颗成年松树 B、公园中25000颗成年松树 C、所有高于60英尺的成年松树 D、森林公园中所有年龄的松树 2、某森林公园的一项研究试图确定成年松树的高度。该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究所感兴趣的变量是() A、森林公园中松树的年龄 B、森林公园中松树的数量 C、森林公园中松树的高度 D、森林公园中数目的种类 3、推断统计的主要功能是() A、应用总体的信息描述样本 B、描述样本中包含的信息 C、描述总体中包含的信息 D、应用样本信息描述总体 4、对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育。这一叙述是()的结果 A、定性变量 B、试验 C、描述统计 D、推断统计 5、一名统计学专业的学生为了完成其统计学作业,在图书馆找到一本参考书中包含美国50个州的家庭收入中位数。在该生的作业中,他应该将此数据报告来源于() A、试验 B、实际观察 C、随机抽样 D、已发表的资料

6、某大公司的人力资源部主任需要研究公司雇员的饮食习惯。他注意到,雇员的午饭要么从家里带来,要么在公司餐厅就餐,要么在外面的餐馆就餐。该研究的目的是为了改善公司餐厅的现状。这种数据的收集方式可以认为是() A、观察研究 B、设计的试验 C、随机抽样 D、全面调查 7、下列不属于描述统计问题的是() A、根据样本信息对总体进行的推断 B、感兴趣的总体或样本 C、图、表或其他数据汇总工具 D、了解数据分布特征 8、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的总体是() A、该大学的所有学生 B、所有的大学生 C、该大学所有的一年级新生 D、样本中的200名新生 9、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的变量是()A、该大学一年级新生的教科书费用 B、该大学的学生数 C、该大学新生的年龄 D、大学生的生活成本 10、在下列叙述中,关于推断统计的描述是() A、一个饼图描述了某医院治疗过的癌症类型,其中2%是肾癌,19%是乳腺癌; B、.从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

统计学第三章课后题及答案解析

第三章 一、单项选择题 1.统计整理的中心工作是() A.对原始资料进行审核B.编制统计表 C.统计汇总问题D.汇总资料的再审核 2.统计汇总要求资料具有() A.及时性B.正确性 C.全面性D.系统性 3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定() A.50在第一组,70在第四组B.60在第二组,80在第五组 C.70在第四组,80在第五组D.80在第四组,50在第二组 4.若数量标志的取值有限,且是为数不多的等差数值,宜编制() A.等距式分布数列B.单项式分布数列 C.开口式数列D.异距式数列 5.组距式分布数列多适用于() A.随机变量B.确定型变量 C.连续型变量D.离散型变量 6.向上累计次数表示截止到某一组为止() A.上限以下的累计次数B.下限以上的累计次数 C.各组分布的次数D.各组分布的频率 7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线B.J型分布曲线 C.右偏分布曲线D.左偏分布曲线 8.划分连续变量的组限时,相临组的组限一般要() A.交叉B.不等 C.重叠D.间断 二、多项选择题 1.统计整理的基本内容主要包括() A.统计分组B.逻辑检查 C.数据录入D.统计汇总 E.制表打印 2.影响组距数列分布的要素有() A.组类B.组限 C.组距D.组中值 E.组数据 3.常见的频率分布类型主要有() A.钟型分布B.χ型分布 C.U型分布D.J型分布 E.F型分布 4.根据分组标志不同,分组数列可以分为() A.组距数列B.品质数列 C.单项数列D.变量数列 E.开口数列 5.下列变量一般是钟型分布的有()

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

统计学 课后习题答案

附录:教材各章习题答案 第1章统计与统计数据 1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5) 分类数据。 1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家 庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。 1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。 1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物 者的月平均花费;(4)统计量;(5)推断统计方法。 1.5(略)。 1.6(略)。 第2章数据的图表展示 2.1(1)属于顺序数据。 (2)频数分布表如下 (4)帕累托图(略)。 2.2(1)频数分布表如下

2.5(1)排序略。 (2)频数分布表如下 (4)茎叶图如下

2.6 (3)食品重量的分布基本上是对称的。 2.7 2.8(1)属于数值型数据。

2.9 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 比A 班分散, 且平均成绩较A 班低。 2.11 (略)。 2.12 (略)。 2.13 (略)。 2.14 (略)。 2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量 3.1 (1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。 (3)2.4=s 。 (4)左偏分布。 3.2 (1) 19 0=M ; 23 =e M 。 (2)5.5=L Q ;12=U Q 。 (3)24=x ;65.6=s 。 (4)08.1=SK ;77.0=K 。 (5)略。 3.3 (1)略。 (2)7=x ;71.0=s 。 (3)102.01=v ;274.02=v 。 (4)选方法一,因为离散程度小。 3.4 (1)x =274.1(万元);M e=272.5 。 (2)Q L =260.25;Q U =291.25。 (3)17.21=s (万元)。 3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原 因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 3.6 (1)x =426.67(万元);48.116=s (万元)。 (2)203.0=SK ;688.0-=K 。 3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相 同,因为均值和标准差的大小基本上不受样本大小的影响。 (3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的围就可能越大。 3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男 生体重的离散系数0.08。 (2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%; (4)95%。 3.9 通过计算标准化值来判断,1=A z ,5.0=B z ,说明在A项测试中 该应试者比平均分数高 出1个标准差,而在B 项测试中只高出平均分数0.5个标准差,由于A 项测试的标准化值高于B 项测试,所以A 项测试比较理想。 3.10 通过标准化值来判断,各天的标准化值如下表 日期 周一 周二 周三 周四 周五 周六 周日 标准化值Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章 统计描述 【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量 即产量超额完成%。 成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比 即成本超额完成%。 劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比 即劳动生产率超额完成%。 【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%, 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。 【解】本题采用累计法: (1)该煤矿原煤开采量五年计划完成=100% ?数 计划期间计划规定累计数 计划期间实际完成累计 = 75%.1261021025357 4 =?? 即:该煤矿原煤开采量的五年计划超额完成%。 (2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【】我国1991年和1994年工业总产值资料如下表:

要求: (1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈; 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ (3) %37.25 1%) 451(2824851353 ≈-+ 即,94年实际比计划增长%。 【】某乡三个村2000年小麦播种面积与亩产量资料如下表: 要求:(1)填上表中所缺数字; (2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。

《统计学概论》第八章课后练习题答案

《统计学概论》第八章课后练习答案 一、思考题 1.什么是相关系数?它与函数关系有什么不同?P237- P238 2.什么是正相关、负相关、无线性相关?试举例说明。P238- P239 3.相关系数r的意义是什么?如何根据相关系数来判定变量之间的相关系数?P245 4.简述等级相关系数的含义及其作用?P250 5.配合回归直线方程有什么要求?回归方程中参数a、b的经济含义是什么?P256 6.回归系数b与相关系数r之间有何关系?P258 7.回归分析与相关分析有什么联系与区别?P254 8.什么是估计标准误差?这个指标有什么作用?P261 9.估计标准误差与相关系数的关系如何?P258-P264 10.解释判定系数的意义和作用。P261 二、单项选择题 1.从变量之间相互关系的方向来看,相关关系可以分为()。A.正相关和负相关B.直线关系与曲线关系 C.单相关和复相关D.完全相关和不完全相关 2.相关分析和回归分析相比较,对变量的要求是不同的。回归分析中要求()。

A.因变量是随机的,自变量是给定的B.两个变量都是随机的 C.两个变量都不是随机的D.以上三个答案都不对 3.如果变量x与变量y之间的相关系数为-1,这说明两个变量之间是()。 A.低度相关关系B.完全相关关系 C.高度相关关系D.完全不相关 4.初学打字时练习的次数越多,出现错误的量就越少,这里“练习次数”与“错误量”之间的相关关系为()。 A.正相关B.高相关 C.负相关D.低相关 5.假设两变量呈线性关系,且两变量均为顺序变量,那么表现两变量相关关系时应选用()。 A.简单相关系数r B.等级相关系数r s C.回归系数b D.估计标准误差S yx 6.变量之间的相关程度越低,则相关系数的数值()。A.越大B.越接近0 C.越接近-1 D.越接近1 7.下列各组中,两个变量之间的相关程度最高的是()。A.商品销售额和商品销售量的相关系数是0.9

相关主题
文本预览
相关文档 最新文档