当前位置:文档之家› 统计学第四版第七章课后题最全答案

统计学第四版第七章课后题最全答案

统计学第四版第七章课后题最全答案
统计学第四版第七章课后题最全答案

第七章 练习题参考答案

7.1 (1)已知σ=5,n=40,x =25,α=0.05,

z

05.0=1.96

样本均值的抽样标准差

σ

x

=n σ=

79.040

5

= (2)估计误差(也称为边际误差)E=

z 2

α

n

σ

=1.96*0.79=1.55 7.2(1)已知σ=15,n=49,x =120,α=0.05,

z

05.0=1.96

(2)样本均值的抽样标准差

σ

x

=n

σ=

=4915

2.14 估计误差E=

z 2

α

n

σ=1.96*

=4915

4.2 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n

x z σ

α

±

=120±1.96*2.14=120±4.2,即(115.8,124.2)

7.3(1)已知σ=85414,n=100,x =104560,α=0.05,

z

05.0=1.96

由于总体标准差已知,所以总体均值μ的95%的置信区间为: n

x z σ

α

±

=104560±1.96*

=100

85414104560±16741.144即(87818.856,121301.144)

7.4(1)已知n=100,x =81,s=12, α=0.1,

z

2

1.0=1.645

由于n=100为大样本,所以总体均值μ的90%的置信区间为:

n

s x z 2

α±=81±1.645*

=100

1281±1.974,即(79.026,82.974)

(2)已知α=0.05,

z

2

05.0=1.96

由于n=100为大样本,所以总体均值μ的95%的置信区间为:

n

s x z 2

α±=81±1.96*

=100

1281±2.352,即(78.648,83.352)

(3)已知α=0.01,

z

2

01.0=2.58

由于n=100为大样本,所以总体均值μ的99%的置信区间为:

n

s x z 2

α±=81±2.58*

=100

1281±3.096,即(77.94,84.096)

7.5(1)已知σ=3.5,n=60,x =25,α=0.05,

z

05.0=1.96

由于总体标准差已知,所以总体均值μ的95%的置信区间为: n

x z σ

α

±

=25±1.96*

=60

.5325±0.89,即(24.11,25.89)

(2)已知n=75,x =119.6,s=23.89, α=0.02,

z

2

02.0=2.33

由于n=75为大样本,所以总体均值μ的98%的置信区间为:

n

s x z 2

α±=119.6±2.33*

=75

9.823119.6±6.43,即(113.17,126.03)

(3)已知x =3.419,s=0.974,n=32,α=0.1,

z

2

1.0=1.645

由于n=32为大样本,所以总体均值μ的90%的置信区间为:

n

s x z 2

α±=3.419±1.645*

=32

74.90 3.419±0.283,即(3.136,3.702)

7.6(1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=0.05,z

2

05.0=1.96

由于总体服从正态分布,所以总体均值μ的95%的置信区间为:

n

x z σ

α2

±=8900±1.96*

=15

5008900±253.03,即(8646.97,9153.03)

(2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=0.05,

z

2

05.0=1.96

虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为:

n

x z σ

α2

±=8900±1.96*

=35

5008900±165.65,即(8734.35,9065.65)

(3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=0.1,

z

2

1.0=1.645

虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为:

n

s x z 2

α±=8900±1.645*

=35

5008900±139.03,即(8760.97,9039.03)

(4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=0.01,

z

2

01.0=2.58

虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间为:

n

s x z 2

α±=8900±2.58*

=35

5008900±218.05,即(8681.95,9118.05)

7.7 已知:n=36,当α=0.1,0.05,0.01时,相应的

z

2

1.0=1.645,

z

2

05.0=1.96,

z

2

01.0=2.58

根据样本数据计算得:x =3.32,s=1.61

由于n=36为大样本,所以平均上网时间的90%置信区间为:

n

s x z 2

α±=3.32±1.645*

=36

1.61 3.32±0.44,即(

2.88,

3.76)

平均上网时间的95%置信区间为:

n

s x z 2

α±=3.32±1.96*

=36

1.61 3.32±0.53,即(

2.79,

3.85)

平均上网时间的99%置信区间为:

n

s x z 2

α±=3.32±2.58*

=36

1.61 3.32±0.69,即(

2.63,4.01)

7.8 已知:总体服从正态分布,但σ未知,n=8为小样本,α=0.05,)

(18t

2

05.0-=2.365 根据样本数据计算得:x =10,s=3.46 总体均值μ的95%的置信区间为:

n

s x t 2

α±=10±2.365*

=8

3.4610±2.89,即(7.11,12.89)

7.9 已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,)

(116t

2

05.0-=2.131 根据样本数据计算得:x =9.375,s=4.113

从家里到单位平均距离的95%的置信区间为:

n

s x t 2

α±=9.375±2.131*

=14

4.1139.375±2.191,即(7.18,11.57)

7.10 (1)已知:n=36,x =149.5,α=0.05,

z

2

05.0=1.96

由于n=36为大样本,所以零件平均长度的95%的置信区间为:

n

s x z 2

α±=149.5±1.96*

=36

1.93149.5±0.63,即(148.87,150.13)

(2)在上面的估计中,使用了统计中的中心极限定理。该定理表明:从均值为μ、方差为

σ

2

的总体中,抽取了容量为n 的随机样本,当n 充分大时(通常要求30n ≥),样本均值

的抽样分布近似服从均值为μ,方差为

n

σ

2

的正态分布。

7.12 (1)已知:总体服从正态分布,但σ未知,n=25为小样本,

α=0.01,)125(201.0-t

=2.797 根据样本数据计算得:x =16.128,s=0.871

总体均值μ的99%的置信区间为:

n

s x t 2

α±=16.128±2.797*

=25

0.87116.128±0.487,即(15.64,16.62)

7.13 已知:总体服从正态分布,但σ未知,n=18为小样本,α=0.1,)118(2

1.0-t

=1.74

根据样本数据计算得:x =13.56,s=7.8

网络公司员工平均每周加班时间的90%的置信区间为:

n

s x t 2

α±=13.56±1.74*

=18

7.813.56±3.2,即(10.36,16.76)

7.14 (1)已知:n=44,p=0.51,α=0.01,z

2

01.0=2.58

总体比例π的99%的置信区间为:

n p p )1(p z 2

-±α=0.51±2.5844

)

51.01(51.0-=0.51±0.19,即(0.32,0.7) (2)已知:n=300,p=0.82,α=0.05,z

2

05.0=1.96

总体比例π的95%的置信区间为:

n p p )1(p z 2

-±α=0.82±1.96300

)

82.01(82.0-=0.82±0.04,即(0.78,0.86) (3)已知:n=1150,p=0.48,α=0.1,,z

2

1.0=1.645

总体比例π的90%的置信区间为:

n p p )1(p z 2

-±α=0.48±1.6451150

)

48.01(48.0-=0.48±0.02,即(0.46,0.5) 7.15 已知:n=200,p=0.23,α为0.1和0.05时,相应的z

2

1.0=1.645,

z

2

05.0=1.96

总体比例π的90%的置信区间为:

n p p )1(p z 2

-±α=0.23±1.645200

)

23.01(23.0-=0.23±0.05,即(0.18,0.28) 总体比例π的95%的置信区间为:

n p p )1(p z 2

-±α=0.23±1.96200

)

23.01(23.0-=0.23±0.06,即(0.17,0.29) 7.16已知:σ=1000,估计误差E=200,α=0.01,

z

2

01.0=2.58

应抽取的样本量为:E

z 2

2

2

)(2n σ

α=

=

200

1000

58.22

2

2

?=167

7.17 (1)已知:E=0.02,π=0.4,α=0.04,

z

2

04.0=2.05

应抽取的样本量为:E

z 2

2

12n )()(ππα-=

=

2

.0005.22

2

.401.40)

(-??=2522

(2)已知:E=0.04,π未知,α=0.05,

z

2

05.0=1.96

由于π未知,可以使用0.5(因为对于服从二项分布的随机变量,当π取0.5时,其方差达

到最大值。因此,在无法得到总体比例的值时,可以用0.5代替计算。这样得出的必要样本容量虽然可能比实际需要的容量大一些,但可以充分保证有足够高的置信水平和尽可能小的置信区间)

故应抽取的样本量为:E

z 2

2

12n )()(ππα-=

=

4

.006.912

2

.501.50)

(-??=601

(3)已知:E=0.05,π=0.55,α=0.1,

z

2

1.0=1.645

应抽取的样本量为:E

z 2

2

12n )()(ππα-=

=

.05

0.64512

2

.5501.550)

(-??=268

7.18 (1)已知:n=50,p=32/50=0.64,α=0.05,

z

2

05.0=1.96

总体中赞成该项改革的户数比例的95%的置信区间为:

n p p )1(p z 2

-±α=0.64±1.9650

)64.01(64.0-=0.64±0.13,即(0.51,0.77) (2)已知:E=0.1,π=0.8,α=0.05,

z

2

05.0=1.96

应抽取的样本量为:E

z 2

2

12n )()(ππα-=

=

.1

0.9612

2

.801.80)

(-??≈62

7.20

(1)构建第一种排队方式等待时间标准差的95%的置信区间。 解:估计统计量

()()222

1~1

n S n χσ

--

经计算得样本标准差2

2s =3.318 置信区间:

()()

()()222222121111n S n S n n αασχχ---≤≤-- 1α-=0.95,n=10,()21n αχ-=()20.0259χ=19.02,()2121n αχ--=()20.9759χ=2.7

()()()()222221211,11n S n S n n ααχχ-??-- ? ?--??=90.227290.2272,19.02

2.7???? ???=(0.1075,0.7574) 因此,标准差的置信区间为(0.3279,0.8703)

(2)构建第二种排队方式等待时间标准差的95%的置信区间。 解:估计统计量

()()222

1~1

n S n χσ

-- 经计算得样本标准差2

1s =0.2272 置信区间:

()()

()()222222121111n S n S n n αασχχ---≤≤--

1α-=0.95,n=10,()21n αχ-=()20.0259χ=19.02,()2121n αχ--=()20.9759χ=2.7

()()()()222221211,11n S n S n n ααχχ-??-- ? ?--??=9 3.3189 3.318,19.02 2.7???? ??

?=(1.57,11.06) 因此,标准差的置信区间为(1.25,3.33) (3)根据(1)和(2)的结果,你认为哪种排队方式更好? 第一种方式好,标准差小!

(1)计算A 与B 各对观察值之差,再利用得出的差值计算d 和d s 。 d =1.75,d s =2.62996

(2)设12μμ和分别为总体A 和总体B 的均值,构造12d μμμ=-的95%的置信区间。

解:小样本,配对样本,总体方差未知,用t 统计量

d d t =

()1t n -

均值=1.75,样本标准差s=2.62996 置信区间:

(

)(

)211d t n d t n αα?

--+- ?

1α-=0.95,n=4,()21t n α-=()0.0253t =3.182

(

)(

)211d t n d t n αα?

--+- ?

=1.75 3.182 3.182?-+ ?=(-2.43,5.93)

7.25 从两个总体中各抽取一个12n n ==250的独立随机样本,来自总体1的样本比例为1

p =40%,来自总体2的样本比例为2p =30%。要求: (1)构造12ππ-的90%的置信区间。 (2)构造12ππ-的95%的置信区间。 解:总体比率差的估计

大样本,总体方差未知,用z 统计量

p p z ππ---=

()0,1N

样本比率p1=0.4,

p2=0.3

置信区间:

122122p p z p p z αα? ---+ ?

1α-=0.90,z α=

0.025z =1.645

122122p p z p p z αα? ---+ ?

=

0.1 1.645 1.645? -+ ? =(3.02%,16.98%)

1α-=0.95,z α=0.025z

=1.96

122122p p z p p z αα? ---+ ?

=

0.1 1.96 1.96? -+ ? =(1.68%,18.32%)

7.26 要求:构造两个总体方差比21σ/2

2σ的95%的置信区间。

解:统计量:

21212

2

2

2s s

σσ()121,1F n n --

置信区间:

22

112222

2121212,1,11,1s s s s F n n F n n αα-?? ? ?---- ? ???

21s =0.058,22s =0.006

n1=n2=21

1α-=0.95,()2121,1F n n α--=()0.02520,20F =2.4645,

()12121,1F n n α---=

()

2211

1,1F n n α--

()12121,1F n n α---=()0.97520,20F =

()

0.0251

20,20F =0.4058

()()22

112222

2121212,1,11,1s s s s F n n F n n αα-?? ? ?---- ? ???

=(4.05,24.6)

7.27 根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求边际误差不超过4%,应抽取多大的样本? 解:

2

z α

?=

()2221p

z p p n α??

-=

?

1α-=0.95,2z α=0.025z =1.96

()222

1p

z p p n α??-=?=221.960.020.98

0.04??=47.06,取n=48或者50。

7.28 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约

为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求边际误差不超过20元,应抽取多少个顾客作为样本? 解:2222

x

z n ασ

?=

?

,1α-=0.95,2z α=0.025z =1.96,

2222x

z n ασ

?=?22

2

1.9612020?=

=138.3,取n=139或者140,或者150。

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

心理和教育统计学课后题答案解析

张厚粲现代心理与教育统计学第一章答案 1名词概念 (1 )随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。 (2)总体 答:总体(population )又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability), 概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理 与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论 找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计 算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主 要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观 事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理 与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而 且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行 心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与 教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a. 可经顺利阅读国内外先进的研究成果。 b. 可以提高心理与教育工作的科学性和效率。

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

统计学课后题答案第四版中国人民大学出版社

●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元): 1521241291161001039295127104 10511911411587103118142135125 117108105110107137120136117108 9788123115119138112146113126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为152-87=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下: 40个企业按产品销售收入分组表 (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40100.0

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

商务统计学(第四版)课后习题答案第八章

288 Chapter 8: Confidence Interval Estimation CHAPTER 8 8.1 X ±Z ?σ n = 85±1.96? 864 83.04 ≤μ≤ 86.96 8.2 X ±Z ? σ n = 125±2.58?24 36 114.68 ≤μ≤ 135.32 8.3 If all possible samples of the same size n are taken, 95% of them include the true population average monthly sales of the product within the interval developed. Thus you are 95 percent confident that this sample is one that does correctly estimate the true average amount. 8.4 Since the results of only one sample are used to indicate whether something has gone wrong in the production process, the manufacturer can never know with 100% certainty that the specific interval obtained from the sample includes the true population mean. In order to have 100% confidence, the entire population (sample size N ) would have to be selected. 8.5 To the extent that the sampling distribution of sample means is approximately normal, it is true that approximately 95% of all possible sample means taken from samples of that same size will fall within 1.96 times the standard error away from the true population mean. But the population mean is not known with certainty. Since the manufacturer estimated the mean would fall between 10.99408 and 11.00192 inches based on a single sample, it is not necessarily true that 95% of all sample means will fall within those same bounds. 8.6 Approximately 5% of the intervals will not include the true population. Since the true population mean is not known, we do not know for certain whether it is contained in the interval (between 10.99408 and 11.00192 inches) that we have developed. 8.7 (a) X ±Z ?σ n =0.995±2.58? 0.02 50 0.9877≤μ≤1.0023 (b) Since the value of 1.0 is included in the interval, there is no reason to believe that the mean is different from 1.0 gallon. (c) No. Since σ is known and n = 50, from the Central Limit Theorem, we may assume that the sampling distribution of X is approximately normal. (d) The reduced confidence level narrows the width of the confidence interval. X ±Z ? σ n =0.995±1.96? 0.02 50 0.9895≤μ≤1.0005 (b) Since the value of 1.0 is still included in the interval, there is no reason to believe that the mean is different from 1.0 gallon.

贾俊平统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(围、数目判定) 样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学第四版答案(贾俊平)

第1章统计和统计数据 指出下面的变量类型。(1)年龄。(2)性别。(3)汽车产量。 (4)员工对企业某项改革措施的态度(赞成、中立、反对)。(5)购买商品时的支付方式(现金、信用卡、支票)。详细答案:(1)数值变量。(2)分类变量。(3)数值变量。(4)顺序变量。(5)分类变量。 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。 (1)这一研究的总体是什么样本是什么样本量是多少(2)“月收入”是分类变量、顺序变量还是数值变量(3)“消费支付方式”是分类变量、顺序变量还是数值变量详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。(2)数值变量。 (3)分类变量。 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。 (1)这一研究的总体是什么 (2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量详细答案: (1)总体是“所有的网上购物者”。(2)分类变量。 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。 (1)这种抽样方式是分层抽样、系统抽样还是整群抽样(2)样本量是多少详细答案:(1)分层抽样。(2)100。 第3章用统计量描述数据

排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为分钟,标准差为分钟,第二种排队方式的等待时间(单位:分钟)如下: (1)计算第二种排队时间的平均数和标准差。 (2)比两种排队方式等待时间的离散程度。 (3)如果让你选择一种排队方式,你会选择哪一种试说明理由。 详细答案: (1)(岁);(岁)。 (2);。第一中排队方式的离散程度大。 (3)选方法二,因为平均等待时间短,且离散程度小。 在某地区随机抽取120家企业,按利润额进行分组后结果如下:按利润额分组(万元)企业数(个) 300以下19 300~40030 400~50042 500~60018 600以上11 合计120 计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。 详细答案: =(万元);(万元)。

教育统计学复习题及答案

《教育统计学》复习题及答案一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。()

2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。 A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 增加1个单位,y增加a的数量增加1个单位,x增加b的数量 增加1个单位,x的平均增加量增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义?

《统计学》(第四版)学习指导书以及课后习题答案

附录:教材各章习题答案 第1章统计与统计数据 1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5) 分类数据。 1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”; (2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。 1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者 的月平均花费;(4)统计量;(5)推断统计方法。 1.5(略)。 1.6(略)。 第2章数据的图表展示 2.1(1)属于顺序数据。 (2)频数分布表如下 (4)帕累托图(略)。 2.2(1)频数分布表如下

2.3 2.5(1)排序略。 (2)频数分布表如下 (4)茎叶图如下

2.6 (3)食品重量的分布基本上是对称的。 2.7 2.8(1)属于数值型数据。

2.9 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 布比A 班分散, 且平均成绩较A 班低。 2.11 (略)。 2.12 (略)。 2.13 (略)。 2.14 (略)。 2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量 3.1 (1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。 (3)2.4=s 。 (4)左偏分布。 3.2 (1)190=M ;23=e M 。 (2)5.5=L Q ;12=U Q 。 (3)24=x ;65.6=s 。 (4)08.1=SK ;77.0=K 。 (5)略。 3.3 (1)略。 (2)7=x ;71.0=s 。 (3)102.01=v ;274.02=v 。 (4)选方法一,因为离散程度小。 3.4 (1)x =274.1(万元);M e=272.5 。 (2)Q L =260.25;Q U =291.25。 (3)17.21=s (万元)。 3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原 因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 3.6 (1)x =426.67(万元);48.116=s (万元)。 (2)203.0=SK ;688.0-=K 。 3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相 同,因为均值和标准差的大小基本上不受样本大小的影响。 (3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生 体重的离散系数0.08。 (2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%; (4)95%。 3.9 通过计算标准化值来判断,1=A z ,5.0=B z ,说明在A项测试中 该应试者比平均分数高 出1个标准差,而在B 项测试中只高出平均分数0.5个标准差,由于A 项测试的标准化值高于B 项测试,所以A 项测试比较理想。 3.10 通过标准化值来判断,各天的标准化值如下表 日期 周一 周二 周三 周四 周五 周六 周日 标准化值Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。

_统计学概论第六版习题集总答案

第一章总论 一、填空题 1.威廉·配弟、约翰·格朗特 2.统计工作、统计资料、统计学、统计工作、统计资料、统计学3.数量对比分析 4.大量社会经济现象总体的数量方面 5.大量观察法、统计分组法、综合指标法、统计推断法 6.统计设计、统计调查、统计整理、统计分析 7.信息、咨询、监督 8.同质性 9.大量性、同质性、差异性 10.研究目的、总体单位 11.这些单位必须是同质的 12.属性、特征 13.变量、变量值 14.总体单位、总体 15.是否连续、离散、性质 二、是非题 1.非2.非3.是4.非5.是6.非7.是8.是9.是10.非11.非12.非13.非14.是15.非 三、单项选择题 1.C 2.B 3.C 4.A 5.C 6.C 7.A 8.A 9.C 10.B 11.A 12.B 13.C 14.A 15.A 四、多项选择题 1.BC 2.ABC 3.ABE 4.ABCD 5.BCDE 6.AC 7.ABCDE 8.BD 9.AB 10.ABCD 11.BD 12.ABCD 13.BD 14.ABD 15.ABC 五、简答题 略 第二章统计调查

一、填空题 1.统计报表普查重点调查抽样调查典型调查 2.直接观察法报告法采访法 3. 统计报表专门调查 4. 经常性一次性 5. 调查任务和目的调查项目组织实施计划 6. 单一表一览表 7. 基层填报单位综合填报单位 8. 原始记录统计台帐 9. 单一一览 二、是非题 1.是 2.是 3.非 4.是 5.非 6.是 7.是 8.非 9.是 10.是 三、单项选择题 1. D 2. A 3. C 4. A 5. B 6. C 7. B 8. D 9. C 10. B 四、多项选择题 1. BCE 2. ABCDE 3. ADE 4. ADE 5.ACDE 6. ABD 7. BCDE 8. ABE 9.ACD 五、简答题 略 第三章统计整理 一、填空题 1.统计汇总选择分组标志 2.资料审核统计分组统计汇总编制统计表 3.不同相同 4.频率比率(或频率) 5.全距组距 6.上限以下 7.组中值均匀 8.离散连续重叠分组 9.手工汇总电子计算机汇总 10.平行分组体系复合分组体系 11.主词宾词

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

统计学贾俊平_第四版课后习题答案 2

3.3 某百货公司连续40天的商品销售额如下: 单位:万元 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 1、确定组数: ()l g 40l g () 1.60206 111 6.32l g (2)l g 20.30103 n K =+ =+=+=,取k=6 2、确定组距: 组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取5 3、分组频数表 销售收入(万元) 频数 频率% 累计频数 累计频率% <= 25 1 2.5 1 2.5 26 - 30 5 12.5 6 15.0 31 - 35 6 15.0 12 30.0 36 - 40 14 35.0 26 65.0 41 - 45 10 25.0 36 90.0 46+ 4 10.0 40 100.0 总和 40 100.0 频数 246810121416<= 25 26 - 30 31 - 35 36 - 40 41 - 45 46+ 销售收入 频数 频数 3.9.下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据: 年龄 18~19 21~21 22~24 25~29 30~34 35~39 40~44 45~59 % 1.9 34.7 34.1 17.2 6.4 2.7 1.8 1.2 (1) 对这个年龄分布作直方图; (2) 从直方图分析成人自学考试人员年龄分布的特点。 解:(1)制作直方图:将上表复制到Excel 表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel 练习题2.6)

精选-《教育统计学》复习题及答案

《教育统计学》复习题及答案 一、填空题 1.教育统计学的研究对象是.教育问题。 2.一般情况下,大样本是指样本容量.大于30 的样本。 3.标志是说明总体单位的名称,它有.品质标志和数量标志两种。 4.统计工作的三个基本步骤是:、和。 5.集中量数是反映一组数据的趋势的。 6.“65、66、72、83、89”这组数据的算术平均数是。 7.6位学生的身高分别为:145、135、128、145、140、130厘米,他们的众数是。 8.若某班学生数学成绩的标准差是8分,平均分是80分,其标准差系数是。 9.参数估计的方法有和两种。 10.若两个变量之间的相关系数是负数,则它们之间存在。 11.统计工作与统计资料的关系是和的关系。 12.标准差越大,说明总体平均数的代表性越,标准差越小,说明总体平均数的代表性越。 13.总量指标按其反映的内容不同可以分为和。 二、判断题 1、教育统计学属于应用统计学。() 2、标志是说明总体特征的,指标是说明总体单位特征的。() 3、统计数据的真实性是统计工作的生命() 4、汉族是一个品质标志。() 5、描述一组数据波动情况的量数称为差异量数。() 6、集中量数反映的是一组数据的集中趋势。() 7、在一个总体中,算术平均数、众数、中位数可能相等。() 8、同一总体各组的结构相对指标数值之和不一定等于100%。() 9、不重复抽样误差一定大于重复抽样误差。() 10. 一致性是用样本统计量估计统计参数时最基本的要求。() 三、选择题 1.某班学生的平均年龄为22岁,这里的22岁为( )。

A.指标值 B.标志值 C.变量值 D.数量标志值 2.统计调查中,调查标志的承担者是( )。 A.调查对象 B.调查单位 C.填报单位 D.调查表 3.统计分组的关键是( )。 A.确定组数和组距 B.抓住事物本质 C.选择分组标志和划分各组界限 D.统计表的形式设计 4.下列属于全面调查的有( )。 A.重点调查 B.典型调查 C.抽样调查 D.普查 5.统计抽样调查中,样本的取得遵循的原则是( )。 A.可靠性 B.准确性 C.及时性 D.随机性 6. 在直线回归方程Yc =a+bx中,b表示( )。 A.x增加1个单位,y增加a的数量 B.y增加1个单位,x增加b的数量 C.y增加1个单位,x的平均增加量 D.x增加1个单位,y的平均增加量 7.下列统计指标中,属于数量指标的有() A、工资总额 B、单位产品成本 C、合格品率 D、人口密度 8.在其他条件不变情况下,重复抽样的抽样极限误差增加1倍,则样本单位数变为( )。 A.原来的2倍 B.原来的4倍 C.原来的1/2倍 D.原来的1/4倍 四、简答题 1.学习教育统计学有哪些意义? 答:(1)教育统计是教育科学研究的工具; (2)学习教育统计学有利于教育行政和管理工作者正确掌握情况,进行科学决策; (3)教育统计是教育评价不可缺少的工具; (4)学习教育统计学有利于训练科学的推理与思维方法。 2.统计图表的作用有哪几方面? 1)表明同类统计事项指标的对比关系; (2)揭示总体内部的结构; (3)反映统计事项的发展动态; (4)分析统计事项之间的依存关系; (5)说明总体单位的分配; (6)检查计划的执行情况; (7)观察统计事项在地域上的分布。 3.简述相关的含义及种类。 答:相关就是指事物或现象之间的相互关系。

相关主题
文本预览
相关文档 最新文档