当前位置:文档之家› 统计学教案习题16寿命表

统计学教案习题16寿命表

统计学教案习题16寿命表
统计学教案习题16寿命表

第十六章 寿命表

一、教学大纲要求

(一)掌握内容 1. 寿命表的概念。

2. 寿命表的分类:现时寿命表、定群寿命表;完全寿命表、简略寿命表等。

3. 寿命中的各项指标:年龄、年龄组死亡概率、尚存人数与死亡人数、生存人年数、平均预期寿命。

4.寿命表的编制:简略寿命表的编制、去死因寿命表的编制。

5.寿命表的分析:寿命表的指标分析;寿命表的应用。 (二)熟悉内容

全死因寿命表、定群寿命表的编制方法。 (三)了解内容

寿命表在生存及死亡分析中的应用。

二、教学内容精要

(一) 寿命表的概念

寿命表(life table )是根据特定人群的年龄组死亡率编制出来的一种统计表。寿命表的指标可以用来评价居民的健康状况。寿命表的编制需要完整的人口资料与死亡资料。

寿命表的分类:现时寿命表(current life table )和定群寿命表(cohort life table )。 现时寿命表是指从一个断面看问题,假定有同时出生的一代人,按照某种人群现时人口实际年龄组死亡率陆续死去,计算出这一代人按年龄的一系列指标。依据年龄分组不同,现时寿命表可分为完全寿命表(年龄分组的组距是1岁)和简略寿命表(年龄分组的组距一般是5岁)。其中简略寿命表更常用。

定群寿命表是指对某特定的人群中的每一个人,从进入该特定人群直到最后一个人死亡,记录的实际死亡过程。因为人的生命周期很长,这种方法实现起来难度很大,因此一般来说应用于涉及事物寿命现象的问题,不一定是人群从出生到死亡的过程。

(二) 寿命表的编制原理与方法

1. 年龄 寿命表中的年龄是指“刚满年龄”(exact age)

2. 年龄组死亡概率(age specific probability of dying ) 是指X 岁尚存者在今后一年或n 年内死亡的可能性。它和年龄组死亡率不是一个概念。在编制寿命表时,这是一个很关键的指标。

X X

X l d q =

或 X

X n X n l d q = (16-1) 其中X q 表示X 岁尚存者在今后一年内的死亡概率;X n q 表示X 岁尚存者在今后n 年的死

亡概率;X d 表示寿命表死亡人数;X n d 表示在X ~(X+n )岁期间的寿命表死亡人数。

3. 尚存人数与死亡人数(number of survival person-years ) 尚存人数X l 表示同时出生的一代人中活满X 岁的人数。

尚存人数X l ,死亡人数X d (X n d )及死亡概率X q (X n q )关系如下:

X X X q l d ?= 或 X n X X n q l d ?= (16-2) X X X d l l -=+1 或 X n X n X d l l -=+ (16-3)

4. 生存人年数(number of survival person-years )及生存总人年数(total number of survival person-years ) X 岁尚存者在今后一年(n 年)内的生存人年数X L (X n L ),即X l 曲线下,X ~(X+n )间的面积。这个面积近似梯形面积。但婴儿组的人年数及最后一组的人年数用下面公式计算:

婴儿组 0010d a l L ?+= (16-4) 其中0a 是指0岁组死亡者的平均存活年数。

最后一个年龄组 w

w

w m l L =

(16-5) 其中w L 是最后一个年龄组的生存人年数;w l 是指尚存人数;w m 是指死亡统计中的最后一组

死亡率。

5. 平均预期寿命(life expectancy ) 表示X 岁尚存者预期平均尚能存活的人年数。

T

x e x l

x

= (16-6)

(三)简略寿命表

简略寿命表(abridged life table)一般以日历年度的人口资料为依据,统计数字的准确与否,直接影响寿命表指标的准确性与可靠性,因此必须要求准确的数据资料。简略寿命表习惯上组距是5岁,但零岁作为一个独立的组。由于简略寿命表年龄分组少,每个年龄组人口数较多,年龄组死亡率较稳定,卫生统计中比较常用。 (四)去死因寿命表

去死因寿命表(cause eliminated life table )是用来分析某种疾病或某类疾病对平均预期寿命等指标的影响,可以综合说明某类死因对人群生命的影响程度,它不受人口年龄结构的影响,而且它既能说明某类死因对全人口的综合作用,又能表达对某年龄组人口的作用。

去死因寿命表的编制方法 去死因寿命表中各项指标的意义与全死因寿命表相同。编制去某死因寿命表的关键是求去某死因后各年龄组生存率(i

X n p -),有了i

X

n p -,就可以仿照

编制全死因寿命表的方法,编制去某死因寿命表,其中

()i

x

X X

r n i n n p p --= (16-7)

(五)寿命表的分析与应用

1.寿命表的分析 寿命的各项指标X l 、X n d 、X n q 、X e 都用来评价居民的健康水平。其

中最主要的指标是平均预期寿命。

寿命表尚存人数:反映在一定年龄组死亡率基础上,一代人口的生存过程,一般用线图表示。尚存人数随年龄增加而减少。

寿命表死亡人数:反映在一定年龄组死亡基础上,一代人口的死亡过程。一般用直方图表示。横坐标为年龄,纵坐标为死亡人数。

寿命表死亡概率:取决于各年龄组死亡率,一般用半对数线图表示。

预期寿命:预期寿命是评价居民健康状况的主要指标。一般用线图表示。

2.寿命表的应用

寿命表主要应用于:(1)评价国家或地区居民健康水平。(2)利用寿命表研究人口再生产情况。(3)利用寿命表指标进行人口预测。(4)利用寿命表方法研究人群的生育、发育及疾病的发展规律。

三、典型试题分析

(一)名词解释

平均预期寿命。

平均预期寿命(life expectancy):寿命表平均预期寿命是指X岁尚存者预期平均尚能存活的年数。平均预期寿命是评价居民健康状况的主要指标。刚满X岁者的平均预期寿命受X 岁以后各年龄组死亡率的综合影响。

(二)单项选择题

某地某年女性简略寿命表中0岁组的预期寿命是65.5岁,则1岁组的预期寿命为()。

A.等于65.5岁

B.小于65.5岁

C.大于65.5岁

D.不一定

答案:D

[评析]本题考点:0岁组的预期寿命与1岁组预期寿命的关系。

0岁组的预期寿命简称平均寿命,它是各年龄组死亡率的综合反映,任何一个年龄组的死亡水平发生变化,都会引起平均寿命的改变,但婴儿死亡率对平均寿命的影响更为明显。一般来说,随着年龄的增长,预期寿命应逐渐下降,0岁组的预期寿命应高于1岁组预期寿命,但是当婴儿死亡率较高时,就会出现0岁组的预期寿命应低于1岁组预期寿命的现象。

四、习题

(一)名词解释

1.寿命表 2.现时寿命表 3.完全寿命表 4.简略寿命表 5.定群寿命表

6.年龄组死亡概率 7.尚存人数

(二)单项选择题

1.在寿命表中,若X岁到X+1岁的死亡概率为1q x,X+1到X+2的死亡概率1q x+1,则X到X+2的死亡概率为( )。

A.1q x×1q x+1 B.1-1q x×1q x+1

C.(1-1q x)×(1-1q x+1)D.1-(1-1q x)×(1-1q x+1)2.卫生统计学中目前常用的计算某年婴儿死亡率的分母是( )。

A .年初0岁组人口数

B .年中0岁组人口数

C .年末0岁组人口数

D .年出生数 (三) 简答题

1.年龄组死亡率与寿命表死亡概率有什么区别和联系? 2.平均寿命与平均死亡年龄的区别?

3.简略说明寿命表中的)(85 m 与85e 的关系。 (四)计算题

1. 下表为某市1998年男性居民的按年龄分组的生存资料,试编制简略寿命表。

表16-1某市1998年男性居民的按年龄分组的生存资料

年龄组(岁) 平均人口数

实际死亡人数

年龄组(岁)

平均人口数 实际死亡人数

0~ 18753 246 40~ 56806 134 1~ 54325 60 45~ 65863 239 5~ 64063 46 50~ 54243 346 10~ 94683 64 55~ 43355 528 15~ 114332 90 60~ 32004 763 20~ 126941 123 65~ 24445 972 25~ 118930 127 70~ 12818 897 30~ 91922 104 75~ 5813 647 35~ 62290

92

80~

2685

517

注:a 0 =0.145

五、习题答题要点

(一) 名词解释

1.寿命表:寿命表(life table )亦称生命表,是根据特定人群的年龄组死亡率编制出来的一种统计表。寿命表中各项指标不受人口年龄构成的影响,不同人群的寿命表指标具有良好的可比性。

2.现时寿命表:现时寿命表(current life table )指从一个断面看问题,假定有同时出生的一代人,按照某种人群现时人口实际年龄组死亡率陆续死去,计算出这一代人按年龄的一系列指标。

3.完全寿命表:在编制寿命表时,如果年龄分组的组距是一岁,则称为完全寿命表(complete life table ),编制完全寿命表时观察人数要足够多。

4.简略寿命表:如果年龄分组的组距不是一岁时,刚称为简略寿命表(abridged life table ),简略寿命表的组距一般是5岁,但零岁作为一个独立组。

5.定群寿命表:定群寿命表(cohort life table )亦称队列寿命表,它是对某特定的人群中的每一个人,从进入该特定人群直到最后一个人死亡,记录的实际死亡过程。 6.年龄组死亡概率:年龄组死亡概率(age specific probability of dying )是指X 岁尚存者在今后一年或n 年内死亡的可能性。它和年龄组死亡率不是一个概念。

7.尚存人数:寿命表尚存人数(number of survivors )是指同时出生的一代人中活满X 岁的人数。

(二)单项选择题 1.D 2.D

(三)简答题

1.二者的区别:年龄组死亡率是说明某年龄组人口在一年内实际的死亡水平,是根据各年龄组的平均人口数及相应的死亡数计算出来的,X n X n X n p D m /=。而寿命表中的死亡概率是按某特定人群的年龄别死亡水平,在同时出生的一代人中,X 岁尚存者在今后n 年内死亡的可能性。

二者的联系:

当年龄组分得较细时,两指标呈下列函数关系:

)2/()2(X n X n X n m n m n q += 或 ])1(1/[X X X X m a m q -+=

其中X a 为X ~X+1岁间死亡者的平均存活年数。0~岁组死亡概率也可以用婴 儿死亡率或校正婴儿死亡率来代替。

2.平均年龄是指死者死亡时年龄的算术均数,它取决于年龄别人口构成,两地的平均死亡年龄不能直接进行比较。平均寿命是指0岁组预期寿命,是同时出生的一代人按照某年某地的年龄别死亡率水平死亡可预期生存年数。它是各年龄组死亡率的综合反映,不受人口年龄构成的影响,可直接进行比较。

3.在简略寿命表中,)(85+m 表示85岁及以上组的年龄组死亡率,即85岁及以上组人口在一年内的平均死亡率,它是根据各年龄组的平均人口数计算出来的。而85e 是指85岁的预期寿命。表示85岁尚存者预期平均尚能存活的年数(即岁数)。

(四) 计算题 1.解:

(1)求年龄组死亡率(X

n X

n

X n P D m =

),计算结果列入表16-2第四栏。 (2)求死亡概率X n q 。计算结果列入第五栏。 其中0q 用婴儿组死亡率代013118.018753

246

0==

q

最后一个组死亡概率为1.000000。

(3)尚存人数X l 与死亡人数X n d 。首先给定1000000=l ,再按前面的计算公式16-2及公式16-3交替计算。结果列入第六栏和第七栏。

1311013118.010*******=?==q l d

986891311100000001=-=-=d l l 434004406.098689111=?==q l d 9825543498689112=-=-=d l l

(4) 求生存人年数X n L ,结果列入第八栏。 本例145.00=a

9887913111450.0986980010=?+=?+=d a l L

125743

192551

.024212

)(8080)(80===++m l L (5) 求生存总人年数∑

=

X n

X L T 。列入第九栏。

对X n L 自下而上进行累加

125743)(8080==+L T 293473807575=+=T L T

(6) 求预期寿命(X

X

X l T e =

)。结果列入第十栏。 95.691000006994553000===l T e

87.6998689

6895674111===l T e

至此,寿命表编制完成,见表16-2。

表16-2 1998年某市男性居民简略寿命表

年龄组(岁)

~X

(1) 平均人口数

X n

P (2) 实际死亡人数

X n

D (3) 年龄组 死亡率

X

n

m

(4) 死亡 概率

X n

q (5) 尚存 人数 X l

(6) 死亡 人数

X n

d

(7) 生存 人年数 X

n

L

(8) 生存总 人年数 X

T

(9) 平均预期寿命

X e

(10) 0~ 18753 246 0.013118 0.013118 100000 1312 98878 6994553 69.95 1~ 54325 60 0.001104 0.004406 98689 434 393888 6895674 69.87 5~ 64063 46 0.000718 0.003584 98255 352 490395 6501786 66.17 10~ 94683 64 0.000676 0.003374 97903 330 488690 6011391 61.40 15~ 114332 90 0.000787 0.003928 97573 383 486907 5522701 56.60 20~ 126941 123 0.000969 0.004833 97190 469 484777 5035794 51.81 25~ 118930 127 0.001068 0.005325 96721 515 482317 4551017 47.05 30~ 91922 104 0.001131 0.005641 96206 542 479675 4068700 42.29 35~ 62290 92 0.001477 0.007358 95664 703 476562 3589025 37.52 40~ 56806 134 0.002359 0.011725 94961 1113 472022 3112463 32.78 45~ 65863 239 0.003629 0.017981 93848 1687 465022 2640441 28.14 50~ 54243 346 0.006379 0.031393 92161 2893 453572 2175419 23.60 55~ 43355 528 0.012179 0.059093 89268 5275 433152 1721847 19.29 60~ 32004 763 0.023841 0.112499 83993 9449 396342 1288695 15.34 65~ 24445 972 0.039763 0.180837 74544 13480 339020 892353 11.97 70~ 12818 897 0.069980 0.297799 61064 18184 259860 553333 9.06 75~ 5813 647 0.111302 0.435368 42880 18668 167730 293473 6.84 80~

2685 517 0.192551 1.000000 24212

24212 125743 125743

5.19

(王仁安 张玉海)

2014年7月高等教育自学考试 00974《统计学原理》试题及答案

2014年7月高等教育自学考试 统计学原理试卷及答案 (课程代码 00974) 一、单项选择题(本大题共20小题,每小题1分,共20分) 1.构成统计总体的每一个别事物,称为 C A .调查对象 B .调查单位 C .总体单位 D .填报单位 2.对事物进行度量,最精确的计量尺度是A A .定比尺度 B .定序尺度 C .定类尺度 D .定距尺度 3.《中华人民共和国统计法》对我国政府统计的调查方式做的概括中指出,调查方式的主体是C A .统计报表 B .重点调查 C .经常性抽样调查 D .周期性普查 4.是非标志的成数p 和q 的取值范围是D A .大于零 B .小于零 C .大于1 D .界于0和1之间 5.在经过排序的数列中位置居中的数值是A A .中位数 B .众数 C .算术平均数 D .平均差 6.确定中位数的近似公式是A A .d f S f L m m ?-+ -∑1 2 B .d L ??+??+ 2 11 C .∑∑? f f x D . ∑-)(x x 7.反映现象在一段时间内变化总量的是B A .时点指标 B .时期指标 C .动态指标 D .绝对指标 8.重置抽样与不重置抽样的抽样误差相比A A .前者大 B .后者大 C .二者没有区别 D .二者的区别需要其他条件来判断 9.如果总体内各单位差异较大,也就是总体方差较大,则抽取的样本单位数A A .多一些 B .少一些 C .可多可少 D .与总体各单位差异无关 10.进行抽样调查时,样本对总体的代表性受到一些可控因素的影响,下列属于可控因素的是D A .样本数目 B .样本可能数目 C .总体单位数 D .样本容量 11.在12个单位中抽取4个,如果进行不重置抽样,样本可能数目M 为B A .4 12 B . ! 8!4! 12 C .12×4 D .12 4 12.方差是各变量值对算术平均数的A A .离差平方的平均数 B .离差平均数的平方根 C .离差平方平均数的平方根 D .离差平均数平方的平方根

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学原理测试题及答案

统计测试一 注:这是基础统计前两章的测试题;准备本月下旬测试。 一、单项选择题 1.要了解某班50名学生的性别构成情况,则总体是(C)。 A.每一个学生 B.每一个学生的性别 C.全体学生 D.全体学生的性别 2.要了解全国的人口情况,总体单位是(A)。 A.每一个人 B.每一户 C.每个省的人口 D.全国总人口 3.某班四名学生金融考试成绩分别为70分、80分、86分和90分,这四个数字是(A)。 A.变量值 B.标志 C.指标 值 D.指标 4.工业企业的职工人数、职工工资是(B)。 A.离散变量 B.前者是离散变量,后者是连续变量 C.连续变量 D.前者是连续变量,后者是离散变量 5.统计学与统计工作的关系是(C)。 A.理论与应用的关系 B.工作与结果的关系 C.理论与实践的关系 D.工作与经验的关系 6.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的90%的五个大型水泥厂的生产情况进行调查,这种调查方式是(B)。 A.典型调查 B.重点调查 C.抽样调查 D.普查 7.某地进行国有商业企业经营情况调查,则调查对象是(B)。 A.该地所有商业企业 B.该地所有国有商业企业 C.该地每一家商业企业 D.该地每一家国有商业企业

8.对企业先按经济类型分组,再按企业规模分组,属于(C)。 A.简单分组 B.平行分组 C.复合分组 D.再分组 9.某变量数列,其末组为开口组,下限为600,又知其相邻组的组中值为550,则末组的组中值是(C)。 A.100 B.500 C.650 D.700 10.统计表的宾词是用来说明总体特征的(A)。 A.统计指标 B.总体单位 C.标志 D.统计对象 11.下面属于时期指标的是(A)。 A.商品销售额 B.商场数量 C.商品价格 D.营业员人数 12.用水平法检查长期计划完成程度,应规定(B)。 A.计划期初应达到的水平 B.计划期末应达到的水平 C.计划期中应达到的水平 D.整个计划期应达到的水平 13.第五次人口普查结果,我国每10万人中具有大学程度的为3611人。该数字资料为(D)。 A.绝对数 B.结构相对数 C.比较相对 数 D.强度相对数 14.某商场计划11月份销售利润比10月份提高2%,实际提高了3%,则销售利润计划完成程度为(A)。 A.100.98% B.95.10% C.99.00% D.105.10% 15.平均数反映了(C)。 A.总体分布的集中趋势 B.总体分布的离中趋势 C.总体中各单位分布的集中趋势 D.总体变动的趋势 16.中位数和众数是一种(B)。

统计学教案习题08卡方检验

第八章 2 χ 检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2 χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数(Theoretical Frequency )。四格 表2χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算 表8-1 2 检验的用途、假设的设立及基本计算公式 01四格表 ①独立资料两 样本率的比较 ②配对资料两 样本率的比较 0H :两总体率相等 1H :两总体率不等 ①专用公式 ))()()(()(22 d b c a d c b a n bc ad ++++-=χ ②当n ≥40但1≤T<5时,校正公式 1

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学原理试题及答案解析

统计学原理试题(6) 一、单项选择题:(每小题1分,共20分) 1.设某地区有200家独立核算的工业企业,要研究这些企业的产品生产情况, 总体是( )。 A.每一家工业企业 B.200家工业企业 C.每一件产品 D.200家工业企业的全部工业产品 2.有600家公司每位职工的工资资料,如果要调查这些公司的工资水平情 况,则总体单位是()。 A.600家公司的全部职工 B.600家公司的每一位职工 C.600家公司所有职工的全部工资 D.600家公司每个职工的工资 3.一个统计总体()。 A.只能有一个指标 B.可以有多个指标 C.只能有一个标志 D.可以有多个标志 4.以产品等级来反映某种产品的质量,则该产品等级是()。 A.数量标志 B.品质标志 C.数量指标 D.质量指标 5.在调查设计时,学校作为总体,每个班作为总体单位,各班学生人数是()。 A.变量值 B.变量 C.指标值 D.指标 6.年龄是()。

A.变量值 B.连续型变量 C.离散型变量 D. 连续型变量,但在实际应用中常按离散型处理 7.人口普查规定统一的标准时间是为了()。 A.登记的方便 B.避免登记的重复与遗漏 C.确定调查的范围 D.确定调查的单位 8.以下哪种调查的报告单位与调查单位是一致的()。 A.职工调查 B.工业普查 C.工业设备调查 D.未安装设备调查 9.通过调查大庆、胜利、辽河等油田,了解我国石油生产的基本情况。这 种调查方式是()。 A.典型调查 B.抽样调查 C.重点调查 D.普查 10.某市进行工业企业生产设备普查,要求在10月1日至15日全部调查完 毕,则这一时间规定是()。 A.调查时间 B.登记期限 C.调查期限 D.标准时间 11.统计分组的关键问题是()。 A.确定分组标志和划分各组界限 B.确定组距和组中值 C.确定组距和组数 D.确定全距和组距 12.某连续变量数列,其最小组为开口组,组限为400,又知其相邻组的组 中值为500,则下开口组的组中值为()。 A.200 B.300 C.400 D.600

统计学期末考试试题(含答案)..

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量 A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是填报 单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错) 5、区间估计就是直接用样本统计量代表总体参数。(错) 6、在假设检验中,方差已知的正态总体均值的检验要计算Z统计量。(错)

统计学基础教案

统计学基础教亲 哈尔滨金融髙等专科学校管理系 第一章总论 学习重点:本章是全课程的总纲,主要讲述统计学的对象和方法、统计的作用和统讣学的基本概念,难点是统计学概念的理解和运用以及概念之间的相互关系。 第一节统计学的产生和发展 看了上面的资料,你能说出什么是统计吗?你能否体会到统计已是人们在社会经济生活中必不可少的工具,是人们认识世界、探索现象数量差异的本质极其规律的方法,是人们进行明智决策的一门艺术,随着人类社会进入信息时代,统计作为一种方法和工具就变得越来越重要。 一、统计的概念

在日常生活中,我们经常会接触到“统计”这一术语。一提到统计,很多人可能首先想到的是统讣工作,这种理解是不全面的。统计作为一种社会实践活动, 已有悠久的历史,可以说,自从有了国家就有了统计实践活动。最初,统计只是一种讣数活动,为统治者管理国家的需要而搜集资料,通过统计计数以弄清国家的人力、物力和财力,作为国家管理的依据。然而在今天,"统计”一词已被人们赋予多种含义,在不同的场合、不同的语言环境中已有许多种不同的解释。 请思考:下列资料中"统计” 一词的含义是什么? (1)小王是学统计的 (2)他已搞了儿十年统计了 (3)据统计,今年一季度物价指数出现负增长 (4)请找统计登记一下 (5)请统计一下今天的销售量 那么,把统讣作为一种专业用语,其含义到底是什么?目前,在国际统计理论界,关于统计?一词的含义比较趋于一致的解释为:统计包含统计工作、统计资料和统计学三个方面的含义。 一是统计工作,即统讣实践,是对社会经济现象客观存在的现实数量方面进行搜集、整理和分析预测等活动的总称。一个完整的统汁工作过程一般包括统计设计、统计调查、统计整理、统计分析等环节。 统计工作是统计一词最基本的含义,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。如银行的讣划统计科,每月编制项LI报表,这个过程就是统计?工作。乂如:我国进行人口普查时要经过方案设计、入户登记、数据汇总、分析总结和资料公布等一系列过程都是统计工作。在我国, 各级政府机构基本上都有统计部门,如统讣局,它们的职能主要就是从事统计数据的搜集、整理和分析工作。 二是统计资料(统计信息):统计工作过程中所取得的各项数字资料和与之相关的其他实际资料的总称。如: (1)我国国土面积960万平方公顷,其中山地约320万平方公顷,高原约250 万平方公顷,平原约"5万平方公顷,丘陵约95万平方公顷。 (2)2003年我国全年全部工业增加值53612亿元,比上年增长12.6%,其中规模以上工业企业(即国有工业企业及年产品销售收入500万元以上的非国有工业企业)增加值增长17.0%。工业产品销售率98.1%,比上年提i?0.1个白分点。 这些山文字和数字共同组成的数字化的信息就是统汁资料,是统计提供数据信息的基本表现形式,是统计工作的直接成果。 统计资料包括原始资料和整理后的资料即次级资料。例如企业各车间的统计抬帐、人口普查时初次登记的资料就是原始资料,而统讣公报、调查分析报告等现实和历史资料就是次级资料。统讣资料的表现形式有统计表、统计图、统计分析报告、统

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学原理模拟试卷及参考答案

统计学原理模拟试卷及参考答案

统计学原理模拟试卷及参考答案 统计学原理试卷(一) 一、单项选择题(每题2分,共20分): 1、以所有工人为总体,则“工龄”是() A、品质标志 B、数量标志 B、标志值 D、质量指标 2、在变量数列中,若标志值较小的组而权数大时,计算出来的平均数() A、近标志值较大的一组 B、接近标志值较小的一组 C、不受次数影响 D、仅受标志值的影响 3、由组距数列确定众数时,如果众数相邻两组的次数相等时,则() A、众数为零 B、众数就是那个最大的变量值 C、众数组的组中值就是众数 D、众数就是当中那一组的变量值

4、某企业产品产量增长30%,价格降低30%,则总产值() A、增长 B、不变 C、无法判断 D、下降 5、已知某厂甲产品的产量和生产成本与直线存在线性相关关系,当产量为1000件时,其生产总成本为3万元,不随产量变化的成本为0.6万元,则成本总额对产品产量的回归方程为 ()(4分) A、Yc=6+0.24X B Yc=6000+24X C、Yc=24+6000X D、Yc=2400+6X 6、在简单随机重复抽样的情况下,如果抽样误差减少一半(其他条件不变),则样本单位必须() A、增加两倍 B、增加到两倍 C、增加四倍 D、增加三倍 7、抽样误差的大小() A、即可避免,也可控制 B、既无法避免,也无法控制

C、可避免,但无法控制 D、无法避免,但可控制 8、如果时间数列环比增长速度大体相同,可以拟合() A、指数曲线 B、抛物线 C、直线 D、无法判断 9、若职工平均工资增长10.4%,固定构成工资指数增长15%,则职工人数结构影响指数为 A、96% B、126.96% C、101.56% D、125.4% 二、多项选择题(每题2分,答案有选错的,该题无分;选择无错,但未选全的,每选对一个得 0.5分,共10分) 1、影响样本单位数的主要因素是 () A、总体标志变异程度 B、抽样推断的可靠程度 C、极限误差的大小 D、抽样方法和组织形式的不同

统计学期末考试试题库和答案解析

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。()

三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备 4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。

统计学课后习题参考问题详解

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

统计学考试试题及答案

统计学考试试题及答案文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

《统计学原理》期末考试题 一、单选题{每小题2分,共12分} 1.对某城市工业企业未安装设备进行普查,总体单位是(B )。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 2.反映不同总体中同类指标对比的相对指标是( B)。 A.结构相对指标 B.比较相对指标 C.强度相对指标 D.计划完成程度相对指标 3.在组距分组时,对于连续型变量,相邻两组的组限(A ) A.必须是重叠的 B.必须是间断的 C.可以是重叠的,也可以是间断的 D.必须取整数 4.按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是(A)。 A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样 5.在其它条件不变的情况下,抽样单位数增加一半,则抽样平均误差(A ) A.缩小为原来的% B.缩小为原来的50% C.缩小为原来的25% D.扩大为原来的四倍 6.下列哪两个变量之间的相关程度高(C )。 A.商品销售额和商品销售量的相关系数是0. 9 B.商品销售额与商业利润率的相关系数是0. 84 C.平均流通费用率与商业利润率的相关系数是一 D.商品销售价格与销售量的相关系数是一

二、多选题(每小题2分,共8分) 1.要了解某地区的就业情况( ABE) A.全部成年人是研究的总体 B.成年人口总数是统计指标 C.成年人口就业率是统计标志 D.反映每个人特征的职业是数量指标 E.某人职业是教师是标志表现 2.影响加权算术平均数的因素有(AB ) A.各组频率或频数 B.各组标志值的大小 C.各组组距的大小 D.各组组数的多少 E.各组组限的大小 3.简单随机抽样(ACDE ) A.适用于总体各单位呈均匀分布的总体 B.适用于总体各单位标志变异较大的总体 C.在抽样之前要求对总体各单位加以编号 D.最符合随机原则 E.是各种抽样组织形式中最基本最简单的一种形式 4.下面哪几项是时期数列(BC ) A.我国近几年来的耕地总面积 B.我国历年新增人口数 C.我国历年图书出版量 D.我国历年黄金储备 E.某地区国有企业历年资金利税率 三、填空题(每小题2分.共10分) 1.变量按其取值的连续性可分为(离散变量)和(连续变量)两种。 2.统计调查根据(被研究总体范围)可分为全面调查和非全面调查,根据(调查登记时间是否连续)可分为连续调查和不连续调查。 3.总体是非标志(0,1)分布的平均数为P ,方差为P(1-P)。

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

高等教育自学考试 《统计学原理》试题及答案

2016年7月高等教育自学考试统计学原理试题 (课程代码 00974) 一、单项选择题(本大题共20小题,每小题1分,共20分)在每小题列出的四个备选项中只有一个是符合题目要求的,请将其选出并将“答题卡”的相应代码涂黑。错涂、多涂或未涂均无分。 1.统计的基本方法包括 A .调查方法、汇总方法、预测方法 B .调查方法、整理方法、分析方法 C .大量观察法、综合分析法、归纳推断法 D .时间数列法、统计指数法、回归分析法 2.构成统计总体的总体单位 A .只有一个指标 B .可以有多个指标 C .只有一个标志 D .可以有多个标志 3.在分组时,如果某个标志值恰好等于相邻两组上下限值时,一般应 A .将此值归入下限所在组 B .将此值归入上限所在组 C .将此值归入上、下限所在组都可以 D .单独设立一组 4.反映某一事物在一定范围内的总数量的统计指标是 A .平均指标 B .动态指标 C .相对指标 D .绝对指标 5.计算加权算术平均数的公式是 A .∑ ∑f x B. f xf ∑ C. ∑∑? )(f f x D.x x -∑ 6.算术平均数的基本形式是 A .同一总体的部分数值与全部数值之比 B. 同一总体的不同部分之间数值之比 C. 同一总体各项数值之和与数值个数之比 D. 同一总体的不同时间数值之比 7.是非标志的成数P 和Q 的取值范围是 A .大于O B. 小于O C .大于1 D. 界于O 和1之间 8.在调查之前可以事先加以计算和控制的误差是 A .登记误差 B. 抽样误差 C .系统误差 D. 调查误差 9.在抽样调查实践中,经常使用的抽样方法是 A .重置抽样 B. 不重置抽样 C .重点抽样 D. 典型抽样 10抽样单位数(n )与置信度(t )的关系为 A .相等 B .置信度(t )越低,则n 越小

应用统计学试题及答案1电子教案

应用统计学试题及答 案1

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一. 单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053- 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –4.76% C. –33.3% D. 3.85% 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示

A.时间每增加一个单位,产品成本平均增加1.75个单位 B.时间每增加一个单位,产品成本平均下降1.75个单位 C.产品成本每变动一个单位,平均需要1.75年时间 D.时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=5.6件乙车间: x=90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二.多选题 (每题2分,共14分) 1.下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E.企业职工人数2000人 2.在数据的集中趋势的测量值中,不受极端数值影响的测度值是

统计学思考题

第一章导论 1、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。按照统计数据 的收集方法,可以将其分为观测数据和实验数据。按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。顺序数据是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。现实中处理的大多数都是数值型数据。 2、解释分类数据、顺序数据和数值数据的意义。 对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合 样本:是从总体中抽出的一部分元素的集合。如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。 参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。在统计中,总体参数通常用希腊字母表示,如,总体平均数用u(miu)表示,总体标准差用(sigma)表示,总体比例用(pai)表示,等。 统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。样本统计量通常用英文字母来表示。如,样本平均数用(x-bar)表示,样本标准车用s表示,样本比例用p表示,等。 变量:是说明现象某种特征的概念。如,商品销售额,受教育程度,产品的质量等级等。 4、变量可分为哪几类? 变量可以分为分类变量、顺序变量、数值型变量,数值型变量根据其取值的不同,又可分为离散型变量和连续型变量。分类变量是说明事物类别的一个名称,顺序变量是说明事物有序类别的一个名称,数值型变量是说明事物数字特征的一个名称。 5、举例说明离散型变量和连续性变量。 离散型变量是只能取可数值的变量,只能取有限个值,而且其取值都以整位数断开,可以一一列举,如,企业量,产品数量;连续型变量是可以在一个或多个区间中取任何值的变量。它的取值是连续不断的,不 能一一列举,如,年龄,温度,零件尺寸的误差等。 第二章数据的搜集 1、比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样也称随机抽样,是指遵守随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。它具有以下几个特点:首先,抽样时是按一定的概率以随机抽样原则抽取样本;其次,每个单位被抽中的概率是已知的,或是可以计算出来的;最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。 非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。 如果调查的目的在于掌握研究对象总体的数量特征,根据调查的结果对总体参数进行评估,得到总体参数的置信区间,就应当采用概率抽样的方法。非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做好准备。非抽样调查也适合市场调查中概念测试,如产品包装测试、广告测试等。第三章数据的图表表示 1、分类数据和顺序数据的整理和图示方法各有那些? 分类数据的整理方法有频数和频数分布,图示方法有条形图、帕累托图、饼图、环形图;顺序数据的整理方法有累积频数和累积频率,图示方法有累积频数分布和频率图。 2、数值型数据的分组方法有哪些?简述组距分组的步骤。 数据分组的方法有单变量值分组和组距分组。 组距分组的步骤:(1)确定组数,一般数据所分组数不应少于5组且不多于15组;(2)确定各组的组距,组距=(最大值-最小值)/组数,组距宜取5或10的倍数;(3)确定上下限,第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。 3、直方图与条形图有何区别? 直方图与条形图不同。首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是 分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章数据的概括性变量 1、一组数据的分布特征可以从那几个方面进行测度? 一组数据的分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2、对于比率数据的平均为什么采用几何平均? 3、简述众数、中位数、和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜采用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。 平均数是针对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等时,这时则应选择平均数作为集中趋势的测度值。但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。 4、为什么要计算离散系数? 方差和标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平低的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。 离散系数也成为变异系数,它是一组数据的标准差与其相应的平均数之比,其计算公式为:v s=s/(x-bar),离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说 明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 第五章参数估计 1、怎样理解置信区间? 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限,由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。 2、解释95%的置信区间 如果抽取了许多不同的样本,比如说抽取了100个样本,根据每一个样本构造一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含,则95%这个值称为置信水平。一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例成为置信水平,也称为置信度或置信系数。 第六章假设检验 1、什么是假设检验中的显著性水平?统计显著是什么意思? 通常把(a-er-fa)称为显著性水平,显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05或0.01. 2、什么是假设检验中的两类错误? 对于原假设提出的命题,我们需要做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述。当然,这是依据样本提供的信息进行判断的,也就是由部分来推断,总体。因而判断有可能正确,也有可能错误,也就是说,我们面临着犯错误的可能。所犯的错误有两种类型,第一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用(a-er-fa)表示所以成为其真错误;第二类错误是原假设为伪我们却没有拒绝,犯这类错误的概率用(bei-ta)表示,所以成为取伪错误。 3、解释假设检验中的P值。 P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由就越充分。 第七章方差分析 1、什么是方差分析?它研究的是什么? 方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型隐变量是否有显著影响。 方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响。 2、简述方差分析的基本思想。 为了研究分类型自变量对对数值型因变量的影响,需要从对数据误差来源的分析入手,误差主要分为组内误差和组间误差,组内误差只包含随机误差,而组间误差除了包含随机误差,还会包含系统误差。3、解释组内误差和组间误差的含义。 组内误差(SSE):反映组内误差大小的平方和,也称为残差平方和,是由于抽样的随机性所造成的随机误差。它反映了每个样本内各观测值之间的离散状况。 组间误差(SSA):反映组间误差大小的平方和,也称为因素平方和,是随机误差和系统误差的总和。它反映了样本均值之间的差异程度。 4、解释则内方差和组间方差的含义。 组间误差和组内误差经过平均后的数值称为均方或方差。 组间方差(MSA)=组间平方和/自由度(SSA/k-1) 组内误差(MSE)=组内平方和/自由度(SSE/n-k) 5、简述方差分析的基本步骤。 1、提出假设; 2、构造检验的统计量;(1)计算各样本的均值(2)计算全部观测值的总均值(3)计算各误差平方和(4)计算统计量 3、统计决策; 4、方差分析表; 5、用Excel进行方差分析。 第八章一元线性回归 1、解释相关关系的含义,说明相关系的特点。 相关关系1)变量间关系不能用函数关系精确表达;2)一个变量的取值不能由另一个变量唯一确定;3)当变量x 取某个值时,变量y 的取值可能有几个。 2、相关分析主要解决那些问题? 相关分析就是对两个变量之间线性关系的描述和度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本之间的变量关系是否能代表总体变量之间的关系? 3、解释回归模型、回归方程、估计的回归方程的含义。 回归模型:描述因变量y如何依赖于自变量x和误差项ε的方程。 回归方程:描述因变量y的期望值如何依赖于自变量x的方程。 估计的回归方程:根据样本数据求出的回归方程的估计。 4、解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的联系。 总平方和(SST):是全部观测值Xij与总均值x-两bar的误差平方和。 残差平方和(SSE):反映组内误差大小的平方和。 回归平方和(SSR):反映了y的总变差中由于x与y之间的线性关系引起的y的变化部分。 SST=SSR+SSE 5、解释判定系数(R2)的含义和作用。 含义:判定系数是对估计的回归方程拟合优度的度量。判定系数等于相关系数的平方,即r2=(r)2 作用:反映回归直线的拟合程度;R2越接近1,说明回归方程拟合的越好;R2越接近0,说明回归方程拟合的越差。 6、在回归分析中,F检验和t检验各有什么作用? F检验是检验自变量和因变量之间的线性关系是否显著,或者说,它们之间能否用一个线性模型y= 来表示。 t检验的显著性检验是要检验自变量对因变量的影响是否显著。在一元线性回归模型y= 中,如果白塔1=0,则回归线是一条水平线,表面因变量y的取值不依赖与自变量x,即两个变量之间没有线性关系。 7、简述线性关系检验和回归系数检验的具体步骤。 线性关系检验:1、提出假设,H0:回归系数等于0,两个变量之间的线性关系不显著;2、计算检验统计量F=(SSR/1)/(SSE/(n-2));3、做出决策,根据显著性水平,分子自由度和分母自由度查F分布表,找到相应的临界值,比较与F的大小,判断是否拒绝原假设 回归系数检验:1、提出检验;2、计算检验统计量t;3、做出决策

相关主题
文本预览
相关文档 最新文档