当前位置:文档之家› 统计学期末练习题(含答案)

统计学期末练习题(含答案)

统计学期末练习题(含答案)
统计学期末练习题(含答案)

统计学期末试题

一.单项选择题(每题1分,共15分)

1、一个统计总体()

A、只能有一个标志

B、只能有一个指标

C、可以有多个标志

D、可以有多个指标

2、调查某大学2000名学生学习情况,则总体单位是()

A 、2000名学生B、2000名学生的学习成绩

C、每一名学生

D、每一名学生的学习成绩

3、某地进行国有商业企业经营情况调查,则调查对象是( )。

A、该地所有商业企业

B、该地所有国有商业企业

C、该地每一国有商业企业

D、该地每一商业企业

4、以下哪种调查的报告单位与调查单位是一致的( )。

A、工业普查

B、工业设备调查

C、职工调查

D、未安装设备调查

5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查

完毕,则这一时间规定是( )。

A、调查时间

B、调查期限

C、标准时间

D、登记期限

6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组

为60——70,第四组为70——80,第五组为80以上,则()

A、50在第一组,70在第四组

B、60在第三组,80在第五组

C、70在第四组,80在第五组

D、80在第四组,50在第二组

7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工

的平均工资,应该采用( )

A、简单算术平均法

B、加权算术平均法

C、加权调和平均法

D、几何平均法

8、用水平法检查长期计划完成程度,应规定( )

A、计划期初应达到的水平

B、计划期末应达到的水平

C、计划期中应达到的水平

D、整个计划期应达到的水平

9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是()。

A、平均指标

B、强度相对指标

C、总量指标

D、发展水平指标

10、时间序列中,每个指标数值可以相加的是()。

A、相对数时间序列

B、时期数列

C、间断时点数列

D、平均数时间序列

11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是

()。

A、时间序列中各期的逐期增长量大体相等

B、各期的二级增长量大体相等

C 、各期的环比发展速度大体相等

D 、各期同比增长量的大体相等

12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( )。

A 、%4%5

B 、%104%105

C 、%96%

95 D 、%4%5

13、某企业报告期产量比基期产量增长了10%,生产费用增长了8%,则其产品单位成本降低了( )。

A 、1.8%

B 、2%

C 、20%

D 、18%

14、在不重复抽样中,抽样单位数从5%增加到25%,抽样平均误差( )。 A 、增加39.7% B 、增加约3/5 C 、减少约3/5 D 、没有什么变化

15、若某总体次数分布呈左偏分布,则成立的有( )。

A 、x > e M >o M

B 、x

C 、x >o M >e M

D 、以上都不对

二、多项选择题(每题2分,共20分)

1、下列各项中属于品质标志的有( )。

A 、性别

B 、年龄

C 、职务

D 、民族

E 、工资 2、从表式上看,统计表由哪些部分构成( )。

A 、总标题

B 、主词

C 、纵栏标题

D 、横行标题

E 、指标数值 3、在相对数中,子项和母项可以互换位置的有( )。

A .结构相对数

B .比例相对数

C .比较相对数

D .动态相对数

E .计划完成相对数

4、下列统计指标属于总量指标的是( )

A 、工资总额

B 、商业网点密度

C 、商品库存量

D 、人均国内生产总值

E 、进出口总额 5、定基增长速度等于( )。

A.定基发展速度-1

B.环比发展速度的连乘积

C.环比增长速度的连乘积

D.环比增长速度加1后的连乘积再减1

E.定基增长量除以最初水平

6、某企业为了分析本厂生产的两种产品产量的变动情况,已计算出产量指数为118.6% ,这一指数是()。

A.综合指数 B.总指数 C.个体指数

D.数量指标指数 E.质量指标指数

7、影响抽样误差的因素有()。

A、是有限总体还是无限总体

B、是平均数还是成数

C、是重复抽样还是不重复抽样

D、总体标志变异程度大小

E、以上答案都对

8、下列正确的说法有()。

A、类型抽样只存在组内抽样误差,不存在组间抽样误差。

B、类型抽样只存在组间抽样误差,不存在组内抽样误差。

C、整群抽样只存在群间抽样误差,不存在群内抽样误差。

D、整群抽样只存在群内抽样误差,不存在群间抽样误差。

E、类型抽样既存在组内抽样误差,又存在组间抽样误差。

9、统计学的基本概念中()。

A、标志是说明总体单位特征的概念

B、指标是说明总体特征的概念

C、可变的数量标志是变量

D、指标和标志都是变量

E、质量指标是不能用数值表示的

10、对某市工业企业状况进行调查,得到下面资料,属于统计指标的有()。

A、该市工业企业实际产值为110亿元

B、某企业为亏损企业

C、该市工业企业职工人数80万人

D、某企业资金利润率为30%

E、该市工业企业机器台数为7500台

三、判断题(每题1分,共10分)

1、总体和总体单位的关系总是固定不变的。()

2、样本指标是随机变量。()

3、所选择单位的标志值占总体标志总量的绝大比例,这些单位就是重点单位()

4、综合指数和平均指数都是总指数。()

5、在简单随机抽样时,当总体单位数较多时,若抽样比例为64%,则不重复抽样的抽样平均误差比重复抽样的抽样平均误差大约减少40%()。

6、对于同一变量分布,其标准差永远小于平均差。( )。

7、在抽样调查中,系统性误差是由人为的原因造成的,因此应当尽量克服。()

8、以1949年a0为最初水平,1997年a n为最末水平,计算钢铁产量的年平均

发展速度时,应当开48次方。()

9、各个变量值与它们的算术平均数的离差平方和等于最小值。()

10、某城市有200万人,有商业零售机构10000个,商业网点密度的逆指标

==人

2000000100005(个/千人)。( )

四、填空题(每空2分,共18分)

第二季度的平均商品库存额为 万元。2、若时间序列有18年的数据,采用3年移动平均,修匀后的时间序列中剩下的数据有 个。

3、将所研究对象按某种特征分成若干个部分,并给每一类别定名,所形成的度量尺度是 。

4、=-∑=i n

i i f x x )(1 ,其中x 是n x x x ,...,,21的平均数,i f 是权数。

5、某银行想知道平均每户活期存款余额和估计其总量,根据存折账号的顺序,每50本存折抽出一本登记其余额。这样的抽样组织形式是 。

6、一家公司在招收职员时,首先要通过两项能力测试。在A 项测试中,其平均分数是100分,标准差是15分;在B 项测试中,其平均分数是400分,标准差是50分。一位应试者在A 项测试中的了115分,在B 向测试中得了425分。与平均分数比,这位应试者 项成绩更为理想。

7、六个工人的日产量分别为:32、20、23、29、26、30,这六个工人日产量的中位数是

8、某县1995—2000年期间粮食产量(万吨)配合的直线趋势方程y=800+5.5t ,式中时间变量t=-5、-3、-1、1、3、5,根据上面的直线趋势方程,预测2001年的粮食产量应为

万吨。

9、给定一组样本观测值921,,x x x ,经计算得∑==9

1

45i i x ,2859

1

2=∑=i i x ,则样本方差

=2S .

五、计算题(共37分,其中第1小题9分,第2小题10分,第3小题10分,第4小题8分)

②用相对数和绝对数说明平均工资变动中两个因素的影响,并说明

它们之间的关系;

2、一个电视节目主持人想了解观众对某个电视专题的喜欢程度,他选取了500

个观众作样本(重复抽样),结果发现喜欢该节目的有175人。(1

)试以95%的

概率估计观众喜欢这一专题节目的区间范围。(2)若该节目主持人希望估计的

,问有多大把握程度?

,并对其季节变动情况做简要分析。

4、甲乙两班同时参加统计学课程的测试,甲班的平均成绩为70分,标准性?

答案:

一、单项选择题(每题1分,共15分)

1、D

2、C

3、B

4、C

5、B

6、B

7、A

8、B

9、B10、B11、B12、C13、A14、C15、B

二、多项选择题(每题2分,共20分)

1、ACD

2、ACDE

3、BC

4、ABCDE

5、ADE

6、ABD

7、CD

8、AC

9、ABC10、ACE

三、判断题(每题1分,共10分)

1、×

2、√

3、√

4、√

5、√

6、×

7、√

8、√

9、√10、×

四、填空题(每空2分,共18分)

1、99

2、16

3、定类尺度

4、0

5、机械抽样或系统抽样或等距抽样

6、A

7、 27.5

8、838.5

9、30

五、计算题(共37分,其中第1小题9分,第2小题10分,第3小题10分,第4小题8分)

①全厂平均工资指数=

%

75

.

118

24

.

693

20

.

823

680

471400

685

563890

1

1

1

=

=

=

f

f

x

f

f x

(可变构成指数)(3分)

由于全厂平均工资上升而增加的平均工资额=823.20―693.24=129.96(元)

②全厂工资水平指数=

%

92

.

106

94

.

769

20

.

823

685

527410

685

563890

1

1

1

1

1

=

=

=

f

f

x

f

f

x

(结构固定指数)(2分)

由于各级别工资水平上升而增加的平均工资额=823.20―769.94=53.26(元)(1分)

工人人数结构指数=

%

06

.

111

24

.

693

94

.

769

680

471400

685

527410

1

1

=

=

=

f

f

x

f

f

x

(结构变动影响指数)(2分)

由于工人人数结构变化而增加的平均工资额=769.94-693.24=76.70(元)(1分)

2、(1)500=n ,

35.0500175

==

p (2分),由于z=1.96,

抽样平均误差为%13.2)

1(=-=

n

p p p μ(2分) 抽样极限误差0213.096.1?==?p p z μ=0.042(2分)

,经计算得概率保证程度为95%时,观众喜欢这一专题节目的置信区间为[30.8%,39.2%]。(1分)

(2)若极限误差不超过5.5%,则z=

58.2%

13.2%

5.5==

?p

p

μ,

(2分)F(z)=0.99。(1分) 3、

产品合格率区间估计某市某产品连续四年各季度的出口额资料及季节比率计算表

第二季度的季节指数为13.54%(2分) 第三季度的季节指数为30.51%(2分) 第四季度的季节指数为254.25%(2分)

从上表中可以看出,该市该产品的出口额变动呈现出比较明显的季节波动。在一年当中,第一季度和第四季度是出口旺季,特别是第四季度达到全年最高点,季节指数为254.25%,第二季度和第三季度是出口淡季,第二季度是全年最低点,季节指数为13.54%。企业应根据该产品的出口季节变动组织生产,特别是要注意为第一季度和第四季度的出口准备好货源。(2分)

4、乙班平均成绩4.7750

5

9512852575665255=?+?+?+?+?=

x (2分) 乙班成绩的标准差

=50

5)4.7795(12)4.7785(25)4.7775(6)4.7765(2)4.7755(22222?-+?-+?-+?-+?-=9.29。

(1分)

乙班成绩的标准差标准差系数为12.04.7728

.9==

乙ν(2分) 甲班成绩的标准差标准差系数为1286.070

9

==甲ν(1分),因为0.1286>0.12,所以乙班的平均成绩更有代表性(2分)。

统计学期末考试试题和答案解析

统计学期末综合测试 一、单项选择题(每小题1分,共20分) 1、社会经济统计的数量特点表现在它是( )。 A 一种纯数量的研究 B 从事物量的研究开始来认识事物的质 C 从定性认识开始以定量认识为最终目的 D 在质与量的联系中,观察并研究社会经济现象的数量方面 2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应是( )。 A 00p q B 11p q C 01p q D 10p q 3、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。 A 均值 B 中位数 C 众数 D 四分位数 4、某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度( )。 A 乡村较大 B 城市较大 C 城市和乡村一样 D 不能比较 5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年1月超额完成计划3%,2月刚好完成计划,3月超额完成12%,则该厂该年一季度超额完成计划( )。 A 3% B 4% C 5% D 无法计算 6、基期甲、乙两组工人的平均日产量分别为70件和50件,若报告期两组工人的平均日产量不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。 A 上升 B 下降 C 不变 D 可能上升也可能下降

7、同一数量货币,报告期只能购买基期商品量的90%,是因为物价( )。 A 上涨10.0% B 上涨11.1% C 下跌11.1% D 下跌10.0% 8、为消除季节变动的影响而计算的发展速度指标为( )。 A 环比发展速度 B 年距发展速度 C 定基发展速度 D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )。 A 简单随机抽样的误差公式 B 分层抽样的误差公式 C 等距抽样的误差公式 D 整群抽样的误差公式 10、我国统计调查方法体系改革的目标模式是以( )为主体。 A 抽样调查 B 普查 C 统计报表 D 重点调查 11、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为100 的样本,则可采用( )。 A Z 检验法 B t 检验法 C 2χ检验法 D F 检验法 12、要通过移动平均法消除季节变动得到趋势值,则移动平均项数( )。 A 应选择奇数 B 应和季节周期长度一致 C 应选择偶数 D 可取4或12 13、回归估计标准差的值越小,说明( )。 A 平均数的代表性越好 B 平均数的代表性越差 C 回归方程的代表性越好 D 回归方程的代表性越差 14、某企业最近几批同种产品的合格率分别为90%、95.5%、96%,为了对下一批产品的合格率 进行抽样检验,确定抽样数目时P 应选( )。 A 90% B 95.5% C 96% D 3 % 96%5.95%90++ 15、假设检验中,第二类错误的概率β表示( )。 A 0H 为真时拒绝0H 的概率 B 0H 为真时接受0H 的概率

统计学期末考试题(含答案)

交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 1、怎样理解统计的三种含义 答:统计包含统计工作、统计资料和统计学三个方面的含义。一是统计工作,即统计实践,是对社会经济现象客观存在的现实数量方面进行搜集、整理和分析预测等活动的总称。二是统计资料(统计信息):统计工作过程中所取得的各项数字资料和与之相关的其他实际资料的总称。三是统计学,是系统论述统计理论和方法的科学,是长期统计工作实践的经验总结和理论概括。

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

应用统计学期末练习题+答案

班级: 课程名称: 应用统计学 一、单选题 1.统计指标按其计量单位不同可分为( A ) A、实物指示和价值指标 B、数量指标和质量指标 C、时点指标和时期指标 D、客观指标和主观指标 2.下列中属于比较相对指标的是( D )。 A.女性人口在总人口中的比例B.医生人数在总人口中的比重 C.党团员在总人口中的比例 D.北京人口相当于上海人口的百分比 3.当相关关系的一个变量动时,另一个变量相应地发生变动,但这种变动是不均等的,这称为( C )。 A、线性相关 B、直线相关 C、非线性相关 D、非完全相关 4.数量指标指数和质量指标指数,是按其( C )不同的划分的。 A.反映对象范围的 B.对比的基期的 C.所表明的经济指标性质的 D.同度量因素的 5.平均发展速度的计算方法有( D ) A、简单算术平均数 B、加权算术平均数 C、调和平均数 D、几何平均法 E、方程法 6.某地区生活品零售价格上涨6%,生活品销售量增长8%,那么生活品销售额是( D )。 A.下降114.48% B.下降14.48% C.增长114.48% D.增长14.48% 7.2000年北京市三次产业比重分别是3.7%、38.0%和58.3%,这些指标是( D ) A、动态相对指标 B、强度相对指标 C、平均指标 D、结构相对指标 8.能形成连续变量数列的数量标志有( B ) A、企业的从业人员数量 B、企业的生产设备台数 C、企业的工业增加值 D、企业从业人员工资总额 E、企业的利税总额 9.对某市100个工业企业全部职工的工资状况进行调查,则总体单位是( B )。 A.每个企业 B.每个职工 C.每个企业的工资总额 D.每个职工的工资水平 10.抽样估计就是根据样本指标数值对总体指标数值做出( B )。 A、直接计算 B、估计和推断 C、最终结论 D、一定替代 11.对比分析不同水平的变量数列之间标志变异程度,应使用( D )。 A.全距B.平均差 C.标准差 D.变异系数 12.两个变量之间的变化方向相反,一个上升而另一个是下降,或者一个下降而另一个是上升,这是 ( B )。

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学期末试题

一、单项选择题: 1、下列哪个指标不属于数量指标?( D )不确定,看看别人的 A、出生人口数 B、人口密度 C、职工人数 D、工资总额 2、某同学的“身高”属于( A )。不确定,看看别人的 A、数量指标 B、质量指标 C、数量标志 D、品质标志 3、“民族成份”属于( A )。 A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 4、某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应当选择( D )。 A、统计报表 B、重点调查 C、典型调查 D、抽样调查 5、下列哪种现象适用于一次性调查?( A ) A、商店的商品库存量 B、婴儿出生数 C、工业总产值 D、货物运输量 6、下边哪种情况下,平均数x、中位数Me、众数M0满足?( B ) A、对称分布 B、正偏分布 C、负偏分布 D、任意分布 7、0-1分布的均值x和标准差σ分别为( B )。 A、 B、C、pqx D、qp 8、两个总体的平均数不等,但标准差相等,则( A )。 A、平均数小,代表性小 B、平均数大,代表性小 C、无法判断 D、两平均数代表性相同 9、综合指数0010q pqp变形为加权算术平均指数时,其权数应是( A )。 A、p0q0 B、p0q1 C、p1q0 D、p1q1 10、下列属于时点指标的是( C )。 A、国内生产总值 B、产值 C、商品库存量 D、出口额 11、发展速度与增长速度的关系是( B )。 A、环比增长速度=定基发展速度-1 B、定基增长速度=定基发展速度-1 C、定基增长速度的连乘积等于定基发展速度 D、环比增长速度的连乘积等于环比发展速度 12、下列属于季节变动的测定方法的是( D )。 A、时距扩大法 B、移动平均法 C、趋势模型法 D、同期平均法 13、某地2001年的工业总产值比1998年增长87.5%,2000年比1998年增长50%,那么,2001年比2000年增长( D )。 A、37.5% B、125% C、115% D、25% C、没有相关关系 D、没有线性相关关系 14、按照“先对比,后平均”的思路编制的总指数是( B )。 A、综合指数 B、平均指数 C、可变构成指数 D、结构影响指数 15、相关系数r=0,表明变量X与Y 之间( D )。 A、完全线性相关 B、线性函数关系 二、多项选择题: 16、统计学的研究对象具有的特点是( ABC )。 A、数量性 B、总体性 C、变异性 D、确定性 E、科学性 17、统计研究的基本方法主要有( ABCD ) A、实验设计 B、大量观察 C、统计描述 D、统计推断 E、个案描述

统计学期末考试试题(含答案)..

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量 A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是填报 单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错) 5、区间估计就是直接用样本统计量代表总体参数。(错) 6、在假设检验中,方差已知的正态总体均值的检验要计算Z统计量。(错)

统计学期末考试复习题

计算题 1.甲、乙两种不同水稻品种,分别在5个田块上试种,其中乙品种平均亩产量是1098公斤,标准差是182公斤。甲品种产量情况如下: 甲品种 要求:(1)以亩产量1000斤及以上为一等,计算甲品种一等品率分布的标准差。(2)以亩产量的稳定性确定哪一品种更有推广价值? 答案:p=3.9/5=0.78 % 58.16%58.1290.14411524142 .0)1(=====-=乙甲甲甲,,,v v x p p σσ 1、已知甲、乙两个班级,乙班学生《统计学》考试平均成绩为76.50分,标准差为10.30分,而甲的成绩如下所示: 甲班 ━━━━━┯━━━━━ 分 数 │ 人 数 ─────┼───── 50以下 │ 5 50─60 │ 7 60─70 │ 8 70─80 │ 20 80─90 │ 14 90以上 │ 6 ━━━━━┷━━━━━ 要求:计算有关指标比较两个班级学生平均成绩的代表性。(计算结果保留2位小

数) 1、已知甲厂职工工资资料如下: 又已知乙厂职工的月平均工资为600元,标准差为120元,试比较甲乙两厂职工 月平均工资的代表性大小。 1.现已知甲企业在2007年前10个月的月平均产值为400万元,标准差为16 请计算乙企业的月平均产值及标准差,并根据产值比较2007年前10个月甲乙 两企业的生产稳定性。 1.某企业三个车间生产同种产品,1995年上半年有关生产资料如下: 要求:(1)计算该企业产品计划完成率; (2)计算该企业产品的实际优质品率。 1.若已知甲、乙两企业1980年的产值分别为300万元和500万元,1994年的产 值分别为800万元和1500万元。要求: (1)分别计算甲、乙两个企业的平均发展速度; (2)若按各自的发展速度,甲企业从1994年起还需几年才能达到乙企业1994 年的产值水平;

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学原理期末复习题及答案

《统计学原理》期末复习题 一、单项选择题部分(每题2分,共计20分) 1.1.社会经济统计的研究对象是(C )。 A、抽象的数量特征和数量关系 B、社会经济现象的规律性 C、社会经济现象的数量特征和数量关系 D、社会经济统计认识过程的规律和方法 1.2.几位学生的某门课程成绩分别为67分、78分、88分、89分、96分,这些分数是(C )。 A、总体单位 B、数量标志 C、标志值 D、变异 1.3.对某城市工业企业未安装设备进行普查,总体单位是(B )。 A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 1.4.标志是说明总体单位特征的名称(C )。 A、它有品质标志值和数量标志值两类 B、品质标志具有标志值 C、数量标志具有标志值 D、品质标志和数量标志都具有标志值 1.5.工业企业的设备台数、产品产值是(D )。 A、连续变量 B、前者是连续变量,后者是离散变量 C.离散变量D、前者是离散变量,后者是连续变量 1.6.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,"学生成绩"是(B )。 A、品质标志 B、数量标志 C、标志值 D、数量指标 1.7.在全国人口普查中(B )。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 1.8.下列指标中属于质量指标的是(B )。 A、社会总产值 B、产品合格率 C、产品总成本 D、人口总数 2.1.连续调查与不连续调查的划分依据是(B )。 A、调查的组织形式不同 B、调查登记的时间是否连续 C、调查单位包括的范围是否全面 D、调查资料的来源不同 2.2.调查几个重要铁路枢纽,就可以了解我国铁路货运量的基本情况和问题,这种调查属于(B )。 A、普查 B、重点调查 C、典型调查 D、抽样调查 2.3. 为了解某工厂职工家庭收支情况,按该厂职工名册依次每50人抽取1人,对其家庭进行调查,这种调查属于(B )。 A、简单随机抽样 B、等距抽样 C、类型抽样 D、整群抽样 2.4.下列调查中,调查单位与填报单位一致的是(D )。 A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查 2.5.在对现象进行分析的基础上,有意识地选择若干具有代表性的单位进行调查研究,是(B )。 A、抽样调查 B、典型调查 C、重点调查 D、普查 2.6.下述各项调查中属于全面调查的是(B )。 A、对某连续生产的产品质量进行检验 B、某地区对工业企业设备进行普查 C、对钢铁生产中的重点单位进行调查 D、抽选部分地块进行农产量调查 2.7.抽样调查和重点调查都是非全面调查,二者的根本区别在于(D )。 A、灵活程度不同 B、组织方式不同 C、作用不同 D、选取单位方式不同 3.1.在组距分组时,对于连续型变量,相邻两组的组限(A )。 A、必须是重叠的B、必须是间断的C、可以是重叠的,也可以是间断的D、必须取整数 3.2.下列分组中属于按品质标志分组的是(B )。 A、学生按考试分数分组B、产品按品种分组C、企业按计划完成程度分组D、家庭按年收入分组 3.3.简单分组和复合分组的区别在于(B )。 A、选择的分组标志的性质不同B、选择的分组标志多少不同 C、组数的多少不同D、组距的大小不同答案: 3.4、品质分组和变量分组的区别在于(A )。 A、选择分组标志的性质不同 B、选择分组标志的多少不同 C、组数的多少不同 D、组距的大小不同 4.1.反映社会经济现象发展总规模、总水平的综合指标是(B )。 A、质量指标 B、总量指标 C、相对指标 D、平均指标 4.2.总量指标按反映时间状况的不同,分为(B )。 A、数量指标和质量指标 B、时期指标和时点指标 C、总体单位总量和总体标志总量 D、实物指标和价值指标

统计学期末考试试题库和答案解析

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。()

三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备 4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。

统计学期末复习计算题分解

第四章 统计特征值 1.某车间工人日生产零件分组资料如下: (2)说明该数列的分布特征。 解: ()()()() ) (71.6571.56010 5080408060111个=+=?-+-+=?-+-+ =+--i f f f f L M o ) (65560108060 22006021个=+=?-+=?-+=-i f S N L M m m e )(5.6420012900 个== =∑∑f xf x 因为o e <M <M x ,所以,该数据分布属于左偏分布。

2.某公司所属三个企业生产同种产品,2002年实际产量、计划完成情况及产品优质品率资料如下: (2)该公司实际的优质品率。 解:(1)产量计划完成百分比: %95.9320.5325008 .02501.11502.1100250150100==++++==∑∑x m m x (2)实际优质品率: % 8.96500484 25015010098.025096.015095.0100==++?+?+?= = ∑∑f xf x 3.某企业2003年一、二季度生产某产品产量资料如下: (2)由于质量变化而给该企业带来的收益(或损失)。

解:(1)平均等级: ) (22.150******** 3100275011 1 1 级=++?+?+?= = ∑∑f xf x ) (5.1100300600100 3300260012 2 2 级=++?+?+?= = ∑∑f xf x 二季度比一季度平均等级下降0.28级。 (2)由于质量下降而带来的损失: ) (33.16835010075050 800100125075018001 1 1 元=++?+?+?= = ∑∑f pf p ) (1535100300600100 800300125060018002 2 2 元=++?+?+?= = ∑∑f pf p () ())(148330 100033.168315352 12 元-=?-=?-∑f p p 由于产品质量下降而损失148330元。 4.某区两个菜场有关销售资料如下: 解: )(82.2200556505 .315008.219505.22200150019502200元==++++==∑∑x m m x 甲 )(98.257.221366005 .330008.219505.21650300019501650元==++++== ∑∑x m m x 乙 乙菜场比甲菜场平均价格高0.16元,理由是销售量结构变动影响。

统计学课后习题参考问题详解

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

统计学原理期末复习题及答案

期末复习题(答案仅供参考) 一、判断题(把正确的符号“V”或错误的符号“X”填写在题后的括号中。) 1. 社会经济统计的研究对象是社会经济现象总体的各个方面。(X) 2. 在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。(X) 3. 总体单位是标志的承担者,标志是依附于单位的。(V ) 4. 在全国工业普查中,全国工业企业数是统计总体,每个工业企业是总体单位。(X) 5. 全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的(X)。 6. 调查单位和填报单位在任何情况下都不可能一致。(X) 7. 对全同各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。(V) 8. 统计分组的关键问题是确定组距和组数(V) 9. 总体单位总量和总体标志总量是固定不变的,不能互相变换。(X) 10. 相对指标都是用无名数形式表现出来的。() 11. 国民收入中积累额与消费额之比为1: 3,这是一个比较相对指标。(X) 12. 抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的 会产生误差,这种误差的大小是不能进行控制的。(X) 13. 从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(X) 14. 在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。(X) 15. 抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(V) 16. 在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(X) 17. 施肥量与收获率是正相关关系。(X ) 18. 计算相关系数的两个变量都是随机变量(V) 19. 利用一个回归方程,两个变量可以互相推算(X) 20. 数量指标作为同度量因素,时期一般固定在基期(X)。 Z q1 p1 21. 在单位成本指数——中,'p1p1 —'弋1卩0表示单位成本增减的绝对额(V)。 瓦q1 P o

生物统计学期末复习题

统计选择题 1,由于(1,研究对象本身的性质)造成我们所遇到的各种统计数据的不齐性。 2,研究某一品种小麦株高,因为该品种小麦是个极大的群体,其数量甚至于是个天文数字,该体属于(4,无限总体) 3,从总体中(2,随机抽出)一部分个体称为样本。 4,用随机抽样方法从总体中获得一个样本的过程称为(3,抽样) 5,身高,体重,年龄这一类数据属于(3,连续型数据;1,度量数据) 6,每10个中男性人数,每亩麦田中杂草株数,喷洒农药后每100只害虫中死虫数等,这一类数据属于(1,离散型数据;2,计数数据) 7,把频数按其组值的顺序排列起来,称为(3,频数分布) 8,以组值作为一个边,相应的频数为另一个边,做成的连续矩形图称为(2,直方图)9,绘制(4,多边形图)的方法是在坐标平面内点上各点(中值,频数),以线段连接各点,最高和最低非零频数点与相邻零频数点相连。 10,累积频数图是根据(3,累积频数表)直接绘出的。 11,样本数据总和除以样本含量,称为(算数平均数 12,已知样本平方和为360,样本含量为10,以下4种结果中(2,6.0)是正确的标准差。 13,概率的古典定义是(2,基本事件数与事件总数之比) 14,下面第(2,概率是事物所固有的特性) 15,对于事件A和B,P(A∪B)等于(2,P(AB)) 16,对于事件A和事件B,P(A|B)等于(P(AB)/P(B)) 17,对于任意事件A和B,P(AB)等于(P(B)P(B|A)) 18,下述(3随机试验中所输入的变量)项称为随机变量 19,关于连续型随机变量,有以下4种提法,其中(1,可取某一区间内的任何数值)20,总体平均数可以用以下4种符号中的一种表示,它是(2,μ) 21,样本标准差可以用以下4种符号中的一种表示,它是(1,s) 22,在养鱼场中,A鱼塘的面积占10%,A鱼塘中鱼的发病率为1%,问从养鱼场中任意捕捞一条鱼,它既是A鱼塘,又是生病的鱼的概率是(4,0.003) 23,以下4点是描述连续型随机变量特征的,其中(2,f(x)=lim △x→0P(x

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

统计学思考题

第一章导论 1、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。按照统计数据 的收集方法,可以将其分为观测数据和实验数据。按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。顺序数据是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。现实中处理的大多数都是数值型数据。 2、解释分类数据、顺序数据和数值数据的意义。 对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合 样本:是从总体中抽出的一部分元素的集合。如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。 参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。在统计中,总体参数通常用希腊字母表示,如,总体平均数用u(miu)表示,总体标准差用(sigma)表示,总体比例用(pai)表示,等。 统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。样本统计量通常用英文字母来表示。如,样本平均数用(x-bar)表示,样本标准车用s表示,样本比例用p表示,等。 变量:是说明现象某种特征的概念。如,商品销售额,受教育程度,产品的质量等级等。 4、变量可分为哪几类? 变量可以分为分类变量、顺序变量、数值型变量,数值型变量根据其取值的不同,又可分为离散型变量和连续型变量。分类变量是说明事物类别的一个名称,顺序变量是说明事物有序类别的一个名称,数值型变量是说明事物数字特征的一个名称。 5、举例说明离散型变量和连续性变量。 离散型变量是只能取可数值的变量,只能取有限个值,而且其取值都以整位数断开,可以一一列举,如,企业量,产品数量;连续型变量是可以在一个或多个区间中取任何值的变量。它的取值是连续不断的,不 能一一列举,如,年龄,温度,零件尺寸的误差等。 第二章数据的搜集 1、比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样也称随机抽样,是指遵守随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。它具有以下几个特点:首先,抽样时是按一定的概率以随机抽样原则抽取样本;其次,每个单位被抽中的概率是已知的,或是可以计算出来的;最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。 非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。 如果调查的目的在于掌握研究对象总体的数量特征,根据调查的结果对总体参数进行评估,得到总体参数的置信区间,就应当采用概率抽样的方法。非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做好准备。非抽样调查也适合市场调查中概念测试,如产品包装测试、广告测试等。第三章数据的图表表示 1、分类数据和顺序数据的整理和图示方法各有那些? 分类数据的整理方法有频数和频数分布,图示方法有条形图、帕累托图、饼图、环形图;顺序数据的整理方法有累积频数和累积频率,图示方法有累积频数分布和频率图。 2、数值型数据的分组方法有哪些?简述组距分组的步骤。 数据分组的方法有单变量值分组和组距分组。 组距分组的步骤:(1)确定组数,一般数据所分组数不应少于5组且不多于15组;(2)确定各组的组距,组距=(最大值-最小值)/组数,组距宜取5或10的倍数;(3)确定上下限,第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。 3、直方图与条形图有何区别? 直方图与条形图不同。首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是 分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章数据的概括性变量 1、一组数据的分布特征可以从那几个方面进行测度? 一组数据的分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2、对于比率数据的平均为什么采用几何平均? 3、简述众数、中位数、和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜采用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。 平均数是针对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等时,这时则应选择平均数作为集中趋势的测度值。但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。 4、为什么要计算离散系数? 方差和标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平低的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。 离散系数也成为变异系数,它是一组数据的标准差与其相应的平均数之比,其计算公式为:v s=s/(x-bar),离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说 明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 第五章参数估计 1、怎样理解置信区间? 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限,由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。 2、解释95%的置信区间 如果抽取了许多不同的样本,比如说抽取了100个样本,根据每一个样本构造一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含,则95%这个值称为置信水平。一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例成为置信水平,也称为置信度或置信系数。 第六章假设检验 1、什么是假设检验中的显著性水平?统计显著是什么意思? 通常把(a-er-fa)称为显著性水平,显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05或0.01. 2、什么是假设检验中的两类错误? 对于原假设提出的命题,我们需要做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述。当然,这是依据样本提供的信息进行判断的,也就是由部分来推断,总体。因而判断有可能正确,也有可能错误,也就是说,我们面临着犯错误的可能。所犯的错误有两种类型,第一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用(a-er-fa)表示所以成为其真错误;第二类错误是原假设为伪我们却没有拒绝,犯这类错误的概率用(bei-ta)表示,所以成为取伪错误。 3、解释假设检验中的P值。 P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由就越充分。 第七章方差分析 1、什么是方差分析?它研究的是什么? 方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型隐变量是否有显著影响。 方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响。 2、简述方差分析的基本思想。 为了研究分类型自变量对对数值型因变量的影响,需要从对数据误差来源的分析入手,误差主要分为组内误差和组间误差,组内误差只包含随机误差,而组间误差除了包含随机误差,还会包含系统误差。3、解释组内误差和组间误差的含义。 组内误差(SSE):反映组内误差大小的平方和,也称为残差平方和,是由于抽样的随机性所造成的随机误差。它反映了每个样本内各观测值之间的离散状况。 组间误差(SSA):反映组间误差大小的平方和,也称为因素平方和,是随机误差和系统误差的总和。它反映了样本均值之间的差异程度。 4、解释则内方差和组间方差的含义。 组间误差和组内误差经过平均后的数值称为均方或方差。 组间方差(MSA)=组间平方和/自由度(SSA/k-1) 组内误差(MSE)=组内平方和/自由度(SSE/n-k) 5、简述方差分析的基本步骤。 1、提出假设; 2、构造检验的统计量;(1)计算各样本的均值(2)计算全部观测值的总均值(3)计算各误差平方和(4)计算统计量 3、统计决策; 4、方差分析表; 5、用Excel进行方差分析。 第八章一元线性回归 1、解释相关关系的含义,说明相关系的特点。 相关关系1)变量间关系不能用函数关系精确表达;2)一个变量的取值不能由另一个变量唯一确定;3)当变量x 取某个值时,变量y 的取值可能有几个。 2、相关分析主要解决那些问题? 相关分析就是对两个变量之间线性关系的描述和度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本之间的变量关系是否能代表总体变量之间的关系? 3、解释回归模型、回归方程、估计的回归方程的含义。 回归模型:描述因变量y如何依赖于自变量x和误差项ε的方程。 回归方程:描述因变量y的期望值如何依赖于自变量x的方程。 估计的回归方程:根据样本数据求出的回归方程的估计。 4、解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的联系。 总平方和(SST):是全部观测值Xij与总均值x-两bar的误差平方和。 残差平方和(SSE):反映组内误差大小的平方和。 回归平方和(SSR):反映了y的总变差中由于x与y之间的线性关系引起的y的变化部分。 SST=SSR+SSE 5、解释判定系数(R2)的含义和作用。 含义:判定系数是对估计的回归方程拟合优度的度量。判定系数等于相关系数的平方,即r2=(r)2 作用:反映回归直线的拟合程度;R2越接近1,说明回归方程拟合的越好;R2越接近0,说明回归方程拟合的越差。 6、在回归分析中,F检验和t检验各有什么作用? F检验是检验自变量和因变量之间的线性关系是否显著,或者说,它们之间能否用一个线性模型y= 来表示。 t检验的显著性检验是要检验自变量对因变量的影响是否显著。在一元线性回归模型y= 中,如果白塔1=0,则回归线是一条水平线,表面因变量y的取值不依赖与自变量x,即两个变量之间没有线性关系。 7、简述线性关系检验和回归系数检验的具体步骤。 线性关系检验:1、提出假设,H0:回归系数等于0,两个变量之间的线性关系不显著;2、计算检验统计量F=(SSR/1)/(SSE/(n-2));3、做出决策,根据显著性水平,分子自由度和分母自由度查F分布表,找到相应的临界值,比较与F的大小,判断是否拒绝原假设 回归系数检验:1、提出检验;2、计算检验统计量t;3、做出决策

相关主题
文本预览
相关文档 最新文档