当前位置:文档之家› 统计学原理与实务 徐静霞

统计学原理与实务 徐静霞

统计学原理与实务 徐静霞
统计学原理与实务 徐静霞

思考与练习 一、思考题

1、 分类数据的图示方法,其中包括条形图、Pareto 图、对比条形图和饼图等。顺序数据除

了上文提到的条形图、pareto 图、对比条形图、饼图之外还可以借助累积频数分布图和环形图来进行描述。

2、 条形图、饼图、环形图、累积分布图、直方图、茎叶图、箱形图、散点图、线图、三维

散点图、气泡图、雷达图等。

3、 数据分组按照分组标志的不同可以分为单变量值分组和组距分组两种。根据组距不同还

可以分为等距分组和不等距分组。

4、 分组和编制频数分布表的具体步骤如下:

第1步:排序。将变量按照一定的大小顺序进行排序,通常是由小至大的递增顺序,使用计算机软件进行整理时此步可以忽略。

第2步:确定组数。一般与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。一般情况下,一组数据所分的组数 K 不应少于 5组且不多于 15组,即 5< K <15。在实际分组时,也可以借助经验公式来确定组数K ,

2

lg lg 1n

K +

= 其中n 为数据的个数,对结果四舍五入取整数即为组数。

第3步:确定各组的组距。在组距分组中,一个组的最小值称为下限(low limit );一个组的最大值称为上限(upper limit ),组距(class width )是一个组的上限与下限的差。

组距可根据全部数据的最大值和最小值及所分的组数来确定,即,

组距=(最大值—最小值)/组数 。

5、 饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或

总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示。饼图只能显示一个总体和样本各部分所占的比例,而环形图则可以同时绘制多个总体或样本的数据系列,每一个总体或样本的数据系列为一个环。因此环形图可显示多个总体或样本各部分所占的相应比例,从而有利于进行比较研究。

6、 直方图与条形图是不同的,首先,条形图是用条形的长度(横置时)表示各类别频数的

多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 7、 茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给

出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用

于小批量数据。

8、统计图一般由下面几个部分构成:(1)标题,即图的名称,简明扼要说明资料的中心内

容,必要时注明时间和地点,一般写在图的正下方位置,同时将图形的编号写在标题的前面。(2)标目,分为纵标目与横标目,分别表示纵轴与横轴数字刻度的意义,一般注明度量衡单位。(3)点线条面,借以用来显示数据的元素,这是图形的主体部分,用于显示数据和展示数据的规律和关系。(4)刻度,指在纵轴或横轴上的坐标。(5)图例,其目的是为了使读者能区分统计图中各种图形的意义。

9、一般用“图优性(Graphical excellency)”来描述一个好的统计图。“图优性”是指图形能

够在最短的时间内,用最少的笔墨,在最小的空间里,给观众最多的思想。一张好的图形应包括如下基本特性:显示数据,集中反映图形的内容,避免歪曲,数据之间可进行有效比较,目的明确且唯一,统计描述和文字说明清晰。

10、常见的统计表一般由4个主要部分组成,即表头、行标题、列标题和数据,此外,

必要时可以在统计表的下方加上表外附加说明。

11、在具体编制统计表时,应当遵循以下几点规则:

(1)统计表的结构要合理,内容要简练,形式要美观。比如行标题、列标题、数字资料的位置应安排合理。如果有合计一项,一般放在最后一行或最后一列。有时,由于强调的问题不同,行标题和列标题可以互换,但应使统计表的横竖长度比例适当,避免出现过高或过长的表格形式。

(2)统计表一般使用“三线表”的形式,如表3—24所示,表的上下两端横线一般用粗线条绘制,用细线把行标题和数字资料进行分离,统计表的左右两端不封口。这样使人看起来清楚、醒目、美观。如果数据关系复杂,单靠三条线是不够的,在这种情况下,数据资料也可用横线或竖线对数据资料进行分开,以表明数据的隶属关系,但必须用细线,总之表中尽量少用横竖线。

(3)表头一般应包括表号、总标题和表中数据的单位等内容。总标题应简明确切地概括出统计表的内容,一般需要表明统计数据的时间(When)、地点(Where)以及何种数据(What),即标题内容应满足3W要求。如果表中的全部数据都是同一计量单位,可放在表的右上角标明,若各变量的计量单位不同,则应放在每个变量后或单列出一列标明。

(4)表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一。当数字因小可略而不计时,可写上“0”;当缺某项数字资料时,可用符号“…”表示;不应有数字时用符号“一”表示,一张填好的统计表不应出现空白单元格。

(5)在绘制统计表时,为保证统计资料的科学性与严肃性,在统计表下,应注明资料来源,以表明表中数据的可靠性,或是方便读者查阅使用。必要时,也可在统计表下添加注解,以对变量或数据进行必要的解释和文字说明。

二、单项选择题

1-5 C A C C D6-10 C B B B C11-15C D D B C

16-20C D D B B 21-25BB B C B 26-30A C A B D

三、练习题

1、(1)属于顺序数据

(4)

2、

(1)

(2)正态分布 3、 (1)

接收

频率 累积 % 接收 频率 累积 % 49 5 10.00 79 15 30.00 59 5 20.00 89 11 52.00 69 10 40.00 69 10 72.00 79 15 70.00 49 5 82.00 89 11 92.00 59 5 92.00 99 4 100.00 99 4 100.00 合计

0 - 合计 0 -

(2)

(3)

VAR00001 Stem-and-Leaf Plot Frequency Stem & Leaf

2468101214161820优

及格

不及格

甲班乙班

2.00 4 . 13

3.00 4 . 667 3.00 5 . 003 2.00 5 . 89 5.00 6 . 01144 5.00 6 . 57799 7.00 7 . 0001344 8.00 7 . 55666788 6.00 8 . 011344 5.00 8 . 57789 3.00 9 . 022 1.00 9 . 7

Stem width: 10.00 Each leaf: 1 case(s)

4、

(2)

(3)

接收

频率% 累积 % 接收 频率 累积 % 69 4 4.00 99 11 22.00% 79 12 16.00 109 9 40.00% 89 16 32.00 89 8 56.00% 99 18 54.00 119 7 70.00% 109 16 72.00 79 6 82.00% 119 14 86.00 129 4 90.00% 129 8 94.00 69 2 94.00% 149

2

100.00 其他

1 100.00%

100

——

VAR

000 04 Stem-and-Leaf Plot

Frequency Stem & Leaf

2.00 6 . 89

6.00 7 . 233566

8.00 8 . 01123456

11.00 9 . 12224556788

9.00 10 . 002466678

7.00 11 . 2355899

4.00 12 . 4678

2.00 13 . 24

1.00 14 . 1

Stem width: 10.00

Each leaf: 1 case(s)

5、

(1)

VAR00003 Stem-and-Leaf Plot

Frequency Stem & Leaf

1.00 11 . 6

2.00 12 . 02

1.00 12 . 8

2.00 13 . 04

2.00 13 . 56

2.00 14 . 22

2.00 14 . 78

.00 15 .

1.00 15 . 5

2.00 16 . 02

1.00 16 . 8

4.00 17 . 0233

Stem width: 100.00

Each leaf: 1 case(s) 6、

(2)

7、(1)、

(2)

8、(1)

(2)

(3)

9、

(1)

接收

频率% 累积 %

接收

频率% 累积 % 29 10 10.00 20-30 5 10.00 39 16 26.00 30-40 8 26.00 49 12 38.00 40-50 6 38.00 59 16 64.00 50-60 13 64.00 69 20 84.00 60-70 10 84.00 79 12 96.00 70-80 6 96.00 89 4 100.00 80-90 2 100.00 合计 100 -

合计 100 -

(2)

(3)

100000

200000

3000004000002006

2007

2008

20092010

国内生产总值全社会固定资产投资社会零售品消费总额

10、(1)

(2)

1000

2000

3000

4000

5000

6000

7000

8000

9000

050100150

降雨量(mm)

降雨量(mm)

11、(1)

(2)

(3)

第四章

二、单项选择题

1-5CADBD 6-10BCBDD 11-15BACCC 16-20BBBCD 21-25CDACC 26-28DAA 三、计算分析题

4.1(1)首先将数据由小到大进行排列,中位数的位置为

72

1

1321=+=+n ,即排在第7位的数值为中位数,即民生银行的营业收入为中位数,=e M 350.17亿元。

平均数()亿元=

809.14621384

.10604.12337.402904.49001

=++++=

∑=Λn

x

x n

i i

(2)25.34

134===

n Q L 的位置 即L Q 在第3个数值(145.13)和第4个数值(176.11)之间0.25的位置上,因此

875.15225.0)13.14511.176(13.145=?-+=L Q (亿元)

5.794

13

343=?==n Q U 的位置

即U Q 在第9个数值(1295.31)和第10个数值(3340.37)之间0.75的位置上,因此

105.282975.0)31.129537.3340(31.1295=?-+=U Q (亿元)

(3)百分位数的位置()()9.313100

3013100===P

i

由于i 不是整数,百分位数的位置就是第1+i 个位置的数据的整数部分,则第30个百分位数是第4个数,即华夏银行的营业收入176.11亿元为第30个百分数。

(4)()

1

1

2

--=

∑=n x x

s n

i i

=1786.559(亿元),()亿元809.1462=x

65.0-599

.1786809

.1462-15.297==-=

s x x z i i 4.2通常情况下,这种比赛对选手的打分是计算切尾均值,即同时集中平均数和中位数两种统计量的优点,且考虑到歌手B 的得分中存在极端高分,故用切尾均值比较合适。

首先将歌手A 的分数按升序整理为顺序统计量,得到

()1x ,()2x ,()3x ,()4x ,()5x ,()6x ,()7x ,()8x ,()9x

7.9, 8.1, 8.2, 8.3, 8.5, 8.6, 8.6, 8.7, 8.9

因为极端高分只有一个,因此去掉一个最高分,去掉一个最低分,取9

1=α。 则歌手A 的最后得分为:

()()()

43

.87

7.82.81.82

99

19298329199291919199

1=+++=

-+++=

?

?-+++=

?

?? ?

?

?-??

? ??

+???

? ??

+?ΛΛΛx x x x x x x

歌手B 的最后得分为:

()()()

37

.87

7.82.81.82

99

19298329199291919199

1=+++=

-+++=

?

?-+++=

?

?? ?

?

?-??

? ??

+???

? ??

+?ΛΛΛx x x x x x x

由以上计算结果,可知歌手A 的分数略高于歌手B 。

4.3若按单利计算:设本金为V ,则该笔本金12年应得的利息总和=V (0.03×3+0.05×1+0.08×2+0.1×3+0.15×1)=0.75V

则平均年利率%5.71075.0==

=

∑∑V

V

f

xf x 若按复利计算:

则平均年利率()()()()()%43.7115.011.0108.0105.0103.01103

2

3

=-+++++=x

4.4已知20000=M (元),1850=e M (元), 则17752

2000

18503230=-?=-=

M M x e (元)

因为0M M x e <<,因此该公司职工月工资收入呈左偏分布。

4.5(1)众数=0M 72和74.3

中位数的位置为

5.152

1

3021=+=+n 则中位数为排序后处于15位和16位的两个数值的平均数,即742

5

.745.73=+=

e M

平均数为82.7330

68

7.698.783.741

=+++=

∑=Λn

x

x n

i i

(2)5.74

304===

n Q L 的位置 即L Q 在第7个数值(71.2)和第8个数值(71.2)之间0.5的位置上,因此

2.715.0)2.712.71(2.71=?-+=L Q (g/L )

5.224

30

343=?==n Q U 的位置

即U Q 在第22个数值(75.8)和第23个数值(75.9)之间0.5的位置上,因此

85.755.0)8.759.75(8.75=?-+=U Q (g/L )

(3)众数72和74.3的频数均为4,故两种情况下异众比率均为

%67.86304

11=-=-

=-=

∑∑∑i

m i m

i

r f f f

f

f V

极差为()()5.15655.80m in m ax =-=-=i i x x R

标准差()

()()91.31

3082.736882.733.741

2

21

2

=--+-=

--=

∑=Λn x x s n

i i

(4)用Excel 求得偏态系数为-0.013,峰态系数为-0.446。

(5)由于众数与平均数非常接近,可知数据分布应较为对称,又由于标准差数值较小,可知数据离散程度应不大。这一点同时可由偏态系数-0.013和峰态系数-0.446得到印证,即女大学生血清总蛋白含量数据属轻微的左偏分布,同时略有扁平。

4.6已知29=x ,4=s ,根据经验法则,有9

5.45%的年份里二氧化硫超标的天数在21~37天之间,有2.275%的年份里超标天数大于37天,有0.00135%的年份里超标天数大于41天,有15.865%的年份里超标天数少于25天。 4.7 22.1623267

433400

==

=

∑∑f

xf x A

(元/人)

25.526267

96

.74056237)

(2

==

-=

∑∑f

f

x x s A (元/人)

%42.3222

.162325

.526==

=

A

A A x s v

∑∑

=?

=1664f

f

x x B (元/人)

17.546298304)(2==?

-=

∑∑

f

f

x x s B (元/人)

%82.321664

17

.546==

=

B

B B x s v

由以上计算可得:(1)B 企业的平均工资高于A 企业的平均工资。(2)由于A B v v >,所以A 企业的平均工资更具有代表性。

4.8(1)2008年粗钢产量的平均数37.901

=∑=n

x

x n

i i

(百万吨)

2008年粗钢产量的中位数的位置为

5.62

1

1221=+=+n ,故中位数7.492

6

.538.45=+=

e M (百万吨)

(2)2009年粗钢产量的四分位数为

34

124===

n Q L 的位置 即L Q 为第3个数值,即3.25=L Q (百万吨)

94

12343=?==

n Q U 的位置 即U Q 为第9个数值,即60=U Q (百万吨)

则2009年粗钢产量的四分位差为7.343.2560=-=-=L U d Q Q Q (百万吨)

2009年粗钢产量的平均数25.861

=∑=n

x

x n

i i

(百万吨)

因此2009年粗钢产量的标准差为

()

()()16.1531

1225.869.1525.868.5671

2

21

2

=--+-=

--=

∑=Λn x

x

s n

i i

(百万吨)

(3)2008年粗钢产量的标准差为

()

()()23.1321

1237.909.1937.903.5001

2

21

2

=--+-=

--=

∑=Λn x

x

s n

i i

(百万吨)

因此2008年中国、印度、俄罗斯和巴西的z 值分别为:

1.323.13237

.90-3.500==

-=

s x x z 中国中国

25.023.13237

.90-8.57-==

-=

s

x x z 印度印度

17.023

.13237

.90-5.68-==

-=

s x

x z 俄罗斯俄罗斯

43.023

.13237

.90-7.33-==

-=

s

x x z 巴西巴西

2009年中国、印度、俄罗斯和巴西的z 值分别为:

14.316.15325

.86-8.567==

-=

s x x z 中国中国

15.0-16.15325

.86-8.62==

-=

s

x x z 印度印度

-0.1716

.15325

.86-60==

-=

s x

x z 俄罗斯俄罗斯

-0.3916

.15325

.86-5.26==

-=

s

x x z 巴西巴西

由以上计算结果可知,中国、俄罗斯、巴西三国的标准分数变数不大,而印度则有明显提高,因此印度粗钢产量的排名也由2008年的第5位上升到2009年的第3位。

4.9(1)由20-30岁年龄组的分数计算离散系数为%73.22110

25

1

11==

=

x s v 由60-64岁年龄组的分数计算离散系数为%78.2790

25

2

22==

=x s v 因此,60-64岁年龄组的分数差异较大。

(2)由于20-30岁年龄组的WAIS 分数大致是正态分布,根据经验法则,可知20-30

岁年龄组中有68.27%的人分数在85~135之间。

(3)由于60-64岁年龄组的WAIS 分数大致是正态分布,根据经验法则,可知60-64岁年龄组中有68.27%的人分数在65~115之间。

(4)莎拉的标准分为125

110

-13511==-=

s x x z 母亲的标准分为2.125

90-12022==-=

s x x z 由计算结果可知,莎拉的母亲在60-64年龄组中分数比较高。

4.10()

()()

064.05

.19043027744

.1216550028.10815067.6803

5

1

331

3

-=-=

?-=

-=

∑∑==i i

i

k

i i

i

f M

ns f x M

SK

()

()

748.0328.1081501464325660034

4

1

4

-=-?=

--=

∑=ns f x M

K k

i i

i

(2)最省油自动挡SUV 耗油量的平均数和标准差分别为

32.820

1.109.95.53.51=+++=∑=Λn x x n

i i =自 ()

59.11

1

2

=--=

∑=n x

x

s n

i i

(3)最省油手动挡SUV 耗油量的平均数和标准差分别为

615.720

2.81.88.6

3.61=+++=∑=Λn x x n

i i =手 ()

53.01

1

2

=--=

∑=n x x s n

i i

因此%11.1932.859.1===

自自

自x s v %96.6615.753

.0===手

手手x s v 由以上结果可知,自动挡SUV 耗油量的离散程度较大。

(4)平均来看,自动挡SUV 的耗油量要高于手动挡,且离散程度较大,如果购买一款SUV ,从经济省油的角度考虑,选择手动挡较合适。

第五章

二.单项选择题:

1-5 BCDAA 6-10 DDBBD 11-15 BBDBD 16-20 AABAC 21-25 DBCAB 26-30 ACDBA 三计算分析题 1、

解:(1)根据原始数据,计算可得:

4340==

∑∑f

xf x (小时);()

1

1

2

--=

∑=n x

x

s n

i i

=735(小时);

则其68.27%的置信区间为:

]5.4413~5.4266[10

735

143402

=?±=±n

s z x α

(2)%9810098?==p ,n=100, 12

=αz ,则其

68.27%的置信区间为:

]994.0~966.0[100

)

98.01(98.0198.0)?1(??2=-?±=-±n p p z p

α 2、解:(1)24.5=x ,71.22

=s ,n=100, 2=αz

]57.5~91.4[100

71

.2224.52

=?

±=±n

s z x α (2)已知:%70?=p ,n=100, 22=αz ,则其

95.45%的置信区间为:

]61.0,79.0[100

)7.01(7.027.0)?1(??=-?±=-±n p p z p

α

3、解:(1)已知:n=20, 1500=x ,150=s ,142.2)19(2

t

由方差未知时,小样本的区间估计公式得:

]85.1571~15.1428[20

150142.21500=?

±=±n

s t x α

(2)已知:1800=x ,100=s ,22

=αz ,则其置信区间为:

]52.1836~48.1763[30

100218002

=?

±=±n

s z x α

4、解:已知:35=x ,4=s ,96.12

=αz ,则其置信区间为:

]64.32,36.37[110010*********.1351100101001022

=??

?

??--?±=??? ??--±s z x α 5、解:已知:5.501=x ,8=s ,3=αz ,则其置信区间为:

]9.503~1.499[100

835.5012

=?

±=±n

s z x α

6、解:已知%,2%,95==E π

22=αz

47502.005

.095.02)

1()(222

22=??=-=

E z n ππα(件)

7、解:已知%,4%,98==E π

96.12=αz

480596.47)04.0(02.098.096.1)

1()(2

22

22===??=-=

E z n ππα(个)

8、解:已知:%85.94136

129?==p ,n=136, 96.1025

.0=z ,则其

95%的置

信区间为:

]9856.0~9114.0[136

)9485.01(9485.096.19485.0)?1(??025.0=-?±=-±n p p z p

9、解:(1)已知:n=16, 75.6=x ,25.2=s ,131.2)15(2

=αt

由方差未知时,小样本的区间估计公式得:

2016初级统计师考试试题:统计学和统计法基础知识备考精炼题(13)含答案

2016初级统计师考试试题:统计学和统计法基础知识备考精炼题(13)含答案 1、对垄断进行管制的经济政策包括()。 A.有效控制市场结构,避免垄断的市场结构产生 B.对垄断企业的产品价格进行管制 C.对垄断企业进行税收调节 D.制定反垄断法 E.对自然垄断企业实行国有化 标准答案:A, B, C, D, E 2、消除外部性的微观经济政策包括()。 A.税收 B.补贴

C.合并企业 D.明晰产权 E.关停企业 标准答案:A, B, C, D 3、下面属于公共产品的是()。 A.国防 B.公安 C.公路 D.义务教育 E.公园 标准答案:A, B, C, D, E

4、规范市场信息的微观经济政策包括()。 A.增加市场透明度 B.进行有效的制度安排 C.设计合理的激励机制 D.规范各种企业信息 E.经常检查企业信息真实性 标准答案:A, B, C, D, E 5、经济外部性可分为()。 A.正外部性和外部经济 B.负外部性和外部不经济 C.正外部性和负外部性

D.外部经济和外部不经济 标准答案:C, D 6、一般均衡只有在政府干预下才有可能实现。 标准答案:错误 解析:一般均衡只有在完全竞争的市场经济中才有可能实现 7、一个不满足帕雷托最优状态的经济社会就一定是缺乏经济效率的。 标准答案:正确 8、市场机制对具有非竞争性和非排他性的公共物品同样是有调节作用的。 标准答案:错误 解析:市场机制对私人物品具有调节作用,但对非竞争性和

非排他性的公共物品不具有调节作用。 9、为了使资源得到有效利用,对公共产品生产的决策应采用市场化的决策方式。 标准答案:错误 解析:为了使资源得到有效利用,对公共产品生产的决策应采用由政府来生产 10、在任何条件下,降低商品和要素价格一定会刺激消费者对该商品的需求。 标准答案:错误 解析:正常消费品和低档品降低其价格,并不会刺激消费者对该商品的需求。

统计学原理公式及应用

《统计学原理》常用公式汇总及计算题目分析 第一部分常用公式 第三章统计整理 a)组距=上限-下限 b)组中值=(上限+下限)÷2 c)缺下限开口组组中值=上限-1/2邻组组距 d)缺上限开口组组中值=下限+1/2邻组组距 第四章综合指标 i.相对指标 1.结构相对指标=各组(或部分)总量/总体总量 2.比例相对指标=总体中某一部分数值/总体中另一部分数值 3.比较相对指标=甲单位某指标值/乙单位同类指标值 4.强度相对指标=某种现象总量指标/另一个有联系而性质不同的现 象总量指标 5.计划完成程度相对指标=实际数/计划数 =实际完成程度(%)/计划规定的完成程度(%) ii.平均指标

1.简单算术平均数: 2.加权算术平均数或 iii.变异指标 1.全距=最大标志值-最小标志值 2.标准差: 简单σ= ;加权σ= 3.标准差系数: 第五章抽样估计 1.平均误差: 重复抽样: 不重复抽样: 2.抽样极限误差 3.重复抽样条件下: 平均数抽样时必要的样本数目

成数抽样时必要的样本数目 4.不重复抽样条件下: 平均数抽样时必要的样本数目 第七章相关分析 1.相关系数 2.配合回归方程y=a+bx 3.估计标准误: 第八章指数分数 一、综合指数的计算与分析 (1)数量指标指数

此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。 (-) 此差额说明由于数量指标的变动对价值量指标影响的绝对额。 (2)质量指标指数 此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。 (-) 此差额说明由于质量指标的变动对价值量指标影响的绝对额。 加权算术平均数指数= 加权调和平均数指数= (3)复杂现象总体总量指标变动的因素分析 相对数变动分析: = × 绝对值变动分析:

统计学原理与实务 徐静霞

思考与练习 一、思考题 1、 分类数据的图示方法,其中包括条形图、Pareto 图、对比条形图和饼图等。顺序数据除 了上文提到的条形图、pareto 图、对比条形图、饼图之外还可以借助累积频数分布图和环形图来进行描述。 2、 条形图、饼图、环形图、累积分布图、直方图、茎叶图、箱形图、散点图、线图、三维 散点图、气泡图、雷达图等。 3、 数据分组按照分组标志的不同可以分为单变量值分组和组距分组两种。根据组距不同还 可以分为等距分组和不等距分组。 4、 分组和编制频数分布表的具体步骤如下: 第1步:排序。将变量按照一定的大小顺序进行排序,通常是由小至大的递增顺序,使用计算机软件进行整理时此步可以忽略。 第2步:确定组数。一般与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。一般情况下,一组数据所分的组数 K 不应少于 5组且不多于 15组,即 5< K <15。在实际分组时,也可以借助经验公式来确定组数K , 2 lg lg 1n K + = 其中n 为数据的个数,对结果四舍五入取整数即为组数。 第3步:确定各组的组距。在组距分组中,一个组的最小值称为下限(low limit );一个组的最大值称为上限(upper limit ),组距(class width )是一个组的上限与下限的差。 组距可根据全部数据的最大值和最小值及所分的组数来确定,即, 组距=(最大值—最小值)/组数 。 5、 饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或 总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示。饼图只能显示一个总体和样本各部分所占的比例,而环形图则可以同时绘制多个总体或样本的数据系列,每一个总体或样本的数据系列为一个环。因此环形图可显示多个总体或样本各部分所占的相应比例,从而有利于进行比较研究。 6、 直方图与条形图是不同的,首先,条形图是用条形的长度(横置时)表示各类别频数的 多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 7、 茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给 出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用

初级统计师统计学和统计法基础知识题(12)含答案

初级统计师统计学和统计法基础知识题(12)含答案 1、对垄断进行管制的经济政策包括()。 A.有效控制市场结构,避免垄断的市场结构产生 B.对垄断企业的产品价格进行管制 C.对垄断企业进行税收调节 D.制定反垄断法 E.对自然垄断企业实行国有化 标准答案:A, B, C, D, E 2、消除外部性的微观经济政策包括()。 A.税收 B.补贴

C.合并企业 D.明晰产权 E.关停企业 标准答案:A, B, C, D 3、下面属于公共产品的是()。 A.国防 B.公安 C.公路 D.义务教育 E.公园 标准答案:A, B, C, D, E

4、规范市场信息的微观经济政策包括()。 A.增加市场透明度 B.进行有效的制度安排 C.设计合理的激励机制 D.规范各种企业信息 E.经常检查企业信息真实性 标准答案:A, B, C, D, E 5、经济外部性可分为()。 A.正外部性和外部经济 B.负外部性和外部不经济 C.正外部性和负外部性

D.外部经济和外部不经济 标准答案:C, D 6、一般均衡只有在政府干预下才有可能实现。 标准答案:错误 解析:一般均衡只有在完全竞争的市场经济中才有可能实现 7、一个不满足帕雷托最优状态的经济社会就一定是缺乏经济效率的。 标准答案:正确 8、市场机制对具有非竞争性和非排他性的公共物品同样是有调节作用的。 标准答案:错误 解析:市场机制对私人物品具有调节作用,但对非竞争性和

非排他性的公共物品不具有调节作用。 9、为了使资源得到有效利用,对公共产品生产的决策应采用市场化的决策方式。 标准答案:错误 解析:为了使资源得到有效利用,对公共产品生产的决策应采用由政府来生产 10、在任何条件下,降低商品和要素价格一定会刺激消费者对该商品的需求。 标准答案:错误 解析:正常消费品和低档品降低其价格,并不会刺激消费者对该商品的需求。

统计基础知识与统计实务

统计基础知识与统计实务 第一章总论 第一节统计的涵义 一、统计的涵义 统计一词一般有三种涵义:统计工作、统计资料和统计学。 统计工作是指利用科学的方法搜集、整理、分析和提供关于社会经济现象数量资料的工作的总称。例如:各级统计部门对其所属地区的工业、农业及贸易业等方面的数据资料进行的搜集、整理、分析等工作就是统计工作。 统计资料是指通过统计工作取得的、用来反映社会经济现象的数据资料的总称。例如:国家统计局每隔一定时期向社会公布的有关我国国内经济发展情况的资料,每年编印的《中国统计年鉴》等,这些公报资料及年鉴就是统计资料。统计资料的形式是多样的,具体表现为:统计图、统计表、统计公报、统计年鉴、统计手册及统计分析报告等。 统计学是指研究如何对统计资料进行搜集、整理和分析的理论与方法的科学。它是人类长期统计实践活动的经验总结和理论概括,又是指导统计工作的原理和原则。 二、统计工作、统计资料和统计学三者之间的关系 统计工作、统计资料和统计学三者之间既有区别,又有一定的联系。它们的联系主要表现在三个方面: 第一,统计工作与统计资料是统计活动过程与活动成果的关系。统计工作活动的目的是取得统计资料;统计资料的取得必须依靠统计工作来进行。 第二,统计工作与统计学是统计实践与统计理论的关系。一方面,统计学是统计工作的经验总结和理论概括;另一方面,统计学又指导统计工作的实践。 第三,统计工作是先于统计学而发展起来的。自从有了国家以来,统计工作就随着社会政治经济的发展和国家管理的需要而发展起来;而统计学的出现只是近代的事情。 第二节统计学中的基本概念 统计学中常用到的基本概念有:总体与总体单位;指标与标志;变异与变量。这些概念很重要,必须准确理解它们的涵义,从而有利于本书以后各章的学习。 一、总体与总体单位 (一)总体 凡是客观存在的,在同一性质基础上结合起来的许多个别事物的整体,就是统计总体,简称总体。例如:某一地区的所有工业企业是一个总体,它是由各个个别的工业企业组成,每个工业企业的经济职能是相同的(同一性质),即都是进行工业生产活动的基层单位。各个事物在某一方面的共同性(称“同质性”),是形成统计总体的一个必要条件,是某一项具体统计工作的研究范围,也是统计总体的一个重要特征。 (二)总体单位 构成统计总体的个别事物称为总体单位。上例中的各个工业企业都是总体单位。一个统计总体中所包括的单位数如果是有限的,则称为有限总体;如果是无限的,则称为无限总体。在社会经济现象中,统计总体大多是有限的。在统计调查中,对无限总体不能进行全面调查,只能调查其中的一小部分单位,据以推断总体;对有限总体既可以进行全面调查,也可只调查其中的一部分单位。 (三)总体与总体单位的关系 总体是由总体单位构成的,但总体和总体单位的概念不是固定不变的,随着研究目的的不同,总体和总体单位也会有所不同。例如:在前面所举的工业企业这个统计总体的例子里,每个工业企业都是一个总体单位。但是,当要研究一个典型企业的内部问题,如职工的有关情况时,则该企业的所有职工就成为统计总体,各个职工是总体单位。

统计学原理常用公式汇总

2.加权算术平均数 X =- X h X 3调和平均数: 式中: m = Xf , f X 统计学原理常用公式汇总 第2章统计整理 a ) 组距=上限—下限 b ) 组中值=(上限+下限)—2 c ) 缺下限开口组组中值=上限-1/2邻组组距 d ) 缺上限开口组组中值=下限+1/2邻组组距 e ) 组数k=1+3.322Lg n n 为数据个数 第3章综合指标 i. 相对指标 1.结构相对指标=各组(或部分)总量/总体总量 2?比例相对指标=总体中某一部分数值/总体中另一部分数值 3?比较相对指标=甲单位某指标值/乙单位同类指标值 4. 强度相对指标=某种现象总量指标/另一个有联系而性质不 同的现象总量指标 5. 计划完成程度相对指标=实际数/计划数 =实际完成程度(%) /计划规定的完成程度(%) ii. 平均指标 1.简单算术平均数:; 丄 iii. 标志变动度 1.全距=最大标志值-最小标志值 加权 或 ? f ? Xf ? Xf

3.标准差系数:”= iiii抽样推 断 1.抽样平均误差: 重复抽样: p(1 P) n 不重复抽样: 2 ( 1 2.抽样极限误差 3.重复抽样条件下: 平均数抽样时必要的样本数目 n 成数抽样时必要的样本数目不重复抽样条件下: t2 2 2- x t2P(1 p) 平均数抽样时必要的样本数目第4 章动态数列分析一、平均发展水平的计算方法:(1)由总量指标动态数列计算序时平均数 ①由时期数列计算 a a n Nt2 2 N 2x t2 2 ②由时点数列计算 在间断时点数列的条件下计算: 若间断的间隔相等,则米用“首末折半法”计算。公式为: 1 1 a i a2 a n a. 1 a 2—— n 1 若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为:

统计学基础试题以及答案

一、单项选择题(每题1分,共15分) 1、一个统计总体( ) A 、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 2、调查某大学2000名学生学习情况,则总体单位是( ) A 、2000名学生 B 、 2000名学生的学习成绩 C 、每一名学生 D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( )。 A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( )。 A 、工业普查 B 、工业设备调查 C 、职工调查 D 、未安装设备调查 5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( )。 A 、调查时间 B 、调查期限 C 、标准时间 D 、登记期限 6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( ) A 、50在第一组,70在第四组 B 、60在第三组,80在第五组 C 、70在第四组,80在第五组 D 、80在第四组,50在第二组 7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A 、简单算术平均法 B 、加权算术平均法 C 、加权调和平均法 D 、几何平均法 8、用水平法检查长期计划完成程度,应规定( ) A 、计划期初应达到的水平 B 、计划期末应达到的水平 C 、计划期中应达到的水平 D 、整个计划期应达到的水平 9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是( )。 A 、平均指标 B 、强度相对指标 C 、总量指标 D 、发展水平指标 10、时间序列中,每个指标数值可以相加的是( )。 A 、相对数时间序列 B 、时期数列 C 、间断时点数列 D 、平均数时间序列 11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( )。 A 、时间序列中各期的逐期增长量大体相等 B 、各期的二级增长量大体相等 C 、各期的环比发展速度大体相等 D 、各期同比增长量的大体相 12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( )。 A 、%4%5 B 、%104% 105 C 、%96% 95 D 、%4%5 13、某企业报告期产量比基期产量增长了10%,生产费用增长了8%,则其产品单位成本降低了( )。 A 、1.8% B 、2% C 、20% D 、18% 14、在不重复抽样中,抽样单位数从5%增加到25%,抽样平均误差( )。 A 、增加% B 、增加约3/5 C 、减少约3/5 D 、没有什么变化 15、若某总体次数分布呈左偏分布,则成立的有( )。 A 、x > e M >o M B 、x o M >e M D 、以上都不对 1、ACD 2、ACDE 3、BC 4、ABCDE 5、ADE 6、ABD 7、CD 8、AC 9、ABC10、ACE 二、多项选择题(每题2分,共20分) 1、下列各项中属于品质标志的有( )。 A 、性别 B 、年龄 C 、职务 D 、民族 E 、工资 2、从表式上看,统计表由哪些部分构成( )。 A 、总标题 B 、主词 C 、纵栏标题 D 、横行标题 E 、指标数值 3、在相对数中,子项和母项可以互换位置的有( )。

统计学原理常用公式汇总

统计学原理常用公式汇总 第2章统计整理 a)组距=上限-下限 b)组中值=(上限+下限)÷2 c)缺下限开口组组中值=上限-1/2邻组组距 d)缺上限开口组组中值=下限+1/2邻组组距 e)组数k=1+3.322Lg n n为数据个数 第3章综合指标 i.相对指标 1.结构相对指标=各组(或部分)总量/总体总量 2.比例相对指标=总体中某一部分数值/总体中另一部分数值 3.比较相对指标=甲单位某指标值/乙单位同类指标值 4.强度相对指标=某种现象总量指标/另一个有联系而性质不 同的现象总量指标 5.计划完成程度相对指标=实际数/计划数 =实际完成程度(%)/计划规定的完成程度(%) ii.平均指标 1.简单算术平均数: 2.加权算术平均数或 3调和平均数: ? ? = f X f X h 1 1 式中:, h Xf Xf m X X m f Xf X X m m Xf f X ==== == ??? ??? iii.标志变动度 1.全距=最大标志值-最小标志值 2.标准差: 简单σ= ;加权σ=

3.标准差系数: iiii 抽样推断 1. 抽样平均误差: 重复抽样: n x σ μ= n p p p ) 1(-= μ 不重复抽样: )1(2 N n n x - = σμ 2.抽样极限误差 x x t μ=? 3.重复抽样条件下: 平均数抽样时必要的样本数目 2 22x t n ?= σ 成数抽样时必要的样本数目2 2)1(p p p t n ?-= 不重复抽样条件下: 平均数抽样时必要的样本数目 2222 2σσt N Nt n x +?= 第4章 动态数列分析 一、平均发展水平的计算方法: (1)由总量指标动态数列计算序时平均数 ①由时期数列计算 n a a ∑= ②由时点数列计算 在间断时点数列的条件下计算: 若间断的间隔相等,则采用“首末折半法”计算。公式为: 1 212 11 21-++++=-n a a a a a n n Λ 若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为:

统计学原理与实务

思考与练习 一、 思考题 1、 分类数据的图示方法,其中包括条形图、Pareto 图、对比条形图和饼图等。顺序数据除 了上文提到的条形图、pareto 图、对比条形图、饼图之外还可以借助累积频数分布图和环形图来进行描述。 2、 条形图、饼图、环形图、累积分布图、直方图、茎叶图、箱形图、散点图、线图、三维 散点图、气泡图、雷达图等。 3、 数据分组按照分组标志的不同可以分为单变量值分组和组距分组两种。根据组距不同还 可以分为等距分组和不等距分组。 4、 分组和编制频数分布表的具体步骤如下: 第1步:排序。将变量按照一定的大小顺序进行排序,通常是由小至大的递增顺序,使用计算机软件进行整理时此步可以忽略。 第2步:确定组数。一般与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。一般情况下,一组数据所分的组数 K 不应少于 5组且不多于 15组,即 5< K <15。在实际分组时,也可以借助经验公式来确定组数K , 2 lg lg 1n K + = 其中n 为数据的个数,对结果四舍五入取整数即为组数。 第3步:确定各组的组距。在组距分组中,一个组的最小值称为下限(low limit );一个组的最大值称为上限(upper limit ),组距(class width )是一个组的上限与下限的差。 组距可根据全部数据的最大值和最小值及所分的组数来确定,即, 组距=(最大值—最小值)/组数 。 5、 饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或 总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。环形图中间有一个“空洞”,样本或总体中的每一部分数据用环中的一段表示。饼图只能显示一个总体和样本各部分所占的比例,而环形图则可以同时绘制多个总体或样本的数据系列,每一个总体或样本的数据系列为一个环。因此环形图可显示多个总体或样本各部分所占的相应比例,从而有利于进行比较研究。 6、 直方图与条形图是不同的,首先,条形图是用条形的长度(横置时)表示各类别频数的 多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 7、 茎叶图类似于横置的直方图,与直方图相比,茎叶图既能给出数据的分布状况,又能给 出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用

统计基础知识与实务课后练习题汇总缩小版

统计基础知识与实务 第一章: 1.在实际应用中,统计的涵义是指(统计工作、统计资料与统计学)。 2.构成总体,必须同时具备(同质性、大量性与差异性)。 3.要了解某工业企业职工的文化水平,则总体单位是(该工业企业的每一个职工)。 4.下列属于品质标志的是(文化程度)。 5.统计工作的基础是(统计调查)。 6.统计的认识过程是(定性认识到定量认识再到定量认识与定性认识相结合)。 7.一个总体(可以有多个指标)。 8.某职工月工资为1800元,“工资”是(数量标志)。 9.统计工作与统计学的关系是(统计实践与统计理论的关系)。 10.对某市工业企业职工收入情况进行研究,总体是(该市全部工业企业的全部职工)。 第二章 1.统计调查搜集的主要是原始资料,所谓原始资料是指(向调查单位搜集的尚待汇总整理的个体资料)。 2.统计调查所搜集的资料包括原始资料和次级资料两种,原始资料与次级资料的关系是(次级资料是从原始资料过渡来的)。 3.统计调查有全面调查和非全面调查之分,它们划分的标志是:(是否对所有组成总体的单位进行逐一调查)。 4.全面调查是对构成调查对象的所有单位进行逐一的调查,因此,下述调查中属于全面调查的是(对全国的人口进行普查)。 5.按调查登记的时间是否连续,统计调查可分为连续调查和不连续调查。下述调查中属于连续调查的是(按旬上报钢铁生产量)。 6.调查单位与报告单位的关系是(二者有时是一致的)。 7、对某省饮食业从业人员的健康状况进行调查,调查对象是该省饮食业的(所有从业人员)。 8.对某省饮食业从业人员的健康状况进行调查,调查单位是该省饮食业的(每个从业人员)。 9.我国的统计报表(目前大多是全面统计报表)。 10.统计报表报送周期不同,报表所反映的指标项目有不同的详细程度。一般,周期越短,则报告的指标项目(越少)。 11.对1990年6月30日24时的全国人口进行逐一调查,这是(普查)。 12.抽样调查与典型调查都是非全面调查,二者的根本区别在于(选取调查单位的方法不同)。 13.通过调查鞍钢、武钢等几个大钢铁基地,了解我国钢铁生产的基本状况。这种调查方式是(重点调查)。 14.统计调查可以分为统计报表制度和专门调查,划分的根据是(调查的组织方式)。 15、如果调查对象是全部工业企业,则调查单位是(每一个工业企业)。 16.典型调查是从被调查对象中(按照调查目的有意识地选取若干具有代表性的单位进行调查)。 17.全面统计报表是一种(报告法的调查方法)。 18.下列属于专门调查的是(普查)。 19.调查时间是指(调查资料所属的时间)。 20.在统计分析中,需要已婚人口数和未婚人口数指标,则相应的调查标志是(婚姻状况)。 21、下列属于一次性调查的是(全国实有耕地面积)。 22、普查是专门组织的(一次性全面调查)。 23.区别重点调查与典型调查的标志是(确定调查单位的标准不同)。 24.抽样调查和重点调查都是非全面调查,二者的根本区别在于(选取单位方式不同)。 25.调查对象是指(所要调查的总体)。 26.某市工业企业2006年生产经营成果年报呈报时间规定在2007年1月31日,则调查期限为(一个月)。 27.重点调查中重点单位是指(标志总量在总体中占有很大比重的单位)。 28.在生产过程中,对产品的质量检查和控制应该采用(抽样调查)。 29.调查期限是指(进行调查登记工作开始到结束的时间)。 30.街头拦截面访的缺点之一是(搜集的数据对总体的代表性不强)。 31.对某市自行车进行普查,调查对象是(该市所有自行车)。 32.对某市自行车进行普查,调查单位是(该市每一辆自行车)。 33.对某市自行车进行普查,报告单位是(该市每一个拥有自行车的人)。 34.为了了解职工的业余生活,某市统计局欲对该市职工2006年8月15日至21日一周的时间安排进行调查。此项调查宜采用(抽样调查)。 35.市统计局对该市职工2006.08.15日至21日一周的时间安排进行调查,调查对象是(该市全部职工)。 36.某市统计局欲对该市职工2006年8月15日至21日一周的时间安排进行调查。要求此项调查在9月底完成。调查时间是(8月15日至21日)。 37.一项调查,当数据需从总体每一单位中搜集时,称为(普查)。 38.一项调查,当数据仅从随机抽取的总体部分单位来获取时,称为(随机抽样调查)。 39.下列属于抽样调查的是(1%人口调查)。 40.下列属于概率抽样的是(简单随机抽样)。 41.按照某一标志,先将总体分成若干层(组、类),再在层按简单随机抽样方法进行抽样,此种方法为(分层随机抽样)。 42.先将总体中各单位按一定的标志排队,然后每隔一定的距离抽取一个单位构成样本,此种方法为(系统随机抽样)。 43.将某居民小区的4000户居民从1~4000编号,在1~100号中随机抽取1个为3,则3、103、203……3903构成抽样调查样本,这样的抽样方法为(系统随机抽样)。 44.某校高三年级学生共1000人参加考试,将1000份试卷编好后,从中随机抽取30份计算平均成绩,此种抽样方法为(简单随机抽样)。 45.为了了解某地区职工家庭生活状况,调查时,将职工家庭按居民委员会分组,并以居委会为单位进行简单随机抽样,再对抽中的居委会所辖每户职工家庭一一进行 调查,这种调查组织方式为(整群随机抽样)。 46.对农作物单位面积产量调查,按平原、丘陵、山区分组来抽选样本单位,此种抽样方法为(分层抽样)。 第三章 1.统计分组是统计资料整理中常用的统计方法,它能够区分(总体中性质相异的单位)。 2.统计分组的关键在于确定(分组标志和分组界限)。 3. 按照反映事物属性差异的品质标志进行分组称为按品质标志分组,下列属于这一类的是(在校学生按性别分组)。 4.按数量标志分组的关键是确定(组距)。 5.全国总人口按年龄分为5组,这种分组方法属于(简单分组)。 6. 对某校学生先按年级分组,在此基础上再按年龄分组,这种分组方法是(复合分组)。 7.对某校学生分别按年级和年龄分组,由此形成的分组体系是(平行分组体系)。 8.组距数列中的上限一般是指(本组变量的最大值)。 9.组距和组数是组距数列中的一对基本要素,当变量的全距一定时,组距和组数(有反向关系)。 10.等距数列和异距数列是组距数列的两种形式,其中等距数列是指(各组组距相等的数列)。 11.用离散变量作分组标志时,相邻组的上下限应(间断)。 12.企业职工工资收入最高者为4260元,最低者为2700元,据此分为6个组,形成闭口式等距数列,则组距应为(260)。 13.在组距数列中,对各组的上限与下限进行简单平均,得到的是(组中值)。 14.在分组时,如遇到某单位的标志值刚好等于相邻两组上下限数值时,一般是(将此值归入作为下限的那一组)。 15.将企业按资产总额分组,使用的分组形式为(组距式分组)。 16.企业按资产总额分组(只能使用组距式分组)。 17.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为(230)。

统计学原理及应用试题及标准答案

一、单项选择题(每题2分,共20分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等B.各组的组中值必须相等 C.各组数据在各组中均匀分布D.各组的组中值都能取整数值 3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分;乙班平均分为75分,标准差为7.5分。由此可知两个班考试成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() A.520公斤 B.530公斤 C.540公斤 D.550公斤 5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% B.400% C.120% D.1200% 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 A.10.71% B.21.95% C.12% D.13.64% 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显著性 D.规范性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认 为哪个回归方程可能是正确的?() A.y=125-10x B.y=-50+8x C.y=150-20x D.y=-15-6x 二、多项选择题(每题2分,共10分) 1.抽样调查的特点有()。 A.抽选调查单位时必须遵循随机原则 B.抽选出的单位有典型意义C.抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值 E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算 2.某种产品单位成本计划比上年降低5%,实际降低了4%,则下列说法正确的是() A.单位成本计划完成程度为80% B. 单位成本计划完成程度为101.05%

统计学原理知识点公式

统计学原理知识点及公式 第一章统计总论 ?1.统计一词的三种含义 ?2.统计学的研究对象及特点 ?3.统计学的研究方法 ?4.统计学的几个基本概念:总体与总体单位、标志与标志表现、变异与变量、统计指标的概念、特点及分类。 ?5.国家统计兼有的职能 第二章统计调查 ?1.统计调查的概念和基本要求 ?2.统计调查的种类 ?3.统计调查方案的构成内容 ?4.统计调查方法:普查、抽样调查、重点调查、典型调查 ?5.调查误差的种类 第三章统计整理 ?1.统计整理的概念和方法 ?2.统计分组的概念、种类 ?3.统计分组的关键 ?4.统计分组的方法:品质分组方法、变量分组的方法 ?5.分配数列的概念、构成及编制方法 变量数列的编制基本步骤为: 第一步:将原始资料按数值大小依次排列。 第二步:确定变量的类型和分组方法(单项式分组或组距分组)。 第三步:确定组数和组距。当组数确定后,组距可计算得到:组距= 全距÷组数全距= 最大变量值-最小变量值。 第四步:确定组限。(第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。) 第五步:汇总出各组的单位数(注意:不同方法确定的组限在汇总单位数时的区别),计算频率,并编制统计表。 间断式确定组限:汇总各组单位数时,按照“上下限均包括在本组内”的原则汇总。

重叠式确定组限:汇总各组单位数时,按照“上组限不在内”的原则汇总。 因为有了“上组限不在内”的原则,实际工作中,对于离散型变量也经常采用重叠式确定组限的方法。 ?6.统计表的结构和种类 第四章综合指标 ?1.总量指标的概念、种类和计量单位 ?2.相对指标的概念、指标数值的表现形式、相对指标的种类。相对指标包括: 结构相对指标、比例相对指标 比较相对指标、强度相对指标 动态相对指标、计划完成程度相对指标 ●3.平均指标的概念、作用和种类。 算术平均数、调和平均数、众数、中位数

统计基础知识与统计实务教材电子版

《统计基础知识与统计实务》 一、总论 统计是指对与某一现象有关的数据的搜集、整理、计算和分析等的活动。一般理解为三个含义:统计工作、统计资料和统计学。统计工作是指利用科学的方法搜集、整理、分析和提供关于社会经济现象数量资料的工作的总称。统计资料是指通过统计工作取得的、用来反映社会经济现象的数据资料的总称。统计学是指研究如何对统计资料进行搜集、整理和分析的理论与方法的科学。三者的关系:联系:1、统计工作与统计资料是统计活动过程与活动成果的关系。2、统计工作与统计学是统计实践与统计理论的关系。3、统计工作是先于统计学而发展起来的。 (一)统计学中的基本概念P4 1、总体与总体单位 (1)总体:凡是客观存在的,在同一性质基础上结合起来的许多个别事物的整体就是统计总体,简称总体。(2)总体单位:构成统计总体的个别事物称总体单位。 一个统计总体中所包括的单位数如果是有限的,称为有限总体;如果是无限的,则称为无限总体。 对无限总体不能进行全面调查,只能调查其中一小部分,据以推算总体;对有限总体既可以进行全面调查,也可以只调查其中的一部分单位。总体是由总体单位构成的,但是总体和总体单位的概念不是固定不变的,随着研究目的的不同,总体和总体单位也会由所不同。 2、指标与标志 指标是反映总体现象数量特征的概念。指标还可以是反映总体现象数量特征的概念及其具体数量。都能用数值表示。如:GDP、人口数等。 标志是说明总体单位特征的名称。可分为:品质标志,不能用数值表示,如性别、民族等;数量标志,可以数值表示,如年龄、工资等。指标与标志的区别:1、指标是说明总体特征的;而标志是说明总体单位特征的。2、标志可以分为不能用数值表示的品质标志与能用数值表示的数量标志两种;而指标都是用数值表示的,没有不能用数值表示的指标。联系:1、有许多指标的数值是从总体单位的数量标志值汇总而来的。2、指标与数量标志之间存在着变换关系。 3、变异与变量P6 标志在同一总体不同总体单位之间的差别就称变异。可分不变标志和变异标志。不变标志是指对总体单位都有完全相同是具体表现的标志;变异标志是指在总体单位之间具有不同标志表现的标志。 数量变异标志称为变量。数量变异标志的表现形式是具体的数值,称为变量值。变异标志有品质便标志和数量变异标志之分。 4、总体单位基本特征:同质性、大量性、差异性。 数量变异标志称为变量。数量变异标志的表现形式是具体的数值,称为变量值。按变量值的连 1

统计学基础课后全部详细答案与讲解

统计学第一至四章答案 第一章 一、思考题 1.统计学是收集、处理、分析、解释数据并从数据中得出结论的科 学。 统计方法可分为描述统计和推断统计。 2.统计数据的分类:按计量尺度:分类数据、顺序数据和数值型数据按获取数据的方式:观测数据和实验数据按数据与时间的关系:截面数据和时间序列数据特点:分类数据各类别之间是平等的并列关系,各类别之间的顺序可以任意改变;顺序数据的分类是有序的;数值型数据说明的是现象的数量特征,是定量数据;观测数据是通过调查或观测而收集到的数据,是在没有对事物进行人为控制的条件下得到的;实验数据是在实验中控制实验对象而收集到的数据;截面数据也称静态数据,描述的是现象在某一时刻的变化情况;时间序列数据也称动态数据,描述的是现象随时间的变化情况。 3.对武昌分校的全体教师进行工资调查,那么全体教师就是总体,从中抽取五十名教师进行调查,这五十名教师的集合就是样本,全体教师工资的总体平均值和总体标准差等描述特征的数值就是参数,五十名教师工资的样本平均值和样本标准差等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说教师的工资。 4.有限总体:指总体的围能够明确确定,而且元素的数目是有限可数的。例如:武昌分校10 级金融专业学生 无限总体:指总体所包含的元素是无限的、不可数的。例如:整个宇宙的星

球 5.变量可分为分类变量、顺序变量、数值型变量。同时数值型变量可分为离散型变量和连续型变量。 6.离散型变量只能取有限个值,而且其取值都以整位数断开,可以一一列举,例如“产品数量” 、“企业数”。连续型变量的取值指连续不断的,不能一一列举。例如“温度” 、“年龄”。 二、练习题 1.(1)数值型变量(2)分类变量(3)数值型变量 (4)顺序变量(5)分类变量 2.(1)这一研究的总体是IT 从业者,样本是从IT 从业者中抽取的1000 人,样本量是1000 (2)“月收入”是数值型变量 (3)“消费支付方式”是分类变量 3.(1)这一研究的总体是所有的网上购物者 (2)“消费者在网上购物的原因”是分类变量 第二章 一、思考题 1:答:1:普查的特点:①:普查通常是一次性的或周期性的; ②:普查一般需要规定统一的调查时间;③:普查的数据一般比 较准确;4:普查的使用围比较狭窄,只能调查一些最基本的、 特定的现象。2 :抽样调查的特点:①:经济性;②:时效性强; ③:适应面广;④:准确性高。

统计学原理-计算公式

位值平均数计算公式 1、众数:是一组数据中出现次数最多的变量值 组距式分组下限公式: 2 11 0m m d L M ??+??+= 0m L :代表众数组下限; 1100--=?m m f f :代表众数组频数—众数组前一组频数 0m d :代表组距; 1200+-=?m m f f :代表众数组频数—众数组后一组频数 2、中位数:是一组数据按顺序排序后,处于中间位置上的变量值。 中位数位置2 1+=n 分组向上累计公式:e e e e m m m m e d f S f L M ?-∑+=-12 e m L 代表中位数组下限; 1-e m S :代表中位数所在组之前各组的累计频数; e m f 代表中位数组频数; e m d 代表组距 3、四分位数:也称四分位点,它是通过三个点将全部数据等分为四部分,其中每部分包含 25%,处在25%和75%分位点上的数值就是四分位数。 其公式为:4 11+=n Q 212+=n Q (中位数) 4) 1(33+=n Q 实例 数据总量: 7, 15, 36, 39, 40, 41 一共6项

Q1 的位置=(6+1)/4=1.75 Q2 的位置=(6+1)/2=3.5 Q3的位置=3(6+1)/4=5.25 Q1 = 7+(15-7)×(1.75-1)=13, Q2 = 36+(39-36)×(3.5-3)=37.5, Q3 = 40+(41-40)×(5.25-5)=40.25 数值平均数计算公式 1、简单算术平均数:是将总体单位的某一数量标志值之和除以总体单位。 其公式为: n x n x x x X n ∑=??++=21 2、加权算术平均数:受各组组中值及各组变量值出现的频数(即权数f )大小的影响, 其公式为:f xf f f f f x f x f x X i i i ∑∑= ??++??++=212211 3、加权算术平均数的频率: 其公式为: f f X f f X f f X f f X X n ∑?∑=∑∑??+∑+∑=2211 4、调和平均数:由于只掌握每组某个标志的数值总和(M )而缺少总体单位数(f )的资料, 不能直接采用加权算术平均数法计算平均数,则应采用加权调和平均数。 其公式为: x m m H ∑∑= 5、简单几何平均数:就是n 个变量值(Xn )连乘积的n 次方根: 其公式为:n n n X X X X X G ∏=????=321

统计学基础期末模拟试题和答案

《统计学基础》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为 数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的置信区间_________________。(Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。 6、判定系数的取值范围是 。 7、设总体X ~) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时, 则n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。每小题1分,共14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( ) 5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( )

相关主题
文本预览
相关文档 最新文档