统计学知识点汇总
一、统计学
统计学是一门关于数据资料的收集、整理、分析和推断的科学。
三、统计的特点
(1)数量性:
社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。
(2)总体性:
社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。
(3)具体性:
社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。
(4)社会性:
社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。
四、统计工作过程
(1)统计设计
根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。
(2)收集数据
统计数据的收集有两种基本方法,实验法和调查法。
(3)整理与分析
描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。
推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。
(4)统计资料的积累、开发与应用
对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。
五、统计总体的特点
(1)大量性
大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求;
(2)同质性
同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件;
(3)变异性
变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作
为所要研究问题的对象。变异性是统计研究的重点。
六、标志与指标的区别与联系
■区别:
标志是说明总体单位特征的;指标是说明总体特征的。
标志中的品质标志不能用数量表示;而所有的指标都能用数量表示。
标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定要经过汇总才能取得。 标志一般不具备时间、地点等条件;但完整的统计指标一定要讲明时间、地点、范围。 ■联系:
有些数量标志值汇总可以得到指标的数值。既可指总体各单位标志量的总和,也可指总体单位数的总和。
数量标志与指标之间存在变换关系。随着统计目的的改变,如果原来的总体单位变成了统计总体,则与之相对应的数量标志就成了统计指标。
七、统计指标体系
统计指标体系是各种互相联系的指标群构成的整体,用以说明所研究的社会经济现象各方面互相依从和互相制约的关系。
八、相对指标
相对指标又称统计相对数。它是两个有联系的现象数值的比率,用以反映现象的发展程度、结构、强度、普遍程度或比例关系。
(1)结构相对指标
结构相对指标是在对总体分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。 (2)比例相对指标
比例相对指标是总体中不同部分数量对比的相对指标,用以分析总体范围内各个局部、各个分组之间的比例关系和协调平衡状况。 (3)比较相对指标
比较相对指标是不同单位的同类现象数量对比而确定的相对指标,用以说明某一同类现象在同一时间内各单位发展的不平衡程度,以表明同类实物在不同条件下的数量对比关系。 (4)强度相对指标
强度相对指标是两个性质不同但有一定联系的总量指标之间的对比,用来表明某一现象在另一现象中发展的强度、密度和普遍程度。 (5)计划完成程度相对指标
计划完成程度相对指标是用来检查、监督计划执行情况的相对指标。它以现象在某一段时间内的实际完成数与计划数对比,来观察计划完成程度。
九、权数
指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各组的标志值对平均数的影响程度
十、中位数
将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,用 表示
e
M
十一、众数
指总体中出现次数最多的变量值,用 表示,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。
十二、标志变异指标
统计上用来反映总体各单位标志值之间差异程度大小的综合指标,也称做标志变动度。
十三、标准差
——标准差是各个数据与其算术平均数的离差平方的算术平均数的开平方根,用 来表示;标准差的平方又叫作方差,用 来表示。 【例A 】某售货小组5个人,某天的销售额分别为440元、480元、520元、600元、750元,求该售货小组销售额的标准差。 解:
即该售货小组销售额的标准差为109.62元。 十四、变异系数
——各种变指标与其算术平均数之比。一般用V 表示。
【例】某年级一、二两班某门课的平均成绩分别为82分和76分,其成绩的标准差分别为15.6分和14.8分,比较两班平均成绩代表性的大小。
解:一班成绩的标准差系数为:
二班成绩的标准差系数为:
因为 ,所以一班平均成绩的代表性比二班大。
十五、时间数列
0M σ2
σ()
N
X
X
N
i i
2
1
∑=-=
σ()元5585
27905750600520480440==++++=X ()
()()()
元62.109560080
55587505584402221
==-++-=
-=∑=ΛN X X N i i σ﹪﹪﹪02.1910082
6
.151001
1
1=?=
?=
X V σσ﹪﹪﹪47.1910076
8
.141002
2
2=?=
?=
X V σσ21σσV V ≤
——把反映现象发展水平的统计指标数值,按照时间先后顺序排列起来所形成的统计数列,又称动态数列。
※时间数列的研究意义
(1)能够描述社会经济现象的发展状况和结果
(2)能够研究社会经济现象的发展速度、发展趋势和平均水平,探索社会经济现象发展变化的规律,并据
以对未来进行统计预测;
(3)能够利用不同的但互相联系的时间数列进行对比分析或相关分析。
十六、统计指数
——统计指数是研究社会经济现象数量关系的变动状况和对比关系的一种特有的分析方法。
※指数的作用
? 综合反映复杂现象总体变动的方向和程度; ? 分析复杂现象总体变动中因素变动的影响。 ? 研究事物的长期变动趋势;
?
研究平均指标变动及其受水平因素和结构因素变动的影响程度
※统计指数的性质
? 综合性;反映的不是个体事物的变化,而是综合反映不同性质的各种事物的总体变化。
? 平均性;统计指数所表示的综合变动是多种事物的平均变动,其数值是各个个体事物数量变化的代
表值。
? 相对性;统计指数是同类现象不同时间、不同空间的数值之比,一般用相对数或比率形式表示。 ? 代表性。统计指数的编制一般以若干重要项目为代表,反映总体变化程度和变动趋势。
十七、总指数按其采用的指标形式不同分为:
综合指数:复杂总体的两个相应的指标对比,采用综合公式计算。
平均指数:复杂总体中个体指数的平均数,一般采用算术平均数和加权平均数的方法计算。
⑴ 加权算术平均指数
⑵ 加权调和平均指数
【例1】计算甲、乙两种商品的价格总指数
∑∑∑∑=
=
00
01
10
P Q P Q Q Q P Q
P Q K Q
1
10
11
1
1
11
/1P Q P P P
Q P
Q P Q K P ∑=
=
∑∑∑()元﹪解:21608240104001
2.1268240
1040067.1400
25.11000010400111111111=-=-==+==
∑
∑∑∑P Q k P Q P Q k P Q K p
p
P
【例2】计算甲、乙两种商品的销售量总指数 商品 名称 计量 单位 销售额 (万元) 销售量比上年增
长(%)
基期 报告期 甲 乙 件 千克 20 30 25 45 10 20 合计
—
50
70
——
如何根据上述资料计算两种商品的价格总指数?
解:
十八、平均指数与综合指数的区别
十九、可变构成指数(平均指标指数)
——将两个不同时期或不同单位的同一经济内容的平均指标对比,所计算的动态对比关系的相对数,称为平均指标指数,亦称为可变构成指数。
【例】已知某公司下属三个商场的职工人数和工资资料如下,分析该公司总平均工资水平的变动情况,并分析各商场工资水平及人数结构因素对其影响的程度和绝对数额。
商场 平均工资(元) 职工人数(人) 工资总额(万元)
甲 乙 丙
310 440 470
350 480 530
150 120 200 180 150 180 4.65 5.28 9.40
6.30
7.20 9.54
5.58
6.60 8.46
合计 411.28 451.76 470
510
19.33 23.04 20.64
解:三个商场职工的平均工资:
)(850580
%
1163020302.1201.10
0001
00
01
01万元=-=-∑
=+?+?=∑=
=∑∑∑∑P Q P Q Q Q P Q P Q Q Q P
Q P Q K Q )
(125870%
1212
.1301.12045
25000
1
1
1000
1
1
10
11
1万元=-=∑-=?+?+=
∑
=
=∑∑∑∑P Q Q
Q P Q P Q Q Q P
Q P
Q P
Q K P 1111f f x x ∑∑=0000f f x x ∑∑=0
11
100011101f f x f f x f f x f f x x x ∑∑∑∑=∑∑∑∑= 可变构成指数 =
1
X 0
X 0
f 1
f 0
0f
X
1
1f
X
1
0f
X
10000
33.190
0?f X
报告期平均工资:
基期平均工资:
职工平均工资变动额为:
计算表明,三个商场职工的平均工资指数为109.84%,即平均工资上升了9.84%,平均工资上升额为40.48元。 二十、指数体系
——指经济上具有一定联系,并且具有一定的数量对等关系的三个或三个以上的指数所构成的整体。 ※简单现象总体总量指标变动的两因素分析
※复杂现象总体总量指标变动的两因素分析
()元71.404510
10000
64.201
1
01=?=
=
∑∑f
f X X ﹪:则总平均工资的变动为可变84.10928
.41176
.45101===X X K ()
元48.4028.41176.45101=-=-X X
※复杂现象总体总量指标变动的多因素分析
二十一、函数关系
——指变量之间存在着确定性依存关系。即当一个或一组变量每取一个值时,相应的另一个变量必然有一个确定值与之对应。
二十二、相关关系
——指变量之间存在着非确定性依存关系。即当一个或一组变量每取一个值时,相应的另一个变量可能有多个不同值与之对应。
二十三、相关关系的测定
定性分析:是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作
出判断
定量分析:在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数与判定系数等方法,来
判断现象之间相关的方向、形态及密切程度
二十四、相关系数
——在直线相关的条件下,用以反映两变量间线性相关密切程度的统计指标,用r 表示 ()()()()2
2
2∑∑∑--?---=
=y
x xy n n
y y n x x n y y x x S S S r y x xy
相关系数r 的取值范围:-1≤r ≤1
※0<|r|<1表示存在不同程度线性相关: |r| < 0.4 为低度线性相关;
0.4≤ |r| <0.7为显著性线性相关; 0.7≤|r| <1.0为高度显著性线性相关。
二十五、相关系数的显著性检验(t 检验法)
【例】检验工业总产值与能源消耗量之间的线性相关性是否显著。
二十六、回归分析与相关分析的联系与区别
联系:
? 理论和方法具有一致性;
? 无相关就无回归,相关程度越高,回归越好; ? 相关系数和回归系数方向一致,可以互相推算。 区别:
? 相关分析中x 与y 对等,回归分析中x 与y 要确定自变量和因变量; ? 相关分析中x 、y 均为随机变量,回归分析中只有y 为随机变量;
? 相关分析测定相关程度和方向,回归分析用回归模型进行预测和控制。
二十七、一元线性回归方程
【例】建立工业总产值对能源消耗量的线性回归方程
解:设线性回归方程为
bx a y
+=????
?
??
?
-=∑-=∑-∑∑∑-∑=
∑x b y n x b n y a x x n y x xy n b 22)(bx a y
+=?∑∑===,
625,916,16y x n 由计算表知
即线性回归方程为:
计算结果表明,在其他条件不变时,能源消耗量每增加一个单位(十万吨),工业总产值将增加0.7961个单位(亿元)。
二十八、判定系数与相关系数的区别:
? 判定系数无方向性,相关系数则有方向,其方向与样本回归系数 b 相同;
? 判定系数说明变量值的总离差平方和中可以用回归线来解释的比例,相关系数只说明两变量间关联程度及方向;
? 相关系数有夸大变量间相关程度的倾向,因而判定系数是更好的度量值。
简答题:
1. 统计的三层含义: (1) 统计工作 (2) 统计资料 (3) 统计学
2. 总体与总体单位的含义。
(1) 总体:客观存在的,在同一性质基础上结合起来的许多个别单位的集合。 (2) 总体单位:构成总体的这些个别单位 3. 标志与指标的关系。 区别:(1)指标是说明总体的。标志是说明总体单位的名称。 (2)指标可以都用数表示。标志有的可以,有的不可以。 联系:(1)指标值往往由数量标志值汇总而来。
(2)一定条件下,指标和数量标志可以变换。 4.一个完整的统计调查设计方案的内容? (1)调查目的
(2)确定调查对象和调查单位 (3)设计调查项目和调查表
()
5142.616
916
7961.0166257961
.09165508616625
91637887162
2
2-=?-=
-==-??-?=
--=
∑∑∑∑∑x b y a x x n y x xy n b x y
7961.05142.6?+-=
(4)其他(a)明确调查所用方法
(b)确定调查资料的所属时间和调查工作期限
(c)调查的组织和实施细表
5.统计分组的含义与作用?
统计分组:根据研究任务的要求和现象总体的内在特点把总体按某一标志划分为若干性质不同又有联系的几个部分。
作用:1.区分事物的类型或性质。
2.反应总体内部结构。
3.研究现象之间的依存关系。
6.时期指标与时点指标的区别?
(1)时期指标数值连续统计,时点指标数值间断统计。
(2)时期指标数值可以累计,时点指标数值直接累计没有意义。
(3)时期指标数值大小和统计期限长短有关。时点指标的大小与时间间隔长短没有直接关系。
7.影响时间数列变动的因素有哪些?
(1)长期趋势
(2)季节变动
(3)循环变动
(4)不规则变动
8统计指数的含义?
研究社会经济现象数量关系的变动状态和对比关系的一种特有分析方法
广义上讲:指反映社会经济现象总体的数量变动状况和对比关系。
狭义上讲:指反映复杂社会经济现象总体数量变动状况和对比关系的特殊相对数。
9.综合指数的编制原则。
(1)数量指标(q)综合指数的编制采用基期的质量指标作为同度量因素
(2)质量指标(p)综合指数的编制采用报告期数量指标作为同度量因素
10.抽样推断的含义及要求?
抽样推断:按照随机原则从全部研究对象中抽取一部分单位进行调查,并以调查结果对总体特征做出具有一定可靠程度的推断与估计,从而认识总体的一种推断方法。
要求:1.无偏性2.一致性3.有效性
11.影响抽样平均误差的因素?
(1)总体各单位标志值的差异程度
(2)样本单位数的
(3)抽样方式
(4)抽样的组织形式
选择题与填空
1.总体与总体单位的定义。(简答题第二个)
2.标志与指标的关系(简答题第三个)
3.统计分组的含义与作用(简答题第五个)
4.分配数列:在统计分组的基础上,将总体所有单位按组归类并排列形成总体各个单位在各
组间的分部,成为分配数列。
5. 时期指标与时点指标的区别(简答题第六个) 6.强度相对数: 同的指标数值
另一有联系的但性质不某一总量指标数值
强度相对数=
特点:分子来源与分母,但分母不是总体(无名) 反映一种依存关系,比例或协调关系(有名) 7.计划完成程度相对数:
%100?=
计划为上年的百分比
实际为上年的百分比
计划完成程度相对数
8.平均发展速度的计算方法 n 21n
n
g x n n x x x R a a ??===Λ 9.趋势线的选择: 直线趋势方程bt a y +=∧
曲线趋势方程2ct bt a y ++=∧
10.直线趋势方程的测定: ∑∑∑∑∑+=+=2
ty t b t a t b na y 11.统计指数的含义(简答题第8个)
12.综合指数的编制原则(简答题第九个) 13抽样推断的定义(简答题第10个) 14.抽样平均误差的计算 (1)样本平均数的抽样平均误差。 重复:n
n
u x σ
σ=
=2
不重复:()
n
N n u x /12-=
σ
(2)样本成数的抽样平均误差
重复:()n
p p u p -=1 不重复:()()n
N n p p u p /11--=
1、相对指标
=
强度
某一总量指标数值另一有联系但性质不同的总量指标数值
相对数
%100?=计划为上年的百分比
实际为上年的百分比
计划完成程度相对数
2.平均指标
=
算术
总体标志总量总体单位总数
平均数 1
i
N
X i X N
==
∑
; 11
N
i
i
i N
i
i X F
X F
===
∑∑; F X XF
F X
F
==∑∑∑
调和平均数11N
i i
N H X ==∑; 1
1K
i
i K
i
i i
M H M X
===
∑∑
3.变异指标 标准差
σ=
σ=
标准差系数100V X
σσ=?﹪
第五章 时间数列
1.动态平均指标的计算式 平均发展速度
G X ====或平均增长速度=%100-g X 平均增长量1
-=
=动态数列项数累计增长量逐期增长量个数
逐期增长量之和 平均发展水平
⑴由时期数列计算序时平均数121...N
i
N i a a a a a N N
=+++==∑
⑵由时点数列计算序时平均数
①由连续时点数列计算
间隔相等时121...N
i
N i a a a a a N N
=+++==∑
间隔不相等时11221121
......m
i i
m m i m
m i
i a f
a f a f a f a f f f f
==+++==+++∑∑
②由间断时点数列计算(重点)
间隔相等时1
21 (2)
21
N
N a a a a a N -++++=- 间隔不相等时23112
121
121
...222...N N N N a a a a a a f f f f f f ---+++?+?++?+++