当前位置:文档之家› 商业统计学复习整理

商业统计学复习整理

商业统计学复习整理
商业统计学复习整理

商业统计学考试大纲

一、考试题型

1.选择题(20道小题,每小题2分,共40分)

2.判断题(10道小题,每小题1分,共10分)

3.简答题(2道小题,每小题5分,共10分)

4.案例分析(1道小题,共10分)

5.计算题(3-4道题目,共30分)

二、复习要点

1.第一章绪论

(1)掌握统计、统计资料、统计工作和统计理论的含义。

(2)熟悉3大统计学派,并知道每个学派的创始人。

(3)了解统计学的定义,统计学的分类。

(4)掌握统计工作的4个阶段。

(5)掌握下面与数据相关的概念:总体、个体(总体单位)、标志、统计指标、变异、变量、变量值和观察值。尤其要区分总体和总体单位,标志和统计指标这两对相似的概念。

(6)了解数据的测量尺度。

(7)了解横截面数据和时间数列数据之间的差别

(8)掌握描述统计和统计推断的含义。

2.第二章描述统计学简介

(1)掌握统计分组过程。掌握统计分组。掌握全距、组数和组距三者之间的关系。知道“上限不在内”原则。

(2)掌握频数分析相关的概念。如分配数列、单项数列、组距数列、频数、频率、向上累计频率、组中值等概念。尤其要掌握频率、向上累计频率,开口组组中值的计算。

(3)了解次数分布曲线的含义。掌握次数分布的主要类型,如钟型分布、U型分布,J型分布。

(4)熟悉直方图、连线图、散点图和饼图这几种统计图形的作用。

(5)熟练掌握综合指标的分类,综合指标包括了总量指标、相对指标、平均指标和变异指标。

(6)掌握6种相对指标的含义和计算公式以及注意要点。这6种相对指标包括:结构相对指标、比例相对指标、比较相对指标、强度相对指标、动态相对指标和计划完成相对程度指标。

(7)掌握一些常用的宏观经济指标:例如国内生产总值GDP、消费者价格指数CPI,失业率,通货膨胀率的概念。

(8)知道描述数据分布的三个方面:集中趋势、离中趋势和偏度和峰度。(9)知道平均指标的含义和作用。

(10)熟练掌握算术平均数、调和平均数、几何平均数、众数和中位数这几个平均指标的含义、计算公式、适用条件和特点。不要求掌握加权调和平均数、

加权几何平均数,以及组距数列中位数计算公式。

(11)知道变异指标的含义和作用。

(12)熟悉全距、方差、标准差这三个变异指标的含义、计算公式和注意要点。(13)熟练掌握方差、标准差含义、计算公式和注意要点。其中组距数列的方差和标准差不要求掌握。

(14)掌握标准差系数。

3.第3章随机事件与概率

(1)了解随机事件的概念,包括:基本事件和复合事件,必然事件和不可能事件。

(2)熟练掌握事件间的关系与运算,包括了事件的包含、事件的相等、事件的和、事件的积、事件的差、互不相容事件、对立事件。

(3)了解概率的定义。掌握古典概型、几何概型、统计概型这三种概率定义的模型。

(4)熟练掌握概率加法公式。

(5)了解条件概率。掌握概率乘法公式

(6)掌握事件的独立性含义。

4.第4章随机变量及其分布

(1)了解随机变量的含义,知道随机变量按其取值情况可以分为离散型随机变量和连续型随机变量。

(2)熟练掌握几种离散型随机变量分布:0-1分布、几何分布、伯努利(二项)分布,泊松分布的分布率。

(3)知道均匀分布和指数分布。

(4)熟练掌握正态分布,知道正态分布两个重要参数μ和σ的含义。掌握标准

正态分布的含义。熟练掌握定理4.2,即正态分布和标准正态分布之间的关系。(5)熟练掌握正态分布的“3σ”原理。

5.第5章数字特征、大数定律和中心极限定理

(1)掌握离散型随机变量的数学期望的计算公式。掌握0-1分布、二项分布、泊松分布的数学期望。

(2)了解连续型随机变量的数学期望的计算公式,了解均匀分布、指数分布和正态分布的数学期望。

(3)掌握离散型随机变量的方差的计算公式。掌握0-1分布、二项分布、泊松分布的方差。

(4)了解对于正态分布而言σ就是它的标准差。

6.第6章抽样与抽样分布

(1)掌握抽样推断的相关概念。例如:总体、样本、抽样、总体容量、样本容量、抽样比、统计量的含义。

(2)了解为什么要进行抽样调查。

(3)熟练掌握下面常用的统计量:样本成数、样本均值、样本方差。

(4)掌握重复抽样、不重复抽样、考虑顺序抽样和不考虑顺序抽样的概念,及

各种情况下的样本数目。

(5)熟练掌握重复抽样和不重复抽样的抽样平均误差。

(6)了解5种抽样的组织方式:简单随机抽样、类型抽样、整群抽样、等距抽样和多阶段抽样。

(7)熟练掌握样本均值的分布。

(8)了解正态分布上α分位点和双侧分位点的含义。

(9)了解什么是2χ分布,t 分布和F 分布。这三大分布的具体的密度函数不要求掌握,但要知道统计量21n

i i ηξ==∑服从2χ分布,()~T t n n

ξ

η

=

服从t 分布,11

22

//V n F V n =

服从F 分布。

7.第11章 统计指数

(1)了解统计指数的含义,包括广义的指数和侠义的指数。

(2)了解统计指数的分类,重点是个体指数、总体指数、数量指标指数和质量指标指数。

(3)熟练掌握综合指数的编制方法。知道在什么情形下,同度量因素应如何选择。编制数量指标指数,应以基期的质量指标作为同度量因素。编制质量指标指数,应以报告期的数量指标作为同度量因素。 (4)熟练掌握拉氏指数和派氏指数。

8.第八章 相关与回归分析

(1)知道函数关系和相关关系。 (2)掌握相关关系的种类。

(3)掌握相关分析定义,了解相关分析基本方法:相关表、相关图和相关系数。 (4)熟练掌握相关系数的含义、计算方法,以及相关系数与相关关系程度的这

两者的对应关系。

(5)熟练掌握回归分析定义

(6)了解回归模型的模型假释、思想和处理方法。 (7)熟练掌握参数估计、预测的计算过程。

三、课堂练习 1.选择题

(1) 若要了解某市工业生产设备情况,则总体单位是该市的( D ) A. 每一个工业企业 B. 每一台设备

C. 每一台生产设备

D. 每一台工业生产设备 (2)统计年鉴属于( A )

A. 统计资料

B. 统计工作

C. 统计理论

D. 统计实践 (3)下列标志中属于品质标志的是( D )

A. 年龄

B. 工资

C. 日产量

D. 籍贯

(4)某连续变量数列,其末组为500以上。又如其邻近组的组中值为480,则末组的组中值为( B )

A. 510

B. 520

C. 530

D. 540 (5)英国的威廉·配第是(B )的代表人物。

A. 记述学派

B. 政治算术学派

C. 图表学派

D. 数理学派 (6)变量数列中各组频率的总和应该( B )

A. 小于1

B. 等于1

C. 大于1

D. 不等于1

(7)某总体容量为N ,其标志值的变量服从正态分布,均值为μ,方差为2

σ。

X 为样本容量为n 的简单随机样本的均值(不重复抽样),则X 的分布为( D )。

A. ),(2

σμN B.

)

,

(2

n N σμ

C. )

,(2n X N σ D. )1,(2--?N n

N n N σμ

(8)某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是(B )

A. 平均指标

B. 强度相对指标

C. 总量指标

D. 发展水平指标 (9)平均指标反映了( C ) A. 总体单位的偏度和峰度 B. 总体分布的特征趋势 C. 总体单位的集中趋势

D. 总体次数分布的离中趋势 (10)某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均单位成本(C )

A.

201815

17.673

++=(元) B. 320181517.54??=(元)

C.

20750181000151500

17.0875010001500?+?+?=++(元)

D. 7501000150016.8375010001500

201815

++=++(元)

(11)根据某一统计数列计算的标准差数值越小,则表明( C ) A. 平均数代表性越强,总体离差程度越大 B. 平均数代表性越弱,总体离差程度越小 C. 平均数代表性越强,总体离差程度越小

D. 平均数代表性越弱,总体离差程度越大 (12)数列1,3,5,7,9的总体方差是(B )

A. 5

B. 8

C. 4

D. 10

(13)下面表述中错误的是:同度量因素是(C )

A.综合指数中的固定媒介因素

B.综合指数的权数

C.综合指数中所要对比的指标因素

D.综合指数编制中的核心问题

(14)已知随机变量X 服从二项分布,且期望值为1,方差为0.8。则该二项分布的参数n 和p 的值分别应为( A )

A.5,0.2n p ==

B. 2,0.5n p ==

C. 4,0.25n p ==

D. 1,0.8n p ==

(15)若随机()2~,X N μσ,()~0,1Z N ,则( B ) A.Z X μ

σ

-= B.X Z μ

σ

-= C.X Z σ

μ-=

D.Z X σ

μ

-=

(16)二个总体都服从正态分布,从这两个总体中分别抽取一个容量为100和200的简单随机样本,则这两个样本方差之比的分布为( b ) A.正态分布 B.F 分布 C.2χ分布 D.二项分布 (17)拉氏的物量指数公式是( a ) A.100

q q p K q p

=

∑∑ B. 1000

p p q K p q

=

∑∑

C.11

1

q q p K q p

=

∑∑ D.1101

p p q K p q

=

∑∑

(18)某企业按1990年不变价格编制的1995年工业总产值指数为135%,这说明( d )

A.每种产品的产量都增长了35%

B.每种产品的价格都上涨了35%

C.由于价格变动使产值增长了35%

D.由于产量变动使产值增长了35% (19) 用最小二乘法拟合直线回归方程时,必须要满足的一个基本条件是( a )。

A. ()2

c y y -∑取最小值 B. ()c y y -∑取最小值 C. ()2c y y -∑取最大值 D. ()c y y -∑取最大值

(20)已知变量X 与变量Y 之间的关系,如下图所示,其相关系数计算出来放在四个备选答案之中,它是( d )。

10.00

8.006.004.002.000.0012.00

10.00

8.00

6.00

4.00

2.00

0.00

y2

y1

图1:变量X 与变量Y 的散点图

注:X 用交叉(X )来表示,Y 用圆圈(O )来表示

A. 0.29

B. -0.88

C. 1.03

D. 0.99

2.案例材料分析

①书本上P26,《2007年国民经济和社会发展公报》 ②书本上P10,《小资料:一些重要的宏观经济指标》 ③书本上P29,《证券时报2007年投资总结及2008年投资展望调查分析报告的节选》

④书本上P70,《平均数的“平均性”》 ⑤书本上P286,《失业、GDP 及奥肯定律》 ⑥书本上P316,《统计局总经济师:未来3个月我国CPI 将进一步回落》。

3. 计算题

<1>下表给出了工人日产量的数据: 按日产量分组 工人数f 组中值x 频率 60以下 10 60-70 19 70-80 50 80-90 36 90-100 27 100-110 14 110以上 8

问题:

①请计算各组组中值,并在上表第三列填上计算结果。 ②各组的组距是多少?

③计算各组工人数的频率,并在上表第四列填上计算结果。 ④计算职工日产量的算术平均数。

⑤计算职工日产量的总体标准差。

<2>设有1995~2004年10年个人消费支出(C)和个人收入水平(Y)资料见下表,

表5 个人收入和消费支出情况

年份个人收入Y消费支出C

1995 64 56

1996 70 60

1997 77 66

1998 82 70

1999 92 78

2000 107 88

2001 125 102

2002 143 118

2003 165 136

2004 189 155

问题:

(1)以个人收入为横坐标,以个人消费支出为纵坐标,画出散点图。

(2)计算个人收入与个人消费支出的相关系数

(3)以个人收入为自变量,以个人消费支出为因变量,建立直线回归方程:=+。请利用资料进行参数估计。并在(1)的散点图中画出直线

C a bY

回归方程

(4)假设2005年当个人收入达到了200时,试预测消费支出。

<3>有40名学生的统计学成绩,成绩资料如下:(单位:分)

40名学生的统计学成绩

序号 1 2 3 4 5 6 7 8 9 10 成绩89 88 76 99 74 60 82 60 89 86 序号11 12 13 14 15 16 17 18 19 20 成绩93 99 94 82 77 79 97 78 95 92 序号21 22 23 24 25 26 27 28 29 30 成绩87 84 79 65 98 67 59 72 84 85 序号31 32 33 34 35 36 37 38 39 40 成绩56 81 77 73 65 66 83 63 79 70 问题:

(1)根据上述数据进行统计分组,并编制分配数列。请依次完成下列问题和表格

①分组数目:拟分组。(1分)

②组距:每组组距是分。(1分)

③完成下面表格。其中分组列:应填上每一组的下限和上限;频数列、频率列和累计频率列应填上各组的频数、频率和向上累计频率。如果表格不够行数,可以自行增加行。(8分)

分组 频数 频率(%)

向上累计频率(%)

<4>.J.R.赖兰计算机公司正在考虑扩建工厂,使公司能够生产一种新型的计算机产品.公司的董事长必须做出决定:是进行中等规模的扩建还是进行大规模扩建.对新产品的需求具有不确定性,可能是低需求、中等需求或高需求,需求概率的估计分别是0.20,0.50和0.30.令x 表示公司的年利润,单位是千美元;y 表示公司的计划人员关于中等规模扩建和大规模扩建工程的利润预期数额。

需求

中等规模扩建的利润 大规模扩建的利润 x f (x) y f (y) 低 中等 高 50 0.20 150 0.50 200 0.30 0 0.20 100 0.50 300 0.30

(1)计算与两种扩建方式有关的利润期望值.对于预期利润最大化目标来说,哪一种决策最好?

(2)计算与两种扩建方式有关的利润的方差.对于风险或不确定性最小化目标

来说,哪一种决策最好?

<5>某商店三种商品的销售量和价格如下表所示: 商品名称 计量单位 销售量 销售价格

基期0q

报告期1q

基期0p

报告期1p

甲 台 4000 5000 192 168 乙 件 800 1040 50 40 丙 公斤 200 150 250 300 问题:(1)选择恰当的指数,说明由于销售量变动对销售额的影响。 (2)选择恰当的指数,说明由于价格变动对销售额的影响。

<6>计算下面10名工人的月平均工资 工人序号

1 2 3 4 5 6 7 8 9 10 工资 1050 1000 1200 1410 1590 1400 1100 1570 1710 1550 问题:求这10名工人的月平均工资。

<7>计算序列{2,4,6}和{5,6,7}这两个序列的相关系数。

<8>计算某国家2000年和2001年国内生产总值资料如下表所示,填列表中所缺的数字。

2001年 2000年实际完成(亿元)

2001年比2000年增长实际完成(亿比重(%)

元)

(%) 国内生产总值 其中:第一产业 第二产业 第三产业 424 4.8

28.4 118 192 5.8

选择题答案

题号 1 2 3 4 5 6 7 8 9 10 答案 D A D B B B D B C C 题号 11 12 13 14 15 16 17 18 19 20 答案

C

B

C

A

B

B

A

D

A

D

计算题答案

第(1)题解: 按日产量分组 工人数f 组中值x 频率 60以下 10 55 6.1% 60-70 19 65 11.6% 70-80 50 75 30.5% 80-90 36 85 22% 90-100 27 95 16.5% 100-110 14 105 8.5% 110以上 8 115 4.9%

①请计算各组组中值,并在上表第三列填上计算结果。 ②各组的组距是多少?组距为10

③计算各组工人数的频率,并在上表第四列填上计算结果。 ④计算加权平均数:

55108115

108

1350016482.62i i

i

x f f

?++?=

++=

=∑∑

⑤计算方差

()2

36172.56

()220.56164

i x x f

Var x f

-=

=

=∑∑ 标准差为()220.5614.85Var X σ===

第(2)题解:

(1)散点图如下

200

1801601401201008060个人收入

160

140

120

100

80

60

40

消费支出

(2)设个人收入为变量x ,个人消费支出为变量y ,其样本相关系数的计算公式为:

()()()()()()()()

2

2

22

1

11xy xx yy

x x y y L x x y y n r L L x x y y x x y y n n

----=

==

----∑∑∑∑∑∑

年份 个人收入 x

个人支

出 y x x - y y - ()2

x x -

()

2

y y -

()()x x y y --

1995 64 56 -47.4 -36.9 2246.8 1361.6 1749.1

1996 70 60 -41.4 -32.9 1714.0 1082.4 1362.1 1997 77 66 -34.4 -26.9 1183.4 723.6 925.4 1998 82 70 -29.4 -22.9 864.4 524.4 673.3 1999 92 78 -19.4 -14.9 376.4 222.0 289.1 2000 107 88 -4.4 -4.9 19.4 24.0 21.6 2001 125 102 13.6 9.1 185.0 82.8 123.8 2002 143 118 31.6 25.1 998.6 630.0 793.2 2003 165 136 53.6 43.1 2873.0 1857.6 2310.2 2004 189 155 77.6 62.1 6021.8 3856.4 4819.0 合计 1114 929 16482.4 10364.9

13066.4

①先算个人收入的平均值和个人消费支出平均值为:

1011114111.410n i i x x n ====∑,10192992.910

n i i y y n ====∑

②计算xx L ,xy L ,yy L

()2

16482.4xx L x x =-=∑, ()210364.9yy L y y =-=∑,

()()13066.4xy L x x y y =--=∑ ③相关系数的计算公式为:

13066.4

116482.410364.9

xy xx yy

L r L L =

=

=?

(3)设回归直线方程为:y a bx =+,根据最小二乘法,参数估计公式为:

13066.4

0.7916482.4

xy xx

L b L =

=

=

92.90.79111.4 4.6a y bx =-=-?=

所求的回归直线为: 4.60.79y x =+,即 4.6.79C Y =+ 回归直线拟合图如下:

200

1801601401201008060个人收入

160

140

120

100

80

6040

消费支出

R S q Li near = 0.999

R S q Li near = 0.999

(5) 当200Y =时,代入回归直线方程,可得: 4.60.79200163.3C =+?=,即

消费支出达到163.3。

第(3)题解:

解:(1)根据上述数据进行统计分组,并编制分配数列。请依次完成下列问题和表格

①分组数目:拟分 5 组。

②组距:每组组距是 10 分 。

③完成下面表格。其中分组列:应填上每一组的下限和上限;频数列、频

率列和累计频率列应填上各组的频数、频率和向上累计频率。如果表格不够行数,可以自行增加行。(8分)

表3 频数分析表(12分)

分组 频数 频率(%) 向上累计频率(%) 60以下 2 5 5 60-70 7 17.5 22.5 70-80 11 27.5 50 80-90 12 30 80 90-100 8 20 100

(2)请计算这40学生统计学成绩的平均分和总体方差。

解:①有两种方法:第一种是根据分组数据,采取加权算术平均数的计算公式。略。

②直接用原始数据计算可得:

88897079.5540

x x n

+++=

==∑

()

()()()

2

22

2

888089807080var 14540

i x x n

--+-++-=

=

=∑

第(4)题解:

解:(1)对于中等规模扩建的预期利润:

()500.21500.52000.3145i i E x x p ==?+?+?=∑ 对于大规模扩建的预期利润

()00.21000.53000.3140i i E y y p ==?+?+?=∑

显然()()E x E y >,对于预期利润最大化目标来说,应该选择中等规模扩建为好。 (2)对于中等规模扩建的利润的方差:

()()()()()()()()22

2

2

2

501450.21501450.52001450.32725

i i

D x

E x E x x E x p =-=-=-?+-?+-?=∑ 对于大规模扩建的利润的方差 ()()()()()()()()2

2

2

2

2

01400.21001400.53001400.312400

i i

D y

E y E y y E y p =-=-=-?+-?+-?=∑ 显然()()D x D y <,对于风险或不确定性最小化目标来说,应该选择中等规模扩建为好。

第(5)题解: 解:(1)应计算拉氏物量指数

100

5000192104050150250400019280050200250

1049500858000122.31%

?+?+?=

=

?+?+?=

=∑∑q q p K q p

1

1049500858000191500q p q p

-=-=∑∑(元)

计算结果表明,三种商品销售量报告期比基期平均增长22.31%,由于销售量增长而增加的销售额为191500元。 (2)应计算派氏价格指数

1101

16850004010403001501925000501040250150

926600104950088.29%

?+?+?==

?+?+?=

=∑∑p p q K p q

11

01

9266001049500122900p q p q

-=-=-∑∑(元)

计算结果表明,三种商品价格报告期比基期平均下降11.71%,由于价格下降而减少的销售额为122900元。

第(6)题解: 解:平均月工资为1050100012001550135810

x x n

++++=

==∑

第(7)题解:

解:令{2,4,6}x =,{5,6,7}y = 列表计算有:

x

y

2x 2y xy

2 5 4 25 10 4 6 16 36 24 6 7 36 49 42 合计 12 18 56 110

76

根据相关系数公式有:

()()()()

2

2

222

2

3761218

35612

311018

1

n xy x y r n x x n y y -=

--?-?=?-?-=∑∑∑∑∑∑∑

第(8)题解:

解:计算题。国家2000年和2001年国内生产总值资料如下表所示,填列表中所缺的数字。

2001年 2000年实际完成(亿元)

2001年比2000年增长(%) 实际完成(亿元)

比重(%) 国内生产总值 其中:第一产业 第二产业 第三产业 424 ⑥100 ⑦404.6 4.8 ①120.4 28.4 118

⑨2.1 ②203.1 ④47.9 192 5.8 ③100.5 ⑤23.6 ⑧94.6 ⑩6.2 ①424×28.4%=120.4

②设2001年实际完成额为x ,x/192=1+5.8%,解得x =203.1 ③424-120.4-203.1=100.5 ④203.1/424=47.9% ⑤100.5/424=23.6%

⑥28.4%+47.9%+23.6%=100%

⑦设2000年实际完成额为x ,424/x=1+4.8%,解得x =404.6 ⑧404.6-118-192=94.6 ⑨120.4/118-1=2.1% ⑩100.5/94.6-1=6.2%

在考试试卷中可以看到的附录。 附录:一些复杂的计算公式

1.组距数列的加权平均数计算公式和总体方差计算公式:

加权平均数:i i

i

x f x f

=

∑∑ 总体方差:()2

()i

i

i

x x f Var X f -=

∑∑

2. 样本有偏方差和无偏方差计算公式:

有偏方差:()22

11n i i s x x n ==-∑ 无偏方差:()22

1

11n i

i s x x n ==--∑ 3. 样本相关系数的计算公式:

()()()()22

1

11x x y y n r x x y y n n

--=

--∑∑∑ 4. 回归直线方程:c y a bx =+在最小二乘法下参数估计公式:

xy xx

L b L =

a y bx =-

其中:()()xy L x x y y xy nxy =--=-∑∑ ()2

22xx L x x x nx =-=-∑∑ ()2

22yy L y y y ny =-=-∑∑ x x n

=∑,y y n

=∑

5.拉氏物量指数:100

q q p

K q p

=

∑∑; 拉氏价格指数:1000

p p q K p q =

∑∑

派氏物量指数:11

1

q q p K q p

=

∑∑; 派氏价格指数:1101

p p q K p q

=

∑∑

6.重复抽样的样本均值的抽样平均误差为:

2

x n

n

σσ

μ=

=

不重复抽样的样本均值的抽样平均误差为:

21x N n n N σμ-??

=

?-??

复习和考试过程中需要注意的问题:

①复习时,要注意看每次小课练习题的答案和做过作业的答案。答案放在ftp 上。

②考试时,尽量答题,不要留有空白。 ③考试时带计算器和直尺。

统计学整理笔记

● 例1:某企业计划规定劳动生产率比上年提高10%,实际提高15%。试计算劳动生产率计划完成百分数。 ● ● 例2:某企业计划规定某产品单位成本降低5%,实际降低7%,试计算成本计划完成指标。 ● 答案: 答案: 答案: 起重量(吨)X 台数f 起重总量(吨)xf 40 1 40 25 2 50 10 3 30 5 4 20 合计 10 140 起重量(吨) 起重机台数构成(%) (吨) 40 10 4 25 20 5 10 30 3 5 40 2 合计 100 14 技术级别 月工资(元) 工资总额(元) 1 146 730 2 152 2280 3 160 1880 4 170 1700 5 185 370 合计 —— 7960

答案: 答案: 某地区国内生产总值的资料 单位:亿元 答案: 某企业2014年第三季度职工人数:6月30日435人,7月31日452人,8月31日462人,9月30日576人,要求计算第三季度平均职工人数. 答案如右图 计划完成程度(%) 组中值(%) 企业数 实际完成数(万元) 计划任务数(万元) 90—100 95 5 95 100 100—110 105 8 840 800 110—120 115 2 115 100 合计 — 15 1050 1000 日产量 (公斤) 工人数(人)f 组中值 (公斤)x xf 20—30 10 25 250 30—40 70 35 2450 40—50 90 45 4050 50—60 30 55 1650 合计 200 — 8400 2009年 2010年 2011年 2012年 2013年 2014年 18530.7 21617.8. 26635.4 34515.1 45005.8 57733

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

社会统计复习题

第一章 1.一般来说,统计这个词包括三个含义:统计工作、统计资料和()。 4.统计按其内容主要包括两个方面:描述统计和()。 5.推断统计有两个基本内容:参数估计和()。 7.总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为()。凡能用数量的多少来表示的标志,称为()。凡不能用数量的多少来表示而只能文字表述的标志,称为()。 9.统计指标和标志的区别与联系在于:统计指标是说明()特征的,标志则是说明()特征的;统计指标的数值是由标志的数值()而成的。 1.统计总体同时具备三个特征( ) 。 A 同质性、大量性、可比性 B 同质性、大量性、变异性 C 数量性、具体性、综合性 D 数量性、具体性、可比性 8.按变量的性质,可把变量分为( ) 。 A 连续变量和随机变量 B 离散变量和确定性定量 C 连续变量和离散变量 D 确定性变量和随机变量 14.统计一般有三个含义,即()。 A 统计调查、统计整理、统计分析 B 统计工作、统计资料、统计学 C 统计活动、统计管理、统计预测 D 统计咨询、统计监督、统计信息 名词解释:大数规律社会统计学 第二章 4.()误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。()误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5.统计误差有()和()两类,其中()在全面调查和非全面调查中都可能发生。 7.统计调查从调查范围上分,可分为()和()。 8.统计调查按调查登记时间是否连续,可分为()和()。 9.统计调查从调查目的上,可分为()和专项调查。 1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫()。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 6.下面能进行除法运算的测量尺度是()。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 7.教育程度是()的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 8.智商是()的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 9.籍贯是()的测量。 A 定比尺度 B 定类尺度 C 定距尺度 D 定序尺度 简答:何谓抽样调查?抽样调查的优点是什么?

热力学与统计物理期末复习笔记1

热力学与统计物理期末复习笔记1

《热力学统计物理》期末复习 一、简答题 1、写出焓、自由能、吉布斯函数的定义式及微分表达式(只考虑体积变化功) 答:焓的定义H=U+PV,焓的全微分dH=TdS+VdP; 自由能的定义F=U-TS,自由能的全微分dF=-SdT-PdV; 吉布斯函数的定义G=U-TS+PV,吉布斯函数的全微分dG=-SdT+VdP。 2、什么是近独立粒子和全同粒子?描写近独立子系统平衡态分布有哪几种? 答:近独立子系统指的是粒子之间的相互作用很弱,相互作用的平均能量远小于单个粒子的平均能量,因而可以忽略粒子之间的相互作用。全同粒子组成的系统就是由具有完全相同的属性(相同的质量、电荷、自旋等)的同类粒子组成的系统。描写近独立子系统平衡态分布有费米-狄拉克分布、玻色-爱因斯坦分布、玻耳兹曼分布。 3、简述平衡态统计物理的基本假设。 答:平衡态统计物理的基本假设是等概率原理。等概率原理认为,对于处于平衡状态的孤立系统,系统各个可能的微观状态出现的概率是相等的。它是统计物理的基本假设,它的正确性由它的种种推论都与客观实际相符而得到肯定。 4、什么叫特性函数?请写出简单系统的特性函数。 答:马休在1869年证明,如果适当选择独立变量(称为自然变量),只要知道一个热力学函数,就可以通过求偏导数而求得均

匀系统的全部热力学函数,从而把均匀系统的平衡性质完全确定。这个热力学函数称为特性函数。简单系统的特性函数有内能U=U (S 、V ),焓H=H (S 、P ),自由能F=F (T 、V ),吉布斯函数G=G (T 、P )。 5、什么是μ空间?并简单介绍粒子运动状态的经典描述。 答:为了形象的描述粒子的运动状态,用r r p p q q ,,,,11 ;共2r 个变量为直角坐标,构成一个2r 维空间,称为μ空间。粒子在某一时刻的力学运动状态()r r p p q q ,,,,11 ;可用μ空间的一个点表示。 6、试说明应用经典能量均分定理求得的理想气体的内能和热容量中哪些结论与实验不符(至少例举三项)。 答:第一、原子内的电子对气体的热容量为什么没有贡献;第二、双原子分子的振动在常温范围内为什么对热容量没有贡献;第三、低温下氢的热容量所得结果与实验不符。这些结果都要用量子理论才能解释。 7、写出玻耳兹曼关系,并据此给出熵函数的统计意义。 答:玻耳兹曼关系:S=k lnΩ 熵函数的统计意义:微观态数的多少反映系统有序程度的高低。微观态数增加就是有序程度的降低或是混乱程度增加,相应地熵增加;反之,微观态数减少就是有序程度的增加或混乱度减少,相应地熵减少。“熵是度量系统有序程度的量”有了明确定量意义。 8、 简述开系、闭系以及孤立系的定义。 答:热力学研究的对象是由大量微观粒子(分子或其它粒子)组成的宏观物质系统。与系统发生相互作用的其它物体成为外

基础统计学笔记 统计学基础笔记整理

一、统计学概论 分理论统计和应用统计 应用统计分为描述统计学和推断统计学。 描述统计为一组数据的中(位置均值、中位数)、散(极差、方差、标准差)、形|(偏度)描述。 推断统计分为参数估计和假设检验。技能 1、经验——数据收集加工——画成图形——数理(规律)(数据不等于数字) PPT 原则用图不用表、用表不用栏、用栏不用字实际问题 5M1E ——组成过程——产品(结果)——属性(包括几何(形位方尺)、物理、生化、人文)——集合统计问题 ——(构成)总体——样本——数据——类型分计数型(离散性)和计量型(连续性),即概率分布为计量型分布和技术型分布)——规律分描述和推断。

1、总体与样本中间有一种学问抽样验收抽样、统计抽样样本量 2、样本和数据中间有一门测量技术MSA 3、分布规律 总体参数平均值() 标准差() 总位数() 比例(p ) 样本统计量的特点随机变化,不要轻易用样本下结论。拉丁字母在数学上用于总体参数阿拉伯字母表示样本统计量希腊字母表示计算 总体参数统计分参数统计和非参数统计。推断统计分 估计总体总体某参数未知,用对应的样本统计量去猜测。检验假设总体某参数已知,用对应的样本统计量去验证。 二统计数据收集与整理1、数据不等于数字 2、数据的两种类型 描述性分类——响应变量(因变量)和预报因子(独立变量)如性别叫因子,男女叫水平。 四种尺度定类、定序、定距、定比

3.数据管理的7个层次无假不乱浅深系4.软件每一列表示一个变量,每一行表示一个样本鱼骨图只适用于一个为什么, 变量程序图IPO 适用于多个为什么。 I (变量)P O 水质烧开水色香味器皿材质火燃料风压强 目的要抓住关键的变量。 2、统计数据的表现形式绝对数——时期数和时点数相对数——比例部分比总体比率部分比部分 统计的数据来源直接来源和间接来源。 1、数据收集分被动收集(利用历史和现场)和主动收集(DOE 试验设计)现场收集数据是被动收集,分临时数据和常态数据。试验是临时数据。 数据好的特征。。。。 数据不好的7个陷阱缺少假混窄异病

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

统计学知识点汇总情况

统计学知识点汇总 一、统计学 统计学是一门关于数据资料的收集、整理、分析和推断的科学。 三、统计的特点 (1)数量性: 社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。 (2)总体性: 社会经济统计的认识对象是社会经济现象的总体的数量方面。例如,国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。 (3)具体性: 社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。(4)社会性: 社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。 四、统计工作过程 (1)统计设计 根据所要研究问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出收集、整理和分析数据的方案和工作进度等。 (2)收集数据 统计数据的收集有两种基本方法,实验法和调查法。 (3)整理与分析

描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。 (4)统计资料的积累、开发与应用 对于已经公布的统计资料需要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论知识去进行分析和利用。 五、统计总体的特点 (1)大量性 大量性是指构成总体的总体单位数要足够的多,总体应由大量的总体单位所构成,大量性是对统计总体的基本要求; (2)同质性 同质性是指总体中各单位至少有一个或一个以上不变标志,即至少有一个具有某一共同标志表现的标志,使它们可以结合起来构成总体,同质性是构成统计总体的前提条件; (3)变异性 变异性就是指总体中各单位至少有一个或一个以上变异标志,即至少有一个不同标志表现的标志,作为所要研究问题的对象。变异性是统计研究的重点。 六、标志与指标的区别与联系 ■区别: 标志是说明总体单位特征的;指标是说明总体特征的。 标志中的品质标志不能用数量表示;而所有的指标都能用数量表示。 标志(指数量标志)不一定经过汇总,可直接取得;而指标(指数量指标)一定要经过汇总才能取得。

生物统计学重要知识点

生物统计学重要知识点 (说明:下列知识点为考试内容,没涉及的不需要复习。注意加粗的部分为重中之重,一定要弄懂。大家要进行有条理性的复习,望大家考出好成绩!) 第一章概论(容易出填空题和名词解释) 1、生物统计学的目的、内容、作用及三个发展阶段 2、生物统计学的基本特点 3、会解释总体、个体、样本、样本容量、变量、参数、统计数、效应和互作 4、会区分误差(随机误差和系统误差)与错误以及产生的原因 5、会区分准确度和精确度 第二章试验资料的整理与特征数的计算(容易出填空和名词解释) 1、随机抽样必须满足的两个条件 2、能看懂次数分布表和次数分布图,会计算全距、组数、组距、组限和组中值 3、会求平均数(算数、加权和几何)、中位数、众数,算术平均数的重要特性 4、会求极差、方差、标准差和变异系数,理解标准差的性质 第三章概率与概率分布(选择、填空和计算) 1、理解事件、频率及概率,事件的相互关系,加法定理和乘法定理的运用 2、概率密度函数曲线的特点和大数定律 3、二项分布、泊松分布和正态分布的概率函数和标准分布图像特征,会计算概率值 4、理解分位数的概念,弄清什么时候用单尾,什么时候用双尾 5、样本平均数差数的分布 第四章统计推断(计算) 1、无效假设和备择假设、显著水平、双尾检验和单尾检验、假设检验的两类错误,会根据 小概率原理做出是否接受无效假设的判断 2、总体方差已知和未知情况下如何进行U检验 3、一个样本平均数的t检验(例4.5) 成组数据平均数比较的t检验(例4.6和4.7) 4、一个样本频率的假设检验(例4.11),知道连续性矫正 5、参数的区间估计(置信区间)和点估计

统计学复习笔记

统计学复习笔记 第七章 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

统计学原理考试知识点整理

第1章 绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性 具体性 综合性 3、统计学的若干基本概念 总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体,构成总体的个别事物叫总体单位; 总体的特征:同质性,大量性,差异性;总体的分类:有限总体与无限总体;标志、变异与变量P10: 标志,是指说明总体单位特征的名称。变异:总体单位之间品质和数量上的差异,即可变标志在总体各单位之间所表现出的差异。变量:可变的数量标志。 连续型变量与离散型变量联系和区别:连续型:变量值可作无限分割的变量离散型:变量值只能以整数出现的变量指标与标志P11 (指标,说明总体数量特征的概念)区别:第一,指标说明总体的特征,而标志则说明总体单位的特征。第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标。而标志既有反映数量也有反映品质。 第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义:根据统计研究的目的,有组织、有计划地搜集统计资料的过程地位:是统计工作的第一阶段,是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是,如实反映情况 二、要及时反映,及时预报 三、要数字与情况相结合 3、统计调查的组织形式:普查P14:含义:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点:,适用场合:主要用于一些重要项目呢的调查,如人口普查、耕地普查、基本单位普查、工业普查和库存普查等; 随机抽样调查P14:含义(按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法)以及具体的抽样方法【第七章】系统抽样、多阶 简单随机、分层抽样、整群抽样、 段抽样)及适用场合;非随机抽样:含义(调查者有意识地或随意而 非随机地从总体中抽取部分单位进行调查的统计方法)以及具体的抽样方法P15 (重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非

基础统计学笔记统计学基础笔记整理

基础统计学笔记统计学基础笔记整理 一、统计学概论: 分理论统计和应用统计: 应用统计分为描述统计学和推断统计学。 描述统计为一组数据的中(位置:均值、中位数)、散(极差、方差、标准差)、形|(偏度)描述。 推断统计分为参数估计和假设检验。技能: 1、经验——数据收集加工——画成图形——数理(规律) (数据不等于数字) PPT 原则:用图不用表、用表不用栏、用栏不用字实际问题: 5M1E ——组成过程——产品(结果)——属性(包括:几何(形位方尺)、物理、生化、人文)——集合统计问题:

——(构成)总体——样本——数据——类型:分计数型(离散性)和计量型(连续性),即概率分布为计量型分布和技术型分布)——规律分描述和推断。 1、总体与样本中间有一种学问:抽样:验收抽样、统计抽样样本量 2、样本和数据中间有一门测量技术:MSA 3、分布规律 总体参数:平均值() 标准差() 总位数() 比例(p ) 样本统计量的特点:随机变化,不要轻易用样本下结论。拉丁字母在数学上用于总体参数阿拉伯字母表示样本统计量希腊字母表 示计算 总体参数统计分参数统计和非参数统计。推断统计分 估计:总体总体某参数,用对应的样本统计量去猜测。检验:假设总体某参数已知,用对应的样本统计量去验证。 二:统计数据收集与: 1、数据不等于数字

2、数据的两种类型: 描述性分类——响应变量(因变量)和预报因子(独立变量)如性别叫因子,男女叫水平。 四种尺度:定类、定序、定距、定比 3.数据管理的7个层次:无假不乱浅深系 4.软件每一列表示一个变量,每一行表示一个样本鱼骨图只适用于一个为什么, 变量程序图IPO 适用于多个为什么。 I (变量) P O 水质烧开水色香味器皿材质火燃料风压强 目的要抓住关键的变量。 2、统计数据的表现形式:绝对数——时期数和时点数相对数——比例:部分比总体比率:部分比部分 统计的数据:直接和间接。

2013春社会统计学期末复习训练

2013春社会统计学期末复习训练 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是() A.样本B.总体C.统计量D.变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率B.累积频数C.累积频率D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平B.比较多组数据的平均水平 C.反映一组数据的离散程度D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有() A.50%的数据B.68%的数据C.95%的数据D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计B.区间估计C.有效估计D.无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例 ()偏高。如果要检验该说法是否正确,则假设形式应该6为() A.:≥0.1; :<;0.1 B.:≤0.1; :>0.1 C.:=0.1; :≠0.1 D.:>0.1; :≤0.1 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布B.观察值是相互独立的 C.各总体的方差相等D.各总体的方差等于0 9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是()

应用统计分析复习笔记

应用统计分析复习笔记 BY 东海 2009年12月1日星期二 第一章 导论 1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。内容:收集数据(取得数据);处理数据(整理与图表展示);分析数据(利用统计方法分析数据);数据解释(结果的说明);得到结论(从数据分析中得出客观结论)。 2、统计研究的循环过程:实际问题—收集数据—处理数据—分析数据—数据解释—实际问题。 4、描述统计:研究数据收集、整理和描述的统计学分支。内容:收集数据;整理数据;展示数据;描述性分析。目的:描述数据特征;找出数据的基本规律。 5、推断统计:研究如何利用样本数据来推断总体特征的统计学分支。内容:参数估计;假设检验。目的:对总体特征做出推断。 6、描述统计与推断统计的关系: 7、统计数据的类型 (1)按计量层次:分类数据、顺序数据、数值型数据(2)按收集方法:观测数据和实验数据(3)按时间状况:截面数据和时间序列数据 8、总体:所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素。分为有限总体和无限总体。 样本:从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量或样本量。 9、参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。所关心的参数主要有总体均值(μ )、标准差(σ)、总体比例(π)等。总体参数通常用希腊字母表示。 10、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数。所关心的样本统计量有样本均值(x )、样本标准差(s)、样本比例(p)等。样本统计量通常用小写英文字母来表示。 变量:说明现象某种特征的概念,如商品销售额、受教育程度、产品的质量等级等。变量的具体表现称为变量值,即数据变量可以分为:(1)分类变量(说明事物类别的名称)、顺序变量(说明事物有序类别的名称)和数值型变量(说明事物数字特征的名称)。其中数值型变量又分离散变量(取有限个值)和连续变量(可以取无穷多个值)。(2)经验变量(所描述的是我们周围可以观察到的事物)和理论变量(由统计学家用数学方法所构造出来的一些变量,比如,z 统计量、t 统计量、χ2统计量、F 统计量等)。(3)随机变量和非随机变量。 11、随机现象的一个特点是:不确定性。随机现象也存在其固有的量的规律性,人们把这一规律性称为随机现象的统计规律性。 对随机现象的观察称为随机试验,并简称试验,用以研究随机现象的统计规律性。随机试验的特点:可重复性、可观察性和随机性。统计中的抽样过程其实就是一次随机试验。因而可以利用概率论的技巧来分析推断统计方法。而样本其实就是随机变量。 12、常见分布:二项分布、几何分布、指数分布、正态分布。 13、统计学中泛称统计量(或枢轴量)的分布为抽样分布。讨论抽样分布的途经有两种:1)精确地求出抽样分布,并称相应地统计推断为小样本统计推断;2) 让样本容量趋于无穷,并求出抽样分布的极限分布。以极限分布作为抽样分 统计方法 描述统计 推断统计 参数估计 假设检验 点估计 区间估计

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

社会统计学复习整理

社会统计学复习整理 一、变量的测量层次 二、判断变量层次的技巧 1.首先所有的变量都是定类变量。 2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。 3.最后如果这个变量能够比较大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。 三、变量层次的比较 定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。

四、相关分析方法 第二节简化一个变项的分布 一、定类变量 1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。 2.统计表必备的容: (1)表号、标题 (2)标识行:变量名、对应数据说明(频次、频率) (3)主题行:变量取值的统计数据 (4)表尾:如果是引用必须说明资料来源 二、定序变量 1.适合定序变量的简化资料的方法 (1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和

向下累加次数(cf↓)。 (2)累加频率:把各级的百分率逐渐相加。也分为向下累加百分率和向下累加百分率。 2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。 3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。 ?cf↑表示低于某个等级的频数有多少 ?cf↓表示高于某个等级的频数有多少 三、定距变量 1.定距变量的简化工具是:分组、直方图和折线图。 2.连续型定距变量的分组统计 (1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。 (2)组限:包括上限(up)和下限(low) (3)标识下限和标识上限,例500—699 (4)真实下限:标识下限—0.5;真实上限:标识上限+0.5. (5)组距:真实上限与真实下限之差。 (6)组中值:真实上限与真实下限的平均值。 第三节集中趋势测量法 1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数 值来代表变项的资料分布,以反映资料的集结情况。 2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的 数值。

(完整word版)医学统计学 重点 终极笔记

Medical Statistics 【Introduction】 医学统计工作的内容 ⒈实验设计:最关键、最重要 ⒉收集资料:最基础 [原始资料] 实验数据,现场调查资料,医疗卫生工作记录、报告、报表 质量控制:精度和偏倚 ⒊整理资料:资料的逻辑、一致性检查,原始数据的加工(频数分布表) ⒋分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断 资料的类型 ⑴计量资料:定量方法测定数值大小所得的资料 ⑵计数资料:按性质或类别分组,然后计数 ⑶等级分组资料:具有计数资料的特性,又有半定量的性质(“+ , -”表示) 变异:不同个体在相同环境下,对外界环境因素发生的不同反应,即个体差异 总体:同质的个体所构成的全体。 [同质性,大量性,差异性] 样本:从总体中抽取部分个体的过程称为抽样,所抽得的部分是样本。 样本包含的个体数目称为样本含量 样本的特征:⑴代表性 ⑵随机性 ⑶可靠性 *抽样的要求:代表性,随机性,可靠性,可比性 完全随机设计:将受试对象随机分配到各处理组或对照组中,或分别从不同总体中随机抽样进行研究。可为两样本或多样本得比较,但样本含量 不宜相差太大。 随机区组设计:也称配伍设计,是配对设计的扩展。配对设计的每一“对子”中的受试对象分别随机分到两个处理组中,而配伍组设计中的每个 “配伍组”,包含多个受试对象,要将它们分别随机分到各处理 组中。 误差:泛指观测值与真实值之差,以及样本统计量与总体参数之差 ⑴系统误差:在收集资料过程中,由于仪器调整、试剂校验、医生对疗效的掌 握等因素,造成观察结果倾向性的偏大活偏小。要尽量查明原因,必须克服。 ⑵随机测量误差:在收集资料过程中,即使系统误差已经避免,由于各种偶然 因素的影响造成对同一对象多次测定的结果不完全一致。譬如操作员技术、电压、环境温度的差异。 没有固定的倾向,时高时低;应采取措施加以控制。

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

相关主题
文本预览
相关文档 最新文档