当前位置:文档之家› 统计学原理常用公式汇总79805

统计学原理常用公式汇总79805

统计学原理常用公式汇总79805
统计学原理常用公式汇总79805

统计学原理常用公式汇总

第2章统计整理

a)组距=上限-下限

b)组中值=(上限+下限)÷2

c)缺下限开口组组中值=上限-1/2邻组组距

d)缺上限开口组组中值=下限+1/2邻组组距

e)组数k=1+3.322Lg n n为数据个数

第3章综合指标

i.相对指标

1.结构相对指标=各组(或部分)总量/总体总量

2.比例相对指标=总体中某一部分数值/总体中另一部分数值

3.比较相对指标=甲单位某指标值/乙单位同类指标值

4.强度相对指标=某种现象总量指标/另一个有联系而性质不

同的现象总量指标

5.计划完成程度相对指标=实际数/计划数

=实际完成程度(%)/计划规定的完成程度(%)

ii.平均指标

1.简单算术平均数:

2.加权算术平均数或

3调和平均数:

?

?

=

f

X

f

X h

1

1

式中:,

h

Xf Xf m

X X

m

f Xf

X X

m

m Xf f

X

====

==

???

???

iii.标志变动度

1.全距=最大标志值-最小标志值

2.标准差: 简单σ= ;加权σ=

3.标准差系数:

iiii 抽样推断

1. 抽样平均误差:

重复抽样: n

x σ

μ=

n

p p p )

1(-=

μ 不重复抽样: )1(2

N

n n

x -

=

σμ 2.抽样极限误差 x x t μ=?

3.重复抽样条件下:

平均数抽样时必要的样本数目

2

22x t n ?=

σ

成数抽样时必要的样本数目2

2)1(p

p p t n ?-=

不重复抽样条件下:

平均数抽样时必要的样本数目

2222

2σσt N Nt n x +?=

第4章 动态数列分析

一、平均发展水平的计算方法:

(1)由总量指标动态数列计算序时平均数 ①由时期数列计算

n

a a ∑=

②由时点数列计算

在间断时点数列的条件下计算:

若间断的间隔相等,则采用“首末折半法”计算。公式为:

1

212

11

21-++++=-n a a a a a n n Λ 若间断的间隔不等,则应以间隔数为权数进行加权平均计算。公式为:

∑--++++++=f

f a a f a a f a a a n n n 1

123212

1222Λ

(2)由相对指标或平均指标动态数列计算序时平均数 基本公式为:

b

a c =

式中:c 代表相对指标或平均指标动态数列的序时平均数;

a 代表分子数列的序时平均数;

b 代表分母数列的序时平均数;

逐期增长量之和 累积增长量

二、平均增长量=─────────=─────────

逐期增长量的个数 逐期增长量的个

计算平均发展速度的公式为:

n x x ∏=

(2)平均增长速度的计算

平均增长速度=平均发展速度-1(100%)

第5章 统计指数

一、综合指数的计算与分析 (1)数量指标指数

01p

q p q ∑∑

此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。

(01p q ∑ -00p q ∑)

此差额说明由于数量指标的变动对价值量指标影响的绝对额。 (2)质量指标指数

∑∑0

1

11p

q p q

此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。

(11p q ∑-01p q ∑)

此差额说明由于质量指标的变动对价值量指标影响的绝对额。

加权算术平均数指数=

∑∑0

0p

q p kq

加权调和平均数指数=

∑∑1

1

11

1p

q k p q

复杂现象总体总量指标变动的因素分析 相对数变动分析:

11p

q p q ∑∑=

01p

q p q ∑∑×

∑∑0

1

11p

q p

q

绝对值变动分析:

1

1

p q ∑-00

p q

∑= (01p q ∑ -00p q ∑)×(11p q ∑-01p q ∑)

第6章 抽样调查

1、全及指标:根据全及总体中的各单位标志值或标志特征

计算的、反映总体某种属性的综合指标。

变量总体: 属性总体:

11N

P Q

N

σ==-== N 1 具有某种属性的单位数 , N 0 不具有某种属性的单位数

1

0=+=Q P N N Q N

X X N

X

X ∑∑

-=

=2

)

(σ称为总体标准差

σ(二)全及指标和抽样指标

2、抽样指标:根据抽样总体中的各单位标志值或标志特征

计算的综合指标。 变量总体:

1

)(2--=

=

∑n x x S n x x 称为样本标准差

S 属性总体:

01

n q n p q =

+= n 1 具有某种属性的单位数 , n 0 不具有某种属性的单位数

pq

p p S n

n p =

-==)1(1

2、不同抽样方法的样本可能数目

2)考虑顺序的不重复抽样

)!

(!

)1()1(n N N n N N N A n N

-=

+--=Λ3)不考虑顺序的不重复抽样

)!

(!!

!)1()1(n N n N n n N N N C n N -=

+--=

Λn

n N

N

B =1)考虑顺序的重复抽样

n

n N n

N C

D 1

-+=4)不考虑顺序的重复抽样

n

n

x σ

σμ=

=

2

变量总体:公式说明了,抽样平均误差仅为全及总体标准差

的 。

n 1

为总体标准差

σ

(1)重复抽样:

n

P P P )1(-=

μ属性总体:P 为总体成数

第7章 相关分析

1.相关系数

[][

]

∑∑∑∑∑∑∑---=

2

2

2

2

)

()(y y n x x

n y

x xy n γ

(2)不重复抽样:

很大时)当N N

n

n N n

N n x ()1()1

(2

2-≈

--=

σσμ 当抽样比大大小于1时,不重复抽样的抽样平均误差与重复抽样的很接近。 )1()1(N

n

n P P P --=

μn

t

t x x 2

σ

μ==?2

22x t n ?=σ重复抽样:

不重复抽样: )1(2

N

n n t

t x x -==?σμ2

22

2

σt N Nt n x +?=五、简单随机抽样的必要样本容量的确定

(一)计算公式:

n

p p t

t p p )

1(-==?μ2

2)1(p

p p t n ?-=)

1()

1(22

2p p t N p p Nt n p -+?-=

2.配合回归方程 y=a+bx

∑∑∑∑∑--=

2

2

)

(x x n y x xy n b

x b y a -=

3.估计标准误:

2

2

---=

∑∑∑n xy b y a y

s

y

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

统计学原理-计算公式

位值平均数计算公式 1、众数:是一组数据中出现次数最多的变量值 组距式分组下限公式:002 110m m d L M ??+??+= 0m L :代表众数组下限; 1100--=?m m f f :代表众数组频数—众数组前一组频数 0m d :代表组距; 1200+-=?m m f f :代表众数组频数—众数组后一组频数 2、中位数:是一组数据按顺序排序后,处于中间位置上的变量值。 中位数位置2 1+=n 分组向上累计公式:e e e e m m m m e d f S f L M ?-∑+=-12 e m L 代表中位数组下限; 1-e m S :代表中位数所在组之前各组的累计频数; e m f 代表中位数组频数; e m d 代表组距 3、四分位数:也称四分位点,它是通过三个点将全部数据等分为四部分,其中每部分包含 25%,处在25%和75%分位点上的数值就是四分位数。 其公式为:4 11+=n Q 212+=n Q (中位数) 4)1(33+=n Q 实例 数据总量: 7, 15, 36, 39, 40, 41 一共6项 Q1 的位置=(6+1)/4=1.75 Q2 的位置=(6+1)/2=3.5 Q3的位置=3(6+1)/4=5.25 Q1 = 7+(15-7)×(1.75-1)=13, Q2 = 36+(39-36)×(3.5-3)=37.5, Q3 = 40+(41-40)×(5.25-5)=40.25 数值平均数计算公式 1、简单算术平均数:是将总体单位的某一数量标志值之和除以总体单位。 其公式为:n x n x x x X n ∑=??++=21 2、加权算术平均数:受各组组中值及各组变量值出现的频数(即权数f )大小的影响,

医学统计学符号-公式-重点

第一章 医学统计中的基本概念 1、医学统计学是研究医学数据的收集、整理、分析、解释和呈现其结果的一门学科。 2、个体:研究的基本观察单位。 3、变量:用于观察研究对象的指标。 4、观察值:个体变量的数值。 5、资料:又称为数据,由变量的观察值构成。 变异:个体观察值之间具有 的差异。 变异和同质是对统计学数据 的要求! 变异是统计学研究的真正对 象! 统计学是研究变异规律的科 学! 同质:个体观察值之间的变 异在允许范围内。 异质:个体观察值之间的变 异超出允许范围。 一、总体、抽样、样本、参数、统计量 总体:同质的个体所构成的全体研究对象。总体同时具有同质和变异两个特点。 有限总体:总体中的个体 数量是有限的。 无限总体:总体中的个体 数量是无限的。 样本:从总体中随机抽取 的部分个体。 样本量:样本所包含的个

体数目。 参数:刻画总体特征的指标。 统计量:刻画样本特征的指标。 抽样:从总体中随机抽取部分个 体的过程。抽样具有代表性、随机性、可靠性、可比性; 原则:代表性:样本能充分反映 总体特征。 随机性:保证总体中每个个体都有相同的几率被抽样。 随机性是代表性的保证; 生活中随机性的例子(思考题); 计数资料计量资料 (分类资料)资料 等级资料(有序多分类资料) 二分类资料 无序多分类资料 计量资料:由连续变量的观察值构成的资料。对每个观察对象的观察指标用定量方法测定其数值大小 所得的资料,一般有度量衡单位,例如年龄、身高、 血糖。 计数资料:由离散变量的观察值构成的资料。先将 观察对象的观测指标按性 质或类别进行分组,然后 计数各组的数目所得的资料,例如性别、患病、血型。 等级分组资料:由等级变量的观测值构成的资料。具有计数资料的特征,同

统计学名词解释及公式

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。 概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。

11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。 22.离散型变量:只能取可数值的变量。 23.连续型变量:可以在一个或多个区间中取任何值的变量。 四、习题答案 1.D 2.D 3.A 4.B 5.A 6.D 7.C 8.B 9.A 10.A 11.C、12.C 13.B 14.A 15.C 16.D 17.C 18.A 19.C 20.D 21.A 22.C 23.C 24.B 25.D 26.C 27.B 28.D 29.A 30.D 31.A 32.B 33.C 34.A 35.A 36.A 37.D 38.B 39.B 40.C 41.C 42.D 43.C 44.D 45.A 46.B 47.C 48.A 49.C 50.D 51.A 52.C 53.D 54.A 55.B

统计学主要计算公式72485

统计学主要计算公式(第三章) 1 11 1k i i k i i k i k i i i f f f f ====?? ? ???? ? ? ?? ? ? ???? ?? ?∑ ∑ ∑ ∑ ∑ N i i=1i i 一、算术平x 简单x=N x 均数加权x=频数权数x=x 1i i H i i i i m m x m m x x = = ∑∑∑∑二、调和平均数 ? = ?? ? ? =?? G G 简单x 三、几何平均数加权x 11/2/2m e m m e m f S M L i f f S M U i f -+?-=+ ??? ? -?=-???∑∑下限公式四、中位数上限公式 1012 20 12d M L i d d d M U i d d ? =+??+?? ?=-??+? 下限公式五、众数上限公式

() ()x x x x f f AD AD ? -?? ? -??? ∑ ∑∑六、平均差简单=N 加权= σ σ σ σ ??? ???? ??? ??? ????? ??? 七、标准差简单加权 简捷公式 简单 加权 100%100% AD AD V x V x σσ ? ??? ? ???? 平均差系数=八、离散系数标准差系数= 统计学主要计算公式(第五章) ( )( ) 11n n s s t t n αα α α αα σ σ μμμμμμ--?±±?? ?? ±±?? ? ?±±??22 22 22 一、参数估计(随机抽样)1.总体均值估计-单总体 正态总体,方差已知 =x z =x z 正态总体,方差未知=x =x 非正态总体,足够大=x z =x z

统计学主要计算公式

统计学主要计算公式(第三章) 统计学主要计算公式(第五章) 010220102001001111221012221 22((((1,1)(1,1)(H H Z Z H H H Z Z H H H Z Z H H H F n n F F n n H S F S ααααασσσσχσσσσσσσσσσσσσ-?≠≥??>≥??<≤??≠--≤≤--22220022222002222002222224.方差检验(正态总体) 单总体: :=:拒绝双侧)(n-1)S =:=:拒绝单侧):=:拒绝单侧) 两方差之比检验 :=:拒绝=011112001111210(1,1)((1,1)(H H F F n n H H H F F n n H αασσσσσσσσ-???>≥--??<≤--??222222222222双侧):=:拒绝单侧):=:拒绝单侧) 统计学主要计算公式(第六章) 统计学主要计算公式(第七章) 统计学主要计算公式(第八章) d L d U 2 4-d U 4-d L d

01'201201101???????(1)(1)(1)t t t t t t t t t y y b b t y y b b t b t y ab b b y y a y a a a a -???=+???=++???=?? =++++=+-=-+-t t-1t t-1t-2t-n t+1t t 六、时间序列预测 一阶差分大致相同,趋势外推法模型测定二阶差分大致相同, (同回归模型)y 环比发展速度大体相同,y 自回归预测y (同回归模型) y y y 移动平均n 指数平滑y =ay y y 201(1)(1)n a a a a ++-++-t-1t-2t-n-1 y y 统计学主要计算公式(第九章)

医学统计学公式整理 简洁版

集中趋势的描述 算术均数: 频数表资料(X0为各组段组中值) n fX f fX x O O ∑∑∑== 几何均数: n n X X X G ...21= 或 ) log ( log 1 n X G ∑-= 频数表资料: ? ?????=????????=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)* 2 1 +=n X M (2) ) (21* 12*2++= n n X X M 百分位数 ?? ? ??-?+ =L X X f n X f i L P 100其中:L 为欲求的百分位 数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为 该组段的的频数 , L f 为该组段之前的累计频数 方差: 总体方差为:式(1); 样本方差为 式(2) (1) N X 2 2 )(μσ-∑= (2) 1)(2 2--∑= n X X S 标准差: 1)(2--∑= n X X S 或 1/)(22-∑-∑= n n X X S 频数表资料计算标准差的公式为 1/)(22-∑∑∑-∑= f f fx fx S 变异系数:当两组资料单位不同或均数相差较大时,对变异 大小进行比较,应计算变异系数 %100?= X S CV 常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化 N p N p i i ∑= ' ∑=i i p N N p )(' 2.间接法标准化 预期人数实际人数= SMR ∑=i i P n r SMR S M R P P ?=' 正态分布:密度函数: )2/()(2221)(σμπ σ--= X e X f 分布函数: 小于X 值的概率,即该点正态曲线下左侧面积 )()(x X P x F <= 特征:(1)关于x=μ对称。(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。(5)曲线下面积分布有一定规律 标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换 σ μ-= X u ,u 服从总体均数为0、总体标准 差为1的正态分布。 u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ 医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为 S X 96.1± 样本均数标准误的估计值为 X s = t 分布的概念:小样本总体标准差未知时,服从自由度为n-1 的t 分布 X X X t s μ-= 总体均数可信区间的计算: 大样本或总体标准差已知:式(1); 小样本:式(2) (1)n S X ? ±96.1 (2)n S n t t ?±-)1(,05.0(前一个t 表示均数) 单样本t 检验: n S X t /0 μ-= 自由度为 n-1; 配对样本t 检验: 检验统计量: n S d t d /0-= 自由度为n-1(n 为对子数) 两样本t 检验:检验统计量: ) 11(2 12 1n n S X X t c +-= (错: Sc 的平方) 2 )()(2)1()1(21222211212 222112-+-+-= -+-+-= ∑∑n n X X X X n n S n S n S c 方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1 检验统计量: (较小)(较大)2 2 2 1 S S F = 分子自由度为n 1-1,分母自由度为n 2-1 方差分析的基本思想: 1、总变异:总离均差平方和: 2() 1 T ij i j SS SS X X N νν=-==-∑∑总总= ∑∑-=N X X ij ij /)(22 ∑=N X C ij /)( 2 2. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。 21() 1 B i i i SS SS n X X k νν-==-∑组间组间== = C n X i i ij -∑ ∑2 )( 3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。 222()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 2()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 1(1)()N k N k ννν=-=-+-=+总组间组内 组间均方与组内均方比值一般地服从分子自由度为ν1,分母 自由度为ν2的F 分布 12 1 MS F k N k MS νννν= ==-==-组间 组间组内组内 , 二项分布的概率函数P (X ): X n X X n C X P --=)1()(ππ; )! (!!X n X n C X n -= 二项分布的均数和标准差:进行n 次独立重复试验,出现X 次阳性结果 X 的总体均数为πμn = 总体方差为)1(2ππσ-=n 总体标准差为)1(ππσ -=n 如果将阳性结果用频率表示 n X p = 率的总体均数 π μ=p 标准差 n p ) 1(ππσ-= n p p n p p S p )1(1 ) 1(-≈--= 又称率的标准误它反映率的抽样误差的大小。 单侧累积概率计算:出现阳性的次数至多为k 次的概率为 ∑∑ ==---==≤k X k X X n X X n X n X P k X P 0 0)1()! (!! )()(ππ 出现阳性的次数至少为k 次的概率 ∑∑ ==---==≥n k X n k X X n X X n X n X P k X P )1()! (!! )()(ππ 率的可信区间的估计 正态近似法:当)1(,p n np - 均大于等于5时 n p p p n p p P )1(96.1,)1(96.1-+-? - 样本率与总体率的比较: 检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量 ) 1(000 πππ--= n n X Z 或 n p Z ) 1(000 πππ--= 2. 不满足正态近似时用直接概率计算法 两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量: ) 1 1)(1(| |2121n n p p p p Z c c +--= 2121n n X X p c ++= Poisson 分布的概率函数为 ! )(X e X P X λλ -= POISSON 分布的应用: 单侧累计概率计算:稀有事件发生次数至多为k 次的概率为 ∑∑==-==≤k X k X X X e X P k X P 0 ! )()(λλ 发生次数至少为k 次的概率为 )1(1)(-≤-=≥k X P k X P 总体均数的区间估计:正态近似法 95%总体均数的可信区间为X X X X 96.1,96.1+- 样本率和总体率的比较 正态近似法: 当满足正态近似条件时, 对检验假设 H0:λ=λ0,H1:λ≠λ0, 检验统计量为 λ λ-= X Z 两组独立样本资料的Z 检验 :当两总体均数都大于20时, 对检验假设H0:λ1=λ2, H1:λ1≠λ2,当两样本观测单

最新《统计学原理》常用公式汇总及计算题目分析

《统计学原理》常用公式汇总及计算题目分析 第一部分常用公式 第三章统计整理 a)组距=上限-下限 b)组中值=(上限+下限)÷2 c)缺下限开口组组中值=上限-1/2邻组组距 d)缺上限开口组组中值=下限+1/2邻组组距 第四章综合指标 i.相对指标 1.结构相对指标=各组(或部分)总量/总体总量 2.比例相对指标=总体中某一部分数值/总体中另一部分数值 3.比较相对指标=甲单位某指标值/乙单位同类指标值 4.强度相对指标=某种现象总量指标/另一个有联系而性质不同的现 象总量指标 5.计划完成程度相对指标=实际数/计划数 =实际完成程度(%)/计划规定的完成程度(%) ii.平均指标

1.简单算术平均数: 2.加权算术平均数或 iii.变异指标 1.全距=最大标志值-最小标志值 2.标准差: 简单σ= ;加权σ= 3.标准差系数: 第五章抽样估计 1.平均误差: 重复抽样: 不重复抽样: 2.抽样极限误差 3.重复抽样条件下: 平均数抽样时必要的样本数目

成数抽样时必要的样本数目 4.不重复抽样条件下: 平均数抽样时必要的样本数目 第七章相关分析 1.相关系数 2.配合回归方程y=a+bx 3.估计标准误: 第八章指数分数 一、综合指数的计算与分析 (1)数量指标指数

此公式的计算结果说明复杂现象总体数量指标综合变动的方向和程度。 ( - ) 此差额说明由于数量指标的变动对价值量指标影响的绝对额。 (2)质量指标指数 此公式的计算结果说明复杂现象总体质量指标综合变动的方向和程度。 ( - ) 此差额说明由于质量指标的变动对价值量指标影响的绝对额。 加权算术平均数指数= 加权调和平均数指数= (3)复杂现象总体总量指标变动的因素分析 相对数变动分析: = × 绝对值变动分析:

医学统计学公式总结

一 资料的描述性统计 (一)算术均数(mean) (1)简单算术平均值定义公式为(直接法): (2)利用频数表计算均数(加权法): (二)方差(即标准差的平方) (三)变异系数 二 参数估计与参考值范围 (一)均数的标准误 (二)样本率的标准误 (p 为样本率) (三)T 分布 (u 为总体均数) (四)总体均数的区间估计 (一般要求 计算95%或99%的可信区间) (五)总体率的区间估计 (六)参考值范围估计 双侧1-a 参考值范围: s u x a 2/± 单侧1-a 参考值范围: s u x a ->或s u x a +< (可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书) 三 T 检验与方差分析 (一)T 检验 (1)单样本T 检验 n x n x x x x x n ∑= ++++= 321∑∑= ++++++++=f fx f f f f x f x f x f x f x k k k 3213322111 )(2 2--= ∑n x x s 22 2()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-=n s x t μ-=x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

检验假设: (假设样本来自均数为0 u 的正态总体) 统计量t 值的计算: (2)配对T 检验 检验假设: 统计量t 值的计算: (d 为两组数据 的差值,Sd 为差值的标准差) (3)两样本T 检验 检验假设: 统计量t 值的计算: 其中 两样本方差齐性检验 (即为两样本方差的比值) (二)单因素方差分析 SS MS F SS MS νν= = B B B W W W (1)完全随机设计资料的方差分析 这里 (T 即为该组数据之和) (2)随机单位组设计资料的方差分析 SS 总=SS 处理+SS 区组+SS 误差 V 总=V 处理+V 区组+V 误差 μμ=:H 1 ,/0 0-=-=-= n n s x s x t x νμμ0210==-μ μμ:H d d t s μ-== 1 -=n ν210μμ=:H 2 1)()(2121x x s x x t ----=μμ2 21-+=n n ν ? ??? ??+=-2121121n n s s C x x 2)()(112222112-+∑-∑+-=n n x x x x s C 2221s s F =111-=n ν1 2 2-=n ν组内组间总SS SS SS +=组内 组间总ννν+=2()/C x N =∑ij j T x = ∑

统计学主要计算公式

统计学主要计算公式(第三章) 1 11 1k i i k i i k i k i i i f f f f ====?? ? ???? ? ? ?? ? ? ???? ?? ?∑ ∑ ∑ ∑ ∑ N i i=1i i 一、算术平x 简单x=N x 均数加权x=频数权数x=x 1i i H i i i i m m x m m x x = = ∑∑∑∑二、调和平均数 ? = ?? ? ? =?? G G 简单x 三、几何平均数加权x 11/2/2m e m m e m f S M L i f f S M U i f -+?-=+ ??? ? -?=-???∑∑下限公式四、中位数上限公式 1012 20 12d M L i d d d M U i d d ? =+??+?? ?=-??+? 下限公式五、众数上限公式

()()x x x x f f AD AD ? -?? ? -??? ∑∑∑六、平均差简单= N 加权= σ σ σ σ ??? ???? ??? ??? ????? ??? 七、标准差简单加权 简捷公式 简单 加权 100% 100% AD AD V x V x σσ ? ??? ? ???? 平均差系数=八、离散系数标准差系数= 统计学主要计算公式(第五章) ( ) ( ) 11n n t t n αα αα αα μμμμμμ--?±±?? ?? ±±?? ? ?±±??22 22 22 一、参数估计(随机抽样)1.总体均值估计-单总体 正态总体,方差已知 =x z =x z 正态总体,方差未知=x =x 非正态总体,足够大=x z =x z

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论真实情况拒绝H 0不拒绝H H 正确Ⅰ型错误(ɑ)推断正确(1?ɑ) H 不正确推断正确(1?β)Ⅱ型错误(β) Ⅰ型错误(ɑ错误):H 为真时却被拒绝,弃真错误 Ⅱ型错误(β错误):H 为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n 7.方差分析 方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本

医学统计学相关公式汇总

医学统计学相关公式汇总 Chapter 基本概念 显著性检验(test of significance ):计算P 值 医学统计工作的内容: 1、实验设计:最关键最重要 2、收集资料:最基础 原始资料:实验数据 现场调查资料 医疗卫生工作记录 报表 报告卡 质量控制——精度和偏倚 3、整理资料 (1) 资料的逻辑检查(坏数) (2) 一致性检查 (3) 原始数据加工:频数分布表 4、分析资料:统计描述(表、图、离散趋势、集中趋势)和统计推断 统计描述类型的选择: 集中趋势 离散趋势 对称、正态 μ,x S SS ,, 对数正态 G S lgX 偏态及其他 M Q ,R 单位不同或均数差别大 CV 医学统计的资料类型:计量资料、计数资料、等级分组资料 医学统计学的对象:有变异的事物 总体和样本: 总体(population )的特性:同质性、大量性、差异性。

抽样的要求:代表性、随机性、可靠性、可比性。 样本的三性:代表性、随机性、可靠性。 可靠性(reliability ):实验的结果要具有可重复性。即由科研课题的样本得出的结论所推测总体的结论有较大的可信度。 两样本间具有:可比性。 误差的类别: 1、系统误差(system error ):在资料的收集过程中,由于仪器初始状态没有调零、标准试剂未经矫正、标准指定偏高或偏低等原因,造成的观察结果的倾向性的偏大或偏小。必须克服。 2、随机测量误差(random measurement error ):在避免系统误差的情况下,由于各种偶然因素的影响造成对同一对象多次测量值的不一致。 3、抽样误差(sampling error ):由于抽样造成的的样本统计量与总体参数之间的差别。不可避免。样本含量越大,抽样误差越小。如均数的抽样误差:|-X | 。 概率(probability ):P (A ) 小概率事件:P ≤0.05(有统计学意义)或P ≥0.01(有高度统计学意义)。 Chapter 集中趋势的统计描述 手工整理资料频数表(frequency table )的步骤: 1、求极差(全距) 2、确定组数、组距 参考组距=全距 / 组数 3、确定组段 4、手工编制划记表 直方图(histogram ): 高度:各组的频数 纵轴 宽度:组距 横轴表示组限 均数(average ): 适用:对称分布或偏度不大的资料,尤其适合正态分布。 抽样 总体 样本 推断

统计学各章计算题公式及解题方法

统计学各章计算题公式及解题方法 第四章数据的概括性度量 1.组距式数值型数据众数的计算:确定众数组后代入公式计算: 下限公式:;上限公式:,其中,L为众数所在组 下限,U为众数所在组上限,为众数所在组次数与前一组次数之差,为众数所在组次数与后一组次数之差,d为众数所在组组距 2.中位数位置的确定:未分组数据为;组距分组数据为 3.未分组数据中位数计算公式: 4.单变量数列的中位数:先计算各组的累积次数(或累积频率)—根据位置公式确定中位 数所在的组—对照累积次数(或累积频率)确定中位数(该公式假定中位数组的频数在该组内均匀分布) 5.组距式数列的中位数计算公式: 下限公式:;上限公式:,其中,为中位数 所在组的频数,为中位数所在组前一组的累积频数,为中位数所在组后一组的 累积频数 6.四分位数位置的确定: 未分组数据:;组距分组数据: 7.简单均值: 8.加权均值:,其中,为各组组 中值 9.几何均值(用于计算平均发展速度): 10.四分位差(用于衡量中位数的代表性): 11.异众比率(用于衡量众数的代表性):

统计学各章计算题公式及解题方法 : 12.极差:未分组数据:;组距分组数据 13.平均差(离散程度):未分组数据:;组距分组数据: 14.总体方差:未分组数据:;分组数据: 15.总体标准差:未分组数据:;分组数据: 16.样本方差:未分组数据:;分组数据: 17.样本标准差:未分组数据:;分组数据: 18.标准分数: 19.离散系数: 第七章参数估计 1.的估计值: 置信水平α 90% 0.1 0.05 1.654 95% 0.05 0.025 1.96 99% 0.01 0.005 2.58 2.不同情况下总体均值的区间估计: 总体分布样本量σ已知σ未知 大样本(n≥30) 正态分布 小样本(n<30)

常用医学统计学方法的选择

常用医学统计学方法的选择 1. 多组率的比较用卡方检验(χ2检验,chi-square test) 直接用几个率的数值比较,与直接用原始数据录入比较,结果会有什么不同?卡方值会受样本量的影响,样本越多,卡方值越大。 2.多组计量资料比较采用方差分析(F检验) ,不能用t检验。当方差分析结果为P<0.05时,只能说明k组总体均数之间不完全相同。若想进一步了解哪两组的差别有统计学意义,需进行多个均数间的多重比较,即SNK-q检验(多个均数两两之间的全面比较)、LSD-t检验(适用于一对或几对在专业上有特殊意义的均数间差别的比较)和Dunnett检验(适用于k-1个实验组与一个对比组均数差别的多重比较)。 3.非正态分布多组数据之间比较选用非参数检验、单样本中位数检验(符号检验和Wilcoxon 检验)、双样本中位数检验(Mann-Whitney 检验)、方差分析(Kruskal-Wallis、Mood 中位数和Friedman 检验) 4.按血糖水平从低到高分成多组,进行多组之间死亡率的比较,由于死亡率同样受年龄、性别、病史、您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书血脂等因素的影响,所以需选取合适统计方法实现“调整年龄、性别等危险因素后,按血糖分组进行死亡率的比较(由血糖从低到高分成的4组)”。 ①年龄是定量变量(是数值),调整年龄的方法可在Logistic回归中运用,连续性变量年龄加入covariate中,当成协变量,就可以调整年龄,age-adjusted odds ratio就能得到了。 ②性别性别是二分类变量,不是定量变量,不可在LOGISTIC回归里比较。调整性别可在卡方检验中采取分层的方法比较。 如果为多分类LOGISTIC回归,在选择用multinomianl LOGISTIC回归中,可选入年龄等进入covariate,观察年龄的配比情况。可把性别选入factors(自变量)。这样可以实现调整年龄、性别等危险因素。 5.回顾性研究(1)临床妊娠率和女性年龄的关系+(2)男性影响临床妊娠的精子参数比较: 数据类型及变量的说明:y:计量 拟采用的分析方法:卡方检验 拟采用的分析软件:spss 原始数据附件及格式:word表 能否用其他方法统计分析:可用卡方分割,调整检验水准(根据比较的次数N,校正后的检验水准为0.05/N)。 6.重复t检验:多个样本均数间的两两比较(又称多重比较)不宜用t检验,因为重复数次,t 检验将增加第一类错误的概率,使检验效率降低。此时宜用方差分析,并在此基础上用两两比较方法(如.SNK、LSD、Duncan法等)。 对于同一对均数间的差异,用t检验无显著性,而两两比较可能有显著性,可见错误选用统计方法将推出错误结论。 统计方法的选择: 分计量、计数、等级资料三

医学统计学 (2)

第一单元概述 1.研究设计应包括那几方面内容? 答:包括:专业设计和统计设计。 专业设计是针对专业问题进行的研究设计,如选题、形成假说等。统计设计是针对统计数据收集和分析进行的设计,如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷,都不能在统计分析阶段弥补和纠正。 第二单元资料描述性统计 1.描述计量资料的集中趋势和离散趋势的指标有哪些?各指标的适用范围如何? 答:集中趋势的指标有:算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置,尤其是正态分布资料;几何均数用来描述等比资料和对数正态分布资料的集中位置;中位数可用于任何资料。 描述离散趋势有:极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布,但两个指标都不能反映变异程度;方差和标准差常用于资料为近似正态分布;变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。 2.变异系数和标准差有何区别和联系? 答:区别:1.计算公式不同:CV=S/X*100%,标准差是方差的平方根。2.单位不同:变异系数无量纲,标准差量纲和原指标一致。3.用途不同。联系:都是适用于对称分布的资料,尤其是正态分布的资料,并且由公式所知,在均数一定时,CV与s呈正比。 3.频数表的用途有哪些? 答:1.描述资料的频数分布的特征;2.便于发现一些特大或特小的可疑值;3.将频数表作为陈述资料的形式,便于进一步的统计分析和处理;4.当样本量足够大时,可以以频数表作为概率的估计值。 4.用相对数时应注意哪些问题? 答:1.在实践工作中,应注意各相对数的含义,避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量,如资料的总数过少,直接报告原数据更为可取。3.正确计算频数指标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此需要对相对数指标进行参数估计和假设检验。 第三单元医学统计推断基础 1.正态分布和标准正态分布的联系和区别? 答:联系:均为连续型随机变量分布。区别:标准正态分布是一种特殊的正态分布(均数为0,标准差为1)。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4.简述二项的应用条件? 答:条件为:1.每次试验只会发生两种互斥的可能结果之一,即两种互斥结果的概率之和为1;2.每次试验产生某种结果固定不变;3.重复试验是相互杜立的,即任何一次试验结果的出现不会影响其他试验结果的概率。 5.简述Q-Q图法的基本原理? 答:u-变换可以把一个一般正态分布变量变换为标准正态分布变量,反之,u-变换的逆变换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q图法实际上就是首先求的小于某个x的积累频率,再通过该积累频率求得相应的u值,如果该变量服从正态分布,则点(u,x)应近似在一条直线上(u-变换直线),否则(u,x)不会近似在一条直线上。Q-Q图法正是根据(u,x)是否近似在一条直线上来判断是否为正态分布。 第四单元参数估计与参考值范围的估计 1.均数的标准差和标准误的区别和联系? 答:区别和联系:标准差是描述个体值变异程度的指标,为方差的算术平方根,该变异不能

统计学计算公式

第4章 ) (公式计划 实际总 2-4%100?= ∑∑X X K 计划任务数为平均数时 ) (公式计划 实际平3-4%100?= X X K (ⅰ)当计划任务数表现为提高率时 ) (公式计划提高百分数实际提高百分数4-4% 10011?++=K ⅱ)当计划任务数表现为降低率时 时间进度= ) (公式全期时间 截止到本期的累计时间 7-4% 100? 8) -4(% 100公式数计划期间计划规定累计数 计划期间实际完成累计计划完成程度相对指标?= ) (公式水平 计划规定末期应达到的平 计划末期实际达到的水计划完成程度相对指标9-4%100?= (% 100公 总体的全部数值 总体中某一部分数值 结构相对指标?=) 11-4(公式总体中另一部分数值 总体中某一部分数值比例相对指标= ) 12-4(公式单位)的同一指标数值同时期乙地区(部门或的某一指标数值 甲地区(部门或单位)比较相对指标= ) 13-4(公式联系的总量指标数值 另一性质不同但有一定某一总量指标数值 强度相对数= % 100?= 计划任务数 实际完成数 计划完成程度相对指标5) -4( %100-11公式计划降低百分数 实际降低百分数 ?-=K % 100?= 全期的计划任务数 本期内累计实际完成数 计划执行进度

14) -4(% 100公式该指标基期数值某指标报告期数值 动态相对数?= 对于分组数据,众数的求解公式为: d f f f f f f M m m m m m m ?-+---≈+-+)()(U 111 0上限公式: d f f f f f f M m m m m m m ?-+--- ≈+-+) ()(U 111 0上限公式: 对于分组的数值型数据,中位数按照下述公式求解: 对于分组的数值型数据,四分位数按照下述公式求解: L L L L L d f S n L Q ?-+≈-14 u U U U U d f S n L Q ?-+≈-1 43 (1)简单算数平均数 (2)加权算数平均数 n x x n i i ∑== 1 ∑∑∑ ∑====? == k i k i i i i k i i k i i i f f x f f x x 1 1 1 1 各变量值与算术平均数的离差之与为零。 各变量值与算术平均数的离差平方与为最小。 2、调与平均数(Harmonic mean) (1)简单调与平均数 (2)加权调与平均数 3、几何平均数 (1)简单几何平均数 (2)加权几何平均数 d f s n L M m m e ?-+=-12下限公式:d f s n M m m e ?-=+12-U 上限公式:()0()0 x x x x f -=-=∑∑或22 ()min ()min x x x x f -=-=∑∑ 或∑== +++= n i i n H x n x x x n x 12111...11∑∑===++++++=n i i i n i i n n n H x m m x m x m x m m m m x 11221121......n n i i n n G x x x x x ∏==???=1 21...∑???= =n i i n f f n f f G x x x x 1 21 (21)

医学统计学重点总结教学提纲

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation ):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity ):对研究指标有影响的非实验因素相同。 4 总体(population ):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample ):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter ):总体的设计指标称为参数。 统计量(statistic ):样本的统计指标称为统计量。 6 变量(variable ):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean )简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G )适用于倍数关系变化,经对数转换后呈正态分布(如:抗 体滴度,血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -(n x f ∑lg ) 三 中位数(M )和百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距和频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距和频数,

相关主题
文本预览
相关文档 最新文档