当前位置:文档之家› (完整版)卫生统计学知识点总结

(完整版)卫生统计学知识点总结

(完整版)卫生统计学知识点总结
(完整版)卫生统计学知识点总结

卫生统计学

统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。

★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。

变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。

资料按性质可分为计量资料、计数资料和等级资料。

定量资料的统计描述

1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。

2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。

★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。

(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。

(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。

标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。

定性资料的统计描述

1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。

指标频率型指标强度型指标相对比型指标

两个有关联的指标A和B之比概念近似反映某一时间出现概率单位时间内某现象的发

频率

计算

A/B

公式

无有可有、可无

有无

量纲

取值

【0,1】可大于1 无限制

范围

表示相对于B的一个单位,A有多少本质大样本时作为概率近似值频率强度,即概率强度的

学中的相对危险度RR=P1/P0也是相对比指标。

3应用相对数应该注意:①防止概念混淆,避免以比代率的错误现象;②计算相对数时分母应有足够数量,如果例数较少会使相对数波动较大,应该使用绝对数;③正确的计算频率(或强度)指标的合计值。当分组的资料需要合并起来估计频率(或强度)时,应将各组频率的分子相加作为合并估计的分子,各组的分母相加作为合并估计的分母;④频率型指标的解释要紧扣总体和属性;⑤相对数间比较要具备可比性:要注意观察对象是否同质、研究方法是否相同、观察时间是否一致、观察对象内部结构是否一致、对比不同时期资料应注意客观条件是否相同;⑥正确进行相对数的统计推断:在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此要进行参数估计和假设检验。

4医学人口统计资料主要来源为日常工作记录(报告单、卡、册)、统计报表、人口调查(普查和抽样调查)。5描述人口学特征的常用指标一般有人口总数和反映人口学基本特征的某些指标。人口学的基本特征包括性别、年龄、文化、职业等,最常用来描述人口结构的是性别和年龄。人口学特征指标:老年人口系数、少儿人口系数、负担系数、老少比、性别比。

6有关生育的常用指标有出生率、生育率和人口再生产指标。测量生育水平的统计指标:粗出生率、总生育率、年龄别生育率、总和生育率。测量人口再生育的统计指标:自然增长率、粗再生率和净再生率。

7常用的死亡统计指标有:粗死亡率、年龄别死亡率、婴儿死亡率、新生儿死亡率、围生儿死亡率、死因别死亡率、某病病死率和死因构成等。

8疾病统计资料主要来源于:疾病报告和报表材料、医疗卫生工作记录、疾病专题调查资料。

9⑴标准化:两个率或多个率之间进行比较时,为消除内部构成不同的影响,采用统一的标准,对两组或多组资料进行校正(调整),计算得到标准化率后再做比较的方法,称为~。其目的是统一内部构成,消除混杂因素,是资料具有可比性。

⑵应用标准化法的注意事项:

①标准化法的应用范围很广。当某个分类变量在两组中分布不同时,这两个分类变量就成为两组频率比较的混杂因素,标准化的目的是消除混杂因素。

②标准化后的标准化率,已经不再反映当时当地的实际水平,只表示相互比较的资料间的相对水平。

③标准化法实质是找一个标准,使两组得意在一个共同的平台上进行比较。选择不同的标准,算出的标准化率也会不同,比较的结果也未必相同,因此报告比较结果时必须说明所选用的标准和理由

④两样本标准化率是样本值,存在抽样误差。比较两样本标准化率,当样本含量较小时,还应作假设检验。10常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。(1)绝对增长量:是说明事物在一定时期增长的绝对值,可分为:累计增长量(报告期指标与基线期指标之差)和逐年增长量(报告期指标与前一期指标之差)。

(2)发展速度与增长速度:均为相对比,说明事物在一定时期的变化,可计算定基比(即报告期指标与基线期指标的比:a n/a0)和环比(报告期指标与其前一期指标之比:a n/a n-1)。增长速度表示的是净增长速度,增长速度=发展速度-100%。

(3)平均发展速度与平均增长速度:用于概括某现象在一段时期中的平均变化。平均发展速度是发展速度

的几何平均数,平均发展速度=n

a

a

n

,平均增长速度=平均发展速度-100%。

11统计表和统计图是描述资料特征、呈现统计分析结果的重要工具。统计表结构标题、标目、线条、数字和备注。

12常用统计图用途:①条图:适用于相互独立的资料(资料有明确分组、不连续);②百分条图、圆图适用于构成比资料;③线图适用于连续性资料,表达事物的动态变化(绝对差值);半对数线图适用于连续性资料,表达事物的发展速度(相对比);④直方图用于描述连续变量的频数分布;⑤散点图适用于双变量资料,用点的排列趋势和密集度表示两变量的相关关系。

常用概率分布

1正态分布(连续型随机变量的概率分布)

(1)正态概率密度曲线特点:①关于x=μ对称;②在x=μ处取得该概率密度函数的最大值,在x=μ±σ处有拐点;③曲线下面积为1;④正态分布有两个参数:位置参数μ(决定曲线在横轴上的位置)和变异参数σ(决定曲线的形状);⑤μ±1.64σ面积为90%,μ±1.96σ面积为95%,μ±2.58σ面积为99%。

(2)Z 变换与标准正态分布:对于任意一个服从正态分布N (μ,σ2)的随机变量,可作Z 变:Z=σμ

-x ,

变换后的z 值仍然服从正态分布,且其总体均数为0、总体标准差为1,称此为标准正态分布,用N (0,1)表示。Φ(z )为标准正态分布Z 变量的累积面积,-∞→Z 的面积,即下侧累计面积。

★(3)正态分布的应用:①确定医学参考值范围:是指特定的“正常”人群(排除了对所研究的指标有影响的的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在范围,习惯用该人群的95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。方法:a 百分位数法:适用于任何分布类型的资料;b 正态分布法。②质量控制图:如果某一波动仅仅由个体差异或随机测量误差所致,那么观察结果服从正态分布。控制图共有7条水平线,中心线位于总体均数μ处,警戒限位于μ±2σ处,控制限位于μ±3σ处,此外还有两条位于μ±σ处。

★(4)确定医学参考值的步骤:①从“正常人”总体中抽样,明确研究总体;②用统一和准确的方法测定相应的指标;③根据不同的用途选定适当的百分界限,常用95%;④根据此指标的实际意义,决定单侧范围

还是双侧范围;⑤根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。 2二项分布:

(1)是一种离散型随机变量的分布类型。如果每个观察对象阳性结果的发生概率为π,阴性结果的发生概率为(1-π);而且每个观察对象的结果是相互对立的,那么,重复观察n 个人,发生阳性结果的人数X 的概率分布为而二项分布,记作B (n ,π)。二项分布的概率函数P (X )=x n C πX (1-π)n-x , x n C =)!(!n!X n X - ⑵适用条件:①每次实验只有两种互斥的结果;②各次实验互相独立;③发生成功事件的概率恒定。 ⑶分布特征:二项分布的特征由二项分布的参数π以及观察的次数n 决定。

①图形分布特征:二项分布图的高峰在μ=n π处或附近;π=0.5时,图形对称;π≠0.5时,分布不对称,且对同一n ,π离0.5愈远,对称性愈差。对于同一π,随着n 的增大,分布趋于对称。当n →∞时,只要π不太靠近0或1(特别是当n π和n (1-π)均大于5时),二项分布趋于对称。

②二项分布的均数和标准差:

若X 服从二项分布B (n ,π),则X 的总体均数为μ=n π,总体方差为σ2=n π(1-π),总体标准差为σ=π)π(-1n ;若将出现阳性结果的频率记为:P=n

X ,则样本率P 的总体均数为μP =π,总体方差为σ2

p =n

π)π(-1,总体标准差为σp =n π)π(-1,σp 是频率P 的标准差,又称频率的标准误,反映阳性频率的抽样误差大小。

⑷累积概率计算:①二项分布出现阳性的次数至多为k 次的概率为:P (X ≤k )=X X X n X n -=--∑n x k

0)1()!(!!ππ

②出现阳性的次数至少为k 次的概率为:P (X ≥k )=

X k X X n X n -=--∑n x n )1()!(!!ππ。

3 Poisson 分布:

⑴是一种离散型随机变量的分布类型,是二项分布的特例,用以描述单位时间、空间、面积等的罕见事件发生次数的概率分布。一般记作P (λ),λ是Poisson 分布的唯一参数。总体均数为λ=n π。前提条件:互斥、独立、恒定。

⑵概率函数为:P (X )=e -λ!X X

λ,X 为观察单位内稀有事件的发生次数,e=2.71828。

⑶分布特性:Poisson 分布是非对称的,总体参数λ值越小,分布越偏;随着λ→∞,分布趋于对称,当λ≥20时,Poisson 分布资料可按正态分布处理。①Poisson 分布总体均数与总体方差相等,均为λ;②Poisson 分布的观察结果可加性,即对于服从Poisson 分布的m 歌互相独立的随机变量X1、X2…Xm ,它们的和也服从Poisson 分布,其均数为这个m 随机变量的均数之和。

⑷ 概率计算:如果稀有事件发生次数的总体均数为λ,有事件发生次数至多为k 次的概率为:P (X ≤k )=

!0X e

X k X λλ∑=-;生次数至少为k 次的概率:P (X ≥k )=1-P (X ≤k-1)

★4三种常用分布之间的关系:

①二项分布与Poisson 分布的关系:当n 很大,发生概率π(或1-π)很小,二项分布B (n ,π)近似于Poisson 分布P (n π);

②二项分布与正态分布的关系:当n 较大,π不接近0或1(特别是当n π和n (1-π)均大于5时),二项分布B (n ,π)近似于正态分布N (n π,n π(1-π));

④ Poisson 分布与正态分布的关系:当λ≥20时,Poisson 分布渐进正态分布N (λ,λ)。

★5二项分布与Poisson 分布的区别:

⑴相同点:都是离散型随机变量的常见分布;

⑵区别:a 取值不同。服从二项分布的随机变量有n+1个不同的取值;Poisson 分布的随机变量的可能去只有无限多个,即非负整数0,1,2……;b 随机变量的概率不同:二项分布P (X=k )=k -n -1)!(!!π)(πk k n k n -,Poisson 分布P (X=k )=e -λ!k k

λ;c 描述的随机变量不同。二项分布描述的是一次试验只会出现两种对立的结果之一,n 次独立重复试验中某种结果出现次数的概率分布。Poisson 分布描述的是在单位时间、面积、空间等范围中某种事件发生数的概率分布。

⑶联系:B (n ,π)??

??→?很大,π很小n Poisson 分布。 参数估计

1在服从正态分布的总体中进行随机抽样,样本均数的抽样分布特点:①各样本均数未必等于总体均数;②样本均数见存在差异;③样本均数围绕总体均数,中间多、两边少,左右基本对称,呈近似正态分布;④样本均数间的变异明显小于原始变量间的变异。

2标准误: ①均数的标准误的理论值:σX =n

σ,总体标准差σ通常未知,需用样本标准差S 来估计,均数标准误的

估计值为:S X =n s ;②频率的标准误:若随机变量X~B (n,π),则样本频率 P=n

X 的总体概率为π,标准误是σp =n π)π(-1,频率标准误的估计值:S P=≈-1-1n p p )(n

p p )(-1(①②增加样本含量可以减少样本误差)。

★3标准差与标准误的区别与联系:

区别:⑴标准差S (σ):①意义:描述个体观察值变异程度的大小。标准差小,均数对一组观察值得代表性好;②应用:与X 结合,用以描述个体观察值的分布范围,常用于医学参考值范围的估计;③与n 的关系:n 越大,S 越趋于稳定;⑵标准误S X (σX ):①意义:描述样本均数变异程度及抽样误差的大小。标准误小,用样本均数推断总体均数的可靠性大;②应用于X 结合,用以估计总体均数可能出现的范围以及对总体均数作假设检验;③与n 的关系:n 越大,S X 越小。

联系:①都是描述变异程度的指标;②由S X =n s 可知,S X 与S 成正比。n 一定时,s 越大,S X 越大。 4 t 分布:当X 服从均数为μ的正态分布时,统计量n s X t μ

-=服从自由度为v=n-1的t 分布,是小样本总

体均数的区间估计及假设检验的理论基础。

⑵t 分布的图形特征:t 值得分布于自由度有关。t 分布只有一个参数即v 。特征:①单峰分布,以0为中心,左右对称;②v 越小,t 值越分散,曲线的峰部越矮,尾部越高;③随着v 逐渐增大,t 分布逐渐接近标准正态分布;当v 趋向∞时,t 分布趋近标准正态分布,故标准正态分布是t 分布的特例;④t 分布是一簇曲线。

⑶t 界值表:①在自由度相同时,t 值越大,t 分布的尾部概率越小;②在t 临界值相同时,双侧尾部面积概率为单侧尾部面积概率的两倍。

5参数估计:包括点估计和区间估计。置信区间的两个要素:①准确度:反映置信度1-α的大小,及区间包括总体均数μ的理论概率的大小,愈接近1越好;②精密度:即区间的宽度,区间越窄越好,如样本含量不变,将置信度由95%提高到99%,则置信区间由窄变宽,估计的精度下降。

6总体均数及总体概率的区间估计:

⑴ 体均数的置信区间:t 分布法和正态近似法

I.t 分布法:当σ未知且n 较小时,总体均数μ的双侧(1-α)置信区间为X ±t v ,α2/S X ;单侧(X -t v ,αS X ,∞)或(-∞,X + t v ,αS X );

II .正态近似法:①当σ已知时,总体均数μ的双侧(1-α)置信区间为X ±Z v ,α2/σX ;单侧(X -Z v ,ασX ,∞)或(-∞,X + Z v ,ασX );②当σ未知但n 足够大时(n>50),t 分布近似服从标准正态分布,

总体均数μ的双侧(1-α)置信区间为:X ±Z v ,α2/S X ,单侧(X - Z v ,α S X ,∞)或(-∞,X + Z v ,α S X )

⑵总体概率的置信区间:对于二项分布的样本资料,可根据样本含量n 和样本频率p 的大小,选用查表法

(n ≤50,特别是p 很接近0或100%时)或正态近似法估计总体概率π的(1-α)置信区间。

正态近似法:当n 足够大,且np 及n(1-p)均大于5时,p 的抽样分布近似正态分布,总体概率π的双侧(1-α)置信区间等于P ±Z 2/αS p

★7医学参考值范围与总体均数的置信区间的区别:

⑴参考值范围

①意义:绝大多数人某项指标的数值范围;

②计算:正态分布 双侧X ±Z v ,α2/S ;单侧(X - Z αS ,∞)或(-∞,X + Z αS )

偏峰分布 双侧P X ~P 100-X ;单侧(P X ,∞)或(-∞,P 100-X )

③应用:判断某项指标正常与否

⑵总体均数的置信区间:

①意义:按一定的置信度估计总体均数所在范围;

②计算:正态分布 σ未知:双侧X ±t v ,α2/S X ,单侧(X -t v ,αS X ,∞)或(-∞,X + t v ,αS X ); σ已知:双侧X ±Z v ,α2/σX ,单侧(X -Z v ,ασX ,∞)或(-∞,X + Z v ,ασX ); 正态分布或偏峰分布:σ未知但n 足够大:双侧X ±Z v ,α2/S X ,单侧(X - Z v ,α S X ,∞)或(-∞,X + Z v ,α S X )

③应用:估计总体均数所在范围。

假设检验

1假设检验的过程:建立检验假设,确定检验水准→计算统计量→确定P 值并与给定的α比较→做出推断 结论。

2假设检验的基本逻辑:在H 0成立的条件下(处理因素不起作用),计算统计量和P 值,把“不太可能出 现假阳性”当作“不可能出现假阳性”,从而拒绝H 0,接受H 1(处理因素起作用)。

3假设检验的两类错误:Ⅰ型和Ⅱ型错误。(见名解)

实际情况 统计推断

拒绝H 0,有差异 不拒绝H 0 ,无差异

H 0成立,无差异 第Ⅰ类错误(假阳性),概率=α 正确,概率=1-α

H 1成立,有差异 正确,该概率=1-β 第Ⅱ类错误(假阴性),概率=β 4t 检验:

⑴应用条件:①随机样本:②来自正态分布总体;③均数比较时,要求两总体方差相等(方差齐性)。 ⑵单样本资料的t 检验:实际上是推断该样本来自的总体均数μ与已知的某一总体均数μ0有无差别。 检验假设:H 0:μ=μ0,H 1:μ≠μ0;前提条件:样本来自正态总体;计算公式:n s X t 0

μ-=;自由v=

n-1。

配对设计资料的t 检验:配对资料的分析着眼与每一对中两个观察值之差,这些差值构成一组资料,用t 检验推断差值总体均数是否为0。

检验假设:H 0:μd =0,H 1:μd ≠0;前提条件:差值服从正态分布;计算公式n

s d n s d s d t d d d d //0=-=-=

μ; 自由度v=n-1(n 是对子数)。

两独立样本资料的t 检验:两样本均数的比较。

检验假设:H 0:1μ=2μ,H 1:1μ≠2μ;前提条件:两样本服从正态分布,且具有方差齐性;计算公式: 212

1X X S X X t --=,21X X S -代表两样本均数之差的标准误,???? ??+=-21

21121n n S S C X X , S 2c 为两样本联合估 计的方差,()()211212222112-+-+-=n n S n S n S c ()()2212

222

11-+-+-=∑∑n n X X X X ;自由度221-+=n n ν。

5 t '检验:前提条件:两小样本来自正态总体且方差不等。方差不齐,可采用的处理方式有:t '检验,基 于秩次的非参数检验和数据变换。非正态分布,方差不齐:基于秩次的非参数检验和数据变换。 检验假设:H 0:1μ=2μ,H 1:1μ≠2μ;计算公式:2221212

1n S n S X X t +-=';自由度()1

124142222121-+-+=n S n S S S X X X X ν

6两组独立样本资料的方差齐性检验:两组正态分布随机样本判断其总体方差是否齐同:

22

211222

10::σσσσ≠=H H ,当H0成立时,检验统计量(较小)较大)2221(S S F =,1,12211-=-=n n νν, 当F>3时,方差不齐。

7大样本资料的Z 检验(u 检验):前提条件:样本足够大;两独立样本资料的Z 检验:假定从两个正态总 体(或非正态)总体随机抽取含量为n1和n2的样本,总体均数和方差分别为2

22211,,σμσμ和。当n1和

n2均较大时,两样本均数的和与差的分布也服从(或近似服从)正态分布,21X X ±~???? ??+±22212121,n n N σσμμ 210:μμ=H ,2221212

1n S n S X X Z +-=。当H0成立时,这个统计量服从标准正态分布。

★t 检验与Z 检验的比较:两样本均数比较的t 检验适用条件为:样本含量小,两样本独立,来自正态总

体,

且两总体方差相等。Z 检验是大样本情况下的t 检验的近似,用于两总体方差已知,或总体方差未知但样本 含量较大(n1>60且n2>60)的两样本均数的比较。样本量较大时,两种检验方法都可用。

★ 8假设检验与区间估计的关系:①置信区间具有假设检验的主要功能:在α水准上可回答差别有无统计 学意义;②置信区间可提供假设检验没有提供的信息:根据置信区间上、下限的数值大小可判断差别是否具有实际意义;③假设检验可提供确切的P 值,置信区间只能在预先确定的置信度100(1-α)%水平上进行推断,没有精确的概率值,且有可能增大Ⅱ类错误;④置信区间推断量的大小,即推断总体均数范围;假设检验推断质的大小即推断总体均数是否存在不同。只有把置信区间和假设检验结合起来,互相补充才是对问题比较的完整分析。

9假设检验的注意事项:①根据研究目的、设计类型、变量类型及样本大小选择恰当的统计分析方法;②权 衡两类错误的危害以确定α的大小;③正确理解P 值的意义:P 值很小时“拒绝H 0,接受H 1”,不能把很 小的P 值误解为总体参数间差异很大。拒绝H 0只是说差异不为0,P 值小只是说犯一类错误的机会远小于 α。P 与α本质相同,都为概率,P 是根据当前实验计算的概率,α是预先给定的概率,为检验水准,是定 义了的小概率上限。

实验设计

1根据研究者是否认为地设置处理因素,即是否给予干预措施,可将医学研究分为调查研究和实验研究两类。

①调查研究:又称观察性研究或非实验性研究,确切的说应是非随机化对比研究。它对研究对象不施加任何干预措施,是在完全“自然状态”下对研究对象的特征进行观察、记录,并对观察结果进行描述和对比研究。

②实验研究:又称干预性研究,是对研究对象人为给予干预措施的研究。

2实验设计的基本要素:受试对象、处理因素、实验效应。

①受试对象:是处理因素作用的客体,根据受试对象不同,实验可以分为三类:动物实验、临床试验、现场试验。

②处理因素:是研究者根据研究目的而施加的特定的实验措施,又称为受试因素。

③实验效应:是处理因素作用下,受试对象的反应或结局,它通过观察指标来体现。

选择观察指标时,应当注意:a客观性:客观指标具有较好的真实性和可靠性;b精确性:包括准确度和精密度两层含义。准确度指观察值与真值的接近程度,主要受系统误差的影响。精密度指相同条件下对同一对象的同一指标进行重复观察时,观察值与其均数的接近程度,其差值受随机误差的影响。c灵敏性和特异性:指标的灵敏度反映其检出真阳性的能力,灵敏度高的指标能将处理因素的效应更好地显示出来;指标的特异度反映其鉴别真阴性的能力,特异度高的指标不易受混杂因素的干扰。

3实验设计的基本原则:对照、随机化和重复。

⑴对照的形式:①安慰剂对照:目的:在于克服研究者、受试对象等由心理因素导致的偏倚。②空白对照:即对照组不接受任何处理,在动物实验和实验方法研究中最常见,常用于评价测量方法的准确度,评价实验是否处于正常状态等。③实验对照;④标准对照:用现有标准方法或常规方法作为对照;⑤自身对照:对照与实验在同一受试对象身上进行。

⑵a随机化体现在三方面:①随机抽样:总体中每一个体都有相同机会被抽到样本中来;②随机分配:每个受试对象被分配到各组的机会相等,保证大量难以控制的非处理因素在对比组间尽可能均衡,以提高组间的可比性;③实验顺序随机:每个受试对象先后接受处理的机会相等,它使实验顺序的影响也达到均衡。b在实验设计中常通过随机数来实现随机化。获得随机数的常用方法有:随机数字表和计算机的伪随机数发生器。随机数字表常用于抽样研究及随机分组。

c常用的两种随机化分组的方法:完全随机化和分层随机化(配对随机化和区组随机化可看成是分层随机化的实际应用)。

⑶重复包括三种情形:①整个实验的重复;②用多个受试对象进行重复;③同一受试对象的重复观察。重复的主要作用:①估计变异的大小;②降低变异大小。

4常用的实验设计方案:

⑴完全随机设计(completely randomized design):又称简单随机设计,是最为常见的一种考察单因素两水平或多水平效应的实验设计的方法,它是采用完全随机分组的方法将同质的受试对象分配到各处理组,观察其实验效应。

⑵配对设计(paired design):是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同的处理组。据以配对的因素应为可能影响实验结果的主要混杂因素。配对设计主要有以下情形:①将两个条件相同或相近的受试对象配成对子,通过随机化,使对子内个体分别接受两种不同的处理;②同一受试对象的两个部分配成对子,分别速记地接受两种不同的处理;③自身前后配对,即同一受试对象,接受某种处理之前和接受该处理后视为配对。

⑶交叉设计(cross-over design):是一种特殊的自身对照设计,它按事先设计好的实验次序,在各个时期对受试对象先后实施各种处理,以比较处理组间的差异。基本前提:个处理方式不能相互影响,即受试对象在接受第二种处理时,不能有前一种处理的剩余效应。优点:节约样本含量;能够控制个体差异和时间对处理因素的影响,故效率较高;在临床试验中,每个受试对象均接受了各种处理,均等的考虑了每个患者的利益。进行交叉设计应注意:尽可能采用盲法,以提高受试对象的依从性,避免偏倚;不宜用于具

有自愈倾向或病程较短的疾病研究。在慢性病观察过程中,应尽量保持条件的可比性。

⑷随机区组设计:又称单位设计、配伍组设计,实际上是配对设计的扩展。通常是将受试对象按性质相同或相近分为b个区组(或称单位组、配伍组),再将每个区组中的k个受试对象随机分配到k个处理组。设计应遵循“区组间差别越大越好,区组内差别越小越好”的原则。

⑸析因设计(factorial design):a是将两个或多个处理因素的个水平进行组合,对各种可能的组合都进行实验,从而探讨个处理因素的主效应以及个处理因素间的交互效应,又称完全交叉分组实验设计。所谓交互作用是指两个或多个处理因素间的效应互不独立,当某一因素取不同水平时,另一个或多个因素的效应相应的发生变化。两因素间的交互作用为一阶交互作用,三因素间交互作用为二阶交互作用。

b当观察k个处理因素,每个因素均有m个水平时,共有m k种组合,简记为m k析因设计。

c可获得三方面的信息:各因素不同水平的效应;各因素间的交互作用;通过比较寻求最佳组合。

5样本含量的估算:

⑴确定样本含量的原则:在保证研究结论有一定可靠性的前提下,估算最少需要多少受试对象。

⑵假设检验所需样本含量取决于四个要素:

①第一类错误概率α的大小:α越小,所需样本量越大;②第二类错误概率β或检验功效(1-β)的大小:第二类错误的概率越小,检验功效越大,所需样本含量越多;③容许误差δ:即两总体参数的的差值,δ越大,所需样本含量越小;④总体标准差σ和总体概率π:σ越大,所需样本含量越多;总体概率π越接近50%,变异性越大,所需样本含量越多。

方差分析

1基本思想:把全部观察值间的变异按设计和需要分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。

2应用条件:①各样本是相互独立的随机样本;②各样本来自正态总体;③各处理组总体方差相等,即方差齐性。

3任何设计方案的SS总和v总算法均相同,即在不考虑数据按任何方向分组的情况下,将所有数据看成一个

整体计算,即SS

总=()2

-

∑X

X=(N-1)S2,v

=N-1。

几种设计方案中SS

总和v

的分解:

设计方案 SS

总的分解 v

完全随机设计 SS

总=SS组间+SS组内v

=v组间+v组内

随机区组设计 SS

总=SS处理+SS区组+SS误差 v

=v处理+v区组+v误差

析因设计SS

总= SS处理+ SS误差v

=v处理+ v误差

=(SS A+SS B+SS AB)+SS误差 =(v A+v B+v AB)+ v误差

重复测量设计(两因素) SS

总=SS受试对象间+SS受试对象内v

= v受试对象间+v受试对象内

=(SS处理+SS个体间误差)+ =(v处理+v个体间误差)+

(SS时间+SS处理与时间交互+SS个体内误差)(v时间+v处理与时间交互+v个体内误差)

4重复测量资料和随机区组设计资料的区别:①同一受试对象在不同时间点的数据高度相关;②重复测量资料中的处理因素在受试对象(看成区组)间为随机分配,但受试对象(看成区组)内的各时间点是固定的,不能随机分配。随机区组设计资料中每个区组内的受试对象彼此独立,处理只在区组内随机分配,同一区组内的受试对象接受的处理各不相同。

5重复测量资料方差分析的前提条件:①各样本是相互独立的随机样本;②各样本来自正态总体;③各处理组总体方差相等,即方差齐性;④需满足协方差阵的球形性或复合对称性。

6多各样本均数的两两比较方法:①未计划的每两个均数的事后比较,常用SNK-q检验;②计划好的某些均数间的两两比较,常用Dunnett-t检验;③Bonferroni法和sidak法适用于所有的两两比较。

方差分析后不能作两两比较的t检验的原因:会增加犯一类错误的概率。如果比较次数为k,每次检验水准为α,则犯一类错误的累积概率为1-(1-α)k,高于原有的α。

7数据变换的目的:①使各组达到方差齐性;②使资料转换为正态分布,以满足方差分析和t 检验的应用条件。通常情况下,一种适当的函数转换可使上述两个目的同时达到。③曲线直线化。常用于曲线拟合。常用的数据变换有对数变换、平方根变换、平方根反正弦变换。

8方差分析中的F 检验是单侧检验的原因:方差分析中检验统计量F 的计算通常是用某部分的均方(如处理因素、交互效应等)除以误差的均方,其中分母误差部分尽含随机因素作用,分子某部分的均方含有相应处理因素或交互作用的效应,而且还含有随机因素的作用,因此得F 值从理论上应≥1,不会小于1,所以方差分析中F 检验是单侧检验。

2χ检验

1 2χ检验用途:常用于分类变量资料的统计推断,主要用途包括:①单样本分布的拟合优度;②比较两个或多个独立样本频率分布;③比较配对设计两样本频率和两频率分布;④推断两个变量或特征之间有无关联性。

2 2

χ检验的理论基础是X 2分布和拟合优度检验。 ⑴2χ分布①是一种连续型随机变量的概率分布,按分布的密度函数可给出自由度=1,2,3,……的一簇分布曲线。 ②2χ分布形状完全依赖于自由度v 的大小,当v>1时,随着v 的增加,曲线逐渐趋于对称;当自由度v 趋于∞时,2χ分布逼近正态分布。

⑵拟合优度检验是根据样本的频率分布检验其总体分布是否等于给定的理论分布。

3 X 2检验的基本思想是:用统计量度量实际频数和理论频数之间的偏离程度,永远是正值,2

χ检验统计量的基本公式是:2χ=()∑=-k i i i i T T A 12,v=k-1-s ,s 是用样本估计量代替总体参数的个数。若假设成立,则各

格子的实际频数与理论频数相差不应该很大,因而算出的X 2值也不会很大,即出现较大2

χ值的概率P 很小。若P ≤α,则认为A 与T 的差别已超出了抽样误差允许的范围,拒绝H 0。若P>α,不拒绝H 0。

4独立样本2×2列联表资料的2χ检验:

H 0:两总体率相等;H 1:两总体率不等。

① n ≥40且T min ≥5, 2χ=()∑-T T A 2

,2χ=()()()()()d b c a d c b a n bc ad ++++-2,v=1;

② n ≥40且1≤T <5,校正公式:2χ=()

∑--T T A 25.0,2χ=()()()()()d b c a d c b a n n bc ad ++++--2

2/,v=1; ③ n <40或T <1,或P ≈α时,Fisher 精确概率法。

5独立样本R ×C 列联表资料的2

χ检验:(多个独立样本率、独立样本频率分布的比较)

H 0:多个总体率相等;H 1:多个总体率不等。

2χ=n ???? ??-∑12C R RC m n A ,v=(R-1)

(C-1) 要求:理论频数不宜太小,一般不宜有1/5以上的格子的理论频数小于5,或不宜有一个理论频数小于1,否则可能会产生偏性。如果不满足此要求,处理方法有:①增加样本含量(首选);②结合专业知识考虑是

否可以将该格所在行或列与别的行和列合并,要根据样本特性来确定,但会损失信息;③改用R ×C 表Fisher 精确概率法,可以用计算机软件实现。

R ×C 列联表的分割:

①多个实验组间的两两比较:分析目的为k 个实验组间,任两个率均进行比较时,须进行???

? ??2k 次独立的四格表2χ检验,再加上总的行×列表资料的2χ检验,共12+???? ??k 次检验假设。故检验水准'

α用下式估计:'α=()1

2+k α,()k 2=)!2(!2!-k k ,k 为样本率的个数。②实验组与同一个对照组的比较:分析目的为各实验组与同一个对照组的比较,而各实验组间不须比较。其检验水准 'α用下式估计:'α=

(α1-2k 。 6配对设计资料的X 2检验:

⑴配对2×2列联表资料的X 2检验(两种处理方法阳性率的比较):

H 0:两总体阳性率相等;H 1:两总体阳性率不等。 ① 当b+c ≥40时,2χ=()∑-T T A 2=()c b c b +-2,v=1;②当b+c<40时,校正公式2χ=()c

b c b +--21,v=1。 ⑵配对R ×R 列联表资料的2

χ检验:

H 0:两变量的概率分布相同;H 1:两变量的概率分布不相同。 T=()∑=-+--k i ii i i i i A m n m n k k 12

21,v=k-1。 基于秩次的非参数检验

1假设检验的方法有:参数检验和非参数检验。

①参数检验:是以特定的总体分布为前提,对未知的总体参数做推断的假设检验方法统称为~,如t 检验和 方差分析。

②非参数检验:不以特定的总体分布为前提,也不针对决定总体分布的几个参数做推断,进行的是分布之间的检验。一般不直接用样本观察值做分析,统计量的计算基于原数据在整个样本中按大小所占位次。由于丢弃了观察值的具体数据,只保留了大小次序的信息,凡适合参数检验的资料,应首选参数检验。 2非参数检验适用于:①有序变量资料;②总体分布类型不明的资料;③分布不对称且无法转化为正态分布资料;④对比组间方差不齐,有无适当变换方法达到方差齐性的资料;⑤一端或两端观察值不确切的资料;⑥等级资料。

3wilcoxon 符号秩(和)检验:

⑴目的:可用于推断总体中位数是否等于某个指定值,还可以推断配对样本差值的总体中位数是否为0。①单样本资料的符号秩检验常用于不满足t 检验条件的单样本定量变量资料的比较。②配对设计资料的符号秩和检验:由检验配对样本的差值是否来自中位数为0的总体,来推断两个总体中位数是否相等,即两种处理效应是否相同。wilcoxon 配对符号秩和检验基本思想:在配对样本中,假定两种处理效果相同,则差值的总体分布为对称分布,并且差值的总体中位数为0。若假设成立,样本差值的正秩和与负秩和应相差不大,均接近n(n+1)/4;当正负秩和相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H 0。

⑵方法要点:①按差值绝对值从小到大编秩,差值为正的秩和以T +表示,为负的秩和以T -表示,任取T +(或T -)作为检验统计量T ,查T 界值表确定P 值;②正态近似法:随着n 的增大,T 分布逼近均数为n (n+1)

/4,方差为n (n+1)(2n+1)/24的正态分布。当n>50,用Z 检验。

⑶注意事项:①编秩时遇差值为0舍去,n 随之减小;遇有差值的绝对值相等,符号相同,仍按顺序编秩;符号不同,取其平均秩次;②T ++T -=n (n+1)/2

4wilcoxon 秩和检验:

⑴目的是推断连续型变量资料或有序变量资料的两个独立样本代表的两个总体分布是否有差别。 ⑵方法要点:①将两组数据由小到大同一编秩,以样本列数小者为n 1,其秩和为T ,查T 界值表确定P 值;②正态近似法:当n 1>10或n 2- n 1>10时,T 分布接近均数为n 1(N+1)/2,方差为n 1 n 2(N+1)/2的正态分布,可用Z 检验。

⑶注意事项:①编秩中若有相同的数据在同一组则依次编秩;若相同数值在不同组内,求平均秩次;②当相持出现较多时(超过25%),需使用校正公式。

⑷基本思想:假设含量为n 1与n 2的两个样本(且n 1≤n 2),来自同一总体或分布相同的两个总体,则n 1样本的秩和T1与其理论秩和n 1(N+1)/2相差不大,即[T- n 1(N+1)/2]仅为抽样误差所致。当二者相差悬殊,超出抽样误差可解释的范围时,则有理由怀疑该假设,从而拒绝H 0。

5Kruskal-Wallis H 检验:

⑴目的:用于推断定量变量或有序分类变量的多个总体分布有无差别。

⑵方法要点:①先将k 组数据由小到大同一编秩,求出各组秩和R i ,计算检验统计量H ;②当组数k=3,且各组例数n i ≤5时,查H 界值表确定P 值;若k ≥3或最小样本例数大于5,则H 统计量近似服从v=k-1的2χ分布。

⑶注意事项:①编秩中若有相同的数据在同一组则依次编秩;若相同数值在不同组内,求平均秩次;②当相持出现较多时(超过25%),需使用校正公式;③当结论为拒绝H 0,认为多组处理效应不全相同时,常需进一步作多个样本的两两比较的秩和检验。

两变量关联性分析

1相关系数的意义及计算:

相关系数=()()的方差的方差的协方差

和Y X Y X 。

①总体相关系数ρ,若ρ≠0,称X 和Y 线性相关;若ρ=0,则简称X 和Y 不相关。样本协方差是离均差乘积在样本中的平均,离均差在总体中的平均就是总体协方差。

②样本相关系数()()()()YY XX XY l l l Y Y X X Y Y X X r =----=∑∑∑22,是两个随机变量之间线性相关强度和方向的统计量,没有单位,取值范围为-10为正相关,r<0为负相关,r=0为零相关。r 的绝对值大小表示两变量之间线性相关的密切程度,r 越接近于1,密切程度越高,越接近于0,密切程度越低。

2相关系数的统计推断:

建立建设:H 0:ρ=0;H 1:ρ≠0,并假定X 和Y 服从二元正态分布。

方法:①直接查相关系数临界值表,根据自由度v=n-2,差临界值表,比较r 与临界值,统计量越大,概率P 越小;统计量越小,概率P 越大。②t 检验:统计量为t r =r

S r 0-,S r 为样本相关系数r 的标准误,

S r =2

r 12

--n ,H 0成立时,t r 服从自由度为v=n-2的t 分布。以上两种方法的决策规则相同:若P>0.05,不拒绝零假设,即认为两个变量间无相关性;若P<0.05,拒绝零假设,接受备择假设,即认为两变量间相关性有统计学意义。

3相关分析应注意的问题:①进行相关分析前,应先绘制散点图。只有散点有线性趋势时,才能进行直线相关分析。②线性相关分析要求两个变量都是随机变量,而且仅适用于二元正态分布资料;③出现离群值慎用相关;④相关关系不一定是因果关系;⑤分层资料盲目合并易出现假象;⑥样本的相关系数接近零并不意味着两变量间一定无相关性,有可能是非线性的曲线关系。

4秩相关系数的计算:r s =qq pp pq

l l l ?=()()()()∑∑∑----22q q p p q q p p ,-1≤r s ≤1。适用于条件:①不服从双

变量正态分布而不宜作积差相关分析的资料;②总体分布型未知的资料;③用等级表示的原始资料;④分布端点无确定数值的资料;⑤用相对数表示的资料。

5秩相关系数的统计推断:H 0:ρs =0;H 1:ρs ≠0,α=0.05,当n ≤50时,查附表14的r s 界值表;当n>50时,计算检验统计量u ,查t 界值表。

6分类资料的关联性分析:

⑴对两个定量变量的关联性,可用Pearson 积矩相关系数或秩相关系数来描述;对两个分类变量,通常是 先根据交叉分类计数所得的列联表进行两种属性独立性的2

χ检验,然后计算关联系数。关于两个分类变量关联的程度,用Pearson 列联系数来描述:r=n +22

χχ,列联系数r 取值范围在0~1之间。0表示完全独

立;1表示完全相关;愈接近于0,关系愈不密切;愈接近于1,关系愈密切。 【对两个反映属性的分类变量,若有一份随机样本,可做交叉分类的频数表,利用关于独立性的2χ检验和列联系数来描述两变量的关联性】

⑵交叉分类2×2表的关联分析:2χ=()∑-T T A 2

⑶2×2配对资料的关联性分析:n ≥40且T min ≥5,2χ=()()()()()d b c a d c b a n bc ad ++++-2; n ≥40且1≤T <5,2χ=()()()()()d b c a d c b a n n bc ad ++++--2

2/。

⑷R ×C 表分类资料的关联性分析:2χ=n ???? ??-∑12C R RC m n A ,每格的T>1且T<5的格子数不宜多于格子总数

的1/5。

简单回归分析 1回归方程:Y ?=a+bX ,b=()()()∑∑---2X X Y Y X X =XX XY l l

2线性回归模型的适用条件:①线性:因变量Y 与自变量X 称线性关系;②独立:每个个体观察值之间互相独立;③正态性:任意给定X 值,对应的随机变量Y 都服从正态分布;④等方差性:在一定范围内不同的X 值所对应的随机变量Y 的方差相等。简记为LINE 。

3总体回归系数β的统计推断:总体回归系数β是否为0的假设检验,可用方差分析或t 检验。 4决定系数反映了回归平方和在总平和中所占的比例,常用来反映回归的实际效果。

5线性回归的应用:①用于计算总体条件均数的置信区间以及总体回归线的置信带;②用于计算个体Y 预测值及其预测区间。线性回归常用于统计预测和统计推断。

6线性回归与线性相关的区别与联系:

⑴区别:

①单位:相关系数r 没有单位,回归系数b 有单位;所以,相关系数与单位无关,回归系数与单位有关; ②应用目的:说明两变量间的关联性用相关分析,说明两者依存变化的数量关系则用回归分析;

③对资料的要求不同:线性回归要求应变量Y 是服从正态分布的随机变量;线性相关要求两个变量X 和Y 为服从双变量正态分布的随机变量。

④取值范围:-∞

⑤计算:r=

YY XX XY l l l ,b=XX

XY l l ⑵联系:

①方向一致: r 与b 的正负号一致;②假设检验等价: t r =t b ;③YY XX l l b r =;④用回归解释相关决定系

数(coefficient of determination):总回SS SS l l l l l l r YY XX XY YY XX XY ===222,回归平方和越接近总平方和,则r 2越接近1,相关性越好。

7服从双变量正态分布的变量,既可以进行两者的线性相关分析,也可以进行线性回归分析,且有tr=tb ,即这两个检验完全等价。线性回归分析与线性相关分析的方向一致。

调查设计

1调查设计是对调查研究所作的周密计划,包括资料收集、整理和分析全过程的设想和安排。

2调查设计包括内容:确定调查目的和指标、确定调查对象和观察单位、确定调查方法、确定资料收集方式、拟定调查项目和调查表、估计样本含量。

3组织计划:调查员的挑选和调查员的培训。

4整理计划步骤:问卷接受、问卷核查、数据编码、数据录入、拟定整理表、归纳汇总等。

5常用的抽样方法:单纯随机抽样、系统抽样、分层抽样、整群抽样、非概率抽样。

6各种抽样方法的抽样误差一般是:整群抽样≥单纯抽样≥系统抽样≥分层抽样。

基础心理学知识点概要

知识点概要: 第一章 1、科学心理学诞生的标志。 19世纪中叶,随着自然科学和实验方法的发展,心理学才从哲学中分化出来,发展成为一门独立的科学。 2、心理学的研究对象 心理学研究的对象是人的心理现象。人的心理现象包括心理过程和个性心理两个方面。 3、人的心理活动内容。 (1)心理过程包括认识过程、情绪与情感过程、意志过程三个相互联系的方面。其中认识过程的主要内容有感觉、知觉、记忆、想象、思维。 (2)个性心理具体表现在人的个性倾向性、个性心理特征和自我意识三个方面。个性倾向性主要包括需要、动机、兴趣、理想、信念、世界观。个性心理特征主要包括人的能力,气质、性格。 4、条件反射:是有机体在后天的生活过程中可得的行为,其神经联系时暂时的。 5、心理学研究所要遵循的原则 (1)客观性原则(2)系统性原则(3)发展性原则(4)教育性原则。 6、学习心理学对教师的作用。 (1)心理学的专业学习可以帮助我们更好地了解学生 (2)心理学的专业学习可以帮助我们建立个办法好的师生关系 (3)心理学的专业学习可以促进我们的职业成熟 第二章 1、马斯洛的需要层次理论。 (1)马斯洛认为人的需要是有七个等级构成:生理需要、安全需要、社会交往的需要、尊重的需要、自我实现的需要。 (2)马斯洛认为低层次的需要没有得到满足时,他就支配着人们的行为。需要的层次越低,力量越大。只有当低层次的需要得到满足以后,高层次的需要才能引起人们的注意。 (3)马斯洛虽然看到了高级需要和低级需要的区别,认为高级需要发展的比较晚一些,而且是在低级需要被满足的前提下才能被满足,但他并没有把高级需要和低级需要完全对立起来。也就是说,高级需要并非绝对的以低级需要的满足为前提。 2、动机。是对所有引起,支配和维持生理和心理活动的过程的概括,是一种内部心理过程。 7、引起动机条件。 3、阿特金森的成就动机理论。 阿特金斯认为成就动机包括追求成功和避免失败的动机。成就需要高,对失败恐惧低者,对中等难度的任务有较高的成就动机。而成就需要高,对失败恐惧强者,只对容易的任务有较高的成就动机。一个成就需要高的的人,并不是在所有任务面前都表现出高的成就动机。事实上,当面临的任务难度很大时,高成就需要的人会很快放弃。 5、三维归因理论。 4、耶基斯-多德森定律。 3、兴趣:兴趣是人力求认识某种事物或从事某种活动的意识倾向。

卫生统计学选择题及答案

t分布与标准正态分布有一定的关系,下述错误的叙述是_____ A.参数数目不同 B.t分布中的自由度趋于无穷大时,曲线逼近标准正态分布 C.为单峰分布 D.对称轴位置在0 E.曲线下面积的分布规律相同 在抽样研究中,当样本例数逐渐增多时_____. A.标准误逐渐加大 B.标准差逐渐加大 C.标准差逐渐减小 D.标准误逐渐减小 E.标准差趋近于0 抽样误差是指。 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别(参数与统计量之间由于抽样而产生的差别) C.样本中每个个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 下面说法中不正确的是_____. A.没有个体差异就不会有抽样误差 B.抽样误差的大小一般用标准误来表示 C.好的抽样设计方法,可避免抽样误差的产生 D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等 E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 抽样研究中,适当增加观察单位数,可() A.减小Ⅰ型错误 B.减小Ⅱ型错误 C.减小抽样误差 D.提高检验效能 E.以上均正确

说明两个有关联的同类指标之比为。 A.率 B.构成比 C.频率 D.相对比 E.频数 构成比用来反映。 A.某现象发生的强度 B.表示两个同类指标的比 C.反映某事物内部各部分占全部的比重 D.表示某一现象在时间顺序的排列 E.上述A与C都对 以下属于分类变量的是___________. A.IQ得分 B.心率 C.住院天数 D.性别 E.胸围 计算麻疹疫苗接种后血清检查的阳转率,分母为______. A.麻疹易感人群 B.麻疹患者数 C.麻疹疫苗接种人数 D.麻疹疫苗接种后的阳转人数 E.麻疹疫苗接种后的阴性人数 关于构成比,不正确的是_____. A.构成比中某一部分比重的增减相应地会影响其他部分的比重 B.构成比说明某现象发生的强度大小 C.构成比说明某一事物内部各组成部分所占的分布 D.若内部构成不同,可对率进行标准化 E.构成比之和必为100% 甲乙两地某病的死亡率进行标准化计算时,其标准的选择______. A.不能用甲地的数据 B.不能用乙地的数据 C.不能用甲地和乙地的合并数据 D.可用甲地或乙地的数据 E.以上都不对 用均数与标准差可全面描述资料的分布特征() A.正态分布和近似正态分布 B.正偏态分布 C.负偏态分布 D.任意分布

卫生统计学考研总结

1、试述正态分布、标准正态分布以及对数正态分布的联系和区别? 2、说明频数分布表的用途? 描述频数分布的特征、描述频数分布的类型、 便于发现一些特大或特小的可疑值、便于进一步做统计分析和处理 3、变异系数的用途? 常用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童与成人身高变异程度的比较。 4、试举例说明均数的标准差与标准误的区别与联系? 例如某医生从某地2000年的正常成年男性中,随机抽取25人,算得其血红蛋白的均数X 为138.5g/l ,标准差S 为5.20g/L,标准误x S 为1.04g/L ,。在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其均数的离散情况。因此标准差是描述个体值变异程度的指标,为方差的算述平方根,该变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差, 均数的标准误实质要均数的标准差,它反映了样本均数的离散程度,也反映了样本均数与总体均数的差异,说明了均数的抽样误差。本例均数的标准误X S 此式 将标准差和标准误从数学上有机地联系起来了,同是可以看出通过增加样本含量方法可以减少标准 误。 5、标准正态分布与t 分布有何不同? T 分布为抽样分布,标准正态分布为理论分布。T 分布比标准正态分布的峰值低,且尾部翘起得要高。随着自由度的增大,t 分布逐渐趋近于标准正态分布,即当v →∞时,t 分布→标准正态分布。 6、假设检验时,一般当P<0.5时,则拒绝0H ,理论根据是什么? P 值是指从0H 规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t 值 或u 值 )的概率。当P<0.5时,说明在0H 成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05.因小概率事件在一次试验中几乎不可能发生,现在的确发生了,说明现有样本信息不支持0H ,所以怀疑原假设0H 不成立,故拒绝0H 。在下“有差别”的结论的同时,我们能够知道可犯I 型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

初中物理基础知识点总汇含公式

初中物理基础知识点总汇含公式 初中物理基本概念概要 一、测量 长度L:主单位:米;测量工具:刻度尺;测量时要估读到最小刻度的下一位;光年的单位是长度单位。 时间t:主单位:秒;测量工具:钟表;实验室中用停表。1时=3600秒,1秒=1000毫秒。 质量m:物体中所含物质的多少叫质量。主单位:千克;测量工具:秤;实验室用托盘天平。 二、机械运动 机械运动:物体位置发生变化的运动。 参照物:判断一个物体运动必须选取另一个物体作标准,这个被选作标准的物体叫参照物。 匀速直线运动: 比较运动快慢的两种方法:a 比较在相等时间里通过的路程。b 比较通过相等路程所需的时间。 公式: 1米/秒=3.6千米/时。 三、力 力F:力是物体对物体的作用。物体间力的作用总是相互的。 力的单位:牛顿(N)。测量力的仪器:测力器;实验室使用弹簧秤。 力的作用效果:使物体发生形变或使物体的运动状态发生改变。 物体运动状态改变是指物体的速度大小或运动方向改变。 力的三要素:力的大小、方向、作用点叫做力的三要素。 力的图示,要作标度;力的示意图,不作标度。 重力G:由于地球吸引而使物体受到的力。方向:竖直向下。 重力和质量关系:G mg m G/g g 9.8牛/千克。读法:9.8牛每千克,表示质量为1千克物体所受重力为9.8牛。 重心:重力的作用点叫做物体的重心。规则物体的重心在物体的几何中心。 二力平衡条件:作用在同一物体;两力大小相等,方向相反;作用在一直线上。 物体在二力平衡下,可以静止,也可以作匀速直线运动。 物体的平衡状态是指物体处于静止或匀速直线运动状态。处于平衡状态的物体所受外力的合力为零。 同一直线二力合成:方向相同:合力F F1+F2 ;合力方向与F1、F2方向相同; 方向相反:合力F F1-F2,合力方向与大的力方向相同。 相同条件下,滚动摩擦力比滑动摩擦力小得多。 滑动摩擦力与正压力,接触面材料性质和粗糙程度有关。【滑动摩擦、滚动摩擦、静摩擦】

卫生统计学试题汇总(印)

最佳选择题 1.收集资料的方法是:E A.收集各种报表 B.收集各种工作记录 C.进行专题调查 D.进行科学实验 E.以上都对 2.统计工作的基本步骤是:D A.调查资料、审核资料、整理资料 B.收集资料、审核资料、分析资料 C.调查资料、整理资料、分析资料 D.收集资料、整理资料、分析资料 E.以上都对 3.在抽样研究中样本是:D A.总体中的一部分 B.总体中任意一部分 C.总体中典型部分 D.总体中有代表性的一部分 E.总体中有意义的一部分 4.计量资料、计数资料和等级资料的关系是:C A.计量资料兼有计数资料和等级资料的一些性质 B.计数资料兼有计量资料和等级资料的一些性质 C.等级资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质 E.以上都不是 5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制D : A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6.直方图可用于: A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D.某现象的频数分布 E.某现象的发展速度 7.统计图表的要求是: A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8.在列频数表时,分组数目一般为: A.5-10 B.8-15 C.10-30 D.15-20 E.>20 9.平均数作为一种统计指标是用来分析: A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E.以上都不对 10.表示变量值变异情况的常用指标是: A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11.确定正常人某个指标正常值范围时,调查对象是: A.从未患过病的人 B.健康达到了要求的人 C.排除影响被研究指标的疾病和因素的人 D.只患过小病但不影响研究指标的人 E.排除了患过某病或接触过某因素的人 12.标准误: A.与标准差呈反比 B.与标准差呈正比 C.与标准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13. x σ是指: A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C.所有样本均数对总体均数的离散程度 D.某些样本均数对总体均数的离散程度 E.所有含量相同的样本均数对总体均数的离散程度 14. 2.58X X S ±表示: A.95%的正常值范围 B.95%的可信区间 C.99%的正常值范围

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

(完整版)操作系统基础知识点详细概括

第一章: 1. 什么是操作系统?OS的基本特性是?主要功能是什么 OS是控制和管理计算机硬件和软件资源,合理组织计算机工作原理以及方程用户的功能的集合。特性是:具有并发,共享,虚拟,异步的功能,其中最基本的是并发和共享。主要功能:处理机管理,存储器管理,设备管理,文件管理,提供用户接口。 2. 操作系统的目标是什么?作用是什么? 目标是:有效性、方便性、可扩充性、开放性 作用是:提供用户和计算机硬件之间的接口,提供对计算机系统资源的管理,提供扩充机器 3. 什么是单道批处理系统?什么是多道批处理系统? 系统对作业的处理是成批的进行的,且在内存中始终保持一道作业称此系统为单道批处理系统。 用户所提交的作业都先存放在外存上并排成一个队列,然后,由作业调度程序按一定的算法从后备队列中选择若干个调入作业内存,使他们共享CPU和系统中的各种资源。 4 ?多道批处理系统的优缺点各是什么? 优点:资源利用率高,系统吞吐量大。缺点:平均周转时间长,无交互能力。 引入多道程序技术的前提条件之一是系统具有终端功能,只有有中断功能才能并发。 5. 什么是分时系统?特征是什么? 分时系统是指,在一台主机上连接了多个带有显示器和键盘的终端,同时允许多个用户通过自己的终端,以交互的方式使用计算机,共享主机中的资源。 特征:多路性、独立性、及时性、交互性 *有交互性的一般是分时操作系用,成批处理无交互性是批处理操作系统,用于实时控制或实时信息服务的是实时操作系统,对于分布式操作系统与网络操作系统,如计算机之间无主次之分就是分布式操作系统,因为网络一般有客户-服务器之分。 6. 什么是实时操作系统? 实时系统:系统能及时响应外部事件的请求,在规定的时间内处理完。按照截止时间可以分为1硬实时任务(必须在截止时间内完成)2软实时任务(不太严格要求截止时间) 7用户与操作系统的接口有哪三种? 分为两大类:分别是用户接口、程序接口。 用户接口又分为:联机用户接口、脱机用户接口、图形用户接口。 8. 理解并发和并行?并行(同一时刻)并发(同一时间间隔) 9. 操作系统的结构设计 1 ?无结构操作系统,又称为整体系统结构,结构混乱难以一节,调试困难,难以维护 2?模块化os结构,将os按功能划分为一定独立性和大小的模块。是os容易设计,维护, 增强os的可适应性,加速开发工程 3?分层式os结构,分层次实现,每层都仅使用它的底层所提供的功能 4. 微内核os结构,所有非基本部分从内核中移走,将它们当做系统程序或用户程序来实现,剩下的部分是实现os核心功能的小内核,便于扩张操作系统,拥有很好的可移植性。 第二章: 1 ?什么叫程序?程序顺序执行时的特点是什么? 程序:为实现特殊目标或解决问题而用计算机语言编写的命令序列的集合特点:顺序性、封闭性、可再现性 2. 什么是前趋图?(要求会画前趋图)P35图2-2 前趋图是一个有向无循环图,记为DAG ,用于描述进程之间执行的前后关系。 3?程序并发执行时的特征是什么? 特征:间断性、失去封闭性、不可再现性

卫生统计学部分题库

对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______. A.有相关关系 B.无任何关系 C.无直线相关关系 D.无因果关系 E.有伴随关系 若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____. A.直线相关分析 B.秩相关分析 C.直线回归分析 D.方差分析 E.病例对照研究 四格表资料的χ2检验应使用校正公式而未使用时,会导致。 A.χ2增大,P值减小 B.χ2减小,P值也减小 C.χ2增大,P值也增大 D.χ2减小,P值增大 E.视数据不同而异 配对设计四格表资料比较两个率有无差别的无效假设为。 A.μ1=μ2 B.π1=π2 C.μ1≠μ2 D.π1≠π2 E.b=c 四格表χ2检验的校正公式应用条件为。 A.n>40且T>5 B.n<40且T>5 C.n>40且1<T<5 D.n<40且1<T<5 E.n>40且T<1 两组设计两样本均数比效的t检验公式中,位于分母位置上的是。 A.两样本均数之差 B.两样本均数之差的方差 C.两样本均数之差的标准误 D.两样本均数方差之差

E.两样本均数标准误之差 两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______. A.t值不变 B.t值变小 C.t值变大 D.t值变小或变大 E.不能判断 在假设检验中,P值和α的关系为。 A.P值越大,α值就越大 B.P值越大,α值就越小 C.P值和α值均可由研究者事先设定 D.P值和α值都不可以由研究者事先设定 E.P值的大小与α值的大小无关 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 下面关于均数的正确的说法是______. A.当样本含量增大时,均数也增大 B.均数总大于中位数 C.均数总大于标准差 D.均数是所有观察值的平均值 E.均数是最大和最小值的平均值 从同一正态总体中随机抽取多个样本,用样本均数来估计总体均数的可信区间,下列哪一样本得到的估计精度高。 A.均数大的样本 B.均数小的样本 C.标准差小的样本 D.标准误小的样本 E.标准误大的样 以一定概率由样本均数估计总体均数,宜采用。 A.抽样误差估计 B.点估计 C.参考值范围估计 D.区间估计

卫生统计学简答题汇总

统计学简答汇总 第一章:绪论(无) 第二章:定量变量的统计描述 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平均数意义应用场合 均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布 几何均数平均增减倍数①等比资料;②对数正态分布资料 中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两 察值水平端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/f x)(n·x%-Σf L) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的. 变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征? 答:从集中趋势和离散趋势两方面回答。 7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

公共基础知识公文写作知识点概括以及范文

《公共基础知识》考点复习之公文写作范文 1. 启事 寻物启事 本人不慎于元月二十五日乘七路公共汽车时,将部队复员证、驾驶证、复员介绍信遗失。有拾到者请与XX厂机修车间XXX联系,必有重谢。电话:XXX 启事人:XXX X年X月X日 招领启事 本商场拾到手提包一个,内装人民币若干元,手机、信用卡等物,望失主前来认领。地点:本市XX商场三楼办公室,电话:XXXXXXXX XX商场办公室(盖章) XX年X月X日 2. 声明 遗失声明 上海XXXXXXX贸易公司遗失XXXXXXXX船务公司海运提单,单号XXXXXX,声明作废。 上海XXXXXXX贸易公司(盖章) X年X月X日 投资者声明书 致深圳永信中鹏会计师事务所: 鉴于贵所验证本公司投资者实投资本的需要,现对有关事项作如下声明: 1. 本公司已向贵所提供有关验资的全部法律文件,其中包括但不局限于公司的协议,合同,章程,公司设立申请报告,可行性报告,政府批复,投资者法人资格证明,营业执照,会计报表,身份证,企业名称预先核准通知,以及董事会纪要,决议等文件。 2. 本公司投资者已按公司的协议,合同,章程规定的出资比例,出资方式和出资期限缴足资本。 3. 本公司投资者所投入的现金已汇入本公司银行帐号,以固定资产,无形资产出资的已办理财产转移手续。 4. 非货币资金出资已进行资产评估。

5. 本公司投资者无意于验资后抽逃资金或变相抽逃资金。 6. 贵所接受验资委托时,已向本公司投资者告知了关于验资责任方面的有关法律、法规,其中包括但不限于《中华人民共和国公司法》第三、二十五、三十四、二○八、二○九条,《中华人民共和国注册会计师法》第十七条,财政部《关于明确注册会计师验资报告作用的通知》。 7. 本公司投资者认识到:验资报告仅证明股东出资情况和某一时点公司所拥有的资金情况,它并不是资信证明和偿债能力的证明,只可以向股东及政府有关部门提供,由于对报告使用不当而造成任何损失与事务所无关。 投资者______________(签章) ______________ ______________ 年月日 3. 公示 公示 经本人申请,党组织长期培养考察,近期确定XXX等3名同学为拟发展对象,根据中央及我院党委发展党员公示制的规定,现公示如下: 姓名性别出生年月系别班级职务入党时间 XXX 男1985.6 XX系03级XXXX1班班长2007.9.1 XXX 女1985.7 XX系03级XXXX2班团支书2008.10.1 XXX 女1985.8 XX系03级XXXX1班2008.11.1 公示期自即日始5个工作日,即12月6日―12月10日,凡对发展上述同志入党有意见者,请及时以书面或口头形式向XX系党总支反映,也可直接向党委组织部反映。 接待时间:每天8:00―12:00,14:00―16:30 联系电话:XX系党总支:XXXXXXXX 党委组织部:XXXXXXXX XX系党总支(盖章) XX年XX月XX日 4. 公告 全国人民代表大会常务委员会公告 自第八届全国人民代表大会常务委员会第十二次会议以来,有2名全国人大代表逝世:福建陈希仲,广西韦元威(壮族)。罢免1名:山东刘延民。

卫生统计学试题汇总

医学统计学复习题 一、名词解释 1、总体 2、样本 3、随机抽样 4、变异 5、概率 6、随机误差(偶然误差) 7、参数 8、统计量 9、算术均数 10、中位数 11、百分位数 12、频数分布表 13、几何均数 14、四分位数间距 15、方差 16、标准差 17、变异系数 18、标准正态分布 19、医学参考值范围 20、可信区间 21、统计推断 22、参数估计 23、标准误及 24、检验水准 25、检验效能 26、率 27、直线相关 28、直线回归 29、实验研究 30、回归系数 二、单项选择 1.观察单位为研究中的()。 A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标 2.总体是由( )组成。 A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标 3.抽样的目的是()。 A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征 4.参数是指( ) 。 A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标 5.关于随机抽样,下列哪一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随机抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.选择符合研究者意愿的样本 6.反映计量资料平均的指标是()。 A.频数 B.参数 C.百分位数 D.平均数 E.统计量 7.表示总体均数的符号是( ) 。 A.σ B.μ C.X D. S E. M 8.下列指标中,不属于集中趋势指标的是()。 A.均数 B.中位数 C.百分位数 D.几何均数 E.众数 9. ( )分布的资料,均数等于中位数。 A.对称分布 B.正偏态分布 C.负偏态分布 D.对数正态分布 E.正态分布 10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选()。 A.中位数 B.算术均数 C.几何均数 D.平均数 E.百分位数末端有确定数据

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

卫生统计学题库56025

最佳选择题 1. 收集资料的方法是:E A. 收集各种报表 B.收集各种工作记录 C.进行专题调查 D. 进行科学实验 E.以上都对 2. 统计工作的基本步骤是:D A. 调查资料、审核资料、整理资料 B.收集资料、审核资料、 分析资料 C. 调查资料、整理资料、分析资料 D.收集资料、整理资料、分析资料 E. 以上都对 3. 在抽样研究中样本是:D A.总体中的一部分 B.总体中任意一部分 C.总体中典型部分 D. 总体中有代表性的一部分 E.总体中有意义的一部分 4. 计量资料、计数资料和等级资料的关系是:C A. 计量资料兼有计数资料和等级资料的一些性质 B. 计数资料兼有计量资料和等级资料的一些性质 C. 等级资料兼有计量资料和计数资料的一些性质 D. 计数资料有计量资料的一些性质 E. 以上都不是 5. 用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制 D : A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6. 直方图可用于: A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D. 某现象的频数分布E某现象的发展速度 7. 统计图表的要求是: A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8. 在列频数表时,分组数目一般为: A.5-10 B.8-15 C.10-30 D.15-20 E.> 20 9. 平均数作为一种统计指标是用来分析: A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E. 以上都不对 10. 表示变量值变异情况的常用指标是: A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11. 确定正常人某个指标正常值范围时,调查对象是: A.从未患过病的人 B.健康达到了要求的人 C.排除影响被研究指标的疾病和因素的人 D.只患过小病但不影响研究指标的人 E.排除了患过某病或接触过某因素的人 12. 标准误: A.与标准差呈反比 B.与标准差呈正比 C.与标准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13. x是指: A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C. 所有样本均数对总体均数的离散程度 D.某些样本均数对 总体均数的离散程度

卫生统计学重点整理资料东大

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本 均数?x 、样本率ρ等。 ⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变 量;变量值的集合成为资料。 ⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料;②等级资料第二章调查研究设计

★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数 字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一 顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若 干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 ⑷整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组 成,随机抽取一部分群,调查抽中群的全部次级观察单位。 第三章实验设计 ★1、实验设计的特点(注意与调查研究的特点的区别): ⑴研究者可人为设置处理因素; ⑵受试对象接受何种处理因素或处理因素的何种水平是随机的。 ★2、实验设计的三要素、四原则: ⑴基本要素:①处理因素②受试对象③实验效应 ⑵基本原则:①对照原则②随机原则③重复原则④均衡原则 4、实验设计的基本步骤: ⑴明确实验目的;⑵确定研究对象;⑶确定可比的实验组和对照组; ⑷确定把受试对象分配到各处理组中的原则;⑸确定样本含量; ⑹确定方法和指标;⑺偏倚及其控制 5、常用的实验设计方案:主要掌握完全随机设计和配对设计。 第四章定量资料的统计描述 ★1、频数表的编制:①求极差②确定组数和组距(一般8~15组)

相关主题
文本预览
相关文档 最新文档