当前位置:文档之家› 卫生统计学作业答案

卫生统计学作业答案

卫生统计学作业答案
卫生统计学作业答案

《卫生统计学》第1次平时作业

一、选择题(每小题1分,共30分)

1.抽样研究中的样本是( C )。

A )研究对象的全体

B )总体中特定的一部分

C )总体中随机抽取的一部分

D )随意收集的一些观察对象

2.对某样品进行测量时,由于测量仪器事先未校正,造成测量结果普遍偏高,这种误差属于( A )。 A )系统误差 B )随机测量误差 C )抽样误差 D )随机误差

3.欲了解某市某年所有三级甲医院的病床数,该市每个三级甲医院就是一个( B )。 A )有限总体 B )观察单位 C )无限总体 D )观察值 4.下面的变量中哪个是数值变量( B )。

A )每个病人就诊的科室

B )每个病人就诊的次数

C )每个病人就诊的疾病

D )每个病人就诊的医院

5.用某年全市的出生数和婴儿死亡数计算婴儿死亡率,这种方法是属于( C )。 A )抽样研究 B )参数估计 C )统计描述 D )统计推断

6.医学人口统计应属于卫生统计学中的哪部分内容( C )。 A )卫生统计学基本原理 B )卫生统计学基本方法 C )健康统计 D )卫生服务统计 7.下面哪一种统计资料的来源不属于经常性的资料( D )。 A )统计报表 B )门诊病例 C )出生报告卡 D )调查问卷

8.5人的血清滴度为1:20,1:40,1:80,1:160,1:320,则平均滴度是( B )。 A )1:40 B )1:80 C )1:160 D )1:320 9.某组资料共5例,

1902

=∑x

,30=∑x ,则均数和标准差分别是( D )

。 A )6,1.9 B )6.33,2.5 C )38,6.78 D )6,1.58 10.偏态分布数值资料,对数变换后,分布仍呈偏态。描述数据的集中趋势宜用( C )。

A)算术平均数B)几何平均数

C)中位数D)标准差

11.反映抗体滴度资料平均水平,适宜采用的指标是( B )。

A)算术均数B)几何均数

C)中位数D)标准差

12.描述一组对称(或正态)分布资料的变异度时,最适宜选择的指标是( B )。

A)极差B)标准差

C)四分位数间距D)变异系数

13.比较身高与体重的变异程度,适宜的指标是( D )。

A)极差B)标准差

C)四分位数间距D)变异系数

14.关于标准差,下面哪个说法是正确的( B )。

A)标准差可以是负数B)标准差必定大于或等于零

C)标准差无单位D)同一资料的标准差一定比均数小

15.关于变异系数,下面哪个说法是错误的( D )。

A)变异系数就是标准差与均数的比值

B)比较同一人群的身高、体重两项指标的变异度时宜采用变异系数

C)两组资料均数相差悬殊时,应用变异系数描述其变异程度

D)变异系数的单位与原始数据相同

16.正态分布曲线,当μ恒定时,α越大( C )。

A)曲线沿横轴越向左移动B)观察值变异程度越小,曲线越陡峭

C)观察值变异程度越大,曲线越平缓D)曲线沿横轴越向右移动

17.某年某地6岁的男孩身高服从正态分布,其均数为115.0cm,标准差为10cm,则( C )。

A)5%的6岁的男孩身高大于95cm B)5%的6岁的男孩身高大于105cm

C)2.5%的6岁的男孩身高大于134cm D)2.5%的6岁的男孩身高大于125cm

18.关于相对数,下列哪一个说法是错误的( D )。

A)相对数是两个有联系的指标之比B)常用相对数包括相对比,率与构成比

C)计算相对数时要求分母要足够大

D)率与构成比虽然意义不同,但性质相近,经常可以混用

19.某县流脑发病率动态分析显示:以1982年的21.37/10万为基期水平,83年流脑发病率降至7.30/10万,84年为5.77/10万,85年为5.22/10万,1985年的定基发展速度是( B )。

A)27.00% B)24.43% C)79.04% D)90.47%

20.对两地的结核病死亡率比较时作率的标准化,其目的是( D )。

A)为了能更好地反映人群实际死亡水平B)消除两地总人数不同的影响

C)消除各年龄组死亡率不同的影响D)消除两地人口年龄构成不同的影响

21.随机抽取男200人,女100人为某寄生虫病研究的调查对象,测得其感染阳性率分别为20%和15%,则合并阳性率为( C )。

A)35% B)16.7% C)18.3% D)无法计算

22.标化后的总死亡率( A )。

A)仅仅作为比较的基础,它反映了一种相对水平B)它反映了实际水平

C)它不随标准选择的变化而变化D)它反映了事物实际发生的强度

23.某日门诊各科疾病分类资料,可作为( C )。

A)计算死亡率的基础B)计算发病率的基础

C)计算构成比的基础D)计算病死率的基础

24.为表示某地近20年来婴儿死亡率的变化情况,宜绘制( A )。

A)普通线图B)直方图

C)直条图D)散点图

25.要表示某校18岁女生体重与肺活量的相关关系,宜绘制( C )。

A)直方图B)百分条图

C)散点图D)普通线图

26.直条图适用于( C )。

A)构成比资料B)连续性资料

C)各自独立的分类资料D)双变量资料

27.直方图适用于( D )。

A)构成比资料B)连续性资料

C)各自独立的分类资料D)数值变量的频数表资料

28.下面哪一种图要求纵轴必须从零开始,中间不可以有折断( B )。

A)百分条图B)直条图

C)直方图D)线图

29.下面中一种图,其横轴为连续性变量的组段,同时要求各组段的组距相等( C )。

A)百分条图B)直条图

C)直方图D)以上皆是

30.将某地居民的性别、年龄结合起来分组,研究不同性别、年龄别的住院率,这样得到的统计表属于( B )。

A )简单表

B )复合表

C )频数表

D )四格表

二、填空题(每小题1分,共10分)

1.计数资料是指_将全体观察单位按照某种性质和类别进行分组,然后分别清点各组中的例数,这样所得到的数据__,常用的统计指标有__率__,____构成比等_,常用的统计方法有_u 检验、卡方检验等_。P3

2.频率是对_样本__而言,概率是对_总体__而言。P7

3.统计资料的两个主要来源_经常性资料_,___一时性资料__。P7

4.收集统计资料的基本三个要求__资料必须完整、正确、及时_,_要有足够的数量_,_注意资料的代表性和可比性_。P8

5.主要从哪两个方面对原始资料进行检查与核对__原始数据有无错漏_,_数据间的相互关系是否合符逻辑_。P8

6.计量资料的分布特征有_集中趋势__和__离散趋势_。P12

7.描述计量资料离散趋势的常用指标有 极差,四分位数间距,方差和标准差,变异系数。P18-20 8.正态分布由参数_均数(μ_)_, 标准差(σ)_。P21 9.常用的相对数有_率_、__构成比__、__相对比_。P29

10.设计统计表的横纵标目时,基本要求是_必须合乎逻辑,主谓分明_,即横标目在表中作主语,表示被研究事物;纵标目在表中作谓语,表示被研究事物的各项统计指标_。P41-42

三、名词解释(每小题2分,共10分)

1.抽样研究p5

2.均数p13

3.构成比p29

4.动态数列p36

5.统计表p41

四、简答题(每小题3分,共18分)

1.描述离散趋势的指标有哪些?它们各自的特点及适用条件?

描述频数分布离散趋势的指标包括极差、四分位间距、方差和标准差及变异系数。

极差的特点是简单明了,但是不能反映全部数据的变异度,不够稳定。其适用条件是任何分布。

四分位间距的特点是比较稳定,但是不能反映全部数据的变异度,其适用条件一是偏态分布,二是末端无确定值。

方差有特点是可反映全部观察值的变异情况,但单位为原单位的平方,其适用条件是对称分布,尤其适用于正态分布。

标准差的特点是可反映全部观察值的变异情况,但单位和原单位相同。其适用于对称分布,特别是正态分布。

变异系数的特点一是相对离散程度,二是没有度量衡单位,便于比较,所以适用条件一是量纲不同的资料,二是适用于均数相关悬殊的资料。

2.正态分布有哪些参数?为什么说正态分布是很重要的连续性分布?

。其答题要点为:总体均数μ和总体标准差σ被称为正态分布参数。μ为位置参数,它描述了正态分布集中趋势的位置;σ为展度参数,反映正态分布的离散程度。若已知某数值变量服从正态分布或近似正态分布,如同年龄、同性别儿童及同性别健康成人身高、体重等,可按正态分成的规律估计某个体变量值所在的范围,如95%的医学参考值的估计。同时正态分布是很多统计分析方法的基础。

3.了解正态分布曲线下面积分分布规律有何用处?

其答题要点为:根据正态曲线下面积的分布规律,可以估计观察值的频数分布情况,通常用于估计95%的观察值所在范围和99%的观察值所在范围,临床医学常用以估计医学参考值范围。

4.应用相对数时有哪些注意事项?

答题要点:常用的相对数指标有率、构成比、相对比。在应用相对数指标时应注意:(1)构成比与率是意义不同的两个统计指标,应用时不能相互混淆。构成比说明事物内部各组成部分所占的比重,而率则说明某事物或现象的发生频

率或强度,不能以构成比代替率来说明问题。(2)样本含量太小时,不宜计算相对数,最好用绝对数来表示。(

3)对各组观察例数不等的几个率,不能直接相加求其总率。(4)在比较相对时应注意资料的可比性。 5.率的标准化法的基本思想?直接标化法需要的条件是什么?

其答题要点为:当不同人群的总率进行比较时,若其人群 的内部构成(如年龄、发生影响、病情轻重等)存在差异,而年龄、性别等因素对率有影响。为消除构成的影响,要按照统一标准构成对两个人群进行校正,使两个人群构成一致。这种选择统一构成,然后计算标准化率的方法称为率的标准化法。直接法计算标准化率需下面两个条件:(1)资料条件:已知实际人群的年龄 别(级)率,且各年龄组率无明显交叉;选择标准人群的年龄组人口数或构成比。

6.绘制统计表的基本要求是什么?p41-42

解答:统计表是以表格的形式列出统计指标。一张统计表只能有一个中心,项目的排列要合理。统计表由标题、标目、线条、数字四个基本部分构成。其基本要求如下。

(1) 标题:要求用一句简明扼要的话说明表的内容,必要时注明资料的时间、地点,写在表的上方(中央)。 (2) 标目:标目指明表内数字的含义,它分为横标目(主语作用)和纵标目(谓语作用),横标目放在表的左侧,

表明表内同一横行数字的含义,表明被研究的事物;纵标目用来表明表内同一纵列数字的含义,表示被研究事物的各项统计指标。标目的设计原则是符合逻辑,主谓分明、文字简明,纵标目应注明指标单位。

(3) 线条:对统计表线条的基本要求是力求简洁,除必须绘制的顶线、底线、标目线、(必要时可绘制总标目线、

合计线)之外,应尽量减少其它不必要的线条。

(4) 数字:基本要求是必须准确无误,一律用阿拉伯数字表示。同一指标的数字的小数点位数应一致,位次对

齐。数字为“零”填写“0”,暂缺或未计录入“…”,无数字用“—”表示。

(5) 备注:(非必要结构)需要说明某一项目时用“*”标记,将备注写在表的底线下方。

五、计算分析题(共32分)

1.12名健康成年男性的血清总胆固醇(mg/dl )如下:222,142,136,212,129,207,172,150, 161,216,174,186,求均数和标准差。 (5分)

解答:

2107186174142222=++++=∑ x

3819111861741422222

2

2

2

2

=+++=∑ x

)

/(58.17512

2107dl mg n x x ===∑

2.某市100名7岁男童的身高均数为120.0cm ,标准差为4.80cm 。问: (1)身高在110cm 以下者占该地7岁男童的百分数? (2)该地7岁男童身高的95%参考值范围?

(3)若一男童身高为135.0cm ,怎样评价? (5分) 解答: (1)

查表得:%88.10188.0)08.2(==-Φ,即身高在110cm 以下者占该地7岁男童的1.88%。 (2))41.129,59.110(80.496.112096.1=?±=±s x

即该地7岁男童身高的95%参考值范围为(110.59cm ,129.41cm )

(3)此男童身高为135cm ,高于95%参考值范围上限,可认为该男童身高偏高。

3.甲乙两医院历年乳腺癌手术资料见表1,是否可以认为乙医院有术后5年生存率(%)高于甲医院?

甲乙两医院历年乳腺癌手术后5年生存率%

(6分) 主要考察: 对象的总率受内部构成的影响——标准化

解答:不能认为乙医院有术后5年生存率(%)高于甲医院。主要原因: (1)

从分组看:无腋下淋巴结转移组, 5年生存率甲医院大于乙医院(77.77%>71.67%),有腋下淋巴结转移组, 5年生存率甲医院也大于乙医院(68.38%>50.60%)。提示甲医院的5年生存率两个组均高于乙医院。

(2)

合计五年生存率出现乙医院高于甲医院,是由于乙医院观察病例中,无腋下淋巴结转移组所占的比例(300/383*100%)明显高于甲医院观察病例中无腋下淋巴结转移组所占的比例(45/755*100%)所致。即内部构成对总率的影响。

(3)

要比较甲乙两所医院总的5年生存率,应该进行标准化处理,消除内部构成对总生存率的影响。

08.280

.4120

110-=-=-=

s x x u )

/(97.3211212/21073819111

/)(222

dl mg n n x x

s =--=--=

∑∑

4.某妇产科医院拟分析畸形儿与母亲分娩年龄关系,将历年在医院分娩的畸形儿116例与其母亲的年龄进行了如

下分析,据此得出结论:“母亲年龄在24-29岁时,最容易出生畸形儿。”

母亲年龄21 23 24 25 26 27 28 29 30及以上合计

畸形儿例

数(%)

1

0.86

2

1.70

14

12.1

19

16.4

24

20.7

18

15.5

19

16.4

13

11.2

6

5.18

116

100.0

(6分)

其答题要点:该资料为构成比资料,计算医院分娩的116名畸形儿的母亲的年龄分布,在这些畸形儿中母亲年龄26岁所占的比重最大,其次为24-29(除26岁外)各年龄组。不能根据该资料得出“母亲年龄在24-29岁时,最容易生出畸形儿”的结论。若要回答哪个年龄组母亲容易生出畸形儿,需要收集各年龄母亲出生的新生儿数及畸形儿资料,计算各年龄组母亲的畸形儿发生率。

5.将以下文字叙述经整理后,绘制成统计表。

某县防疫部门在该地区不同年龄组的人群中,开展了某种疫苗的预防接种工作,并进行了下列调查:接种前,观察1920人的锡克试验反应情况:其中:幼儿园儿童144人,阳性37人;小学生1417人,阳性323人;中学生359人,阳性41人。接种后,抽取482人作为样本,其锡克试验反应情况为:幼儿园儿童101人,阳性21人;小学生145人,阳性22人;中学生236人,阳性15人。(5分)

6.某医生列出下表,分析中小学生近视性眼底改变(弧形斑眼底)与年级高低、视力不良程度的关系。请问该表有哪些不符合列表原则和要求的地方,并予以改正。

视力不

良程度

轻中重备

近视

眼人

弧形

斑眼

% 近视

眼人

弧形

斑眼

% 近视

眼人

弧形

斑眼

%

小学生217 20 9.69 143 43 30.06 60 33 55.00 P<0.01

初中生173 30 19.07 157 62 39.89 121 62 51.23 P<0.01

高中生90 37 40.11 78 51 63.65 70 62 81.14 P<0.01

(5分)

原表存在以下不当

(1)无标题

(2)“视力不良程度”纵标目标识内容不当

(3)标的线条过于繁杂

(4)纵标目“%”的含义不明确等

原表可修改为:

《卫生统计学》第2次平时作业

一、选择题(每小题1分,共30分)

1.表示均数抽样误差大小的统计指标是( C )。

A)标准差B)方差

C)均数标准误D)变异系数

2.抽样研究中,s为定值,若逐渐增大样本含量,则样本( B )。

A)标准误增大B)标准误减少

C)标准误不改变D)标准误的变化与样本含量无关

3.均数标准误越大,则表示此次抽样得到的样本均数( C )。

A)系统误差越大B)可靠程度越大

C)抽样误差越大D)可比性越差

得分

教师签名得分批改人

4.假设已知某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg,标准差为11.2 mmHg,后者反映的是( A )。

A)个体变异B)抽样误差

C)总体均数不同D)抽样误差或总体均数不同

5.随机抽取上海市区120名男孩作为样本,测得其平均出生体重为3.20Kg,标准差0.50 Kg。则总体均数95%可信区间的公式是( B )。

A)3.20±1.96×0.50 B)3.20±1.96×0.50/120

C)3.20±2.58×0.50 D)3.20±2.58×0.50/120

6.下列关于总体均数可信区间的论述是正确的,除了( C )外。

A)总体均数的区间估计是一种常用的参数估计

B)总体均数可信区间所求的是在一定概率下的总体均数范围

C)求出总体均数可信区间后,即可推断总体均数肯定会在此范围内

D)95%是指此范围包含总体均数在内的可能性是95%,即估计错误的概率是5%

7.总体率可信区间的估计符合下列(A、C)情况时,可以借用正态近似法处理。

A)样本例数n足够大时B)样本率p不太大时

C)np和n(1-p)大于5时D)p接近1或0时

8.正太近似法估计总体率95%可信区间用( D )。

A)p±1.96s B)p±1.96σ

C)p±2.58σ D)p±1.96s p

9.统计推断的内容( C )。

A)用样本指标估计相应总体指标B)假设检验

C)A和B答案均是D)估计参考值范围

10.关于假设检验,下列哪个是正确的( A )。

A)检验假设是对总体作的某种假设

B)检验假设是对样本作的某种假设

C)检验假设包括无效假设和零假设

D)检验假设只有双侧的假设

11.两样本均数假设检验的目的是判断( C )。

A)两样本均数是否相等B)两总体均数的差别有多大

C)两总体的均数是否相等D)两样本均数的差别有多大

12.比较两种药物疗效时,对于下列哪项可作单侧检验( C )。

A)已知A药与B药均有效B)不知A药好还是B药好

C)已知A药不会优于B药D)不知A药与B药是否均有效

13.当总体方差已知时,检验样本均数与已知总体均数差别的假设检验是( B )。P88

A)只能用t检验B)只能用u检验

C)t检验或u检验 D)方差分析

14.完全随机设计的两样本均数t检验时,不仅要求数据来自正态分布总体,而且要求( B )。

A)两组数据均数相近,方差齐B)两组数据方差齐

C)两组数据均数相近D)两组数据的σ已知

15.配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,两次t检验( C )。P71公式判断A)t值符号相反,结论相反B)t值符号相同,结论相同

C)t值符号相反,但结论相同D)t值符号相同,但大小不同,结论相反16.以下正确的一项是( D )。

A)配对设计的t检验中t值的分子是两样本均数之和

B)配对设计的t检验中t值的分子是差值的和

C)配对设计的t检验中t值的分母是差值的标准差

D)配对设计的t检验中t值的分母是差值均数的标准误

17.在比较完全随机设计两个小样本的均数时,需要(校正)t检验的情况是( A )。P69

A)两总体方差不等B)两样本方差不等

C)两样本均数不等D)两总体均数不等

18.假设检验时所犯的两类错误的关系是( B )。P76

A)n一定时,α减小则β减小B)n一定时,α减小则β增大

C)α值改变与β值无关D)n一定时,α减小则β不变

19.若检验效能1-β=0.90,其含义是指( D )。P76

A)统计推断中有10%的把握认为两总体均数不相等

B)按α=0.10,有90%的把握认为两总体均数相等

C)两总体均数确实相等时,平均100次抽样中,有90次能得出两总体平均有差别的结论

D)两总体均数确实有差别时,平均100次抽样中,有90次能得出两总体均数有差别的结论20.为调查我国城市女婴出生体重:北方n1=5385人,均数为3.08Kg,标准差为0.53Kg;南方n2=4896人,均数为3.10Kg,标准差为0.34Kg,经统计学检验,P=0.0034<0.01,这意味着( D )。P77

A)南方和北方女婴出生体重的差别无统计学意义

B)南方和北方女婴出生体重的差别很大

C)由于P值太小,南方和北方女婴出生体重的差别无意义

D)南方和北方女婴出生体重的差别有统计学上的意义但无实际意义

21.完全随机设计的方差分析中的组间均方是( D )。P79

A)仅仅表示处理因素造成的差异

B)仅仅反映了个体差异和随机测量的误差

C)它是表示全部变量值总的离散程度的指标

D)反映了随机误差和可能存在的处理的综合结果

22.完全随机设计的方差分析中从总变异分出组间变异和组内变异是指( C )p78-79

A)从总均方中分出组间均方和组内均方

B)从组内离均差平方和分出各组的离均差平方和

C)从总离均差平方和分出组间离均差平方和和组内离均平方的(和)

D)从组间离均差平方和分出组间与组内的离均差平方和

23.方差分析的适用条件为( D )。P80

A)独立性B)正态性C)方差齐性D)以上都对24.四格表资料的卡方检验,其校正条件是( D )。P93

A)总例数大于40 B)有实际数为0

C)有实际数小于1 D)有一个理论数小于5大于1,且n>40

25.检验两年的菌型构成比有否差别,应选择的统计方法是( D )。类似p96例题7.6

χ检验

A)完全随机设计方差分析B)配对计数资料2

χ检验D)行×列表资料2χ检验

C)四格表资料2

26.四格表资料的卡方检验时无需校正,应满足的条件是( D )。P93

A)总例数大于40 B)理论数大于5

C)实际数均大于1 D)总例数大于40且理论数均大于或等于5

27.某医师用A药治疗9例病人,治愈7人,用B药治疗10人例病人,治愈1人,比较两药疗效时,适宜的统计方法是( B )。P93

A)u检验B)直接计算概率法

χ检验D)校正2χ检验

C)2

28.多个率比较的卡方检验,其行×列表中的基本数字为( C )。P95 A )多个率的分子和分母 B )多个率的百分比

C )多个样本的实际阳性频数和阴性频数

D )多个样本的理论阳性频数和阴性频数 29.三个样本 比较的卡方检验,若P ≤0.05,则结论是( D )。P96 A )三个样本率各不相同 B )总体率之间两两有差别

C )至少有两个总体率有差别

D )p 1、p 2、p 3不全相等或完全不相等 30.配对计数资料差别的卡方检验,其备择假设是( D )。P99 A )p 1=p 2 B )p 1≠p 2 C )B =C D )B ≠C

二、填空题(每小题1分,共10分)

1.在同一总体中随机抽取样本含量相同的若干样本时,_样本指标之间的差异_之间的差异以及样本指标_和_总体指标__的差异,称为抽样误差。P57

2.均数的标准误用符号___σx_______表示,它反映了_均数_之间的离散程度。P58 3.率的标准误用符号____σp______表示,它反映了_率与率_之间的离散程度。P58

4.T 分布与标准正态分布相比,其特征之一是自由度_v 越小_,则t 值 _越分散__,曲线变得_越低平__,尾部__翘得越高_。P59

5.参数估计有两种方法,即__点估计__和_区间估计_。P64

6.假设检验的目的是_判断两个(或多个)总体均数(或率)是否相等_。P87 7.检验假设有两种,即_无效假设(零假设)_和__被择假设__。P67 8.假设检验的前提是_确定检验水准(按一定的概率水准做出假设推断)。? 9.2

值可反映___实际频数与理论频数的__符合程度。P92

10.四格表的四个基本数字是_两组资料的阳性频数、阴性频数(表中的a 、b 、c 、d )__。

三、名词解释(每小题2分,共12分)

1. 抽样误差P57

2.均数的抽样误差P57

3.检验水准P67

4.检验效能P76

5.四格表资料p91:两个样本率资料,即2行*2列的资料称为四个表资料,又称2*2表资料。

6.列联表资料p96:

四、简答题(每小题3分,共30分)

1.均数标准误的意义是什么?与标准差有何区别?

解答:

均数标准误是指在同一总体中随机抽取样本含量相同的若干样本时,样本均数之间的差异以及样本均数和总体均数的差异,是样本均数的标准差,反映抽样误差的大小。标准差是指个体指标值的离散程度指标,反映个体的变异程度。均数标准误与标准差比较:(1)计算公式不同;(2)在应用上,均数标准误主要用于对总体均数的参数估计和显著性检验,均数标准差主要用于医学参考值的确定。他们也有联系,一般而言,均数标准误根据标准差计算而得。

2.T分布的特征是什么?

答题要点:T分布的特征包括:(1)以0为中心,左右对称的单峰分布;(2)自由度v=n-1越小,曲线变得越低平,尾部翘得越高;(3)随着自由度逐渐增大时,T分布逐渐逼迫标准正态分布;当自由度趋于∞时,T分布就完全成为标准正态分布。

3.为什么要做假设检验?假设检验可以回答什么问题?

答题要点:假设检验的目的是通过样本推断总体,即通过两个样本均数的比较来判断两个总体均数是否相等(以完全随机设计类型为例)。通过假设检验,可以回答两个样本均数的差异是由于抽样误差造成,还是由于两个总体均数不相等造成的。

4.T检验和u检验有何区别?

解答:T检验和u检验有何区别

(1)适用对象有一定差别:T检验和u检验均适于样本均数与已知总体均数的比较、配对设计的比较、完全随机设计的两样本均数的比较,但在样本率与总体率比较时,如果样本含量足够大,且p和(1-p)均不太小时

也可以应用率的u检验。

(2)适用条件不同:在计量资料的比较时:

t检验适用条件为总体标准差未知、样本含量较小(如小于或等于50)、样本来自正态分布总体。完全随机设计的两个小样本均数比较时还要求两总体方差相等。

U检验的适用条件为总体标准差未知但样本含量较大(如大于50),或者总体标准差已知时,选用u检验。

(3)计算的统计量不同:t检验计算统计量t,u检验计算统计量u。不同的资料和已知条件分别均有不同的计算公式。

5.怎样正确使用单侧检验与双侧检验?p66

解答:在进行显著性检验时,应该根据专业知识来确定选择单侧检验或双侧检验。从专业知识的角度,判断一种方法的结果不可能低于或高于另一种方法的结果,则可以选择单侧检验;在根据专业知识不能判断两种方法结果谁高谁低

时,则选用双侧检验。

卫生统计学整理笔记

如何绘制频数表? 求组距 确定各组段的两个端点 归组计数 频数分布表与分布图作用 1.揭示变量分布形态 2.揭示变量分布趋势 3.便于发现特大的或特小的极端值 4.便于进一步计算统计指标和分析 5.作为一种数据陈述的形式 算数应用条件: 对称分布,尤其正态分布 几何应用条件: 1.对数对称分布、等比资料 2.变量值中不能有0;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出结果后再加上负号。 中位数条件: 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 极差应用条件:所有分布、尤其偏态分布 不足: 不能全面的反映所有值的偏离程度 不稳定、小样本小于大样本、样本小于总体 四分位数间距应用条件 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 方差应用条件: 对称分布,尤其正态分布 变异系数应用 1.量纲不一致

散点图作用 观察两组数据的总体趋势和明显偏离趋势的观察点 判断两组数据的关联形式、方向和密切程度 相关分类 线性相关 秩相关 分类变量相关 线性相关意义 r>0表示正相关,r=1表示完全正相关;r<0表示负相关,r=-1表示完全负相关。 |r|→0表示相关性越弱,|r|→1表示相关性越强。 r=0表示没有线性相关,不代表没有相关。 如何判断线性相关 画散点图 计算线性相关系数 假设检验 如何进行秩相关 编秩次 计算秩相关系数 假设检验 回归分析:利用样本信息,找到变量间数量依存关系。 线性回归分析:利用样本信息,找到变量间线性数量依存关系。 决定系数:反映回归贡献的相对程度,即Y的变异被X解释的比例。 如何进行分类变量的相关分析 交叉表的制作,计算各种概率 计算列联系数 假设检验 相关分析的条件 线性相关系数:二元正态分布的定量变量 秩相关系数:非二元正态分布的定量变量、有序分类变量 列联系数:无序分类变量 轶闻数据:由坊间流传或各种媒体报道的一些个案数据,由于其特殊性往往给公众留下突出和深刻的印象。 特点:缺乏代表性,常诱导人们进行简单的推论,得到一些具有倾向性的结论。 可得数据:为了某些特定目的已收集或积累的数据。如:各类监测数据、统计年鉴等。

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

卫生统计学考试试题及答案

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

10级-卫生统计学-整理资料

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本 均数?x 、样本率ρ等。 ⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变 量;变量值的集合成为资料。

⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料;②等级资料 第二章调查研究设计 ★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数 字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一 顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若 干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 ⑷整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组 成,随机抽取一部分群,调查抽中群的全部次级观察单位。 第三章实验设计 ★1、实验设计的特点(注意与调查研究的特点的区别):

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

. A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学重点笔记之令狐文艳创作

医师资格考试蓝宝书-预防医学 令狐文艳 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。

二、变量的分类 变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越 小,观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学试题

卫生统计学习题 定量资料的统计描述 1. 1985年某省农村30例6-7岁正常男童胸围(cm)测量结果如下:51.654. 154.056.9 57.755. 558.355. 453.857. 751.353. 857.354. 852.155. 354.854.7 53.457. 153.155. 951.454. 656.161. 859.356. 859.853.9 (1)试编制以上数据的频数表,绘制直方图,概括其分布特征。(2)用合适的统计量描述其集中趋势和离散趋势。 (3)对样本进行正态性检验

第三章定性资料的统计描述 1.某地通过卫生服务的基线调查得到如下资料,试作如下分析:(1)计算全人口的性别比; (2)计算育龄妇女(15~49岁)占总人口的百分比; (3)计算总负担系数; (4)计算老年人口系数 某地人口构成情况 年龄组(岁)男(%)女(%)年龄组(岁)男(%)女(%)0~ 4.24.045~ 2.42.7 5~ 3.23.150~ 2.12.4 10~ 4.44.255~ 1.2 2.2 15~ 5.55.360~ 1.3 2.4 20~

5.15.265~ 1.11.4 25~ 6.06.170~ 0.81.2 30~ 4.34.575~ 0.50.9 35~ 3.23.380~ 0.20.5 40~ 2.32.585~ 0.10.2 第四章常用概率分布 1.假定虚症患者中,气虚型占30%。现随机抽查30名虚症患者,求其中没有1名气虚型的概率、有4名气虚型的概率。 2.某溶液平均1毫升中含有大肠杆菌3个。摇均后,随机抽取1毫升该溶液,内含大肠杆菌2个和低于2个的概率各是多少? 3.某人群中12岁男童身高的分布近似正态分布,均数为 144.00cm,标准差为 5.77cm,试估计

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

卫生统计学知识点(笔记)

第一章绪论 1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研究总体所下的结论未必适用于目标总体。 3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样(sampling)。抽样研究的目的是用样本数据推断总体的特征。需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。 5.▲变异(variation)是指同质的个体之间存在的差异。 6.▲变量的类型 二分类变量 分类变量或名义变量 定性变量多分类变量 变量有序变量或等级变量 定量变量离散型变量 连续型变量 变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值 7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总

体均数μ,总体标准差σ。 8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。 统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。 10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。 11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

电大实用卫生统计学期末复习材料

《实用卫生统计学》期末复习题一 《实用卫生统计学》期末复习题一 一、名词解释 1、卫生统计学: 2、随机抽样: 3、构成比: 4、频率: 5、非参数检验: 6、概率 7、变异系数 名词解释答案 1. 卫生统计学:是运用数理统计的基本原理和方法,通过数据的收集,整理和分析,研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。 2. 随机抽样:就是按照随机的原则获得样本,保证总体中每个个体都有同等机会被抽取,使样本对总体有较好的代表性。 3. 构成比:又称构成指标,它表示事物内部各组成部分所占比重或分布。常用百分数表示。 4. 频率:若随机事件在n次重复中出现m次,则n/m比值成为随机事件出现的频率。 5.非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。 6.概率是描述随机事件发生的可能性的大小的数值,常用P表示。7.变异系数常记为CV,它被定义为标准差与算术均数之比。 《实用卫生统计学》期末复习题二 单选题 1.对某样品进行测量时,由于测量仪器事先未校正,造成测量结果普遍偏高,这种错误属于()。 A. 系统误差 B. 随机测量误差 C. 抽样误差 D. 随机误差 2.医学人口统计应属于卫生统计学中的哪部分内容( )。 A. 卫生统计学基本原理 B. 卫生统计学基本方法 C. 健康统计 D.卫生服务统计 3. 原始数据分布不明时,表示其集中趋势易采用 ( ) 。 A. 算数均数 B. 几何均数 C. 中位数 D. 标准差 4.描述一组偏态分布资料的变异度时,最适宜选择的指标是( ) 。  A.极差 B.标准差 C.四分位数间距 D.变异系数

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

卫生统计学考试题及答案要点

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 P的含义假设检验中21. 型错误II I型和22. 检验效能23. 24.检验水准方差分析25. 26.随机区组设计27.相对数- 1 - 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 二、单项选择题

1.观察单位为研究中的( D )。 A.样本B.全部对象 C.影响因素D.个体 2.总体是由(C )。 A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是(B )。 A.研究样本统计量B.由样本统计量推断总体参数 C.研究典型案例研究误差D.研究总体统计量 4.参数是指( B )。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的(A )。 - 2 - .抽样时应使得总体中的每一个个体都有同等的机会被抽取A .研究者在抽样时应精心挑选个体,以使样本更能代表总体B .随机抽样即随意抽取个体C .为确保样本具有更好的代表性,样本量应越大越好D B )。6.各观察值均加(或减)同一数后( .均数改变,标准差不变BA.均数不变,标准差改变 .两者均改变 D .两者均不变C )。7.比较身高和体重两组数据变异度大小宜采用(A B.方差.变异系数 A D.标准差C.极差 D )可用来描述计量资料的离散程度。8.以下指标中( .几何均数 B A.算术均数 D.标准差C.中位数 )。9.血清学滴度资料最常用来表示其平均水平的指标是(C B.中位数A.算术平均数 D.平均数C.几何均数 。)10.两样本均数的比较,可用(C 检验B.t A.方差分析 .方差齐性检验 D C.两者均可 ?。D 11.配伍组设计的方差分析中,)等于(配伍???? A.--B.总误差总处理?????? D.---C.+处理总误差总处理误差??|X??|?,的正态总体中随机抽样,)的概率为5% 。12.在均数为标准差为( B tSst?1.96 C.D. A. B.?1.96??,,X20.0520.05X13.完全随机设计方差分析的检验假设是(D )。 A.各处理组样本均数相等B.各处理组总体均数相等 C.各处理组样本均数不相等D.各处理组总体均数不全相等 14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( D )。 2检验χB A.分别进行比较.两个率比较的 - 3 -

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总由于山东大学部分专业课官方没有公布参考书目由此给很多考生带来了很大的不便,对此精都考研网整理了山东大学本专业研究生初试用书及配套资料供大家参考 一、353卫生综合参考书目: ①《环境卫生学》 ②《流行病学》 ③《卫生统计学》 ④《营养与食品卫生学》 ⑤《职业卫生与职业医学》 二、配套精编复习资料 山东大学353卫生综合《复习全程通》精都考研组编 三、复习全程通内容简介 《复习全程通》由精都考研工作室依托多年为各大机构编写考研专业课资料以及学员辅导的经验,由本团队组织目标院校本专业的高分研究生共同合作编写而成,全书考点知识面覆盖全面,权威细致,编排结构科学合理,是专门为本届考研的考生量身定制的必备专业课资料。 通过本精编资料四大模块内容,结合考生每个阶段的复习,有助于考生深入了解目标院校以及专业考点重点,提高复习效率,拓展解题思路。 NO.1历年真题汇编 通过目标院校原版真题,了解命题老师的出题思路,且分析考点重点,快速了解目标院校出题风格及命题思路,提高复习效率,拓展解题思路 NO.2教辅一本通 本部分内容主要是由目标院校本专业研究生对应其初试参考书目整理汇编章节重点考点以及对应章节历年典型考题及答案解析,通过本书的配套复习,分析专业考点侧重,通过大量典型考题让充分掌握本门科目重点,确保考场应对自如。 NO.3冲刺模拟套卷 书在遵循专业课最新参考书目,结合历年考研真题规律,制定的模拟卷,并有详细的配套答案讲解,适用于考生在冲刺模拟阶段的专业课复习。 NO.4电子版赠送内容 本部分内容为购买全套资料的同学附赠的内容,主要是初试参考书目主编老师的教学讲义以及相关的扩充习题,此部分内容对于跨考的考生相对比较重要,通过讲义了解专业课基础复习侧重,达到专业知识点不缺不漏。 四、解析备考辅导班: 专业课一对一无忧全程班 专业课一对一标准全程班 山东大学在读研究生授课 以上内容是【精都考研网】整理发布,每天及时发布最新考研资讯、考研经验、考研真题。目前很多同学已加入2019山东大学考研总群640030269,抓紧时间加入了解你所不知道的考研信息。

卫生统计学试题(含答案)

医学统计方法选择题一 医学统计方法概述 l .统计中所说的总体是指: A A 根据研究目的确定的同质的研究对象的全体 B 随意想象的研究对象的全体 C 根据地区划分的研究对象的全体 D 根据时间划分的研究对象的全体 E 根据人群划分的研究对象的全体 2. 概率P=0,则表示B A 某事件必然发生 B 某事件必然不发生 D 某事件发生的可能性很大 E 以上均不对 7. 将计量资料制作成频数表的过程,属于 A 统计设计 B 收集资料 C 整理资料 8. 统计工作的步骤正确的是 C A 收集资料、设计、整理资料、分析资料 C 设计、收集资料、整理资料、分析资料 E 搜集资料、整理资料、分析资料、进行推断 ¬¬ 统计工作哪个基本步骤: C D 分析资料 E 以上均不对 B 收集资料、整理资料、设计、统计推断 D 收集资料、整理资料、核对、分析资料 B 10. 以下何者不是实验设计应遵循的原则 D A 对照的原则 B 随机原则 C 重复原则 D 交叉的原则 E 以上都不对 第八章 数值变量资料的统计描述 11. 表示血清学滴度资料平均水平最常计算 B A 算术均数 B 几何均数 C 中位数 D 全距 E 率 12. 某计量资料的分布性质未 明,要计算集中趋势指标,宜选择 C A X B G C M D S E CV 13. 各观察值均加(或减)同一数后: B A 均数不变,标准差改变 B 均数改变,标准差不变 C 两者均不变 D 两者均改变 E 以上均不对 14. 某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时), 问 3.抽签的方法属于 D A 分层抽样 B 系统抽样 C 整群抽样 4.测量身高、体重等指标的原始资料叫: A 计数资料 B 计量资料 某种新疗法治疗某病患者 治愈 8 D 单纯随机抽样 E 二级抽样 5. 治疗结果 治疗人数 该资料的类型是: A 计数资料 6.样本是总体的 A 有价值的部分 D 任意一部分 显效 23 B C 等级资料 41 人, 好转 6 D 分类资料 治疗结果如下: 恶化 3 E 有序分类资料 计量资料 C B 有意义的部分 C 有代表性的部分 E 典型部分 C 无序分类资料 死亡 1 D 有序分类资料 E 数值变量资料 A 抽样误差 B 系统误差 C 随机误差 D 责任事故 E 以上都不对 C 某事件发生的可能性很小 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:

卫生统计学复习笔记

卫生统计学复习笔记 一、概述 1、卫生统计学的概念(熟练掌握) 统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。 卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。 由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。 卫生统计学的内容(了解): 1)健康统计:医学人口统计、疾病统计和生长发育统计等; 2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。 2、卫生统计学的工作步骤(熟练掌握) 统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤: 1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环,也是指导以后工作的依据 2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表,职业病报表,医院工作报表等。②经常性工作记录:如卫生监测记录、健康检查记录等。③专题调查或实验。 3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。其过程是:首先对原始资料进行准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。 4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行

卫生统计学重点整理-预防医学

1.卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生 服务领域中数据的收集、整理和分析的一门科学。 2.同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。 否则称为异质(heterogeneity)的或者间杂的。 3.变异(variation):同质事物之间的差别称为变异。[没有个体变异,就没有统计学!] 4.总体(population):根据研究目的所确定的同质观察单位的全体。 5.样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。 6.样本含量(sample size):样本中包含的观察单位个数。 7.参数(parameter):反映总体特征的指标。特点:未知、唯一,希腊字母表示,如总体均 数、总体率等。 8.统计量(statistic):根据样本观察值计算出来的指标。特点:已知、不唯一,拉丁字母 表示,如样本均数、样本率等。 9.变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特 征或属性称为变量。 10.变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observed value)。 11.资料(data):变量值的集合称之为资料。 12.定量资料(quantitative data):变量值是定量的,表现为数值大小。特点:一般有度、 量、衡单位,一般属连续性资料。 13.定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。特点: 一般无度、量、衡单位,一般属于离散型资料。可进一步分为计数资料和等级资料。 14.计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所 得的资料。可进一步分为二项分类资料和无序多项分类资料。 15.等级资料(ordinal data):将观察单位按照某种特质或属性的程度或等级顺序分组,清点 各组观察单位所得的资料。各属性之间互不相容且有程度的差别。 16.抽样研究(sampling research):从总体中随机抽取样本,通过样本信息推断总体特征的 研究方法。 17.抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量 之间的差异。 18.概率(probability):概率是随机事件发生可能性大小的数值度量。通常用P表示。大小 介于0与1之间,即0≤P ≤1。 19.小概率事件:医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。 20.小概率原理:并不表示不可能发生,但在某一次试验中,是不会发生的。

相关主题
文本预览
相关文档 最新文档