当前位置：文档之家› 卫生统计学复习笔记

卫生统计学复习笔记

一、概述

1、卫生统计学的概念（熟练掌握）

统计学是研究数据的收集、整理和分析的一门科学，帮助人们分析所占有的信息，达到去伪存真、去粗取精、正确认识世界的一种重要手段。

卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。

由此看出：统计学是处理资料中变异性的科学和艺术，是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”，但在实际工作中，许多人往往是忽略了设计、收集和归类（整理），到了分析数据时才想到统计学，此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。

卫生统计学的内容（了解）：

1）健康统计：医学人口统计、疾病统计和生长发育统计等；

2）卫生服务统计：包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。

2、卫生统计学的工作步骤（熟练掌握）

统计学对统计工作的全过程起指导作用，任何统计工作和统计研究的全过程都可分为以下四个步骤：

1)、设计：在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上，对将要进行的研究工作所做的全面设想。其内容包括：明确研究目的和研究假说，确定观察对象、观察单位、样本含量和抽样方法，拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环，也是指导以后工作的依据

2)、收集资料：遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面：①统计报表：是由国家统一设计，有关医疗卫生机构定期逐级上报，提供居民健康状况和医疗卫生机构工作的主要数据，是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表，职业病报表，医院工作报表等。②经常性工作记录：如卫生监测记录、健康检查记录等。③专题调查或实验。

3）、整理资料：收集来的资料在整理之前称为原始资料，原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳，使原始资料系统化、条理化，便于进一步计算统计指标和分析。其过程是：首先对原始资料进行准确性审查（逻辑审查与技术审查）和完整性审查；再拟定整理表，按照“同质者合并，非同质者分开”的原则对资料进行质量分组，并在同质基础上根据数值大小进行数量分组；最后汇总归纳。

4）、分析资料：其目的是计算有关指标，反映数据的综合特征，阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图（表）等方法对样本资料的数量特征及其分布规律进行

描述；后者是指如何抽样，以及如何用样本信息推断总体特征。进行资料分析时，需根据研究目的、设计类型和资料类型选择恰当的描述性指标和统计推断方法。

统计工作的四个步骤紧密相连、不可分割，任何一步的缺陷，都将影响整个研究结果。

3、基本概念：

1）、同质与变异。严格地讲，同质是指被研究指标的影响因素完全相同。但在医学研究中，有些影响因素往往是难以控制的（如遗传、营养等），甚至是未知的。所以，在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。例如研究儿童的身高时，要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同，而不易控制的遗传、营养等影响因素可以忽略。

同质基础上的个体差异称为变异。如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。事实上，客观世界充满了变异，生物医学领域更是如此。哪里有变异，哪里就需要统计学。若所研究的同质群体中所有个体一模一样，只需观察任一个体即可，无须进行统计研究。

2）、总体与样本

任何统计研究都必须首先确定观察单位，亦称个体。观察单位是统计研究中最基本的单位，可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。

总体是根据研究目的确定的同质观察单位的全体，或者说，是同质的所有观察单位某种观察值（变量值）的集合。例如欲研究山东省2002年7岁健康男孩的身高，那么，观察对象是山东省2002年的7岁健康男孩，观察单位是每个7岁健康男孩，变量是身高，变量值（观察值）是身高测量值，则山东省2002年全体7岁健康男孩的身高值构成一个总体。它的同质基础是同地区、同年份、同性别、同为健康儿童。总体又分为有限总体和无限总体。有限总体是指在某特定的时间与空间范围内，同质研究对象的所有观察单位的某变量值的个数为有限个，如上例；无限总体是抽象的，无时间和空间的限制，观察单位数是无限的，如研究碘盐对缺碘性甲状腺病的防治效果，该总体的同质基础是缺碘性甲状腺病患者，同用碘盐防治；该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果，没有时间和空间范围的限制，因而观察单位数无限，该总体为无限总体。

在实际工作中，所要研究的总体无论是有限的还是无限的，通常都是采用抽样研究。样本是按照随机化原则，从总体中抽取的有代表性的部分观察单位的变量值的集合。如从上例的有限总体（山东省2002年7岁健康男孩）中，按照随机化原则抽取100名7岁健康男孩，他们的身高值即为样本。从总体中抽取样本的过程为抽样，抽样方法有多种。抽样研究的目的是用样本信息推断总体特征。

统计学好比是总体与样本间的桥梁，能帮助人们设计与实施如何从总体中科学地抽取样本，使样本中的观察单位数（亦称样本含量）恰当，信息丰富，代表性好；能帮助人们挖掘样本中的信息，推断总体的规律性。

3）、资料与变量及其分类

总体确定之后，研究者应对每个观察单位的某项特征进行测量或观察，特征称为变量。如“身高”、“体重”、“性别”、“血型”、“疗效”等。变量的测定值或观察值称为变量值或观察值，亦称为资料。

按变量的值是定量的还是定性的，可将变量分为以下类型，变量的类型不同，其分布规律亦不同，对它们采用的统计分析方法也不同。在处理资料之前，首先要分清变量类型。

1）数值变量：其变量值是定量的，表现为数值大小，可经测量取得数值，多有度量衡单位。如身高（cm）、体重（kg）、血压（mmHg kPa）、脉搏（次/min）和白细胞计数（×10 9 /L）等。这种由数值变量的测量值构成的资料称为数值变量资料，亦称为定量资料。大多数的数值变量为连续型变量，如身高、体重、血压等；而有的数值变量的测定值只能是正整数，如脉搏、白细胞计数等，在医学统计学中把它们也视为连续型变量。

2）分类变量：其变量值是定性的，表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类：

（1）无序分类变量是指所分类别或属性之间无程度和顺序的差别。它又可分为①二项分类，如性别（男、女），药物反应（阴性和阳性）等；②多项分类，如血型（O、A、B、AB），职业（工、农、商、学、兵）等。对于无序分类变量的分析，应先按类别分组，清点各组的观察单位数，编制分类变量的频数表，所得资料为无序分类资料，亦称计数资料。

（2）有序分类变量各类别之间有程度的差别。如尿糖化验结果按－、±、＋、＋＋、＋＋＋分类；疗效按治愈、显效、好转、无效分类。对于有序分类变量，应先按等级顺序分组，清点各组的观察单位个数，编制有序变量（各等级）的频数表，所得资料称为等级资料。

变量类型不是一成不变的，根据研究目的的需要，各类变量之间可以进行转化。例如血红蛋白量（g/L）原属数值变量，若按血红蛋白正常与偏低分为两类时，可按二项分类资料分析；若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时，可按等级资料分析。有时亦可将分类资料数量化，如可将病人的恶心反应以0、1、2、3表示，则可按数值变量资料（定量资料）分析。

4、随机事件与概率

医学研究的现象，大多数是随机现象，对随机现象进行实验或观察称为随机试验。随机试验的各种可能结果的集合称为随机事件，亦称偶然事件，简称事件。例如用相同治疗方案治疗一批某病的患者，治疗转归可能为治愈、好转、无效、死亡四种结果，对于一个刚入院的患者，治疗后究竟发生哪一种结果是不确定的，可能发生的每一种结果都是一个随机事件。

对于随机事件来说，在一次随机试验中，某个随机事件可能发生也可能不发生，但在一定数量的重复试验后，该随机事件的发生情况是有规律可循的。概率是描述随机事件发生的可能性大小的数值，常用P表示。例如，投掷一枚均匀的硬币，随机事件A表示“正面向上”，用 n表示投掷次数；m表示随机事件A发生的次数；

f表示随机事件A发生的频率（f=m/n），0≤m≤n, 0≤f≤1。

用不同的投掷次数n作随机试验，结果如下：m/n=8/10=0.8, 7/20=0.35,…… , 249/500=0.498,

501/1000=0.501, 10001/2000=0.5000，由此看出当投掷次数n足够大时,f=m/n→0.5，称P(A)=0.5，或简写为：P=0.5。当n足够大时，可以用f估计P。

随机事件概率的大小在0与1之间，即0

能性越大；P越接近0，表示某事件发生的可能性越小。P＝1表示事件必然发生，P＝0表示事件不可能发生，它们是确定性的，不是随机事件，但可以把它们看成随机事件的特例。

若随机事件A的概率P(A)≤a，习惯上，当a=0.05时，就称A为小概率事件。其统计学意义是小概率事件在一次随机试验中不可能发生。例如，某都市大街上疾驶的汽车撞伤行人的事件的发生概率为1/万，但大街上仍有行人，这是因为“被撞”事件是小概率事件，所以行人认为自己上街这“一次试验”中不会发生“被撞”事件。“小概率”的标准a是人为规定的，对于可能引起严重后果的事件，如术中大出血等，可规定a=0.01，甚至更小。

误差是指测定结果与真实结果之间的差值。对任何一个物理量进行的测量都不可能得出一个绝对准确的数值，即用测量技术所能达到的最完善的方法，测出的数值也和真实值存在差异，这种测量值和真实值的差异称为误差。

误差的分类

误差分为绝对误差和相对误差。也可以根据误差的来源分为系统误差（又称偏性）和随机误差（又称机会误差）。

1、绝对误差是测量值对真值偏离的绝对大小，因此它的单位与测量值的单位相同。

2、相对误差则是绝对误差与真值的比值，因此它是一个百分数。一般来说，相对误差更能反映测量的可信程度。相对误差等于测量值减去真值的差的绝对值除以真值，再乘以百分之一百。

3、系统误差是由一些固有的因素（如测量方法的缺陷）产生的，理论上总是可以通过一定的手段来消除。如天平的两臂应是等长的，可实际上是不可能完全相等的；天平配置的相同质量的砝码应是一样的，可实际上它们不可能达到一样。

4、随机误差是由于在测定过程中一系列有关因素微小的随机波动而形成的具有相互抵偿性的误差（也称为偶然误差和不定误差）。

第二节疾病统计常用指标

一、疾病统计的意义

疾病统计（morbidity statistics）从数量方面研究疾病在人群中的发生、发展和流行分布的特点与规律，为病因学研究，为防治疾病和评价防治工作效果提供科学依据。

二、疾病统计资料的来源

包括以下三个方面：

1.疾病报告和报表资料

2.医疗卫生工作记录

3.疾病调查资料

三、疾病和死因分类

疾病和死因的分类是按国际疾病和死因分类（international classification of diseases,简称ICD）, 目前正在使用的版本是ICD－10。见有关书籍。

四、常用疾病统计指标

1.反映疾病发生水平的指标

(1)发病率(incidence rate)

(2)患病率（prevalence rate）

2.反映疾病构成情况的指标

3.反映疾病危害程度和防治效果的指标

（1）某病死亡率：见死因别死亡率。

（2）某病病死率（case fatality）

（3）治愈率(cure rate)

（4）有效率

（5）生存率（survival rate）：指病人能活到某一时点的概率。常用于对慢性病的治疗效果或预后估计。（五）、残疾统计

1.残疾的定义及分级

残疾是指在心理、生理、人体结构上，某种组织、功能丧失或者不正常，全部或者部分丧失以正常方式从事某种活动能力的人。分为功能、形态残疾（impairment）、丧失功能残疾（ disability）和社会功能残疾（handicap）三个此次。

2.残疾的常用统计指标

（1）残疾患病率

（2）残疾构成

第一节医学人口统计常用指标

一、医学人口统计资料的来源

1.来源于人口普查资料

2.来源于人口抽样调查资料

3.来源于人口抽样资料，包括生命时间登记、人口迁移变动登记、户口登记等途径。

二、人口数与人口构成

（一）人口总数

人口总数（Population）一般指一个国家或某一特定时间的人口数，一般采用一年的中点，即7月1日零时为标准时刻统计。

（二）人口构成及其分析

1、基本人口学特征包括年龄、性别、文化、职业等，其中最常用的是性别和年龄，用以描述人口构成情况。

2、人口年龄构成指各年龄组人口在总人口中所占的比例。在人口年龄构成的基础上，可以导出许多有用的描述人口状况的指标，比如：

（1）人口系数

1）老年（人口）系数：

老年人口系数越大，表明人口中老年人口所占比重越大；在一定程度上反映人群的健康水平。

2）少年儿童（人口）系数

少年儿童人口系数越大，表明人口中少年人口所占比重越大，人口越年轻。该指标主要受生育水平的影响。（2）负担系数又称抚养比或抚养系数，是指人口中非劳动年龄人数与劳动年龄人数之比。负担系数包括三个指标：

总负担系数=

少年儿童负担系数=

老年负担系数=

（3）老少比：是划分人口类型的标准之一。

老少比=

3、性别比指男性人口与女性人口的比值，即

性别比=

4、人口金字塔是将人口的性别、年龄分组数据，以年龄（或出生年份）为纵轴，以人口数或年龄构成比为

横轴，按左侧为男、右侧为女绘制的直方图，其形如金字塔，故称为人口金字塔。

人口金字塔更形象直观地反映了人口的年龄构成，便于说明和分析人口现状、类型及发展趋势。

三、生育与计划生育统计

（一）、生育与计划生育统计资料的来源

有关原始资料包括人口、出生、死亡、结婚登记、育龄妇女资料等，可向有关部门索取，也可根据需要自行调查取得。

（二）生育与计划生育统计指标

1.反映生育水平的指标

（1）粗出生率（crude birth rate，简记为CBR）：

粗出生率=

上式中平均人口数的取值，若在人口普查年，可用普查所得的该地该年7月1 日零时的人口总数；在非人口普查年，则用上年末及本年末两个人口数的平均值。粗出生率的优点在于资料易获得，计算简单，但它的主要缺点是受人口的年龄、性别构成和婚姻状况的影响。粗出生率只能粗略地反映生育水平。

总生育率（general fertility rate,简记为GFR）：指某地某年平均每千名妇女的活产数。

总生育率=

总生育率消除了总人口中年龄性别构成不同对生育水平的影响，较粗出生率能更确切地反映生育水平。但受育龄妇女内部年龄构成的影响。

（3）年龄别生育率（age-specific fertility rate,简记为ASFR）：又称年龄组生育率，其算式为：

某年龄组生育率=

年龄别生育率消除了育龄妇女内部年龄构成不同对生育水平的影响。

（4）终生生育率（life-time fertility rate,简记为LTFR）与总和生育率（total fertility rate,简记为TFR）

终生生育率说明一批经历过整个生育期的同龄妇女一生的生育水平，其算式为：

终生生育率=

总和生育率的算式为：总和生育率=n

2.测量人口再生育的

统计指标

（1）自然增长率（natural increase rate,简记为NIR）：是粗出生率（CBR）与粗死亡率（CDR）之差，即NIR=CBR-CDR（15.13）

自然增长率容易理解，计算简单，但它受人口的性别、年龄构成不同的影响，只能粗略地估计人口的一般增长趋势，不能用来预测未来人口的发展速度。

（2）粗再生育率（gross reproduction rate,简记为GRR）

粗再生育率是只计算女婴的总和生育率。

（3）净再生育率（net reproduction rate,简记为NRR）

NRR=（15.14）

式中ASFR为只记女婴的年龄别生育率。

（4）平均世代年数（mean length of generation,简记为LG）

LG=

上式中NRR的计算前已述及；分子育龄妇女总人年数的计算见课本表15.1第（6）栏。

3.反映计划生育工作情况的统计指标

(1)避孕现用率

(2)Pearl怀孕率（Pearl pregnancy rate）：是评价避孕效果的指标。

（3）累计失败率（cummulative failure rate）：是在给定时间内，妇女用某一措施后意外怀孕的人数。能较准确地反映避孕效果。

（4）人工流产率（induce abortion rate）：反映育龄妇女中人工流产的强度。

（5）人流活产比（ratio of induced abortion and live birth）：用于间接地反映计划外怀孕情况。

（6）计划生育率：用于综合说明计划生育的质量。

（7）节育率：反映计划生育工作质量。

4．与出生有关的其他常用指标

（1）低出生体重百分比（proportion of low birth weight）：反映居民健康水平及孕期保健的情况。

（2）儿童妇女比(child-women ratio)：是一个间接反映生育水平的指标，其优点在于不需要活产数，在没有生命事件登记的地区常用它间接测量生育水平。

四、人口死亡统计

（一）、人口死亡资料的来源

我国人口死亡资料主要由公安部门负责收集，并按ICD-10中的死因分类填写。

（二）、常用人口死亡统计指标

1．测量死亡水平的指标

（1）粗死亡率（crude death rate, CDR）：具有资料易获得，计算简单的优点，但受人口的年龄、性别构成情况的影响。

K为比例系数，常用/千，/万，或/10万。

（2）年龄别死亡率(age-specific death rate, ASDR)：年龄别死亡率消除了人口的年龄构成不同对死亡水平的影响，不同地区同一年龄组的死亡率可以直接进行比较。

（3）婴儿死亡率(infant mortality rate, IMR)：是反映社会卫生状况和婴儿保健工作的重要的指标，不受年龄的影响，可直接比较。

（4）新生儿死亡率(neonatal mortality rate, NMR)：是反映妇幼卫生工作质量的重要指标。

（5）围生儿死亡率(perinatal mortality)：是衡量孕前、孕期、产期、产后保健工作质量的敏感指标之一。

（6）5岁以下儿童死亡率(child mortality under age 5)：是综合反映儿童健康水平和变化的主要指标。

‰

(7)孕产妇死亡率(maternal mortality rate)：这一指标不仅可以评价妇女保健工作，而且间接反映一个国家的卫生文化水平。

（8）死因别死亡率(cause-specific death rate)：是死因分析的重要指标，反映各类病伤死亡对居民生命的危害程度。

2.反映死因构成及死因顺位的指标

（1）死因构成或相对死亡率(proportion of dying of a specific cause)：反映各种死因的相对重要性。

（2）死因顺位：是指按各类死因构成比的大小由高到低排列的位次，说明各类死因的相对重要性。

第十二章统计表和统计图

1．掌握统计表的编制基本原则

2．掌握统计表的编制基本要求

要求

统计表和统计图是统计描述的重要方法。医学科学研究资料经过整理和计算各种统计指标后，所得结果除了用适当的文字说明外，常将统计资料及其指标以表格列出（称为统计表，statistical tables），或将统计资料形象化，利用点的位置、线断的升降、直条的长短或面积的大小等形式直观表示事物间的数量关系（称为统计图，statistical graph）。统计表与统计图可以代替冗长的文字叙述，表达清楚，对比鲜明。

一、常用统计表

（一）统计表的结构与编制

1．统计表的结构统计表由标题、标目、线条和数字构成。如下表所示：

表号标题

横标目名称纵标目合计

横标目数字

合计

2．列表的原则重点突出，简单明了，即一张表一般表达一个中心内容，便于分析比较；主谓分明，层次清楚，符合逻辑，明确被说明部分（主语）与说明部分（谓语）。

3．编制要求

（1）标题要能概括表的内容，写于表的上端中央，一般应注明时间与地点。

（2）标目标目是表格内的项目。以横、纵向标目分别说明主语与谓语，文字简明，层次清楚。横标目列在表的左侧，一般用来表示表中被研究事物的主要标志；纵标目列在表的上端，一般用来说明横标目的各个统计指标的内容。

标目内容一般应按顺序从小到大排列，小的放在上面，不同时期的资料可按年份、月份先后排列，有助于说明其规律性。

（3）线条线条不易过多，常用3条线表示,谓之“三线图”。表的上下两条边线可以用较粗的横线，一般省去表内的线条，但合计可用横线隔开。表的左右两侧的边线可省去，表的左上角一般不用对角线。

（4）数字以阿拉伯数字表示。表内的数字必须正确，小数的位数应一致并对齐，暂缺与无数字分别以“…”、“-”表示，为“0”者记作“0”，不应有空项。为方便核实与分析，表一般应有合计。

（5）说明一般不列入表内。必要说明者可标“※”号，于表下加以说明。

（二）统计表的种类

通常按分组标志多少分为简单表与组合表。

?简单表（simple table）由一组横标目和一组纵标目组成，如表2-10。

表2-10 2001年某省不同地区的卫生系统反应性评分比较

地区调查人数评分均值

省会城市333 703.63

一般城市152 507.15

县及乡村971 679.06

合计1456 666.73

?复合表（combinative table）是由2组及以上的横标目和纵标目相结合起来或1组横标目和2组及以上纵标目结合起来以表达他们之间关系的统计表，如表2-11。

表2-11 2001年某省不同地区、性别的卫生系统反应性评分比较

地区

男女

调查人数评分均值调查人数评分均值

省会城市217 706.60 116 698.07

一般城市100 517.15 52 487.92

县及乡村371 669.88 600 684.74

合计688 659.26 768 673.43

二、常用统计图

医学领域中常用的统计图有条图、百分条图、圆图、线图、半对数图、直方图、散点图、箱式图与统计地图等。

?绘制统计图的基本要求

o根据资料的性质和分析目的决定适当的图形。

o标题应说明资料的内容、时间和地点，一般位于图的下方。

o图的纵、横轴应注明标目及对应单位，尺度应等距或具有规律性，一般自左而右、自上而下、由小到大。

o为使图形美观并便于比较，统计图的长宽比例一般为7：5，有时为了说明问题也可加以变动。

o比较、说明不同事物时，可用不同颜色或线条表示，并常附图例说明，但不宜过多。

常用统计图的适用条件与绘制

1．条图（bar graph）条图用等宽长条的高度表示按性质分类资料各类别的数值大小，用于表示他们之间的对比关系，一般有单式（图2-3）与复式（图2-4）之分.

制图要求：

（1）一般以横轴为基线，表示各个类别；纵轴表示其数值大小。

（2）纵轴尺度必须从0开始，中间不宜折断。在同一图内尺度单位代表同一数量时，必须相等。

（3）各直条宽度应相等，各直条之间的间隙也应相等，其宽度与直条的宽度相等或为直条宽度的1/2。

（4）直条的排列通常由高到底，以便比较。

（5）复式条图绘制方法同上，所不同的是复式条图以组为单位，1组包括2个以上直条，直条所表示的类别应用图例说明，同一组的直条间不留空隙。

图2-3 2001年某省不同地区的卫生系统反应性评分比较

图2-4 2001年某省不同地区、性别的卫生系统反应性评分比较

2．圆图（pie graph）圆形图适用于百分构成比资料，表示事物各组成部分所占的比重或构成。以圆形的总面积代表100%，把面积按比例分成若干部分，以角度大小来表示各部分所占的比重（图2-5）。

图2-5 2001年某医科大学公共卫生学院专业技术人员构成

制图要求：

（1）先绘制以大小适当的圆形。由于圆心角为360度，因此每1%相当于3.6度的圆周角，将各部分百分比分别乘以3.6度即为各构成部分应占的圆周角度数。

（2）圆形图上各部分自圆的12点开始由大到小按顺时针方向依次绘制，其他置最

?简单表（simple table）由一组横标目和一组纵标目组成，如表2-10。

表2-10 2001年某省不同地区的卫生系统反应性评分比较

地区调查人数评分均值

省会城市333 703.63

一般城市152 507.15

县及乡村971 679.06

合计1456 666.73

?复合表（combinative table）是由2组及以上的横标目和纵标目相结合起来或1组横标目和2组及以上纵标目结合起来以表达他们之间关系的统计表，如表2-11。

表2-11 2001年某省不同地区、性别的卫生系统反应性评分比较

地区

男女

调查人数评分均值调查人数评分均值

省会城市217 706.60 116 698.07 一般城市100 517.15 52 487.92 县及乡村371 669.88 600 684.74 合计688 659.26 768 673.43

二、常用统计图

医学领域中常用的统计图有条图、百分条图、圆图、线图、半对数图、直方图、散点图、箱式图与统计地图等。

?绘制统计图的基本要求

o根据资料的性质和分析目的决定适当的图形。

o标题应说明资料的内容、时间和地点，一般位于图的下方。

o图的纵、横轴应注明标目及对应单位，尺度应等距或具有规律性，一般自左而右、自上而下、由小到大。

o为使图形美观并便于比较，统计图的长宽比例一般为7：5，有时为了说明问题也可加以变动。

o比较、说明不同事物时，可用不同颜色或线条表示，并常附图例说明，但不宜过多。

?常用统计图的适用条件与绘制

制图要求：

（1）一般以横轴为基线，表示各个类别；纵轴表示其数值大小。

（2）纵轴尺度必须从0开始，中间不宜折断。在同一图内尺度单位代表同一数量时，必须相等。

（3）各直条宽度应相等，各直条之间的间隙也应相等，其宽度与直条的宽度相等或为直条宽度的1/2。

（4）直条的排列通常由高到底，以便比较。

（5）复式条图绘制方法同上，所不同的是复式条图以组为单位，1组包括2个以上直条，直条所表示的类别应用图例说明，同一组的直条间不留空隙。

图2-3 2001年某省不同地区的卫生系统反应性评分比较

图2-4 2001年某省不同地区、性别的卫生系统反应性评分比较

图2-5 2001年某医科大学公共卫生学院专业技术人员构成

制图要求：

（1）先绘制以大小适当的圆形。由于圆心角为360度，因此每1%相当于3.6度的圆周角，将各部分百分比分别乘以3.6度即为各构成部分应占的圆周角度数。

（2）圆形图上各部分自圆的12点开始由大到小按顺时针方向依次绘制，其他置最

绘制要求（普通线图）：

（1）横轴表示某一连续变量（时间或年龄等）；纵轴表示某种率或频数，其尺度必须等距（或具有规律性）。

（2）同一图内不应有太多的曲线，通常≤5条，以免观察不清。

（3）如有几根线，可用不同的图线（实线、虚线等）来表示，并用图例说明。

（4）图线应按实际数字绘制成折线，不能任意改为光滑曲线。

5．直方图（histogram）直方图用于表达连续性资料的频数分布。以不同直方形面积代表数量，各直方形面积与各组的数量成正比关系（图2-8）。

图2-8 2001年某地区居民受教育年限分布

制图要求：

（1）一般纵轴表示被观察现象的频数（或频率），横轴表示连续变量，以各矩形（宽为组距）的面积表示各组段频数。

（2）直方图的各直条间不留空隙；各直条间可用直线分隔，但也可不用直线分隔。

（3）组距不等时，横轴仍表示连续变量，但纵轴是每个横轴单位的频数。

6．散点图（scatter diagram）散点图以直角坐标系中各点的密集程度和趋势来表示两现象间的关系（图2-9）。根据点的散布情况，推测2种事物或现象有无相关，故常在对资料进行相关分析之前使用。

图2-9某地区饮水氟含量与氟骨症患病率散点图

制图要求：

（2）一般横轴代表自变量或可进行精确测量、严格控制的变量，纵轴则代表与自变量有依存关系的因变量。

（2）纵轴和横轴的尺度起点可根据需要设置。

卫生统计学整理笔记

如何绘制频数表？求组距确定各组段的两个端点归组计数频数分布表与分布图作用 1.揭示变量分布形态 2.揭示变量分布趋势 3.便于发现特大的或特小的极端值 4.便于进一步计算统计指标和分析 5.作为一种数据陈述的形式算数应用条件：对称分布，尤其正态分布几何应用条件： 1.对数对称分布、等比资料 2.变量值中不能有0；不能同时有正值和负值；若全是负值，计算时可先把负号去掉，得出结果后再加上负号。中位数条件：所有分布、尤其偏态分布： 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清极差应用条件：所有分布、尤其偏态分布不足：不能全面的反映所有值的偏离程度不稳定、小样本小于大样本、样本小于总体四分位数间距应用条件所有分布、尤其偏态分布： 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清方差应用条件：对称分布，尤其正态分布变异系数应用 1.量纲不一致

散点图作用观察两组数据的总体趋势和明显偏离趋势的观察点判断两组数据的关联形式、方向和密切程度相关分类线性相关秩相关分类变量相关线性相关意义 r>0表示正相关，r=1表示完全正相关；r<0表示负相关，r=-1表示完全负相关。 |r|→0表示相关性越弱，|r|→1表示相关性越强。 r=0表示没有线性相关，不代表没有相关。如何判断线性相关画散点图计算线性相关系数假设检验如何进行秩相关编秩次计算秩相关系数假设检验回归分析：利用样本信息，找到变量间数量依存关系。线性回归分析：利用样本信息，找到变量间线性数量依存关系。决定系数：反映回归贡献的相对程度，即Y的变异被X解释的比例。如何进行分类变量的相关分析交叉表的制作，计算各种概率计算列联系数假设检验相关分析的条件线性相关系数：二元正态分布的定量变量秩相关系数：非二元正态分布的定量变量、有序分类变量列联系数：无序分类变量轶闻数据：由坊间流传或各种媒体报道的一些个案数据，由于其特殊性往往给公众留下突出和深刻的印象。特点：缺乏代表性，常诱导人们进行简单的推论，得到一些具有倾向性的结论。可得数据：为了某些特定目的已收集或积累的数据。如：各类监测数据、统计年鉴等。

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论名词解释统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。抽样:从研究总体中抽取少量有代表性得个体,称为抽样。概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。变量:表现出个体变异性得任何特征或属性。随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。第二章定量资料得统计描述名词解释算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

实用卫生统计学复习题及答案2013.1

实用卫生统计学期末复习题2013.1 一、名词解释 1．构成比：又称构成指标，它表示事物内部各组成部分所占的比重或分步。 2．综合评价：是指人们根据不同的评价目的，选择相应的评价形式，据此选择多个因素或指标，并通过一定的数学模型，将多个评价因素或指标转化为能反映评价对象总体特征的信息。 3．可比性：指除了处理因素外，其他可能影响结果的非处理因素在各组间应该尽可能相同或相近，即“齐同”。 4．参数检验：是一种要求样本来自总体分布型是已知的（如正态分布），在这种假设的基础上，对总体参数（如总体均数）进行统计推断的假设检验。 5．非参数检验：是一种不依赖总体分布类型，也不对总体参数（如总体均数）进行统计推断的假设检验。 6．抽样误差：在同一总体中随机抽取样本含量相同的若干样本时，样本指标之间的差异以及样本指标与总体指标的差异，称为抽样误差。7．变异：是指同一性质的事务，其观察值之间的差异，在统计学上就称作变异。 8．卫生统计学：是运用数理统计的基本原理和方法，通过数据的收集，整理和分析，研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。 9．随机抽样：就是按照随机的原则获得样本，保证总体中每个个体都有同等机会被抽取，使样本对总体有较好的代表性。 10．频率：若随机事件在n次重复中出现m次，则n/m比值成为随机事件出现的频率。 11．区间估计：按一定的概率估计总体参数所在的可能范围的方法。二、简答题 1. 完全设计的两样本均数比较的t检验与方差分析之间的关系如何？ 2. 假设检验的结论为什么不能绝对化？ 3请总结直线相关系数r与直线回归系数b的意义及特点？ 4. 应用相对数时有哪些注意事项？答案： 3.答：直线相关系数r是说明具有直线关系的两个变量间，相关关系的密切程度与相关方向的统计指标。总体相关系数用ρ表示，样本和相关系数用r表示，r是ρ的估计值。相关系数没有单位，取值范围是-1≤r≤1。r值为正，表示两变量呈正相关，x与y变化趋势是正向的。r值为负，表示两变量呈负相关，x与y呈反向变化。通常r的绝对值越大，表示两变量相关关系越密切。直线回归系数b即回归直线的斜率，b＞0表示直线从左下方走向右上方，y随x增大而增大；b＜0表示直线从左上方走向右下方，y随x增大而减小；b=0则直线与x轴平行，x与y无直线关系。b的统计学意义是x每增加（减）一个单位，y平均改变b个单位。 4. （1）构成比与率是意义不同的两个统计指标，应用时不能相互混淆。（2分）构成比说明事物内部各组成部分所占的比重，而率说明某事物或现象的发生频率或强度，不能以构成比代替率来说明问题。（2）样本含量太小时，不宜计算相对数，最好用绝对数来表示。（3）对各组观察例数不等的几个率，不能直接相加求其总率。（4）在比较相对数时应注意资料的可比性。三．计算题 1.某医院对医院的医生和护士的年龄分布进行了调查，整理得到下表，请根据统计表制表原则和注意事项指出问题所在并予以修改。（1）标题不确切改标题。（2分）（2）标目设置不当（2分），增加构成比。（2分）（3）表中数字不明，应增加“人数”。（2分）（4）线条不规范。（2分）建议修改的表如下表（5分）

卫生统计学复习题5

卫生统计学复习题选择题一、A1型：每一道题下面有A、B、C、D、E五个备选答案，请从中选择一个最佳答案。（1′） 1、统计工作的基本步骤是： A.设计、调查、审核、整理资料 B.收集、审核、整理、分析资料 C.设计、收集、整理、分析资料 D.调查、审核、整理、分析资料 E.以上都不对 2、统计学中所说的样本是指 A.从总体中随意抽取一部分 B.依照研究者的要求选取有意义的一部分 C.有意识地选择总体中的典型部分 D.从总体中随机抽取有代表性的一部分 E.以上都不对 3、统计学上的系统误差、测量误差、抽样误差在实际工作中： A.均不可避免 B.系统误差和测量误差不可避免 C.测量误差和抽样误差不可避免 D.系统误差和抽样误差不可避免 E.只有抽样误差不可避免 4、μ确定后，δ越大，则正态曲线： A.越陡峭 B.形状不变 C.越平缓 D.向左移动 E.向右移动 5、抽样误差指的是： A.个体值和总体参数值之差 B.个体值和样本统计量值之差 C.样本统计量值和总体参数值之差 D.不同的总体参数之差 E.以上都不是 6、治疗效果判定资料属于： A.计量资料 B.技术资料 C.等级资料 D.无序分类资料 E.以上都不是 7、平均数可用于分析下列哪种资料： A.统计资料 B.等级资料 C.计数资料 D.计量资料 E.调查资料 8、一组正态或近似正态分布资料的平均水平用： A.算术均数 B.几何均数 C.中位数 D.平均数 E.以上均是 9、对于同一份正偏峰的资料，求得的几何均数与算术均数： A.几何均数大于算数均数 B. 几何均数小于算数均数 C. 几何均数等于算数均数 D. 几何均数可以大于算数均数，也可以小于算数均数 E. 以上说法都不对 10、原始数据加上一个不为0的常数后： A.x不变，CV变 B. x变或CV变 C. x不变，CV不变 D. x变，CV不变 E. x、CV均改变 11、血清学滴度资料最常计算______以表示其平均水平 A.均数 B.中位数 C.几何均数 D.全距 E.标准差 12、表示变量值变异情况的指标最常用的是： A.四分位数间距 B.全距 C.标准差 D.变异系数 E.方差 13、变异系数CV的数值 A.一定小于1 B.一定大于1 C.可大于1；也可小于1 D.一定不会等于零 E.一定比S小 14、若成年人血铅含量近似对数正态分布，拟用300名正常成人血铅确定99%正常值范围，最好采用下列哪个公式： A. x+2.58S B.lg-1(x lgx+2.58S lgx) C. x±2.58S D.P99=L+i/f99(300*99/100-f L) E. lg-1(x lgx+2.33S lgx) 15、_______小，表示用该样本均数估计总体均数的可靠性大。 A.CV B.S C.σx D.R E.四分位数间距 16、两样本均数比较时，分别取以下检验水准，以_______所对应的第二类错误最小。 A.α=0.01 B.α=0.05 C.α=0.10 D.α=0.20 E.α=0.25 17、方差分析中，当P﹤0.05时，结果_________。 A.可认为各样本均数都不相等 B.可认为各总体均数不等或不全等 C.可认为总体均数都不相等 D.证明总体均数不等或不全相等 E.以上都不对 18、正态性检验中，按α=0.10水准，认为总体服从正态分布，此时若推断有错，此错误的概率为__________。

卫生统计学重点笔记之令狐文艳创作

医师资格考试蓝宝书-预防医学令狐文艳医学统计学方法第一节基本概念和基本步骤（非常重要）一、统计工作的基本步骤设计（最关键、决定成败）、搜集资料、整理资料、分析资料。总体：根据研究目的决定的同质研究对象的全体，确切地说，是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。实际工作中，经常是从总体中随机抽取一定数量的个体，作为样本，用样本信息来推断总体特征。样本的指标为统计量。由于总体中存在个体变异，抽样研究中所抽取的样本，只包含总体中一部分个体，这种由抽样引起的差异称为抽样误差。抽样误差愈小，用样本推断总体的精确度愈高；反之，其精确度愈低。某事件发生的可能性大小称为概率，用P表示，在0～1之间，0和1为肯定不发生和肯定发生，介于之间为偶然事件，<0.05或0.01为小概率事件。

二、变量的分类变量：观察单位的特征，分数值变量和分类变量。第二节数值变量数据的统计描述（重要考点）一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称，适用于正态或近似正态分布。 2.几何均数适用于等比资料，尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布，经对数变换后（用原始数据的对数值lgX代替X）服从正态分布，观察值不能为0，同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布，特别是偏态分布资料的集中位置，以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数，但可求中位数。百分位数是个界值，将全部观察值分为两部分，有X％比小，剩下的比大，可用于计算正常值范围。二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用，适于正态分布，既考虑了离均差（观察值和总体均数之差），又考虑了观察值个数，方差使原来的单位变成了平方，所以开方为标准差。均为数值越小，观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变

卫生统计学考试重点总结复习

一、绪论 1.总体：根据研究目的确定的同质观察单位的全体，确切的说是同质的所有观察单位某种变量值的集合。 2.样本：从总体中随机抽取部分观察单位所组成的集合。 3.参数：用样本的指标来推算或估计出来的，用来说明总体情况的统计指标。 4.统计量：根据观察值计算出来的量，是用来描述和分析样本的统计指标。 5.变量的类型及其转换： ①定性变量：a.分类变量（计数资料）i.二分类变量 ii.多项无序分类 b.有序变量（等级资料） ②定量变量：a.连续型变量 b.离散型变量变量只能由“高级”向“低级”转化：定量→有序→分类→二值。 6.概率：是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括：统计学是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。 8.卫生统计学：运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象：有变异的事物。 10.统计工作的一般步骤：设计资料、搜集资料、整理资料、分析资料。 11.同质：指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异：同一总体内的个体间存在差异又是绝对的，这种现象称为变异。 13.误差可分为：系统误差、随机测量误差、抽样误差。 14.抽样误差：由于个体差异的存在，从某一总体中随机抽取一个样本，所得样本统计量与总体参数之间可能存在差异，这种差异称为抽样误差。二、定量资料的统计描述 1.频率分布表的编制步骤： ①计算极差R、②确定组段数与组距（一般为8-15组）、③确定各组段的上下限、④列表。 2.频率分布表的用途： ①揭示频数分布的分布特点和分布类型，文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时，可用各组段的频率作为概率的估计值。 3.中位数：指将原始观察值从小到大或从大到小排序后，位次居中的那个数。 4.四分位数间距：表示百分位数P75和百分位数P25之差，定义为Q=P75-P25，恰好包括总体中50%的个体观察值，用来描述偏态分布资料的离散趋势的指标。 5.标准差：即方差的算术平方根，是衡量对称分布资料的离散程度的指标，标准差大，则离散度大，标准差小，则离散度小。 6.变异系数：变异的大小S相对于其平均水平X的百分比，主要用于量纲不同的变量间，或均数差别较大的变量间变异程度的比较。三、定性资料的统计描述 1.构成比：说明一事物内部各组成部分在总体中所占的比重或分布，常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型：

卫生统计学考试复习题及参考答案

中南大学现代远程教育课程考试复习题及参考答案《卫生统计学》一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 21.假设检验中P的含义 22.I型和II型错误 23.检验效能 24.检验水准 25.方差分析 26.随机区组设计

27.相对数 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 44.灵敏度 45.特异度 46.误诊率 47.漏诊率 48.阳性似然比 49.阴性似然比 50.Youden指数 51.ROC曲线 52.统计图二、单项选择题 1．观察单位为研究中的( )。 A．样本B．全部对象C．影响因素D．个体

2．总体是由（）。 A．个体组成B．研究对象组成 C．同质个体组成D．研究指标组成 3．抽样的目的是（）。 A．研究样本统计量B．由样本统计量推断总体参数C．研究典型案例研究误差D．研究总体统计量 4．参数是指（）。 A．参与个体数B．总体的统计指标 C．样本的统计指标D．样本的总和 5．关于随机抽样，下列那一项说法是正确的（）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取B．研究者在抽样时应精心挑选个体，以使样本更能代表总体C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6．各观察值均加（或减）同一数后（）。 A．均数不变，标准差改变B．均数改变，标准差不变C．两者均不变D．两者均改变 7．比较身高和体重两组数据变异度大小宜采用（）。 A．变异系数B．方差 C．极差D．标准差 8．以下指标中（）可用来描述计量资料的离散程度。 A．算术均数B．几何均数 C．中位数D．标准差 9．血清学滴度资料最常用来表示其平均水平的指标是（）。A．算术平均数B．中位数 C．几何均数D．平均数 10．两样本均数的比较，可用（）。 A．方差分析B．t检验 C．两者均可D．方差齐性检验 11．配伍组设计的方差分析中，配伍等于（）。

卫生统计学1复习参考资料

（一）．单选题（共”题，每题2 分） 1 ，某次研究进行随机抽样，测量得到该市110 名健康成年男子的血清总胆固醉值，则研究总体为（ D ) A ．所有成年男子 B ．该市所有成年男子 C . 110 名该市健康成年男子 D ．该市所有健康成年男子 2 ．关于随机抽样，下面说法正确的是（ D ) A ．抽样时样本量越大越好 B ．选取符合研究者意愿的样本 C ．抽样时应精心挑选个体，使得样本更好地代表总体 D ．抽样时要求总体中每一个个体都有同等机会被抽取 3 ．下列选项中，属于计数资料类型的是( C ) A ．身高资料 B ．舒张压资料 C ．某病患病率资料 D ．血清总胆固醉资料 4 ．要全面描述正态总体分布或近似正态总体分布资料的分布特征，可采用（ A ) A ．均数和标准差 B ．中位数和四分位间距 C ．极差和中位数 D ．均数和变异系数 5 ．均数X 是描述一组同质数值变量数据(A）的统计指标 A ．集中趋势 B ．离散趋势 C ．变化范围 D ．频数分布 6 ．标准差S 是描述一组同质数值变量数据(C）的统计指标 A ．集中趋势 B ．变化范围 C.变异程度 D. 频数分布 7 ．一组观察值15 , 20 , 30 , 50 , 40 , 90 , 20 ,95. 其中位数为( B ) A . 30 B . 35 C ．40 D 70 8 ·某组织资料共15 例，∑X2＝1535, ∑X=45 , 则标准差S 为（ D ） A . 100 . 00 B . 93 . 33 C . 9 . 66 D . 1 0 . 00 9 ．将75 个观测值从小到大排列后，这75 个观测值中有10 ％的观测值比50 小，有90 % 的观测值比50 大，则50 是（ A ）

卫生统计学最好的复习资料

一、名词解释 1. 计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data ）。计量资料亦称定量资料、测量资料。．其变量值是定量的，表现为数值大小，一般有度量衡单位。 2. 计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data ）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。 3. 等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data ）。等级资料又称有序变量。 4. 总体：总体（population ）指特定研究对象中所有观察单位的测量值。 5. 样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample ）。 6. 抽样误差：抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。 7. 频数表：用来表示一批数据各观察值在不同取值区间出现的频繁程度（频数）。 8. 算术均数：描述一组数据在数量上的平均水平。总体均数用μ表示，样本均数用X 表示。 9. 中位数：将一组观察值由小到大排列，位次居中的那个数。 10. 极差：亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳定性较差。 11. 方差：方差表示一组数据的平均离散情况，由离均差的平方和除以样本个数得到。 12. 标准差：是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资料，大样本、小样本均可，最为常用。 13. 变异系数：用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。 14. 正态分布：若资料X 的频率曲线对应于数学上的正态曲线，则称该资料服从正态分布。通常用记号),(2σμN 表示均数为μ，标准差为σ的正态分布。 15. 标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布，通常记为2(0,1)N 。 16. 统计推断：通过样本指标来说明总体特征，这种通过样本获取有关总体信息的过程称为统计推断。 17. 抽样误差：由个体变异产生的，由于抽样造成的样本统计量与总体参数的差异，称为抽样误差。 18. 标准误：通常将样本统计量的标准差称为标准误。 19. 可信区间：按预先给定的概率确定的包含未知总体参数的可能范围。 20. 参数估计：指用样本统计量估计总体参数。参数估计有两种方法：点估计和区间估计。

卫生统计学知识点(笔记)

第一章绪论 1.统计学（statistics）是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。 2.▲总体（population）用来表示大同小异的对象全体，例如一个国家的所有成年人；某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论，这个总体便称为目标总体（target population）；资料常来源于目标总体中的一个部分，它称为研究总体（study population）。需要谨慎的是，就研究总体所下的结论未必适用于目标总体。 3.▲样本（sample）是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样（sampling）。抽样研究的目的是用样本数据推断总体的特征。需要注意的是，统计学的结论从来就不是完全肯定或完全否定的，能不能成功地达到从样本推断总体的目的，关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质（homogeneity）是指同一总体中个体的主要性质相同。 5.▲变异（variation）是指同质的个体之间存在的差异。 6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化：只能由“高级”向“低级”转化，即由信息量多的向信息量少的类型转化，如：定量有序分类二值 7.▲参数（parameter）是反映总体特征的指标，参数的大小是客观存在的，是一个常数，不会发生变化，然而往往是未知的，需要通过样本资料来估计，如总

体均数μ，总体标准差σ。 8.▲统计量（statistic）又称样本统计量，是反映样本特征的指标，是由观察资料计算出来的，如样本均数 X，样本标准差S。统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别：概率是参数，频率是统计量；频率总是围绕概率上下波动。当某事件发生的概率≤0.05时，即P≤0.05，统计学习惯上称该事件为小概率事件。 10.▲误差：表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差，其中系统误差呈现倾向性偏大或偏小现象，是可以避免的；而随机误差，是非人为偶然因素所致，不可避免，但可通过增大样本量等措施使其减小。 11.因果与联系：存在联系未必有因果关系，需排除虚假关联、间接关联。大多数观察性研究，单靠统计学分析只能考察变量之间的联系，难以证明因果关系。

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学统计工作基本步骤：统计设计（调查设计和实验设计）、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断（参数估计和假设检验）】。 ★统计推断：是利用样本所提供的信息来推断总体特征，包括：参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数，主要有点估计（把样本统计量直接作为总体参数估计值）和区间估计【按预先设定的可信度（1-α），来确定总体均数的所在范围】。b假设检验：是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化，通常是由高级向低级转化。资料按性质可分为计量资料、计数资料和等级资料。定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表（图）的用途：①描述资料的分布类型；②描述分布的集中趋势和离散趋势；③便于发现一些特大和特小的可疑值；④便于进一步的统计分析和处理；⑤当样本含量足够大时，以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。（1）描述集中趋势的统计指标：平均数（算术均数、几何均数和中位数）、百分位数（是一种位置参数，用于确定医学参考值范围，P50就是中位数）、众数。算术均数：适用于对称分布资料，特别是正态分布资料或近似正态分布资料；几何均数：对数正态分布资料（频率图一般呈正偏峰分布）、等比数列；中位数：适用于各种分布的资料，特别是偏峰分布资料，也可用于分布末端无确定值得资料。（2）描述离散趋势的指标：极差、四分位数间距、方差、标准差和变异系数。四分位数间距：适用于各种分布的资料，特别是偏峰分布资料，常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差：都适用于对称分布资料，特别对正态分布资料或近似正态分布资料，常把均数和标准差结合起来描述资料的集中趋势和离散趋势；变异系数：主要用于量纲不同时，或均数相差较大时变量间变异程度的比较。标准差的应用：①表示变量分布的离散程度；②结合均数计算变异系数、描述对称分布资料；③结合样本含量计算标准误。定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征，通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标概念近似反映某一时间出现概率单位时间内某现象的发生率两个有关联的指标A和B之比计算公式 A/B 有无量纲无有可有、可无取值范围【0,1】可大于1无限制本质大样本时作为概率近似值分子式分母的一部分频率强度，即概率强度的似值表示相对于B的一个单位，A有多少位 A和B可以是绝对数、相对数和平均

山东大学2019考研：353卫生综合参考书目及真题笔记资料汇总

山东大学2019考研：353卫生综合参考书目及真题笔记资料汇总由于山东大学部分专业课官方没有公布参考书目由此给很多考生带来了很大的不便，对此精都考研网整理了山东大学本专业研究生初试用书及配套资料供大家参考一、353卫生综合参考书目： ①《环境卫生学》 ②《流行病学》 ③《卫生统计学》 ④《营养与食品卫生学》 ⑤《职业卫生与职业医学》二、配套精编复习资料山东大学353卫生综合《复习全程通》精都考研组编三、复习全程通内容简介《复习全程通》由精都考研工作室依托多年为各大机构编写考研专业课资料以及学员辅导的经验，由本团队组织目标院校本专业的高分研究生共同合作编写而成，全书考点知识面覆盖全面，权威细致，编排结构科学合理，是专门为本届考研的考生量身定制的必备专业课资料。通过本精编资料四大模块内容，结合考生每个阶段的复习，有助于考生深入了解目标院校以及专业考点重点，提高复习效率，拓展解题思路。 NO.1历年真题汇编通过目标院校原版真题，了解命题老师的出题思路，且分析考点重点，快速了解目标院校出题风格及命题思路，提高复习效率，拓展解题思路 NO.2教辅一本通本部分内容主要是由目标院校本专业研究生对应其初试参考书目整理汇编章节重点考点以及对应章节历年典型考题及答案解析，通过本书的配套复习，分析专业考点侧重，通过大量典型考题让充分掌握本门科目重点，确保考场应对自如。 NO.3冲刺模拟套卷书在遵循专业课最新参考书目，结合历年考研真题规律，制定的模拟卷，并有详细的配套答案讲解，适用于考生在冲刺模拟阶段的专业课复习。 NO.4电子版赠送内容本部分内容为购买全套资料的同学附赠的内容，主要是初试参考书目主编老师的教学讲义以及相关的扩充习题，此部分内容对于跨考的考生相对比较重要，通过讲义了解专业课基础复习侧重，达到专业知识点不缺不漏。四、解析备考辅导班：专业课一对一无忧全程班专业课一对一标准全程班山东大学在读研究生授课以上内容是【精都考研网】整理发布，每天及时发布最新考研资讯、考研经验、考研真题。目前很多同学已加入2019山东大学考研总群640030269，抓紧时间加入了解你所不知道的考研信息。

卫生统计学复习题库

1.完全随机设计方差分析的目的是检验 A、多个样本方差的差别有无统计学意义 B、多个总体方差的差别有无统计学意义 C、多个样本均数是否相同 D、多个总体均数是否相同 E、以上都不对正确答案：D 方差分析中，当P<0.05时，结论为 A、可认为各样本均数都不相等 B、可认为各总体均数不等或不全相等 C、可认为总体均数都不相等 D、证明总体均数不等或不相等 E、以上都不对正确答案：B 完全随机设计的方差分析中，若处理因素无作用，理论上 A、F=1 B、F=0 C、F<1.96 D、F=1.96 正确答案：A 方差分析中，组间变异主要反映了 A、随机误差

B、处理因素的作用 C、抽样误差 D、测量误差 E、个体差异正确答案：B 方差分析中对数据的要求有 A、任何两个观察值之间不相关 B、每一水平下的观察值分别服从正态分布 C、各总体的方差齐性 D、只需B和C E、每组样本含量均较小正确答案：ABC 职业病防治院测定了11名石棉肺患者、9名石棉肺可疑患者和11名非患者的用力肺活量，求得其均数分别为1.79L、2.31L和3.08L。能否据此认为石棉肺患者、石棉肺可疑患者和非患者的用力肺活量不同？ A、能，因3个样本均数不同 B、需对3个均数作两两t检验才能确定 C、需对3个均数作两两Z检验才能确定 D、需作完全随机设计3个均数比较的ANOVA才能确定 E、需作随机区组设计3个均数比较的ANOVA才能确定正确答案：D

某研究者在5种不同的温度下分别独立地重复了10次试验，共测得某定量指标的50个数据。根据资料的条件，可用单因素方差分析处理此资料。其组间的自由度是 A、49 B、45 C、36 D、9 E、4 正确答案：E 某医师用A、B、C三种方案分别治疗7例、6例和8例婴幼儿贫血患者。治疗1月后，记录Hb的增加量（g/L），求得其均数26.0，18.0，6.0。若ANOVA分析推断3种治疗方案对婴幼儿贫血的治疗效果是否不同，其检验假设H0为 A、3个样本均数不同 B、3个样本均数全相同 C、3个总体均数全相同 D、3个总体方差全相同 E、3个总体方差不全相同正确答案：C 64只大鼠被随机地均分到4个不同的饲料组中去，饲养一段时间后，观察每只鼠的肝重比值（即肝重/体重），希望评价4种饲料对肝重比值的影响大小。如果资料满足正态的前提条件，正确的统计方法应当是 A、进行6次t检验

卫生统计学-重点整理资料东大

卫生统计学第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法，研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学，是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3)：设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4)： ⑴同质：在统计学中，若某些观察对象具有相同的特征或属性，我们就称之为同质，或具有同质性。 ⑵变异：同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体：同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本：从总体中随机抽取的具有代表性的部分观察单位的集合。样本中包含的观察单位个数成为样本含量。 ⑸参数：反映总体特征的指标，一般是未知的，常用希腊字母表示，如总体均数μ、总体率π等。 ⑹统计量：根据样本观察值计算出来的指标，常用拉丁字母表示，如样本均数x 、样本率等。

⑺变量与资料：对每个观察单位进行观察或测量的某项特征或属性称为变量；变量值的集合成为资料。 ⑻定量资料：亦称计量资料，其变量值是定量的，表现为数值大小，一般有度、量、衡单位。 ⑼定性资料：亦称分类资料，其观察值是定性的，表现为互不相容的类别或属性，一般无度、量、衡单位。可细分为：①计数资料； ②等级资料第二章调查研究设计 ★1、调查研究的特点（P7）： ①不能人为施加干预措施；②不能随机分组； ③很难控制干扰因素；④一般不能下因果结论 2、常用抽样方法（名称、原理）： ⑴单纯随机抽样：先将调查总体的全部观察单位统一编号，然后采用随机数字表、统计软件或抽签方法之一随机抽取n（样本大小）个编号，由这n个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样：又称机械抽样或等距抽样。事先将总体内全部观察单位按某一顺序号等距分成n（样本大小）个部分，每一部分内含m个观察单位；然后从第一部分开始，从中随机抽出第i 号观察单位，依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样：先按对观察指标影响较大的某项或某几项特征，将总体分成若干层，该特征的测定值在层内变异较小，层间变异

卫生统计学复习笔记

卫生统计学复习笔记一、概述 1、卫生统计学的概念（熟练掌握）统计学是研究数据的收集、整理和分析的一门科学，帮助人们分析所占有的信息，达到去伪存真、去粗取精、正确认识世界的一种重要手段。卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。由此看出：统计学是处理资料中变异性的科学和艺术，是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”，但在实际工作中，许多人往往是忽略了设计、收集和归类（整理），到了分析数据时才想到统计学，此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。卫生统计学的内容（了解）： 1）健康统计：医学人口统计、疾病统计和生长发育统计等； 2）卫生服务统计：包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。 2、卫生统计学的工作步骤（熟练掌握）统计学对统计工作的全过程起指导作用，任何统计工作和统计研究的全过程都可分为以下四个步骤： 1)、设计：在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上，对将要进行的研究工作所做的全面设想。其内容包括：明确研究目的和研究假说，确定观察对象、观察单位、样本含量和抽样方法，拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环，也是指导以后工作的依据 2)、收集资料：遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面：①统计报表：是由国家统一设计，有关医疗卫生机构定期逐级上报，提供居民健康状况和医疗卫生机构工作的主要数据，是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表，职业病报表，医院工作报表等。②经常性工作记录：如卫生监测记录、健康检查记录等。③专题调查或实验。 3）、整理资料：收集来的资料在整理之前称为原始资料，原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳，使原始资料系统化、条理化，便于进一步计算统计指标和分析。其过程是：首先对原始资料进行准确性审查（逻辑审查与技术审查）和完整性审查；再拟定整理表，按照“同质者合并，非同质者分开”的原则对资料进行质量分组，并在同质基础上根据数值大小进行数量分组；最后汇总归纳。 4）、分析资料：其目的是计算有关指标，反映数据的综合特征，阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图（表）等方法对样本资料的数量特征及其分布规律进行

卫生统计学期末复习重点

卫生统计学期末复习重点 Revised as of 23 November 2020

《卫生统计学》期末复习提要一、期末考试有关问题的说明 <一>出题的指导思想、原则及题目类型出题的指导思想是：全面考核学生对本课程的基本概念、基本方法，基本技能的掌握情况，考核学生运用所学的知识和方法综合分析与解决实际问题的能力。出题的原则是：不超过教学大纲的内容，难度适中但覆盖面较广，基本知识占８０─９０％，稍难或灵活的题目占１０─２０％。凡自学的章节不考。 <二>答题要求选择题：要求选择无误，每题只选一个最佳答案。计算分析题：要求完整地写出计算步骤（包括计算公式）、用计算器计算出正确结果，并能对所得结果作出相应的分析结论。二、期末复习范围和重点绪言 <一>重点复习的名词：计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。总体(population)：表示大同小异的对象（某个测量值）全体。样本(sample)：从研究总体中随机抽取的一部分有代表性的个体变异(variation)：同一总体内的个体间存在差异。抽样误差：消除了系统误差并控制了随机测量误差之后，样本数值仍和总体指标的数值有差异，这种误差称之。概率: 某事件出现机会大小的量。 <二>重点复习的问题：１、根据计量、计数、等级资料的概念正确识别统计资料的类型。等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data），等级资料又称有序变量。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。２、统计工作的步骤及搜集资料的来源和要求。 1．设计：设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环，是今后工作应遵循的依据。

卫生统计学复习题

卫生统计学复习题 Document number：WTWYT-WYWY-BTGTT-YTTYU-2018GT

《卫生统计学》复习题一.单选题 1.均数和标准差的关系是( ) 愈大，s愈大愈大，s愈小愈大，对各变量值的代表性愈好愈小，与总体均数的距离愈大愈小，对各变量值的代表性愈好 2.对于均数为μ、标准差为σ的正态分布，95%的变量值分布范围为( ) A.μ-σ～μ+σ B.μσ～μ+σ C.μσ～μ+σ ∞～μ+σ ～μ+σ 3.设x符合均数为μ.标准差为σ的正态分布，作u＝(x－μ)/σ的变量变换，则 ( ) 符合正态分布，且均数不变符合正态分布，且标准差不变符合正态分布，且均数和标准差都不变符合正态分布，但均数和标准差都改变不符合正态分布 4.在比较两个独立样本资料的总体均数时，进行t检验的前提条件是( ) A.两总体方差相等 B.两总体方差不等 C.两总体均数相等 D.两总体均数不等 E.以上都不对

5.在同一总体中作样本含量相等的随机抽样，有99%的样本均数在下列哪项范围内 ( ) A.± B.± C.μ± D.μ± E.μ± 分布与标准正态分布相比 ( ) A.均数要小 B.均数要大 C.标准差要小 D.标准差要大 E .均数和标准差都不相同 7.由两样本均数的差别推断两总体均数的差别，所谓差别有统计学意义是指( ) A.两样本均数差别有统计学意义 B.两总体均数差别有统计学意义 C.其中一个样本均数和总体均数的差别有统计学意义 D.两样本均数和两总体均数差别都有统计学意义 E.以上都不是 8.要评价某市一名8岁女孩的身高是否偏高或偏矮，应选用的统计方法是( ) A.用该市8岁女孩身高的95%或99%正常值范围来评价 B.作身高差别的假设检验来评价 C.用身高均数的95%或99%可信区间来评价 D.不能作评价 E.以上都不是 9.若正常人尿铅值的分布为对数正态分布，现测定了300例正常人的尿铅值，以尿铅过高者为异常，则其95%参考值范围为( ) A. lg － 1(x x lg ± S lg x )