当前位置：文档之家› 01 流行病学统计基本概念

01 流行病学统计基本概念

流行病学统计基本概念

?数据（Data）

?变量（variable）：

o连续性变量（continuous variable）:

?总体（population）与样本（sample）

?变量的分布及其描述

o分类型变量分布描述

o连续性变量分布描述

集中趋势与离散趋势

描述集中趋势的指标：均数，几何均数，中位数

描述离散趋势的指标：方差（Variance）、标准差（Standard deviation），极

差（Range），四分位数间距（Quartile range），百分位数

?总体均数的可信区间

?效应估计

?线性回归与Logistic回归

数据（Data）：

对一组观察对象进行观测，记录若干个观测指标值，将每个观测个体每个观测指标的观测值整理成行乘列表的形式。每行表示每个观测个体，每列表示每个观测指标（又称变量或字段）。

数据文件格式：

文本文件格式：行间有行分隔符，列（字段）间分隔符常用：制表符、或逗号、或

空格。

Excel文件：

特定的数据文件格式：如R数据文件、SAS数据文件。

EmpowerStats 《易尔统计》可直接读取文本文件格式、Excel文件格式的数据文件。

变量（variable）：

变量，是指没有固定的值。从一个总体人群中随机抽取一个个体进行观测（如测量身高），这个观测值是随机的、可变的（再抽取一个个体观测的结果很可能不同）。

分类变量（categorical variable）：

其变量值是定性的，表现为互不相容的类别或属性，如性别。

分类变量可分为无序变量和有序变量两类。

无序分类变量（unordered categorical variable）

是指所分类别或属性之间无程度和顺序的差别。，它又可分为①二项分类，如

性别（男、女），药物反应（阴性和阳性）等；②多项分类，如血型（O、A、

B、AB等。

有序分类变量（ordinal categorical variable）

各类别之间有程度的差别。如尿糖化验结果按－、±、+、++、+++分类；疗效

按治愈、显效、好转、无效分类。

连续性变量（continuous variable）:

在一定区间内可以任意取值的变量叫连续变量，其数值是连续不断的，相邻两个数值可作

无限分割,即可取无限个数值。如身高、体重。

总体（population）与样本（sample）

统计的过程是从样本（sample）推断总体（population）的过程。

总体是根据研究目的确定的同质观察单位的全体，或者说，是同质的所有观察单位某种观

察值（变量值）的集合。

样本是按照随机化原则，从总体中抽取的有代表性的部分观察单位的变量值的集合。

变量的分布及其描述

统计分析的一个基本步聚是对一个样本中的某观测变量的频数分布进行描述，推断总体的

该变量的分布情况。

分类型变量分布描述：

统计各组频数，计算各组所占的百分数。如：

连续性变量分布描述：

首先根据变量的取值范围，等分成7-9组，统计落在每组内的观测数，绘制频数表与直方图。例图：

上图中，横轴表示连续性变量取值（身高），直条的面积表示频数。

从图上可以看出连续性变量分布的两个基本特征：（1）频数分布有向中间集中的趋势，称集中趋势；（2）频数分布向两侧逐渐减少，称离散趋势。

描述集中趋势的指标：

1.均数：

又称算术平均数，即所有观测数值的平均数。适用于对称性的分布。

2.几何均数：

将所有观测数值取对数后再求平均数，然后对该平均数取反对数。适用于对数正态

分布。

3.中位数：

将所有观测数值从小到大排列，位于中间的数。适用于对称或偏态分布资料。对于

完全对称的或正态的分布资料，理论上中位数与均数相等。

描述离散趋势的指标：

1.方差（Variance）、标准差（Standard deviation）：

方差是各个数据与平均数之差的平方的平均数。用来度量随机变量和其数学期望

（即均值）之间的偏离程度。

标准差是方差的平方根。

2.极差（Range）：

是最大值减最小值。适用于对称或偏态分布资料。

3.四分位数间距（Quartile range）：

所有观测值从小到大排列后，第75百分位数（P75）与第25百分位数（P25）的差。

适用于对称或偏态分布资料。

4.百分位数：

将所有观测值从小到大排列后，位于第X百分位上的数叫第X百分位数（P x）。

中位数即第50百分位数（P50）。

同理，最小值即P0，最大值即P100。

总体均数的可信区间：

样本是从总体里抽样出来的。由样本可以计算均数（A）、标准差（SD）。

假设每次抽样样本量为n，重复M次抽样，得样本均数A1,A2,……,A m。这M个样本均数都是对总体均数的估计。这M个样本均数互不相同，也可以计算出一个标准差，称样本均数的标准误（Se）。

实际工作中，我们不可能作M次抽样，无法直接得到M个样本均数A1,A2,……,A m。但可由样本的标准差估计均数的标准误：Se = SD / n(?)

我们无法确切得到总体均数，但可由样本均数估计总体均数落在哪个区间，这就是总体均数的可信区间。总体均数有95%的可能性落在（A-1.96* Se, A+1.96*Se)的区间内。

效应估计：

流行病学分析是为了确定危险因素与结果变量之间是否有联系，危险因素对结果变量的作用大小（即效应）。

效应的估计取决于结果变量与危险因素的类型。

线性回归与Logistic回归

回归分析是通过回归方程最大限度地拟合数据来估计自变量对因变量的影响。在方程中可加入混杂因素以控制这些因素的作用。如年龄、体重指数与肺功能有关，也与吸烟有关，将年龄、体重指数与吸烟一起放入回归方程中，这样估计的吸烟的作用就是控制年龄、体重指数的影响后吸烟的作用。

一、回归方程中的因变量的类型

回归方程的一般表达式为：f(Y)= β

0+β

+β

+ …… + e (1)

又可简写为：f(Y)= Xβ + e

式中X （X

1、X

、X

等）是自变量，e是残差，Y是因变量，f(Y)表示Y的关联函数。

如果Y是连续变量，如肺功能值、收缩压值等，Y服从正态分布，则f(Y) = Y，这就是一般的直线回归方程，

方程表达式为：

Y= β

0+β

+β

+ …… + e

如果Y是两分类变量，如是否患高血压、是否患慢性阻塞性肺病等，Y呈二项分布，则f(Y)=Logit（Y），这就是一般的Logistic回归方程

方程表达式为：

Logit（Y）= β

0+β

+β

+ …… + e

根据Y的分布，f(Y)不同，常见的有：

Y的分布不同，只影响方程左边的关联函数f(Y)，不影响方程右边的线性表达式，因此统称为广义线性模型（Generalized Linear Model）。

一般人常有一种误解，认为一般直线回归方程：

Y= β

0+β

+β

+ …… + e

中Y一定要服从正态分布。实际上Y是否服从正态分布不是必要条件，必要条件是残差e要服从正态分布。

二、回归方程中的自变量的类型

那么回归分析中的X是否也要服从正态分布呢？不是的。回归分析中的自变量X可以是连续变量、等级变量、分类变量。下面以吸烟与血压（SBP）的关系为例，分别解释不同的自变量类型的回归系数的意义。

1、自变量为二分类（0/1）变量：

如是否吸烟（SMOKE）对SBP的影响，SMOKE是0/1分类的变量，即0=不吸烟、1=吸烟，

回归方程为：SBP= β

0 + β

SMOKE （A）

当SMOKE=0时，SBP= β

0；SMOKE=1时，SBP= β

+ β

，

0是不吸烟者SBP的均数，β

+ β

是吸烟者SBP的均数。β

反映了吸烟与不吸烟

SBP的差，统计检验的目的就是检验β

是否等于零。

2、自变量为连续变量：

如累计吸烟年包（PACKYRS）与SBP的关系，PACKYRS是连续变量，不吸烟的人PACKYRS为0，

回归方程为：SBP= β

0 + β

PACKYRS （B）

当PACKYRS=0时，SBP=β

0；PACKYRS=1时，SBP=β

+β

；PACKYRS=2时，SBP=β

；

1反映了每多吸烟一个年包SBP会增加多少。统计检验的目的也是检验β

是否等于

零。

这里我们假定了吸烟每增加一个年包，SBP的变化是一样的，即吸烟年包与SBP呈直线关系。这种假定是否合理呢？吸烟从1年包增加到2年包与从20年包增加到21年包对SBP的影响作用是否一样呢？如不想做这样的假定，可以将吸烟年包转换成等级，按分类变量来处理分析。

3、自变量为等级变量：

将吸烟年包分成四等，生成新变量PACKYRC，

PACKYRC=0，表示不吸烟；

PACKYRC=1，表示吸烟年包大于零小于等于5；

PACKYRC=2，表示吸烟年包大于5小于等于10；

PACKYRC=3，表示吸烟年包大于10。

如将PACKYRC代入回归方程： SBP= β

0 + β

PACKYRC （C）

则β

0是不吸烟者的SBP，β

反映了吸烟年包每增加一个等级SBP会增加多少。这里

同样假定了吸烟年包每增加一个等级，SBP的变化是一样的，即吸烟年包等级与SBP 呈直线关系。如不做这样的假设，则将PACKYRC看成是一个四分类的变量。

4、自变量为多分类变量：

有些变量有多个分类，各类间的差别不定。如职业，0=农民、1=工人、2=干部、3=学生、4=其它，不能说他们呈一个等级变化的趋势。有些等级变量，不假定等级间变化相同时也看成是多分类变量。如上例PACKYRC有四个分类，将它做如下转换，

生成四个二分类的0/1变量：PY0、PY1、PY2、PY3。

当PSCKYRC=0时，PY0=1，其它变量均为0；当PSCKYRC=1时，PY1=1，其它变量均为0，余依此类推。

将PY1、PY2、PY3代入方程：

SBP= β

0 + β

PY1 + β

PY2 + β

PY3 （D）

此时，如PACKYRC=0，则PY1=0，PY2=0，PY3=0，SBP= β

；

如PACKYRC=1，则PY1=1，PY2=0，PY3=0，SBP= β

0 + β

；

如PACKYRC=2，则PY1=0，PY2=1，PY3=0，SBP= β

0 + β

；

如PACKYRC=3，则PY1=0，PY2=0，PY3=1，SBP= β

0 + β

。

因此，β

1反映了吸烟年包第一个等级者与不吸烟者SBP的差别；β

反映了吸烟年包

第二个等级者与不吸烟者SBP的差别；β

反映了吸烟年包第三个等级者与不吸烟者

SBP的差别。可以比较β

1、β

、β

判断吸烟年包等级与SBP是否呈直线关系，如是

则用模型（C）更好。这里没有假定吸烟年包每增加一个等级，SBP的变化是一样的。

上例中因为PY0（即PACKYRC=0的指示变量）不在方程中，所有组都以它为参照。如将PY3从方程中删除，加入PY0：

SBP= β

0 + β

PY0 + β

PY1 + β

PY2 （E）

则所有组都是与吸烟年包为第三个等级者比。

三、Logistic回归方程中的回归系数的解释

一般线性回归方程的回归系数比较容易理解，上面已通过SBP为例解释得很清楚了。

Logistic回归方程的回归系数简单地说就是Logit（Y）的变化。如Y为是否患高血

压，Logit（Y）=Log(P/(1-P))，P是Y的率，即患高血压的率。

假定不吸烟者的率为P0，吸烟者为P1，如吸烟比不吸烟者Logit（Y）增加β，则表示：

Log(P1/(1-P1)) - Log(P0/(1-P0)) = β

即：Log（(P1/(1-P1))/(P0/(1-P0))）= β

即：P1/(1-P1))/(P0/(1-P0))=e β，

上式左边即为比值比（OR），即将Logistic回归方程的回归系数的以自然数（e）

为底求指数，就是吸烟与不吸烟者高血压发病的比值比（OR）。如果P很小，1-P近于1，P/（1-P）接近P，比值比OR就可看成是两个率的比。

医学统计知识点整理(1)

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质：统计研究中，给观察单位规定一些相同的因素情况。如儿童的生长发育，规定同性别、同年龄、健康的儿童即为同质的儿童。变异：同质的基础上个体间的差异。 “同质”是相对的，是客观事物在特定条件下的相对一致性，而“变异”则是绝对的二、总体与样本 1、总体：是根据研究目的所确定的，同质观察对象（个体）所构成的全体。 2、样本：是从总体中随机抽取的部分观察单位变量值的集合。三、参数与统计量总体参数：根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量：根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的，抽样研究的目的就是用样本统计量来推断总体参数，包括区间估计和假设检验四、误差：实测值与真值之差★ 1.随机误差：是一类不恒定的、随机变化的误差，由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差：是一类恒定不变或遵循一定变化规律的误差，其产生原因往往是可知的或可能掌握的。 3.非系统误差：过失误差，可以避免或清除。五、概率是用来描述事件发生可能性大小的一个量值，常用P表示。概率取值0~1。统计上一般将P≤0.05或P≤0.01的事件称为小概率事件，表示其发生的概率很小，可以认为在一次抽样中不会发生。第二节统计资料的类型★

变量：确定总体之后，研究者应对每个观察单位的某项特征进行观察或测量，这种特征能表现观察单位的变异性，称为变量。一、数值变量资料又称为计量资料、定量资料：观测每个观察单位某项指标的大小而获得的资料。表现为数值大小，带有度、量、衡单位。如身高（cm）、体重(kg)、血红蛋白（g）等。二、无序分类变量资料又称为定性资料或计数资料：将观察对象按观察对象的某种类别或属性进行分组计数，分组汇总各组观察单位后得到的资料。分类：二分类：+ -；有效，无效；多分类：ABO血型系统特点：没有度量衡单位，多为间断性资料【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料，又称为计数资料。因为是按照变量的血型分类，血型表现为互不相容的属性。所以本题选C。【例题单选】测量正常人的脉搏数所得的变量是（） A.二分类变量 B.多分类变量 C.定量变量 D.定性变量【答案】C 【解析】脉搏数有数值大小，有度量衡，所以这个资料属于定量资料。本题选C。三、有序分类变量资料半定量资料或等级资料：将观察对象按观察对象的某种属性的不同程度分成等级后分组计数，分组汇总各组观察单位后得到的资料。特点：每一个观察单位没有确切值，各组之间有性质上的差别或程度上的不同举例：- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学最佳选择题

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学最佳选择题医学统计学最佳选择题一、绪论医学统计学最佳选择题一、绪论 1.下面的变量中，属于分类变量的是 A.脉搏 B.血型C.肺活量 D.红细胞计数 E.血压 2.下面的变量中，属于数值变量的是 A.性别 B.体重 C.血型 D.职业 E.民族 3.下列有关个人基本信息的指标，其中属于有序分类变量的是 A.学历 B.民族 C.职业 D.血型 E.身高 4.若要通过样本作统计推断，样本应是 A.总体中典型的一部分 B.总体中任意部分C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分E.总体中信息明确的一部分 5. 统计量是指 A.是统计总体数据得到的量 B.反映总体统计特征的量 C.是根据总体中的全部数据计算出的统计指标 D.是用参数估计出来的量 E.是由样本数据计算出来的统计指标 6.下列关于概率的说法，错误的是 A.通常用 P 表示 B.大小在 0～1 之间 C.某事件发生的频率即概率 D.在实际工作中，概率是难以获得的 E.某事件发生的概率 P0.05 时，称为小概率事件。 7.减少抽样误差的有效途径是 A.避免系统误差 B.控制随机测量误差 C.增大样本含量 D.减少样本含量 E.以上都不对二、定量资料的统计描述 1．用均数和标准差能用于全面描述下列哪种资料的特征 A.正偏态分布 B.负偏态分布 C.正态分布 D.对数正态分布 E.任意分布 2．当各观察值呈倍数变 1 / 13

医学统计学试题和答案解析

第一套试卷及参考答案一、选择题 (4０分） 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式Ｂ负偏态分布 C 正偏态分布Ｄ正态分布与近似正态分布 3、要评价某市一名５岁男孩得身高就是否偏高或偏矮，其统计方法就是( A ） A 用该市五岁男孩得身高得９5%或９9%正常值范围来评价Ｂ用身高差别得假设检验来评价Ｃ用身高均数得9５％或９９%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（ A ) Ａ变异系数 B 方差Ｃ标准差 D 四分位间距５、产生均数有抽样误差得根本原因就是（ A ) A、个体差异Ｂ、群体差异Ｃ、样本均数不同Ｄ、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为（ A ）（A)相对比（B) 构成比（C)定基比 (D)率 7、统计推断得内容为（ D ) A、用样本指标估计相应得总体指标Ｂ、检验统计上得“检验假设”C、A与Ｂ均不就是Ｄ、Ａ与Ｂ均就是 8、两样本均数比较用t检验，其目得就是检验（ C ) Ａ两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本，样本含量分别为n1与n２，在进行成组设计资料得ｔ检验时,自由度就是（ D ） (A） n1+ n2 (B) n1+ n2–１（C) n1＋ n2 +1 (D）n1+ ｎ2-２ 10、标准误反映（ A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得（Ｃ） A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小Ｄ纵向距离最小１2、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为ｔr,对回归系数检验得ｔ值为ｔb,二者之间具有什么关系？（Ｃ) A t r>t b B t r〈t b C t r= tｂ D二者大小关系不能肯定 13、设配对资料得变量值为x１与x2,则配对资料得秩与检验（D ) A分别按ｘ1与x2从小到大编秩Ｂ把x１与x2综合从小到大编秩Ｃ把x１与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、０5，ν可认为( A ) Ａ各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同Ｄ各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原，其中甲年级调查3５人，阳性人数4人；乙年级调查40人,阳性人数８人。该资料宜选用得统计方法为（ A ） A.四格表检验 B、四格表校正检验 C t检验 D U检验 1６、为调查我国城市女婴出生体重：北方n1=5385，均数为3、０8kg,标准差为0、５3kｇ；南方n２=4８96,均数为3、1０ｋg,标准差为０、34kｇ,经统计学检验，p=0、０034〈0、０1,这意味着( D )

统计学基本概念

基本概念 1、统计的含义：统计工作、统计资料、统计学 2、社会经济统计学的特点：数量性、社会性、综合性 3、统计工作的职能：统计信息职能、统计咨询职能、统计监督职能 4、统计工作过程：统计调查、统计整理、统计分析 5、统计调查的质量要求：准确性、全面性、及时性、有效性 6、专门调查的方法：普查、重点调查、典型调查、抽样调查 7、统计调查的方法：直接观察法、报告法、采访法、通讯法、实验调查法、网上调查法 8、次数分布的主要类型：钟型分布、U型分布、J型分布 9、统计表的结构，从组成要素看，由总标题、横行与纵栏标题、指标数值等三部分组成 10、统计表的结构，从内容上看，由主词、宾词两部分构成 11、统计分析方法：综合指标、动态数列、统计指数、相关回归、抽样推断 12、综合指标从它的作用和方法特点的角度可概括为三类：总量指标、相对指标、平均指标 13、相对指标的种类：计划完成相对指标、结构相对指标、比例相对指标、比较相对指标、强度相对指标、动态相对指标 14、平均指标的种类：算术平均数、调和平均数、几何平均数、众数、中位数 15、测定标志变动度的主要方法：全距、四分位差、平均差、标准差、离散系数 16、动态数列按构成其指标数值的性质不同分为：绝对数动态数列、相对数动态数列、平均数动态数列

17、动态数列的水平分析指标：发展水平、平均发展水平、增长量、平均增长量 18、动态数列的速度分析指标：发展速度、增长速度、平均发展速度、平均增长速度 19、测定长期趋势常用的主要方法：间隔扩大法、移动平均法、最小平方法 20、指数按其反映指标性质不同分为：数量指标指数和质量指标指数 21、指数按其表现形式不同分为：综合指数、平均指数、平均指标对比指数 22、相关关系按其方向不同分为:正相关和负相关 23、相关关系按其涉及因素多少分为：单相关和复相关 24、相关关系按其形式不同分为：直线相关和曲线相关 25、抽样调查的组织形式：简单随机抽样、类型抽样、等距抽样、整群抽样、多阶段抽样 26、总体参数的抽样估计方法为点估计和区间估计。统计分析 1．某市某“五年计划”规定计划期最末一年甲产品产量应达到75万吨，假定每天产量相等，实际生产情况如下表所示（单位：万吨）。试计算该市甲产品产量五年计划完成程度和提前完成计划的时间。第一年第二年第三年 56 58 62 第四年一季二季三季四季 16 17 18 18 第五年一季二季三季四季 19 19 20 23

医学统计学基本概念

习题-医学统计学基本概念选择题： 1. 若以舒张期血压大于等于1 2.7kPa 为为高血压，调查某地1000 人，记录每人是否患有高血压。最后清点结果，其中有10 名高血压患者，有990 名非高血压患者。（） A.这是计量数据 B.这是等级数据 C.还看不出是记数还是计量数据 D.这是连续型数据 E.这是计数数据 2、统计学中所说的样本是指（） A.随意抽取的总体中任意的部分 B.有意识的选择总体中的典型部分 C.依照研究者要求选取总体中有意义的一部分 D.依照随机原则抽取总体中有代表性的一部分 E.按研究目的随意抽取有代表性的一部分 3、下列资料属等级资料的是（） A.白细胞计数 B.住院天数 C.门、急症就诊人数 D.病人的病情分级（轻、中、重） E.疾病疗效（有效、无效） 4、总体是由（） A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 E.观察单位组成 5、抽样的目的是（） A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体参数 E.研究样本特征 6、参数是（） A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 E.参考值范围 7、关于随机抽样，下列哪一项说法是正确的（） A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体，以使样本更能代表总体 C.随机抽样即随意抽样个体 D.为确保样本具有更好的代表性，样本量应越大越好 E.以上均不对 8、统计工作各个步骤的首要基础是（） A.收集资料 B.整理资料 C.核对资料 D.分析资料 E.医学研究设计 9、统计工作的基本步骤是：() A.调查资料、核对资料、整理资料 B调查资料、归纳资料、整理资料 C收集资料、核对资料、整理资料

医学统计学试题及答案

《医学统计学》课程考试试题（A卷）（评卷总分：100分，考试时间：120分钟，考核方式：□开卷 V 闭卷）一、选择题（每题1分，共62分，只选一个正确答案） 1、医学科研设计包括（ D ） A．物力和财力设计 B．数据与方法设计 C．理论和资料设计 D．专业与统计设计 2、医学统计资料的分析包括（ D ） A．数据分析与结果分析 B．资料分析与统计分析 C．变量分析与变量值分析 D．统计描述与统计推断 3、医学资料的同质性指的是（ D ） A．个体之间没有差异 B．对比组间没有差异 C．变量值之间没有差异 D．研究事物存在的共性 4、离散型定量变量的测量值指的是（ D ） A．可取某区间内的任何值 B、可取某区间内的个别值 C．测量值只取小数的情况 D．测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是（ A ） A．无序二分类变量 B、定量变量． C．等级变量 D．无序多分类变量 6、计量资料编制频数表时，组距的选择（ D ） A．越大越好 B．越小越好 C．与变量值的个数无关 D．与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选（ D ）A．极差 B．方差 C．标准差 D．变异系数 8、若要用方差描述一组资料的离散趋势，对资料的要求是（ D ）A．未知分布类型的资料 B．等级资料 C．呈倍数关系的资料 D．正态分布资料 9、频数分布两端没有超限值时，描述其集中趋势的指标也可用（ D ） A．标准差 B．几何均数 C．相关系数 D．中位数 10、医学统计工作的步骤是（ A ） A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析，统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法，其正确的是（ A ） A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间（小时）分别为3, 4，5，3，2，5.5，2.5，6，6.5, 7,其中位数是（ B ） A．4 B．4.5 C．3 D．2 13、调查一组正常成年女性的血红蛋白，如果资料属于正态分布，描

医学统计学最佳选择题

医学统计学最佳选择题一、绪论 1、下面的变量中,属于分类变量的就是 A、脉搏 B、血型 C、肺活量 D、红细胞计数 E、血压 2、下面的变量中,属于数值变量的就是 A、性别 B、体重 C、血型 D、职业 E、民族 3、下列有关个人基本信息的指标,其中属于有序分类变量的就是 A、学历 B、民族 C、职业 D、血型 E、身高 4、若要通过样本作统计推断,样本应就是 A、总体中典型的一部分 B、总体中任意部分 C、总体中随机抽取的一部分 D、总体中选取的有意义的一部分 E、总体中信息明确的一部分 5、统计量就是指 A、就是统计总体数据得到的量 B、反映总体统计特征的量 C、就是根据总体中的全部数据计算出的统计指标 D、就是用参数估计出来的量 E、就是由样本数据计算出来的统计指标 6、下列关于概率的说法,错误的就是 A、通常用P表示

B、大小在0～1之间 C、某事件发生的频率即概率 D、在实际工作中,概率就是难以获得的 E、某事件发生的概率P≤0、05时,称为小概率事件。 7、减少抽样误差的有效途径就是 A、避免系统误差 B、控制随机测量误差 C、增大样本含量 D、减少样本含量 E、以上都不对二、定量资料的统计描述 1.用均数与标准差能用于全面描述下列哪种资料的特征 A、正偏态分布 B、负偏态分布 C、正态分布 D、对数正态分布 E、任意分布 2.当各观察值呈倍数变化(等比关系)时,平均数宜用 A、均数 B、几何均数 C、中位数 D、相对数 E、四分位数间距 3、某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标就是 A、M B、G C、X D、P95 E、CV 4、对于正态分布的资料 ,理论上 A、均数比中位数大

医学统计学考试重点整理

一、基本概念 1.总体与样本总体：所有同质观察单位某种观察值（即变量值）的全体样本：是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查普查：就是全面调查，即调查目标总体中全部观察对象抽样调查：是一种非全面调查，即从总体中抽取一定数量的观察单位组成样本，对样本进行调查 3.参数与统计量参数：总体的某些数值特征统计量：根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误（ɑ错误）: H0为真时却被拒绝，弃真错误 Ⅱ型错误（β错误）: H0为假时却被接受，取伪错误 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义:①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示为S x =S/√n ㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π（1-π）/n

临床研究常用统计方法概述

临床研究常用统计方法概述金雪娟周俊时智英葛均波 (复旦大学附属中山医院，上海市心血管病研究所，上海200032) 经过周密设计和科学实施的临床研究还需要规范的数据管理和统计分析，才能得到可靠的结论。随着计算机技术和统计分析软件发展，近年来，统计理论和方法发展非常迅速。临床医师日常繁忙的工作使得他们很少有时间系统学习医学统计理论，及时了解一些实用、有效的新方法。在此，我们介绍目前临床研究最常用的一些统计分析方法，以实用、易懂为原则，重点综述各种方法的适用条件。 1 几个基本概念和统计量 1.1 数据的类型数据(Data)是统计分析的基础。统计分析方法的选择取决于不同的数据类型。最常见的数据类型有两种，分类数据(Categorical Data)或称定性数据(Qualitative Data)和定量数据(Qulantitative Data) 或称计量数据(Numerical Data)。分类数据类型：分类数据的分层大于2时，又称为多分类数据(Polytomous Data)。分类数据类型有无序(Nominal Categorial)和有序(Ordinal Categorieal)。无序数据如性别(男、女)、血型(A、B、O、AB 型)等。有序数据如肿瘤的分级(I级、II级、III级)、疼痛的程度(轻、中、重)等，以及在临床研究设计中，经常看到的“非常好、好、一般、差”这样的数据类型。不同类型的分类数据在统计分析方法上也不同，并不是大家所熟悉的x2检验所能全部涵盖的。定量数据类型：包括连续性数据(Continuous Data)，如身高、体重以及不连续性数据(Discrete Data)，如妇女的产次，疾病的复发次数等。 1.2 常用的描述性统计量最常用的描述集中趋势的统计量为算术均数(Arithmetic Mean)，但其值易受极端值影响。可以采用中位数(Median)、修整均数（Trimmed Mean，去除最大和最小值后的算术均数）或Winsorized均数（Winsorized Mean，极端值用最接近的非极端值替代后的算术均数）来代替。对于数值呈几何分布的资料，则可采用几何均数(Geometric Mean)。临床研究论文中常采用均数±标准差或均数±标准误来表示定量数据的分布特征。标准差(Standard Deviation)为方差(Variance)的平方根，表示个体数值与样本均数间的离散程度；标准误(Standard Error)为均数的标准差，表示样本统计量与总体参数间的离散程度，标准误越小，总体均数的95%可信区间(confident interval，CI)越窄，也就是说样本均数对总体均数的代表性越好。虽然不同的统计学家对论文中应该引用哪种表达方式有争议，但两种方式均用于描述正态分布的计量数据。在医学论文中，采用标准差或标准误应该说明。对于非对称数据只用均数±标准差或标准误表达是不恰当的，可以采用中位数结合四分位数间距(Inter-quartile Range)表示。 1.3 显著性水平(a)和P值

医学统计学最佳选择题

医学统计学最佳选择一、绪论 1. 下面的变量中，属于分类变量的是 A. 脉搏 B. 血型 C. 肺活量 D. 红细胞计数 E. 血压 2. 下面的变量中，属于数值变量的是 A. 性别 B. 体重 C. 血型 D. 职业 E. 民族 3. 下列有关个人基本信息的指标，其中属于有序分类变量的是 A. 学历 B. 民族 C. 职业 D. 血型 E. 身高 4. 若要通过样本作统计推断，样本应是 A. 总体中典型的一部分 B. 总体中任意部分 C. 总体中随机抽取的一部分 D. 总体中选取的有意义的一部分 E. 总体中信息明确的一部分 5. 统计量是指

A. 是统计总体数据得到的量 B. 反映总体统计特征的量 C. 是根据总体中的全部数据计算出的统计指标 D. 是用参数估计出来的量 E. 是由样本数据计算出来的统计指标 6. 下列关于概率的说法，错误的是 A. 通常用P 表示 B. 大小在0?1之间 C .某事件发生的频率即概率 D. 在实际工作中，概率是难以获得的 E. 某事件发生的概率P< 0.05时，称为小概率事件。 7. 减少抽样误差的有效途径是 A. 避免系统误差 B. 控制随机测量误差 C. 增大样本含量 D. 减少样本含量

E. 以上都不对二、定量资料的统计描述 1用均数和标准差能用于全面描述下列哪种资料的特征 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D.对数正态分布 E. 任意分布 2. 当各观察值呈倍数变化（等比关系）时，平均数宜用 A.均数 B.几何均数 C.中位数 D.相对数 E.四分位数间距 3. 某医学资料数据大的一端没有确定数值，描述其集中趋势适用的统计指标是 A. M B. G C. X D. P95 E. CV 4. 对于正态分布的资料，理论上 A.均数比中位数大 B. 均数比中位数小 C. 均数等于中位数 D. 均数与中位数无法确定孰大孰小 E. 以上说法均不准确 5. 当资料两端含有不确定值时，描述其变异度宜采用

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法，错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中，概率是难以获得的 E. 某事件发生的概率很小，在单次研究或观察中时，称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中，属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标，其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法，不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言，参数难以测定，仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中，总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。答：当某事件发生的概率很小，习惯上认为小于或等于0.05时，统计学上称该事件为小概率事件，其含义是该事件发生的可能性很小，进而认为它在一次抽样中不可能发生，这就是所谓小概率事件原理，它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答：某项研究通常想知道关于总体的某些数值特征，这些数值特征称为参数，如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量，如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的，而参数是他们想知道的。一般情况下，这些参数是难以测定的，仅能根据样本估计。显然，只有当样本代表了总体时，根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念答：研究人员通常需要了解和研究某一类个体，这个类就是总体。总体是根据研究目的所确定的观察单位的集合，通常有无限总体和有限总体之分，前者指总体中的个体数是无限的，如研究药物疗效，某病患者就是无限总体，后者指总体中的个体数是有限的，它是指特定时间、空间中有限个研究个体。但是，研究整个总体一般并不实际，通常能研究的只是它的一部分，这个部分就是样本。例如在一项关于2007

统计学基本概念

日志吕品吕品的日志当前日志返回日志首页? 较新一篇/ 较旧一篇分享 1. 统计学：收集处理分析解释数据并从数据中得出结论的科学。 2. 描述统计：研究数据收集处理汇总图表描述概括与分析等统计方法。 3. 推断统计：研究如何利用样本数据来推断总体特征的统计方法。 4. 分类数据：只能归于某一类别的非数字型数据。 5. 顺序数... 如果你也考统计学~~~~~网上搜索到的统计学基本概念~~~~~ 2011-05-28 12:06 | (分类:默认分类) 1. 统计学：收集处理分析解释数据并从数据中得出结论的科学。 2. 描述统计：研究数据收集处理汇总图表描述概括与分析等统计方法。 3. 推断统计：研究如何利用样本数据来推断总体特征的统计方法。 4. 分类数据：只能归于某一类别的非数字型数据。

5. 顺序数据：只能归于某一有序类别的非数字型数据。 6. 数值型数据：按数字尺度测量的观察值。 7. 观测数据：通过调查或观测而收集到的数据。 8. 实验数据：在实验中控制实验对象而收集到的数据。 9. 截面数据：在相同或近似相同的时间点上收集的数据。 10. 时间序列数据：在不同时间上收集到的数据，这类数据按时间顺序收集到的。 11. 抽样调查：从总体中随机抽取一部分单位作为样本进行调查，根据样本调查结果来推断总体特征的数据收集方法。

12. 普查：为特定目的而专门组织的全面调查。 13. 总体：包含所研究的全部个体（数据）的集合。 14. 样本：从总体中抽取的一部分元素的集合。 15. 样本容量：也称样本量，是构成样本的元素数目。 16. 参数：用来描述总体特征的概括性数字度量。 17. 统计量：用来描述样本特征的概括性数字度量。 18. 变量：说明现象某种特征的概念。 19. 分类变量：说明事物类别的一个名称。 20. 顺序变量：说明事物有序类别的一个名称。

临床科研设计报告书的撰写~final

临床医学研究项目申报书的撰写第一节概述一、科学研究的基本程序二、临床科研类型三、科研项目申请前的准备第二节研究设计报告书的基本内容与撰写方法一、项目名称及摘要二、立项依据三、研究目标、研究内容及拟解决的关键科学问题四、研究方案与可行性分析五、项目的特色与创新之处六、年度研究计划及预期研究结果七、研究基础与研究团队介绍八、医学伦理学问题九、经费预算十、对照检查提纲科学研究的本质是创造知识，从事新知识的生产，因此科学研究工作是一种非常复杂的、难度较高的脑力劳动，它具有继承性、创造性、探索性等基本特点。临床医学是一门理论进展快且实践性强的学科，临床医学科学研究对推动临床医学发展的作用越来越明显。如何做好临床医学的科学研究，提升临床医学在疾病诊治、预后、病因学等方面的研究水平，是每一位临床医生和临床医学学生面临的挑战。因此，在了解临床医学科学研究的种类及研究基本程序的基础上，掌握临床医学研究项目申报书要领，撰写出高质量的申报书，是医院学术水平和研究能力的反应，是学科发展的标志，也是每一位临床医学工作者基本素质的体现。

第一节概述一、科学研究的基本程序科学研究的全过程包括提出问题、验证假说和得出结论。其基本程序及主要步骤包括，查阅文献、提出临床医学科学问题、凝练科学问题、提出科学假说、制定研究计划及设计研究方案，撰写项目申报书，获得项目的资助，实验观察或调查、研究资料的整理与数据处理、总结分析、归纳研究结论、撰写研究报告及其推广应用等。二、临床科研类型要撰写高质量的临床医学研究项目申报书，首先要了解临床科研类型，按临床医学科学研究的任务来源、科技活动类型及研究内容可归纳为以下几方面。按任务来源分类可分为纵向科研任务、横向科研任务及自由选题项目。 1.纵向科研任务是指各级政府主管部门下达的课题及项目，包括国家自然科学基金委员会设立的各类科学研究基金，政府管理部门科研基金，如科技部卫生部的科学研究基金，以及单位科研基金。 2.横向科研任务是以横向科技合同为依据的，它主要由企业、事业单位及其它机构委托进行，研究经费一般由委托单位提供。 3.自由选题是根据学科发展和科技人员的专长，结合医疗卫生工作的实际需要由科技人员自己提出的研究课题。按科技活动类型分类，有基础研究、应用研究及发展研究。 1.基础研究是以认识自然现象，探索自然规律为目的，没有或者只有笼统的社会应用设想的研究活动。 2.应用研究主要针对某个特定的有实际应用价值的目标开展的研究。 3.发展研究也称开发研究，是运用基础研究和应用研究的知识，推广新材料、新产品、新设计、新流程和新方法，或对之进行重大的、实质性改进的创造活动。三、科研项目申请前的准备 1.文献调研文献查阅是课题选择的前提，是产生或形成临床医学科学问题假设的前提，通过文献查阅，了解本学科的整体发展水平，当前学科研究的热

医学统计学试题和答案.doc

医学统计学试题和答案

（一）单项选择题 3．抽样的目的是（ b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C．研究典型案例研究误差 4．参数是指（ b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（a）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A. 均数不变，标准差改变 B. 均数改变，标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用（a ）。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中（d）可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用（c）描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后，（b）不变。 A．算术均数 B. 标准差 C. 几何均数 D.中位数 11.（ a）分布的资料，均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料，可用（ c ）描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.（ c）小，表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是（c ）。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体，具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值，描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比，其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布，其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A ．比较不同计量指标的变异程度 2. 对于近似正态分布的资料，描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4．应用百分位数法估计参考值范围的条件是B ．数据服从偏态分布 5．已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布，描述其个体差异的统计指标应使用 E ．四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ～9.1×109 /L ，其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差，应该使用的方法是 E.增加样本含量 5．两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料

医学统计学试题及答案

第一套试卷及参考答案一、选择题（40分） 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制（ B ） A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式Ｂ负偏态分布Ｃ正偏态分布Ｄ正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮，其统计方法是（A ） A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（A ） A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是（ A ） A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍，该指标为（A ）（A）相对比（B）构成比（C）定基比（D）率 7、统计推断的内容为（ D ） A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验，其目的是检验（ C ） A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本，样本含量分别为n1和n2，在进行成组设计资料的t检验时，自由度是（D ）（A）n1+ n2（B）n1+ n2–1 （C）n1+ n2 +1 （D）n1+ n2 -2 10、标准误反映（A ） A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) Ａ垂直距离的平方和最小Ｂ垂直距离最小Ｃ纵向距离的平方和最小Ｄ纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r，对回归系数检验的t值为t b，二者之间具有什么关系？（C） A t r>t b B t rχ20.05,ν可认为（A ） A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原，其中甲年级调查35人，阳性人数4人；乙年级调查40人，阳性人数8人。该资料宜选用的统计方法为（ A ） A．四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重：北方n1=5385，均数为3.08kg，标准差为0.53kg；南方n2=4896，均数为3.10kg，标准差为0.34kg，经统计学检验，p=0.0034<0.01，这意味着（D ） A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

(完整word版)医学统计学试题和答案

（一）单项选择题 3．抽样的目的是（b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 C．研究典型案例研究误差 D. 研究总体统计量 4．参数是指（b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变 B.均数改变，标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a ）。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中（d）可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用（c）描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（b）不变。 A．算术均数 B.标准差 C.几何均数 D.中位数 11.（ a ）分布的资料，均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料，可用（ c ）描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.（ c ）小，表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是（ c ）。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学总复习练习题(含答案)

一、最佳选择题 1．卫生统计工作的步骤为C A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2．统计分析的主要内容有D A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3．统计资料的类型包括E A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4．抽样误差是指B A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指B

A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6．描述一组偏态分布资料的变异度，宜用D A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差 7．用均数与标准差可全面描述其资料分布特点的是C A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8．比较身高和体重两组数据变异度大小宜采用A A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9．频数分布的两个重要特征是C A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10．正态分布的特点有B A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11．正态分布曲线下右侧5％对应的分位点为D

医学统计学试题及其答案

l．统计中所说的总体是指： A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2．概率P=0，则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3．抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4．测量身高、体重等指标的原始资料叫： B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5．某种新疗法治疗某病患者41人，治疗结果如下：治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是： D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6．样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7．将计量资料制作成频数表的过程，属于统计工作哪个基本步骤：C A统计设计B收集资料C整理资料D分析资料E以上均不对8．统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9．良好的实验设计，能减少人力、物力，提高实验效率；还有助于消除或减少： B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10．以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对第八章数值变量资料的统计描述11．表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12．某计量资料的分布性质未明，要计算集中趋势指标，宜选择 C A X B G C M D S E C V 13．各观察值均加（或减）同一数后： B A均数不变，标准差改变B均数改变，标准差不变 C两者均不变D两者均改变E以上均不对14．某厂发生食物中毒，9名患者潜伏期分别为：16、2、6、3、30、2、l O、2、24+(小时)，问该食物中毒的平均潜伏期为多少小时 C A5B5．5C6D10E1 2