当前位置:文档之家› 中南大学研究生医学统计学

中南大学研究生医学统计学

中南大学研究生医学统计学
中南大学研究生医学统计学

统计描述:指选用恰当的指标,通常称为统计量,选用合适的统计表与统计图,对资料的数量特征及其分布规律进行测定和描述。包括搜集数据、整理数据、总结数据、分析数据以及将数据呈现出来

统计推断:指如何在一定的可信度下由样本信息统计指标来推断总体相应指标,又称参数估计。包括进行推测、假设检验、确定关系然后作出预测

小概率事件:统计分析中的很多结论都是基于一定可信程度下的概率推断,习惯上将P<=0.05称为小概率事件,表示一次实验或观察中该事件发生的可能很小,可以视为可能不发生。

算术均数:简称均数可用于反映一组呈对称分布的变量值在数量上的平均水平或者说是集中位置的特征值。

几何均数(geometric mean):可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。

适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料

中位数(median):是将变量值从小到大排列,位置居于中间的那个变量值。符号为Md,反映一批观察值在位次上的平均水平。适用于:1、各种分布类型的资料2、特别是偏态分布资料和开囗资料(一端或两端无确切数值的资料)。 3、资料分布不明等

百分位数:将一组数据从大到小按顺序排列起来,并计算相应的累计百分位(频率)。那某一百分位所对应的数据变量值就叫这一百分位的百分位数百分位数的应用:确定医学参考值范围;中位数Md与四分位半间距QD一起使用,描述偏态分布资料的特征

百分位数:数据从小到大排列;在百分尺度下,所占百分比对应的值。记为Px。包括直接算法和频数表法

应用:1.确定医学参考值范围(reference range):如95%参考值范围=P97.5-P2.5;表示有95%正常个体的测量值在此范围。2.中位数Md与四分位半间距QD一起使用,描述偏态分布资料的特征

方差(variance)也称均方差(mean square deviation),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。

标准差(standard deviation)即方差的正平方根;其单位与原变量X的单位相同。

自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度

变异系数:多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。

医学参考值(reference value)是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标常数,也称正常值。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故采用医学参考值范围(medical reference range)作为判定正常和异常的参考标准。

95%可信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括μ(估计正确),只有5个可信区间不包括μ(估计错误)。

假设检验过去称显著性检验:它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。

检验水准α,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取α = 0.05。可根据不同研究目的给予不同设置。

P的含义是指从H0规定的总体随机抽样,抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量(如t、u等)值的概率。

I 型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是α(其值等于检验

水准)

II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是β(其值未知)完全随机设计:是采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。

组间变异:各处理组由于接受处理的水平不同,各组的样本均数(i=1,2,…,g)也大小不等,这种变

异称为组间变异。其大小可用各组均数与总均数的离均差平方和表示,记为SS 组间

组内变异:在同一处理组中,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异(误差)。组内变异可用组内各测量值Xij 与其所在组的均数的差值的平方和表示,记为SS 组内, 表示随机误差的影响。

随机区组设计(randomized block design)又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组

动态数列(dynamic series):是一系列按时间顺序排列起来的统计指标(可以为绝对数,相对数或平均数),用以观察和比较该事物在时间上的变化和发展趋势。

绝对增长量;是说明事物在一定时期增长的绝对值。

发展速度与增长速度:均为相对比,说明事物在一定时期的速度变化。发展速度表示报告期指标的水平相当于基期水平的百分之多少或若干倍,

平均发展速度;是各环比发展速度的几何平均数,说明某事物在一个较长时期中逐期(如逐年)平均发展的程度。

平均增长速度;是各环比增长速度的平均数,说明某事物在一个较长时期中逐期平均增长的程度。

b 的意义: 回归系数b 称为斜率(slope),其统计学意义是:X 每增加(减)一个单位,Y 平均改变b 个单位。 残差(residual)或剩余值,即实测值Y 与假定回归线上的估计值Y 的纵向距离。

直线相关系数(correlation coefficient ),Pearson 积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。

统计图:指利用点的位置、线段的升降、直条的长短和面积的大小等各种几何图形来表达统计资料。统计图只能提供概略的情况,而不能获得确切数值,因此不能完全代替统计表,常需要同时列出统计表作为统计图的数值依据

百分条图:是以矩形总长度作为100%,将其分割成不同长度的段表示各构成的比例。圆图和百分条图适合描述分类变量的各类别所占的构成比。百分条图以总长度L 为100%,将长度L 乘以各类别的构成比(%)得到各构成的长度,由大到小或按类别的自然顺序依次排列,其它项放最后。

箱式图(box plot):使用5个统计量反映原始数据的分布特征,即数据分布中心位置、分布、偏度、变异范围和异常值。箱式图的箱子两端分别是上、下四分位数,中间是中位数,两端连线分别是除异常值之外的最小与最大值。箱子越长数据变异程度越大,中间横线在箱子中点表明分布对称,否则不对称。箱式图特别适合多组数据分布的比较。

二项分布(binomial distribution )是指在只会产生两种可能结果如“阳性”或“阴性”之一的n 次独立重复试验中,当每次试验的“阳性”概率π保持不变时,出现“阳性”次数X=0,1,2,…,n 的一种概率分布。记作:X ~B(n ,π) 。概率可以由下边公式求出:

X=0,1,2,3、、、,n

Poisson 分布:(Poisson distribution )作为二项分布的一种极限情况,已发展成为描述小概率事件发生规律性的一种重要分布。Poisson 分布是描述单位面积、体积、时间、人群等内稀有事件(或罕见事件)发生数的分布。

所谓随机变量X 服从Poisson 分布,是指在足够多的n 次独立Bernoulli 试验中,取值X 的概率为

非参数检验 针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布式连续型的或是离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计() 0,1,2,!X

e P X X X λλ-==???!()(1)

!()!X n X

n P X X n X ππ-=--

分析方法。由于这类方法不受总体参数的限制,故称为非参数统计,或称为不拘分布的统计分析方法,又称为无分布型式假定的统计分析方法。适于处理总体分布不易确定或未知;分布非正态但无合适转换方法;有一端或两端有不确定数值(如<0.1, >15.0) 的资料;等级资料等。

参数检验 通常要求样本来自总体分布类型已知(正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数检验。例如,均数的区间估计;t 检验/u 检验,F 检验。

“球对称”假设 : 满足“球对称”假设,可用第四章随机区组方差分析比较处理组间差异;若不满足“球对称”假设,亦可用随机区组方差分析,但需校正时间效应F 界值的自由度。

单变量分析:研究单个变量的数量特征,推断两个或多个总体参数的差别。

双变量分析:研究两个变量的数量依存(或依赖)关系或互依(或相关)关系。

多变量分析:研究多个变量的数量依存(或依赖)关系或互依(或相关)关系。

单独效应:指其他因素的水平固定时,同一因素不同水平间的差别

主效应: 指某一因素各水平间的平均差别

交互作用:当某因素的各个单独效应随另一因素变化而变化时,则称这两个因素间存在交互作用。

正交试验:非全面组合,g 个处理组是各因素 各水平的部分组合,即析因设计 的部分实施。优点:减少试验次数缺点:牺牲分析各因素部分交互作用 b 0为截距:表示各自变量均为0时y 的的估计值。

bi 称为偏回归系数,是βi 的估计值,表示当方程中其他自变量保持不变时,自变量Xi 变化一个计量单位,反应变量Y 的平均变化量。

b 称为 X =(X 1, X 2, ?, Xm )时,反应变量Y 的估计值。

e 是去除m 个自变量对Y 影响后的随机误差(残差

偏相关系数:扣除其他变量的影响后,变量Y 与Xi 的相关, 称为Y 与Xi 的偏相关系数。

优势比OR (odds ratio) 流行病学衡量危险因素作用大小的比数比例指标。计算公式为:

优势比估计:可反映某一因素两个不同水平(c 1,c 0)的优势比:

logistic 回归:是一个概率型模型,因此可以利用它预测某事件发生的概率。例如在临床上可以根据患者

的一些检查指标,判断患某种疾病的概率有多大。 综合评价:利用多项指标对某个评价对象的某种属性进行定性、定量评估,或者对多个评价对象的属性进行定性、定量评估,可对优劣顺序排序

多元回归与逐步回归法:多元回归分析挑选标准化偏回归系数绝对值较大或偏回归系数假设检验有显著性的指标作为评价指标;逐步回归有自动挑选主要影响指标的功能,是目前最常用的指标挑选方法。 指标聚类法:在存在众多指标的情况下,可将相似指标聚成类,再从每类中找一个典型指标作为代表,从而用少量几个典型指标作为评价指标来代表原来众多的指标建立评价模型。

层次分析法(Analytic Hierarchy Process,简称AHP):由美国科学家T.L.Saaty 于20世纪70年代提出,是用系统分析的方法,对评价对象依评价目的所确定的总评价目标进行连续性分解,得到各级(各层)评价目标,并以最下层指标作为衡量目标达到程度的评价指标。然后依据这些指标计算出一综合评分指数对评价对象的总评价目标进行评价,依其大小来确定评价对象的优劣等级。

秩和比(Rank Sum Ratio ,RSR )指行(或列)秩次的平均值,是一个非参数统计量,具有0~1连续变量的特征。在综合评价中,秩和比综合了多项评价指标的信息,表明多个评价指标的综合水平, RSR 值越大越优。

重复测量设计 :当前后测量设计的重复测量次数m ≥3时,称重复测量设计或重复测量数据。 判别分析:在已知分为若干个类的前提下,获得判别模型,并用来判定观察对象的归属。

聚类分析:将随机现象归类的统计学方法,在不知道应分多少类合适的情况下,试图借助数理统计的方法用已收集到的资料找出研究对象的适当归类方法。已成为发掘海量基因信息的首选工具。

1100/(1)

/(1)

j P P OR P P -=-)](exp[?01c c b R O j j -=

R型聚类: 又称指标聚类,是指将m个指标归类的方法,其目的是将指标降维从而选择有代表性的指标。Q型聚类:又称样品聚类,是指将n个样品归类的方法,其目的是找出样品间的共性。

非参数检验针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布式连续型的或是离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称为非参数统计,或称为不拘分布的统计分析方法,又称为无分布型式假定的统计分析方法。适于处理总体分布不易确定或未知;分布非正态但无合适转换方法;有一端或两端有不确定数值(如<0.1, >15.0)的资料;等级资料等。

参数检验:通常要求样本来自总体分布类型已知(正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数检验。例如,均数的区间估计;t检验/u检验,F检验。

完全数据:一部分研究对象可观察到死亡,从而得到准确的生存时间,所提供的信息是完全的

不完全数据:亦称截尾数据:一部分病人,或中途失访,或到观察结束时仍存活,对这部分病人无法知道准确的生存时间,只知道其生存时间比观察到的时间要长,它提供不完全的信息,称为不完全数据,亦称截尾数据

生存时间:生存时间(survival time)是任何两个有联系事件之间的时间间隔,常用符号t表示。狭义的生存时间常指患某种疾病的病人从发病到死亡所经历的时间跨度,广义的生存时间定义为从某种起始事件到终点事件所经历的时间跨度。

生存函数:生存函数(survival function)又称为累积生存率,简称生存率。表示具有协变量X的观察对象其生存时间T大于时间t的概率,常用),

P

T

S>

=表示。

t

(

X t

)

,(X

死亡概率:表示一个观察对象从开始观察到时间t为止的死亡概率,它是一个随时间上升的函数:F(t,X)=P(T

Cox模型与logistic回归模型有何不同?

Cox模型与logistic回归分析具有相似之处,即在估计出回归系数后可以得到协变量对应的相对危险度。但logistic回归模型是一种概率模型,只考虑了事件是否发生,而不考虑事件发生所需要的时间长短。Cox 模型不仅考虑了事件发生的结果,同时也利用了生存时间提供的信息,因此其效率较高。

叙述Fisher判别准则和Bayes判别准则。

答:Fisher判别准则:找出一个线性组合Z=C1X1+C2X2+…+C m X m使得综合指标Z在A类的均数与在B类的均数的差异尽可能大,而两类内综合指标Z的变异尽可能小,即使达到最大。Bayes判别准则:寻求一种判别规则使得属于第k类的样品,在第k类中取得最大的后验概率。

何为多重共线性?它对资料分析有何影响?

所谓多重共线性是指多元回归中一些自变量之间存在较强的线性关系,这种情况在实际应用中非常普遍,如研究高血压与年龄、吸烟年限、饮白酒年限等因素的关系,这些自变量通常是相关的,如果这种相关程度非常高,所得到的回归方程可能非常不可靠。如将一些很有统计学意义的自变量变得不显著,出现回归系数估计值的正负符号与客观实际不一致等问题。

层次分析法:用系统分析的方法,对评价对象依评价目的所确定的总评价目标进行连续性分解,得到各级(各层)评价目标,并以最下层指标作为衡量目标达到程度的评价指标。然后依据这些指标计算出一综合评分指数对评价对象的总评价目标进行评价,依其大小来确定评价对象的优劣等级。

Topsis法:是系统工程中有限方案多目标决策分析的一种常用方法,可用于效益评价、卫生决策和卫生事业管理等多个领域。本法对样本资料无特殊要求,使用灵活简便,故应用日趋广泛。

秩和比法:指利用RSR进行统计分析的一组方法。其基本思想是:在一个行列矩阵中,通过秩转换,获得无量纲统计量;在此基础上,运用参数统计分析的概念与方法,研究的分布;以RSR值对评价对象的优劣直接排序或分档排序。

医学统计学 研究生期末考试版.doc

一、名词解释(考10对) 1.总体;样本 总体:根据研究目的确定的、同质的全部观察单位某一指标(或某些因素及结果)的测量值总体。根据总体集合所包括元素是否有限,分为有限与无限总体。总体具有特定的分布特征及参数; 样本:以某方式按预先规定的概率从总体中随机抽取的、具有足够数量的、能够代表总体分布特征的一部分观察单位某指标数据的集合。 根据研究目的从总体中抽取部分有代表性的样本,用样本统计量推断总体参数。 2.标准差;标准误 标准差:是描述单个测量值对其均数的离散程度。标准差越大,数据的离散程度就越大,均数的代表性越差;标准差越小,均数的代表性越好。 标准误:样本统计量的标准差称为标准误,它反映样本统计量的抽样误差的大小,也反映样本统计量对总体参数的离散程度。标准误大,表示样本统计量对总体参数的代表性差;标 3、s x 96.1±;x v s t x ?±)(2/α s x 96.1±:表示从正态总体中抽样,样本含量较大时,观测值双侧95%的波动范围 x v s t x ?±)(2/α:从正态总体中抽样,样本含量较大(小)时,按照预先给定的概率a 确定的总体均值的(1—a )的可信区间。 4.计量资料(数值变量资料);计数资料(分类变量资料) 计量资料:通过度量的方法,测量每个观察单位的某项指标的量的大小而得到的一系列数据资料,其特点是多有度量单位或多为连续性资料。 计数资料:指将全体观察单位按某种属性分组,然后再分别清点各组观察单位的个数而得

到的数据资料,其特点是没有度量单位或多为非连续性资料 5.点估计;区间估计 点估计:直接利用样本统计量的一个数值来估计总体参数,比如基于一份随机样本,用x 估计u,用p估计π,用S估计σ。点估计方法简单,但未考虑抽样误差,故难以反映估计值对其真值的代表性。 区间估计:将样本统计量和标准误结合起来,按预先给定的概率(1—a)所确定的一个包含未知总体参数的范围,该范围为总体参数的置信区间(CI)。预先给定的概率(1—a)称为可信度或置信度,常取95%或99%。 6.回顾性研究;前瞻性研究 回顾性研究:即病例—对照研究,是由果到因,即先选定病例组和对照组,然后分别回顾两组过去的暴露情况,比较其差异,探索与发病相关的可能因素。回顾性研究的优点是对于患病率非常低的研究人群可获得较高的效果,研究周期较短和可以探索多个因素与患病的关联;其缺点是不能估计患病率和死亡率,容易产生回忆性偏倚和选择性偏倚。 前瞻性研究:即队列研究,是由因寻果,是将选定的人群按暴露状况分成暴露组和对照组,暴露组接触某个因素而对照组不接触某个因素,其他所有条件两组基本相同。经过一定时间随访,比较暴露组和对照组在随访期间的发病率,如果两组发病率不同,则归因于该暴露因素。前瞻性研究的优点是可以估计发病率,暴露测量可以做到无偏倚,结论比较可靠。其缺点是研究效率比较低,研究周期比较长导致在研究期间可能出现失访及各种混杂因素影响。 7、完全随机设计;随机区组设计 完全随机设计:又称为单因素设计或成组设计,是将同质的研究对象随机地分配到各处理组中进行实验观察,或从不同总体中随机抽样进行对比研究。 随机区组设计:又称配伍组设计,是在实验设计中用一个非研究因素的变量进行分层,每个层的观察对象数相等,并对每个层进行随机分组。 两种实验设计方案均为单因素实验设计。区别是:①两者观察对象随机分配方式不同;②统计分析方法不同;③误差内涵及大小不同;④检验效能不同。 8.独立性数据与重复性数据 独立性:对一群观察指标独立测定一次,形成一个群体数据,观察值间互相独立,不相互影响。 重复性:一个观察对象,同一或不同时间测定产生的数据。 9.α值;P值 α值:检验水准(显著性水准),即在假设检验中预先规定的判断小概率事件的概率尺度,通常为0.01或0.05,代表在原假设成立的前提下,拒接原假设所犯I类错误的概率。 P值:从已知总体中(或假设总体中)抽得统计量达到当前统计量这么大及比这绝对值还 H可能犯I 大的总概率,若以当前统计量为拒绝域临界点,在规定α前提下,实际欲拒绝

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

研究生医学统计学试题

试卷编号:卷课程名称:医学统计学适用专业:科学学位专业:班级 姓名:学号:学院 (系 ):考试日期:题号一二三四五六七八九十总分统分题分30152530100签名得分 考生注意事项: 1、本试卷共6 页,请查看试卷中是否有缺页或破损。如有立即举手报告以 便更换。 2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。 一、最佳选择题(每题 2 分,共 30 分) 得评阅 把每题的答案填入下表中: 123456789101112131415 A B C D B B A C C C B B C D B 1、描述一组正态分布资料的集中趋势,以指标为好。 A. 算术平均数; B. 几何平均数; C. 中位数; D. 变异系数 2、比较成人身高和儿童身高的离散趋势,宜用。 A. 标准差; B. 变异系数; C. 方差; D. 离均差平方和 3、对于正态分布资料,X +1.96S,所对应的面积占总面积的。 A. 95% ; B. 99% ; C. 47.5%; D. 49.5% 4、下列说法哪个是错误的?中位数适用于描述资料。 A. 最小组段无下限; B. 最大组段无上限; C. 偏态分布; D. 正态分布 5、大,表示用该样本均数估计总体均数的可靠性小。 A. S X; B. S; C.CV; D. Q U—Q L 6、某地 1992年随机抽取 100名健康女性,算得其血清总蛋白含量的均数为74g/L ,标准差为 4g/L ,则其 95%的可信区间为。

7、两样本均数比较的t 检验,分别取以下检验水准,以所取第二类错误最大。 A. α =0.01; B. α=0.05; C. α =0.10; D.α=0.20 8、两样本均数比较的t 检验结果, P<0.05 ,可认为。 A. 两样本均数不等; B. 两样本均数相等; C. 两总体均数不等; D. 两总体均数相等 9、完全随机设计的方差分析结果,P≤ 0.05,可认为。 A. 各样本均数不等或不全等; B. 各样本均数都不相等; C. 各总体均数不等或不全等; D. 各总体均数都不相等 10、某地某年肝炎发病人数占总人数的5%,这是该地该年肝炎的。 A. 年发病率; B. 年患病率; C. 患病构成比; D. 患者平均数 11、已知甲县人口较乙县年青,今欲比较两县死亡率的高低,适当的比较方法是。 A.将两县的总死亡率直接比较; B.对年龄进行标准化后,再比较两县总死亡率; C.将两县的总死亡率进行 t 检验后再比较; D.将两县的总死亡率进行χ2检验后再比较 12、下面哪一点不是Poisson 分布的性质。 A. λ =σ2; B. 当λ≥ 20 时,近似正态分布; C. 可加性; D. 相互影响性 13、χ2检验中理论数T 的计算式为。 A. n r (1 n c ) ; B. (1 n r ) n c; C. n r n c; D. n r n c N N N N 14、已知两组计量资料方差不齐,可用检验。 A. t 检验; B. U 检验; C. F 检验; D. 秩和检验 15、对一组既做相关分析又做回归分析的资料,有。 A. b=r ; B. t b=t r; C. b=a; D. r=1

医学统计学题库

1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0

研究生医学统计学上机试题

医学科研中的统计学方法上机试题 时间:2014-12-15 共4题,共100分 1.某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记录见下表,问左、右肾重量有无不同? 表1:20例男性尸解时左、右肾的称重记录 编号左肾(克)右肾(克) 1 170 150 2 155 145 3 140 105 4 11 5 100 5 235 222 6 125 115 7 130 120 8 145 105 9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 140 15 120 90 16 130 120 17 105 100 18 95 100 19 100 90 20 105 125 2. 在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别?

表2 各剂量组48小时部分凝血活酶时间(s) 0.5 U 1 U 2 U 3 U 36.8 40.0 32.9 33.0 34.4 35.5 37.9 30.7 34.3 36.7 30.5 35.3 35.7 39.3 31.1 32.3 33.2 40.1 34.7 37.4 31.1 36.8 37.6 39.1 34.3 33.4 40.2 33.5 29.8 38.3 38.1 36.6 35.4 38.4 32.4 32.0 31.2 39.8 35.6 33.8 3. 某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义? 4. 某省卫生防疫站对八个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘进行监测,结果如下,试检验两者有无相关? 表4 八个城市的肺癌标化死亡率和大气中苯并(a)芘浓度城市编号肺癌标化死亡率(1/10万)苯并(a)芘(μg/100m3) 1 5.600.05 2 18.50 1.17 3 16.23 1.05 4 11.400.10 5 13.800.75 6 8.130.50 7 18.000.65 8 12.10 1.20

医学统计学研究生题库汇编

医学统计学复习练习题库 研究生教材使用 一、最佳选择题 1.卫生统计工作的步骤为 A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距

E.方差 7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为 A.μ+1.96σ B.μ-1.96σ C.μ+2.58σ D.μ+1.64σ E.μ-2.58σ 12.下列哪个变量为标准正态变量 A.s x μ- B.σμ-x C. x s x μ- D.x x σμ- E. s x μ- 13.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标 (如血糖水平)的正常值范围一般指 A.该指标在所有人中的波动范围 B.该指标在所有正常人中的波动范围 C.该指标在绝大部分正常人中的波动范围 D.该指标在少部分正常人中的波动范围 E.该指标在一个人不同时间的波动范围 14.下列哪一变量服从t 分布 A. σμ-x B. σμ-x C. x x σμ- D. x s x x - E. x s x μ- 2.统计分析的主要内容有

研究生医学统计学试题

《医学统计学》试题 注:满分300分。最终成绩=总得分/3;

说明 1、试题意在考察研究生对《医学统计学》理论知识和SPSS统计软件的学习掌握情况。 2、研究生在答题过程中严禁抄袭、复印。如发现答案雷同者,该科目成绩将判为“不及格”,后果由学生自负。 3、答题时,不写具体的操作过程(如“选择Analyze→General linear Models→Univariate…,弹出Univariate对话框”)。 4、答题时,首先应明确交代某题所用的具体统计方法。 5、答题时,只将答题有关的SPSS输出结果粘贴到答案中,并且对结果要做出必要的解释;对答题无关的输出结果不要粘贴到答案中。如果对结果不做任何解释,或将跟答题无关的输出结果粘贴到答案中,将对成绩有严重影响。 6、试题(卷)的答案要求A4纸双面打印。

1、(20分)从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果如下表1,①求其均数,中位数,标准差,标准误,最大值,最小值,极差、第2.5、25、75、97.5百分位数(10分);②编制(改进)频数分布表、绘制直方图(各5分)。 表1 某年某单位101名正常成年的血清总胆固醇(mmol/L) 2.35 4.21 3.32 5.35 4.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.50 2.70 4.61 4.75 2.91 3.91 4.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.91 4.15 4.55 4.80 3.41 4.12 3.95 5.08 4.53 3.92 3.58 5.35 3.84 3.60 3.51 4.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.50 3.96 4.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.87 5.71 3.30 4.73 4.17 5.13 3.78 4.57 3.80 3.93 3.78 3.99 4.48 4.28 4.06 5.26 5.25 3.98 5.03 3.51 3.86 3.02 3.70 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26 2、(10分)为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表2第(1)~(3)栏。问两法测定结果是否不同?(写出统计方法并粘贴结果5分;写出统计量、p及对结果进行合理解释5分)。 表2 两种方法对乳酸饮料中脂肪含量的测定结果(%) 编号(1) 哥特里-罗紫法 (2) 脂肪酸水解法 (3) 1 0.840 0.580 2 0.591 0.509 3 0.67 4 0.500 4 0.632 0.316 5 0.687 0.337 6 0.978 0.517 7 0.750 0.454 8 0.730 0.512 9 1.200 0.997 10 0.870 0.506 3、(10分)大量研究显示汉族足月正常产男性新生儿临产前双顶径(BPD)均数为9.3cm。某医生记录了某山区12名汉族足月正常产男性新生儿临产前双顶径(BPD)资料如下:9.95、9.33、9.49、9.00、10.09、9.15、9.52、9.33、9.16、9.37、9.11、9.27。试问该地区男性新生儿临产前双顶径(BPD)是否大于一般新生儿(写出统计方法并粘贴结果5分;写出统计量、p及对结果进行合理解释5分)。 4、(15分)为研究国产四类新药阿卡波糖胶囊的降血糖效果,某医院用40名II型糖尿病病人 进行同期随机对照试验。试验者将这些病人随机等分到试验组(用阿卡波糖胶囊)和对照组(用拜唐苹 胶囊),分别测得试验开始前和8周后的空腹血糖,算得空腹血糖下降值见表3。①请对两组数据做 正态性检验(5分);②能否认为该国产四类新药阿卡波糖胶囊与拜唐苹胶囊对空腹血糖的降糖效果 不同(写出统计方法并粘贴结果5分、写出统计量、p及对结果进行合理解释5分)?

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

医学统计学题库

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A . 调查、录入数据、分析资料、撰写论文 B . 实验、录入数据、分析资料、撰写论文 C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析是在统计设计的基础上,根据设计的不同特点,选择相应的统计分析方法对资料进行分析

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

医学统计学总复习练习题(含答案)

一、最佳选择题 1.卫生统计工作的步骤为C A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有D A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括E A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指B A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指B

A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用D A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差 7.用均数与标准差可全面描述其资料分布特点的是C A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用A A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是C A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有B A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为D

医学统计学模拟试题

考试成绩100分=70分卷面+30分平时成绩

一、 选择题 1. 调查某疫苗在儿童中接种后的预防效果,在某地全部 1000 名易感儿童中进 行接种,经一定时间后从中随机抽取 300名儿童做效果测定,得阳性人数228 名。若要研究该疫苗在该地儿童中的接种效果,则 A. 该研究的样本是 1000 名易感儿童 B. 该研究的样本是 228 名阳性儿童 C. 该研究的总体是 300 名易感儿童 D. 该研究的总体是 1000 名易感儿童 E. 该研究的总体是 228 名阳性儿童 2. 各观察值均加(或减)同一数后: A 、均数不变,标准差改变 B 、均数改变,标准差不变 C 、两者均不变 D 、两者均改变 E 、以上均不对 3. 比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是: A 、全距 B. 标准差 C. 方差 D. 变异系数 E 、极差 4. 统计学中的小概率事件,下面说法正确的是: A .反复多次观察,绝对不发生的事件 B .在一次观察中,可以认为不会发生的事件 C .发生概率小于0.1的事件 D .发生概率小于0.001的事件 E .发生概率小于0.1的事件 5. 均数与标准差之间的关系是: A .标准差越大,均数代表性越大 B .标准差越小,均数代表性越小 C .均数越大,标准差越小 D .均数越大,标准差越大 E .标准差越小,均数代表性越大 6. 横轴上,标准正态曲线下从0到1.96的面积为: A.95% B.45% C.97.5% D.47.5% E.49.5% 7. 当第二类错误β由0.2变到0.3时,则第一类错误α是: A.增大 B.减小 C.不确定 D.不变化 E.以上都不对 8. 各种概率抽样方法按抽样误差按由大到小顺序排列,其顺序为 A. 整群抽样、单纯随机抽样、系统抽样、分层抽样 B. 整群抽样、系统抽样、单纯随机抽样、分层抽样 C. 分层抽样、单纯随机抽样、整群抽样、系统抽样 D. 系统抽样、单纯随机抽样、整群抽样、分层抽样 E. 系统抽样、整群抽样、分层抽样、单纯随机抽样 9. 假设检验中的第二类错误是指 A.拒绝了实际上成立的0H B.不拒绝实际上成立的0H C.拒绝了实际上不成立的1H D.不拒绝实际上不成立的0H

医学统计学 研究生期末考试版(包含大题)

一、名词解释 1总体与样本 总体:指根据研究目的确定的同质的所有研究对象的某项或某几项指标测量值的集合。根据总体集合所包括的元素分为有限总体和无限总体。 样本:指以某种方式按预先规定的概率从总体中随机抽取的、足够数量的、能代表总体分布特征的一部分观察单位某指标数据的集合。 联系:根据研究目的,从总体中抽取的部分有代表性的样本,可用样本统计量推断总体参数。 2标准差与标准误 标准差(S ):描述一个变量的所有观察值与均数的平均离散程度的指标。表示单个观测值对某均数的离散程度,用于描述观测值的变异范围。标准差越大表明数据的离散程度越大。 变量值的标准差()2 1x x S n -∑=-,阳性结果标准差()1S np p =- 标准误:描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度,相当于多个样本均数的标准差,反映的是样本均数之间的变异。表示样本统计量对总体参数的离散程度,用于推断估计总体参数的可信区间和假设检验。标准误越大表明样本的统计值越差,样本对总体的代表性越差。样本均数的标准误S X S n =,样本阳 性率的标准误S p ()1p p n -= 3.X ±1.96S 与X ±t 0.05/2,v S X X 即算术平均数,描述一个变量的所有观察值的平均水平,适用于频数分布对称数据。 S 即标准差,描述一个变量的所有观察值与均数的平均离散程度。 S X 即标准误,反映样本均数间的离散程度和样本均数与相应总体均数间的差异,是说明均数抽样误差大小的指标。 t0.05/2,v 表示双侧尾部面积为0.05,自由度为v 的t 界值。 X ±1.96S :表示从正态总体中抽大样本,观测值95%的波动范围,常用来制定参考值范围,判断某人的某一指标是否正常。 X ±t 0.05/2,v S X :表示从正态总体中抽大样本或小样本,总体均数95%的可信区间(置信区间),表示该区间有95%的可能性包含总体均数。 4.计量资料与计数资料 计量资料:指通过度量衡的方法,测量每一个观察单位的某项指标的量的大小而得到的一系列数据资料,其特点是多有度量衡单位和多为连续性资料。 计数资料:指将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数而得到的数据资料,其特点是没有度量衡单位和多为间断性资料。 5 点估计与区间估计 点估计:就是直接用随机样本的样本均数X 作为做为总体均数μ的一个估计,用样本的标准差S 作为总体标准差δ的一个估计,即直接用样本统计量X ±S 作为总体参数μ±δ的估计值。 区间估计:是按预先给定的概率(1-α)用一个区间来估计总体均数,这个区间称为可信度(1-α)的可信区间(CI )或置信区间,预先给定的1-α称为可信度或置信度,常取95%或99%。 6回顾性研究与前瞻性研究 回顾性研究:现有结果,后回顾过去一探求接受因素的百分比,由果溯因,例:病例—对照研究。不能直接估计相对危险度,通常要通过计算优势比或比数比(OR )来近似估计相对危险度。 前瞻性研究:先设定因素,后经过一段时间研究后,分析暴露因素与疾病发生之间的因果关系。由因探果,例:队列研究。可直接估计相对危险度(RR )。 7完全随机设计与完全随机区组设计 完全随机设计:又称为单因素设计或成组设计,是将同质的研究对象随机地分配到各处理组中进行实验观察,或从不同总体中随机抽样进行对比研究。 随机区组设计:又称配伍组设计,是在实验设计中用一个非研究因素的变量进行分层,每个层的观察对象数相等,并对每个层进行随机分组。 两种实验设计方案均为单因素实验设计。区别是:①两者观察对象随机分配方式不同;②统计分析方法不同;③误差内涵及大小不同;④检验效能不同。

医学统计学试题及答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

研究生医学统计学试题

南昌大学医学院硕士生试卷 试卷编号: 卷 课程名称:医学统计学 适用专业: 科学学位 专业: 班级 姓名: 学号: 学院 系: 考试日期: 考生注意事项: 1、本试卷共 6 页,请查看试卷中是否有缺页或破损。如有立即举手报告 以便更换。 2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。 一、最佳选择题 (每题 2 分,共 30 分) 把每题的答案填入下表中: 1、描述一组正态分布资料的集中趋势,以 指标为好。 A. 算术平均数; B. 几何平均数; C. 中位数; D. 变异系数 2、比较成人身高和儿童身高的离散趋势,宜用 。 A. 标准差; B. 变异系数; C. 方差; D. 离均差平方和 3、对于正态分布资料, X +1.96S ,所对应的面积占总面积的 。 A. 95%; B. 99%; C. 47.5%; D. 49.5% 4、下列说法哪个是错误的?中位数适用于描述 资料。 A. 最小组段无下限; B. 最大组段无上限; C. 偏态分布; D. 正态分布 5、 大,表示用该样本均数估计总体均数的可靠性小。 A. S X ; B. S ; C. CV ; D. Q U —Q L 6、某地 1992 年随机抽取 100 名健康女性,算得其血清总蛋白含量的均数为 74g/L ,标 准 差为 4g/L ,则其 95%的可信区间为 。 A. 74±1.96×4; B. 74 ±1.96× 4/10; C. 74±2.58×4; D. 74± 2.58× 4/10 第1 页共6 页

7、 A. 8、 A. C . 9、 A . C . 两样本均数比较的 t 检验,分别取以下检验水准,以 α =0.01; B. α=0.05; 两样本均数比较的 t 检验结果, 两样本均数不等; 两总体均数不等; 完全随机设计的方差分析结果, 各样本均数不等或不全等; 各总体均数不等或不全等; C. α =0.10; P<0.05,可认为 B. 两样本均数相等; D. 两总体均数相等 P ≤ 0.05,可认为 B . D. 10、某地某年肝炎发病人数占总人数 的 5%, A. 年发病率; B. 年患病率; 所取第二类错误最 大。 D. α =0.20 各样本均数都不相等; 各总体均数都不相等 这是该地该年肝炎的 C. 患病构成比; D. 患者平均 数 11、已知甲县人口较乙县年青,今欲比较两县死亡率的高低,适当的比较方法是 A . 将两县的总死亡率直接比较; B . 对年龄进行标准化后,再比较两县总死亡率; C . 将两县的总死亡率进行 t 检验后再比较; D . 将两县的总死亡率进行 χ2 检验后再比较 12、 面哪一点不是 Poisson 分布的性质 A. λ =σ ; B. 当λ ≥20 时,近似正态分布; C. 可加性; D. 相互影响性 13、 χ2 检验中理论 数 T 的计算式为 A. n r (1 n c ) ; A. N ; B. (1 n r ) n c ; C. n r n c N D. n r n c D. N 14、已知两组计量资料方差不齐,可用 检验。 A. t 检验; B. U 检验; C. F 检验; D. 秩和检 验 15、对一组既做相关分析又做回归分析的资料,有 A. b=r ; B. t b =t r ; C. b=a ; D. r=1

相关主题
文本预览
相关文档 最新文档