当前位置:文档之家› 【孙振球第三版】医学统计学复习题(整理版)

【孙振球第三版】医学统计学复习题(整理版)

【孙振球第三版】医学统计学复习题(整理版)
【孙振球第三版】医学统计学复习题(整理版)

1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。

2、有限总体:是指空间、时间范围限制的总体。

3、无限总体:是指没有空间、时间限制的总体。

4、样本:从总体中随机抽取部分观察单位,其实测值的集合。

5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。

6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。

7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。

8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。

9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。14、率:强度相对数,说明某现象发生的频率或强度。15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。20、相关系数:又称Pearson积差相关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1≤r≤1。相关系数的检验假设常用t检验。

21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。25、期望寿命:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。

26、检验效能:表达式为1-β,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。27、观察单位:亦称个体,是统计研究中的基本单位。它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。28、样本含量:样本中包含观察单位数称为该样本的样本含量。29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。30、变量值:对变量的观测值称为变量值或观察值。31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差②非系统误差。32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。35、概率:概率是描述随机事件发生可能性大小的一个度量。36、医学参考值:是直指包括绝大多数正常人的人体形态、功能和代谢产物等个各种生理指标常数,也称正常值。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故医学参考值范围作为判定正常和异常的参考标准。37、正态分布:正态分布又称高斯分布,是一种很重要的连续型分布,应用很广。若指标X的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。38、38.偏态分布:指集中位置偏向一侧,频数分布不对称。(1)正偏态分布:集中位置偏向数值小的一侧。(2)负偏态分布:集中位置偏向数值大的一侧。39.抽样:在医学研究中,为节省人力、物力、财礼和时间,一般都采取从总体中抽取样本,根据样本信息来推断总体特征的方法,即抽样研究的方法来实现,这种从总体种随机抽取部分观察单位的过程称为抽样。为保证样本的代表性,抽样时必须遵循随机化原则。40.统计描述:指选用恰当的指标,通常称为统计量,选用合适的统计表与统计图,对资料的数量特征及其分布规律进行测定和描述。包括搜集数据、整理数据、总结数据、分析数据以及将数据呈现出来.41.统计推断:指如何在一定的可信度下由样本信息统计指标来推断总体相应指标,又称参数估计。包括进行推测、假设检验、确定关系然后作出预测。

42.小概率事件:统计分析中的很多结论都是基于一定可信程度下的概率推断,习惯上将P<=0.05称为小概率事件,表示一次实验或观察中该事件发生的可能很小,可以视为可能不发生。43.算术均数:简称均数可用于反映一组呈对称分布的变量值在数量上的

平均水平或者说是集中位置的特征值。44.几何均数(geometric mean):可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。适用条件:呈倍数关系的等比资料或对数正态分布(正偏态)资料;如抗体滴度资料45.中位数(median):是将变量值从小到大排列,位置居于中间的那个变量值。符号为Md,反映一批观察值在位次上的平均水平。适用于:1、各种分布类型的资料2、特别是偏态分布资料和开囗资料(一端或两端无确切数值的资料)。 3、资料分布不明等46.百分位数:将一组数据从大到小按顺序排列起来,并计算相应的累计百分位(频率)。那某一百分位所对应的数据变量值就叫这一百分位的百分位数百分位数的应用:确定医学参考值范围;中位数Md与四分位半间距QD一起使用,描述偏态分布资料的特征。47.百分位数:数据从小到大排列;在百分尺度下,所占百分比对应的值。记为Px。包括直接算法和频数表法。应用:1.确定医学参考值范围(reference range):如95%参考值范围=P97.5-P2.5;表示有95%正常个体的测量值在此范围。2.中位数Md与四分位半间距QD一起使用,描述偏态分布资料的特征。48.方差(variance)也称均方差(mean square deviation),样本观察值的离均差平方和的均值。表示一组数据的平均离散情况。49.标准差(standard deviation)即方差的正平方根;其单位与原变量X的单位相同。50.自由度是数学名词,在统计学中,n个数据如不受任何条件的限制,则n个数据可取任意值,称为有n个自由度。51.变异系数:多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。52.医学参考值(reference value)是指包括绝大多数正常人的人体形态、机能和代谢产物等各种生理及生化指标常数,也称正常值。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故采用医学参考值范围(medical reference range)作为判定正常和异常的参考标准。53.95%可信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括μ(估计正确),只有5个可信区间不包括μ(估计错误)。54. 假设检验过去称显著性检验:它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。55. 检验水准α,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取α = 0.05。可根据不同研究目的给予不同设置。56.P 的含义是指从H0规定的总体随机抽样,抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量(如t、u等)值的概率。57.

I 型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是α(其值等于检验水准)。58. II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是β(其值未知)。59.完全随机设计:是采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。60.组间变异:各处理组由于接受处理的水平不同,各组的样本均数(i=1,2,…,g)也大小不等,这种变异称为组间变异。其大小可用各组均数与总均数的离均差平方和表示,记为SS组间。61.组内变异:在同一处理组中,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异(误差)。组内变异可用组内各测量值Xij 与其所在组的均数的差值的平方和表示,记为SS组内, 表示随机误差的影响。62. 随机区组设计(randomized block design)又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。63. 绝对增长量;是说明事物在一定时期增长的绝对值。64.发展速度与增长速度:均为相对比,说明事物在一定时期的速度变化。发展速度表示报告期指标的水平相当于基期水平的百分之多少或若干倍。65.平均发展速度;是各环比发展速度的几何平均数,说明某事物在一个较长时期中逐期(如逐年)平均发展的程度。66.平均增长速度;是各环比增长速度的平均数,说明某事物在一个较长时期中逐期平均增长的程度。67. b的意义: 回归系数b称为斜率(slope),其统计学意义是:X 每增加(减)一个单位,Y 平均改变b个单位。68. 残差(residual)或剩余值,即实测值Y与假定回归线上的估计值Y的纵向距离。69. 直线相关系数(correlation coefficient),Pearson积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。70.统计图:指利用点的位置、线段的升降、直条的长短和面积的大小等各种几何图形来表达统计资料。统计图只能提供概略的情况,而不能获得确切数值,因此不能完全代替统计表,常需要同时列出统计表作为统计图的数值依据。71.百分条图:是以矩形总长度作为100%,将其分割成不同长度的段表示各构成的比例。圆图和百分条图适合描述分类变量的各类别所占的构成比。百分条图以总长度L为100%,将长度L乘以各类别的构成比(%)得到各构成的长度,由大到小或按类别的自然顺序依次排列,其它项放最后。72.箱式图(box plot):使用5个统计量反映原始数据的分布特征,即数据分布中心位置、分布、偏度、变异范围和异常值。箱式图的箱子两端分别是上、下四分位数,中间是中位数,两端连线分别是除异常值之外的最小与最大值。箱子越长数据变异程度越大,中间横线在箱子中点表明分布对称,否则不对称。箱式图特别适合多组数据分布的比较。73.二项分布(binomial distribution)是指在只会产生两种可能结果如“阳性”或“阴性”之一的n次独立重复试验中,当每次试验的“阳性”概率π保持不变时,出现“阳性”次数X=0,1,2,…,n的一种概率分布。记作:X~B(n,π) 。概率可以由下边公式求出:

X=0,1,2,3、、、,n 74.Poisson分布:(Poisson distribution)作为二项分布的一种极限情况,已发展成为描述小概率事件发生规律性的一种重要分布。Poisson分布是描述单位面积、体积、时间、人群等内稀有事件(或罕见事件)发生数的分布。所谓随机变量X 服从Poisson分布,是指在足够多的n次独立Bernoulli试验中,取值X 的概率为

()0,1,2,

!

X

e

P X X

X

λλ

-

==???

!

()(1)

!()!

X n X

n

P X

X n X

ππ-

=-

-

75.非参数检验针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布式连续型的或是离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制,故称为非参数统计,或称为不拘分布的统计分析方法,又称为无分布型式假定的统计分析方法。适于处理总体分布不易确定或未知;分布非正态但无合适转换方法;有一端或两端有不确定数值(如<0.1, >15.0)的资料;等级资料等。

76.参数检验:通常要求样本来自总体分布类型已知(正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数检验。例如,均数的区间估计;t检验/u检验,F检验。77.“球对称”假设:满足“球对称”假设,可用第四章随机区组方差分析比较处理组间差异;若不满足“球对称”假设,亦可用随机区组方差分析,但需校正时间效应F界值的自由度。

78.单变量分析:研究单个变量的数量特征,推断两个或多个总体参数的差别。双变量分析:研究两个变量的数量依存(或依赖)关系或互依(或相关)关系。多变量分析:研究多个变量的数量依存(或依赖)关系或互依(或相关)关系。79.单独效应:指其他因素的水平固定时,同一因素不同水平间的差别。80.主效应:指某一因素各水平间的平均差别81.交互作用:当某因素的各个单独效应随另一因素变化而变化时,则称这两个因素间存在交互作用。82.正交试验:非全面组合,g 个处理组是各因素各水平的部分组合,即析因设计的部分实施。优点:减少试验次数缺点:牺牲分析各因素部分交互作用83. b0为截距:表示各自变量均为0时y的的估计值。bi称为偏回归系数,是βi的估计值,表示当方程中其他自变量保持不变时,自变量Xi变化一个计量单位,反应变量Y的平均变化量。b称为X=(X1, X2, ?, Xm)时,反应变量Y的估计值。e是去除m个自变量对Y影响后的随机误差(残差)。84.偏相关系数:扣除其他变量的影响后,变量Y与Xi的相关,称为Y与Xi的偏相关系数。85.优势比OR(odds ratio) 流行病学衡量危险因素作用大小的比数比例指标。86.优势比估计:可反映某一因素两个不同水平(c1,c0)的优势比。87. logistic 回归:是一个概率型模型,因此可以利用它预测某事件发生的概率。例如在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大。88.综合评价:利用多项指标对某个评价对象的某种属性进行定性、定量评估,或者对多个评价对象的属性进行定性、定量评估,可对优劣顺序排序。89.秩和比(Rank Sum Ratio,RSR)指行(或列)秩次的平均值,是一个非参数统计量,具有0~1连续变量的特征。在综合评价中,秩和比综合了多项评价指标的信息,表明多个评价指标的综合水平,RSR值越大越优。90.完全数据:一部分研究对象可观察到死亡,从而得到准确的生存时间,所提供的信息是完全的91.不完全数据:亦称截尾数据:一部分病人,或中途失访,或到观察结束时仍存活,对这部分病人无法知道准确的生存时间,只知道其生存时间比观察到的时间要长,它提供不完全的信息,称为不完全数据,亦称截尾数。92.生存时间:生存时间(survival time)是任何两个有联系事件之间的时间间隔,常用符号t表示。狭义的生存时间常指患某种疾病的病人从发病到死亡所经历的时间跨度,广义的生存时间定义为从某种起始事件到终点事件所经历的时间跨度。93.生存函数:生存函数(survival function)又称为累积生存率,简称生存率。表示具有协变量X的观察对象其生存时间T大于时间t的概率,

常用)

,

(

)

,(X

X t

T

P

t

S>

=表示。94.死亡概率:表示一个观察对象从开始观察到时间t为止的死亡概率,它是一个随时间上升的函数:F(t,X)=P(T

1、统计资料可以分成几类?答: 根据变量值的性质,可将统计资料分为数值变量资料(计量资料),无序分类变量资料(计数资料),有序分类变量资料(等级资料或半定量资料)。用定量方法测定某项指标量的大小,所得资料,即为计量资料;将观察对象按属性或类别分组,然后清点各组人数所得的资料,即为计数资料;按观察对象某种属性或特征不同程度分组,清点各组人数所得资料称为等级资料。

2、不同类型统计资料之间的关系如何?答: 根据分析需要,各类统计资料可以互相转化。如男孩的出生体重,属于计量资料,如按体重正常与否分两类,则资料转化为计数资料;如按体重分为: 低体重,正常体重,超体重,则资料转化为等级资料。计数资料或等级资料也可经数量化后,转化为计量资料。如性别,结果为男或女,属于计数资料,如男性用0(或1),女性用1(或0)表示,则将计数资料转化为计量资料。

3、频数分布有哪两个重要特征?答:频数分布有两个重要特征:集中趋势和离散趋势,是频数分布两个重要方面。将集中趋势和离散趋势结合起来分析,才能全面地反映事物的特征。一组同质观察值,其数值有大有小,但大多数观察值集中在某个数值范围,此种倾向称为集中趋势。另一方面有些观察值较大或较小,偏离观察值集中的位置较远,此种倾向称为离散趋势。

4、标准差有什么用途?答: 标准差是描述变量值离散程度常用的指标,主要用途如下: ①描述变量值的离散程度。两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。②结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误。

5、变异系数(CV)常用于哪几方面?答: 变异系数是变异指标之一,它常用于以下两个方面: ①比较均数相差悬殊的几组资料的变异度。如比较儿童的体重与成年人体重的变异度,应使用CV;②比较度量衡单位不同的几组资料的变异度。如比较同性别,同年龄人群的身高和体重的变异度时,宜用CV。

6、制定参考值范围有几种方法?各自适用条件是什么?答: 制定参考值范围常用方法有两种: ①正态分布法: 此法是根据正态分布的原理,依据公式: X±uS计算,仅适用于正态分布资料或对数正态分布资料。95%双侧参考值范围按: X±1.96S计算;95%单侧参考值范围是: 以过低为异常者,则计算: X-1.645S,过高为异常者,计算X+1.645S。若为对数正态分布资料,先求出对数值的均数及标准差,求得正常值范围的界值后,反对数即可。②百分位数法。用P2.5~P97.5估计95%双侧参考值范围;P5或P95为95%单侧正常值范围。百分位数法适用于各种分布的资料(包括分布未知),计算较简便,快速。使用条件是样本含量较大,分布趋于稳定。一般应用于偏态分布资料、分布不明资料或开口资料。

7、计量资料中常用的集中趋势指标及适用条件各是什么?答: 常用的

描述集中趋势的指标有: 算术均数、几何均数及中位数。①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;②几何均数: 用G表示,也称倍数均数,反映变量值平均增减的倍数,适用于等比资料,对数正态分布资料;③中位数: 用M 表示,中位数是一组观察值按大小顺序排列后,位置居中的那个观察值。它可用于任何分布类型的资料,但主要应用于偏态分布资料,分布不明资料或开口资料。

8、标准差,标准误有何区别和联系?答: 标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别: ①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同: 当样本含量n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。联系: 标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。9、统计推断包括哪几方面内容?答:统计推断包括: 参数估计及假设检验两方面。参数估计是指由样本统计量( 样本均数,率)来估计总体参数(总体均数及总体率),估计方法包括点值估计及区间估计。点值估计直接用样本统计量来代表总体参数,忽略了抽样误差;区间估计是按一定的可信度来估计总体参数所在的范围,按X±uσX或X±uS X来估计。假设检验是根据样本所提供的信息,推断总体参数是否相等。10、假设检验的目的和意义是什么?答:在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。如果是由于抽样误差原因引起的差别,则这种差异没有统计学意义,认为两个或两个以上的样本来自同一总体,;另一方面如果样本是来自不同的总体而引起的差异,则这种差异有统计学意义,说明两个或两个以上样本所代表的总体的参数不相等。样本统计量之间的差异是由什么原因引起,可以通过假设检验来确定。因此假设检验的目的是推断两个或多个样本所代表的总体的参数是否相等。11、何谓假设检验?其一般步骤是什么?答:所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后用适当方法根据样本所提供的信息,对所提出的假设作出拒绝或不拒绝的结论的过程。假设检验一般分为五个步骤: ①建立假设:包括: H0,称无效假设;H1: 称备择假设;②确定检验水准:检验水准用α表示,α一般取0.05;③计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P值;⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0,差别有统计学意义。12、假设检验有何特点?答:假设检验的特点是: ①统计检验的假设是关于总体特征的假设;②用于检验的方法是以检验统计量的抽样分布为理论依据的;③作出的结论是概率性的,不是绝对的肯定或否定。13、如何正确理解差异有无显著性的统计学意义?答: 在假设检验中,如P≤α,则结论是: 拒绝H0,接受H1,习惯上又称“显著”,此时不应该误解为相差很大,或在医学上有显著的(重要的)价值;相反,如果P>α,结论是不拒绝H0。习惯上称“不显著”,不应理解为相差不大或一定相等。有统计学意义( 差异有显著性)不一定有实际意义;如某药平均降低血压5mmHg,经检验有统计学意义,但在实际中并无多大临床意义,不能认为该药有效。相反,无统计学意义,并不一定无实际意义。如用新疗法治疗某病,有效率与旧疗法无差异,此时无统计学意义,如果新疗法方法简便,省钱,更容易为病人接受,则新疗法还是有实际意义。14、参考值范围与可信区间区别是什么?答:(1)意义不同: 参考值范围是指同质总体中包括一定数量(如95%或99%) 个体值的估计范围,如95%参考值范围,意味该数值范围只包括95%的个体值,有5%的个体值不在此范围内。可信区间是指按一定的可信度来估计总体参数所在范围。如95%的可信区间,意味着做100次抽样,算得100个可信区间,平均有95个可信区间包括总体参数(估计正确)有5个可信区间不包括总体均数(估计错误)。(2)计算方法不同: 参考值范围用X±u a/2S计算。可信区间用X±t a/2S x或X±u a/2S x计算;前者用标准差,后者用标准误。(3)用途不同:参考值范围用于描述绝大多数观察对象某项指标的分布范围。可信区间用于总体均数的估计,也可间接进行假设检验。15、X2检验有何用途? 答: X2检验有以下应用: ①推断两个或两个以上总体率(或构成比)之间有无差别;②检验两变量之间有无相关关系;③检验频数分布的拟合优度。16、四格表资料的u检验和X2检验的应用条件有何异同?答:(1) 相同点:四格表资料的u检验是根据正态近似原理进行的,凡能用u检验对两样本率进行检验的资料,均能使用X2检验,两者是等价的,即u2=X2;u检验和X2检验都存在连续校正的问题。(2) 不同点:由于u分布可确定单、双侧检验界值,可使用u检验进行单侧检验;满足四格表u检验的资料,可计算两率之差的95%可信区间,以分析两率之差有无实际意义;X2检验可用于2×2列联表资料有无关联的检验。17、参数检验与非参数检验有何区别? 各有何优缺点?答: 参数检验是检验总体参数是否有差别,而非参数检验是检验总体分布的位置是否相同。参数检验的优点是能充分利用样本资料所提供的信息,因此,检验效率较高。其缺点是有较严格的使用条件,如要求总体的分布呈态分布,各总体方差要相等,有些资料不满足使用条件,就不能用参数检验。非参数检验的优点是适用范围广。它不要求资料分布的形式,另外可用于等级资料或不能确切定量的资料。缺点是不能充分利用样本所提供的信息,因此检验效率较低,产生第二类错误较大。18、非参数检验适用于哪些情况?答: 非参数检验应用于以下情况: ①不满足参数检验的资料,如偏态分布资料;②分布不明的资料;③等级资料或开口资料。19、直线回归与相关有何区别和联系?答: 1、区别: ①在资料要求上,回归要求因变量y 服从正态分布,自变量x是可以精确测量和严格控制的变量,一般称为Ⅰ型回归;相关要求两个变量x、y服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。②在应用上,说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关。2、联系: ①对一组数据若同时计算r与b,则它们的正负号是一致的;②r与b的假设检验是

等价的,即对同一样本,二者的t值相等。③可用回归解释相关。

20、常用的统计图有哪几种?它们的适用条件是什么?答: 常用的统计图及适用条件是: ①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及园图,适用于构成比资料,反映各组成部分的大小;③普通线图: 适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。⑤直方图: 适用于连续性变量资料,反映连续变量的频数分布。⑥散点图: 适用于成对数据,反映散点分布的趋势。1、集中趋势、离散趋势的统计描述指标以及区别。答:一、集中趋势的描述指标:统计学用平均数这一指标来描述一组变量值的集中位置或平均水平。(1)算术均数:简称均数字,可用于反映一组呈对称分布的位置在数量上的平均水平。(2)几何均数:可用于反映一组经对数转换后呈对称分布的变量在数量上的平均水平,在医学研究中常适用于免疫学的指标。(3)中位数:是将n个变量值从小到大排列,位置居中间的那个数。<分为奇偶两种情况。(4)百分位数:是一种位置指标,用P X来表示。二、描述数据变异大小的常用指标有极差、四分位数间距、方差、标准差和变异系数。(1)级差:级差即是一组变量最大的值与最小值之差。(2)四分位数间距:四分位数间距是把全部变量值分为四部分的分位数,即第1四分位数、第2四分位数、第3四分。四分位数间距,是由第三四分位数,和第1四分位数向减而得。(3)方差:也叫均方差,反映一组数据的平均离散水平。(4)标准差:是方差的正平方根,其量纲与原变量值相同(5)变异系数:记为CV,多用于观察指标单位不同时,或均数相差较大时的比较。它实质上是一个相对变异指标,无单位。三、两者的区别。A、集中趋势的描述:(1)算数均数:适用于对称分布资料;(2)几何均数:适合于作对数变换后对称分布资料;(3)中位数和百分位数:①适用于任何分布的资料;②中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;③中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。不同质的资料应考虑分别计算平均数。B、离散趋势的描述:(1)极差不稳定,不灵敏。(2)标准差的基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、平均地描述了变量值的离散程度。在同质的前提下,标准差大表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。(3)变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。2、中位数和标准差的作用。答:(1)标准差:是方差的正平方根,其量纲与原变量值相同。标准差是统计分析中最常用的变异指标,适用于近似正态分布的资料,大样本、小样本均可用。四份位数间距适用于偏态分布资料,四分位半间距相当于偏态分布资料的“标准差”。(2)中位数:是将n个变量值从小到大排列,位置居中间的那个数。分为奇偶两种情况。中位数适用于任何分布资料,有不确定值的资料。常用于描述偏态分布资料的集中趋势,反映位次居中的观察值的平均水平。在对称分布的资料中,中位数和算术平均数在理论上是相同的。适用于当一组变量值呈偏态分布,或资料的分布情况不清楚,或变量值一端(或两端)无确定数值(开口型资料),均可用中位数表示其集中趋势。

3、正态分布、标准正态分布及对数正态分布的联系和区别。答:(1)正态分布:原始值不需转换;属于对称分布类型;用μ表示集中趋势的指标;均数与中位数的关系是μ=M(中位数)。(2)标准正态分布:作u转换;属于对称分布类型;集中趋势μ=0;均数与中位数的关系是μ=M。(3)对数正态分布:作对数转换;属于正偏太分布;集中趋势用G(几何均数表示);均数与中位数的关系是μ>M。1、举例说明标准差与标准误的区别与联系。答:标准差是描述个体值变异程度的指标,为方差算术平方根,该变变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差。具体举例略。2、u分布和t分布有何不同。答:t分布为抽样分布;u分布为标准正态分布,为理论分布。t 分布比标准正态分布的峰值低,且尾部翘得更高。随自由度的增大,t分布逐渐趋近标准正态分布。3、均数的可心信区间与参考值范围有何不同。答:(1)均数的可信区间按预先给定的概率所确定的未知参数的可能范围。用于估计总体的均数。(2)参考值范围是“正常人”的解剖、生理、生化某项指标的波动范围。用于判断观察对象的某项指标正常于否。

4、t检验的应用条件。答:(1)单样本的t检验要求资料服从正态分布。(2)配对t检验要求差值服从正态分布。(3)两样本的t检验要求两组数据服均从正态分布,切两样本的方差相等,尤其对小样本。

5、假设检验的结论不能绝对化。答:通过假设检验作出的检验推断具有概率性,有可能发生两类错误。拒绝H O时犯I型错误,接受H O时间犯II型错误。

6、假设检验和区间估计的区别。答:假设检验用于推断质的不同的两个总体或多个总体参数是否不等。可信区间估计是用于说明量的大小,推断总体参数的范围。可信区间可以回答假设检验的问题。在判断两个或多个总体参数是否不相等时,假设检验与区间估计是完全等价的。1、方差分析的基本思想和应用条件。答:基本思想:是根据实验设计的类型,将全部测量值总的离均差平方和及自由度分解为两个或多个部分,除随机误差作用外。每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过比较不同变异的来源的均方,借助F 分布作出统计推断从而推论各种研究因素对实验结果的影响。

应用条件:①各样本是相互独立的随机样本,均服从正态分布。

②相互比较的各样本的总体方差相等。具有方差齐性。2、随机区组设计与完全随机设计在设计和变异分解上有何不同。答:随机区组设计:随机分配的次数越多,每次随机分配都对同一区组内的受试对象进行,且歌处理组受试对象数量相同,区组内均衡。四种变异处理组间变异、区组间变异、误差变异、总变异。完全随机设计:采用完全随机化分组方法,将全部试验对象分配到g 个处理组(水平组),各组接受不同的处理。三种变异组间变异、组内变异、总变异。1、举例说明为什么不能以构成比代替率。答:(1)率=某时期内发生某现象的观察单位数字/同时期可能发生某现象的观察单位总数。用来说明某现象发生的频率或强度。(2)构成比=某一组成部分的观察单位数/同一事物各组成部分的

观察单位总数。用来说明各构成部分在总体中所占的比重或分布。举例略。2、应用标准化率进行比较时的注意问题。答:(1)只适用于两组内部构成不同,并有可能影响两组分组的情况。(2)比较几个标准化率时采用统一标准口。(3)标准化后的标准化率,已不再反映当时当地的实际水平,它只表示相互比较的资料的相对水平。(4)两样本标准化率是样本值,存在抽样误差。3、相对数的动态指标及作用。答:即动态数列的分析指标:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。(1)绝对增长量:某相对数在一定时期的增长的绝对值;(2)发展速度与增长速度:某相对数在一定时期的速度变化;(3)平均发展速度:各环节比发展速度的几何均数。说明某相对数在一个较长时期中平均发展变化的程度。1、二项分布的应用。答:(1)每次试验之发生两种互斥可能结果,互斥结果的概率和等于1;(2)每次产生某种结果的概率固定不变;(3)重复试验是独立的。2、Poisson 分布的性质。答:(1)总体均数λ与总体方差σ2相等;(2)当n 很大时候,而π很小时候,πn=λ为常数,Poisson分布是二项分布的极限分布;(3)当λ增大,Poisson分布渐近正态分布。当λ≥20时,做正态分布资料处理。(4)具可加性质。3、二项分布、Poisson分布和正态分布的联系。答:(1)当n很大时,而π很小的时,且πn=λ为常数,Poisson分布是二项分布的极限分布;(2)当n较大,而π不接近0也不接近1时候,二项分布近似正态分布。(3)当λ增大时,Poisson分布渐进正态分布,一般λ≥20时,做正态分布资料处理。1、Χ2检验的用途。答:(1)用于推断个总体率或构成比之间有无差别;(2)推断多个总体或构成比之间有无差别;(3)多个样本率比较的Χ2分割;(4)两个分类变量间有无关联性;(5)频数分布的拟合优度检验。2、两样本率u 检验和Χ2检验有何区别。答:两样本率进行比较时,若对同一样本资料同时进行u检验和Χ2检验,在不教正的情况下,Χ2=u2;u检验通常用于大样本,Χ2检验用于小样本。3、R*C列联表资料的Χ2检验应注意的事项。答:(1)R*C列联表中的理论频数不能小于1,或1<T<5的格子数不宜超过格子总数的1/5;(2)多个样本率比较,若所的到的统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说任两个总体率有差别,需进一步做多个样本率的比较,做多个样本率的多重比较。(3)对有序的R*C列联表资料不宜用Χ2检验。4、R*C列联表资料的分类及其检验方法的选择。答:(1)分类:双向无序、单向无序、双向有序属性相同、双向有序属性不同。(2)检验方法的选择:①双向无序R*C列联表资料。研究多个样本率或构成比的比较,用行*列表的Χ2检验;研究两分类变量间有无关联性以及关系密切程度,可用行*列表的Χ2检验以及Pearson列联表系数进行分析。②单向无序R*C列联表资料。若R*C表中的分组变量是有序的,而指标变量是无序的,用行*列表的Χ2检验分析其构成情况。若R*C表的分组变量是无序的,指标变量是有序的,用秩转换的非参数检验分析。③双向有序属性相同R*C列联表资料。用一致性检验分析两种检测两方法的一致性。④双向有序属性不同R*C列联表资料。若研究目的为分析两有序分类变量间是否存在相关关系,用宜等级相关分析或Pearson积矩相关分析;若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验;若研究目的为分析不同年龄组患者疗效间有无差别时,可视其为单向有序R*C列联表资料,选用秩转换的非参数检验分析。1、非参数检验,与参数检验的区别。答:非参数检验对总体分布不作严格的假定,不受总体分布的限制,又称任意分布检验。它直接对总体分布(或分布位置)作假设检验。总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。2、秩转换的非参数检验,适用情况。答:秩转换的非参数检验是先将数值变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量。其特点是假设检验的结果对总体的分布形状差别不敏感,只对总体的分布位置差别敏感。适用于:①不满足正态或(和)方差齐性的小样本资料;②分布不知是否正态的小样本资料;③一端或两端是不确切数值的资料;④等级资料。3、两组或多组等级资料的比较,为何不用Χ2检验而用秩转换的非参数检验。答:Χ2检验只能推断两个或多个总体的等级构成比的差别。选用秩转换的非参数检验,可推断两个或多个总体的等级强度差别。1、何为“最小二乘”原则。答:在直线回归方程中,将实际测量值与假定回归线上估计值的纵向距离称之为残差,通常情况下取各点残差的平方和的最小直线为所求得的回归直线。即所谓的“最小二乘原则”。2直线回归分析中的注意问题(即直线回归的应用条件)。答:(1)两变量的选择一定要有专业背景,直线回归要求至少对于每个X相应的Y要服从正态分布,X可以是服从正态分布的随机变量也可以能精确测量和严格控制的非随机变量。(2)分析前应绘制散点图,检查数据是否满基本假设。(3)对结果应有正确的解释。3、直线回一归与直线相关的区别与联系。答:联系:(1)对于既可以做回归分析又可做相关的同一组数据,计算出的b与r的正负号一致;(2)相关系数与回归系数的假设检验等价。对同一样本t b=t r。(3)同一组数据的相关系数和回归系数可以相互换算。(4)用回归解释相关:由于决定系数r2=SS回/SS总,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则r2越接近1,说明相关的效果越好。区别:(1)资料上:相关要求X、Y服从双变量正态分布,这种资料进行回归称II型回归;回归要求Y 在给定某个X值服从正态分布,X是可以精确测量和严格控制的变量,称I型回归。(2)应用上:双变量间相互关系用用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,用以说明Y如何依赖于X而变化。(3)意义上:说明具有直线关系的两变量间相互关系的方向与密切程度;b表示X 每变化一个单位所导致的Y的平均变化量(4)单位:r没单位,b有单位。(5)取值范围不同(6)计算公式不同。1、统计表的制表原则与要求。答:原则:(1)重点突出,一张表只表达一个中心内容;(2)统计表描述要完整,有起描述的对象(主语)和内容(宾语),通常主语放在表的左边作横标目,宾语放在右边作纵标目。(3)统计表应简单明了,文字数字、线条尽量从简。要求:(1)标题:概括表的主要内容,包括研究时间、地点、内容等放在在表的正上方。(2)标目:分别用横标目和纵标目说明表的每行和每列数字的意义。注单位。(3)线条:至少要用三线条,表格的顶线和底线将表格与文章的其它部分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。(4)数字:………..

五、分析应用题

1.Cox模型与logistic回归模型有何不同?Cox模型与logistic 回归分析具有相似之处,即在估计出回归系数后可以得到协变量对应的相对危险度。但logistic回归模型是一种概率模型,只考虑了事件是否发生,而不考虑事件发生所需要的时间长短。Cox 模型不仅考虑了事件发生的结果,同时也利用了生存时间提供的信息,因此其效率较高。2.logistic回归与线性回归有什么不同?两种方法各有什么特点?logistic回归属于概率型非线性回归,应变量Y是一个二值变量(服从二项分布),而线性回归的应变量一般为连续变量(正态分布)。线性回归对资料的分析比较细腻,级适合大样本资料又适合小样本数据,但要求对不同的自变量取值。应变量Y服从正态分布和等方差,这一条件有时在实际中不能得到满足。Logistic回归则对资料几乎没有什么限制,而且参数具有明确的实际意义(得到OR的估计值),但要求有较大的样本含量。

1.某医师用甲乙两疗法治疗小儿单纯消化不良,结果如下表:欲比较两种疗法的治愈率是否相同,应使用何种统计方法?

━━━━━━━━━━━━━━━━━━━━

疗法治疗人数治愈人数治愈率(%)

────────────────────

甲13 6 46.2

乙18 8 44.4

─────────────────

合计31 14 45.2

━━━━━━━━━━━━━━━━━━━━答:这是一个四格表资料,作两样本率的比较,由于n较小(n=31),应采用四格表确切概率法(直接计算概率法)进行检验。

2.为观察骨质增生丸对大骨节病的疗效,于治疗前测量踝关节的伸屈幅度,治疗80天后复测,两次测量所得的成对数据的差值可表示治疗的作用,结果如下。欲比较大骨节病人服骨质增生丸前后关节伸屈幅度的差异有无显著性,应用何种统计方法?

患者号1 2 3 4 5 6 7 8 9 10 11 12 13 14 变化幅度0 0 0 0 0 1 1 1 2 2 -2 3 5 9

答:由于治疗前后关节伸屈幅度的差值为偏态分布,故应用配对设计差值的符号秩和检验。

3.有甲、乙两个医院某传染病各型治愈率资料,见下表。经X2检验,X2=0.9044,P=0.3409,按α=0.05,可以认为,甲、乙两个医院对该种传染病总治愈率没有差异。该统计分析是否正确?如不正确,应如何进行分析?

甲、乙两个医院某传染病各型治愈率

病型甲医院乙医院

患者数治愈率(%)患者数治愈率(%)普通型300 60.0 100 65.0

重型100 40.0 300 45.0

暴发型100 20.0 100 25.0

合计500 48.0 500 45.0 答:该统计分析是错误的。因为某传染病不同病型其治愈率不同,而甲乙两医院所治疗的病人,其病型构成不一样,因此两家医院总的治愈率没有可比性,应对其进行标准化后再比较。4. 根据下表资料,欲分析胆麻片对慢性气管炎的疗效是否优于复方江剪刀草合剂,可以应用什么统计分析方法?

复方江剪刀草合剂与胆麻片对慢性气管炎的疗效

疗效

药物无效好转显效控制

复方江剪刀草合剂760 1870 620 30

胆麻片9 51 21 11

答:这是一个单向有序列联表(等级)资料,可以采用秩和检验进行比较。

5. 某部队共有1200人,在某段时间内患某病人数有120人,其中男性114人(95%),女性6人(5%)。某卫生员进行统计分析后说:该病的两性发病率之间相差非常显著,由此得出结论“该病男性易得”。你对这个结论有何看法?为什么?答:这个结论值得怀疑。因为1200人中男性和女性的人数并不知道,因此该资料仅能计算构成比,而不能计算男女性的发病率,。若1200人中,只有6名女性,则结论正好与卫生员得出的结论相反。

6.某医院用中药治疗7例再生障碍性贫血患者,现将血红蛋白(g/L)变化的数据列在下面,假定资料满足各种参数检验所要求的前提条件,若要了解治疗前后之间的差别有无显著性意义,应当选择哪种检验方法,为什么?

患者编号 1 2 3 4 5 6 7 治疗前血红蛋白65 75 50 76 65 72 68

治疗后血红蛋白82 112 125 85 80 105 128 答:用配对t检验。因为该资料是同一受试对象治疗前后比较,属于配对设计,而且例数仅有7例,所以选用配对t检验。

7.某卫生防疫站对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度资料如下。求其平均滴度用什么指标合适,请说出理由。

抗体滴度1:8 1:16 1:32 1:64 1:128 1:256 1:512合计

例数 2 6 5 10 4 2 1 30 答:用几何均数描述,因为该抗体滴度资料呈对数正态分布,要正确描述其平均水平,应该用几何均数。

8.145名食物中毒病人的潜伏期如下表,选择适应的指标求其平均

潜伏期,请说出理由。

145名食物中毒病人的潜伏期

潜伏期人数

0~ 17

6~ 46

12~ 38

18~ 32

24~ 6

30~ 0

36~ 4

42~48 2

答:用中位数。因为该资料是正偏态分布,适合用中位数描述其平均水平。

9.某医院用中药治疗7例再生障碍性贫血患者,现将血红蛋白(g/L)变化的数据列在下面,假定资料满足各种参数检验所要求的前提条件,若要了解治疗前后之间的差别有无显著性意义,应当选择哪种检验方法,为什么?

患者编号 1 2 3 4 5 6 7 治疗前血红蛋白65 75 50 76 65 72 68 治疗后血红蛋白82 112 125 85 80 105 128 答:用配对t检验。因为该资料是同一受试对象治疗前后比较,属于配对设计,而且例数仅有7例,所以选用配对t检验。10.活动型结核患者的平均心率一般为86次/分,标准差为6.5次/分。现有一医生测量了36名该院的活动型结核患者的心率,得心率均数为90次/分,标准差为7.8次/分,要比较该院活动型结核患者与一般活动型结核患者的心率有无差别,应当选择哪种检验方法,为什么?

答:用样本均数与总体均数比较的t检验。因为已知一般活动型结核患者的平均心率,可看为总体均数。而36名该院的活动型结核患者的心率均数可看为一个样本均数。比较两者有无差别,宜用样本均数与总体均数比较的t检验。

11.某医生调查了维吾尔族与回族居民血型构成,资料见下表,他要比较两民族血型分布是否相同,选择用R×C表卡方检验,是否正确?为什么?

维吾尔族与回族居民血型构成比调查结果

民族血型构成比(%)调查例数

A B O AB

维吾尔族29.21 31.92 27.50 11.37 1513 回族27.23 28.34 35.94 8.49 1355 答:对的。因为由上表可知,血型是无序分类变量,要比较两组无序分类变量的构成宜用行×列表的卡方检验。

12. 某地抽样调查144名正常成年男子红细胞数(万/立方毫米), 此资料符合正态分布, 现计算其均数为537.8(万/立方毫米),标准差为40.9(万/立方毫米),标准误为3.66(万/立方毫米), 故该地正常成年男子红细胞的95%可信区间下限为537.8-1.96×40.9=457.64(万/立方毫米); 上限为537.8+1.96×4 0.9=617.96(万/立方毫米)。该分析正确否? 为什么?

答:错。题目要求计算95%可信区间,可是在具体计算时,误用了是95%参考值范围的公式。正确的计算:下限为537.8-1.96×3.66,上限为537.8+1.96×3.66。

13. 某地1968年与1971年几种主要急性传染病情况如下表。某医师根据此资料中痢疾与乙脑由1968年的44.2%与3.4%分别增加到1971年的51.9%和5.2%,认为该地1971年痢疾与乙脑的发病率升高了,值得注意!你的看法如何?为什么?

━━━━━━━━━━━━━━━━━━━━

1968年1971年

病种──────────────

病例数%病例数%

━━━━━━━━━━━━━━━━━━━━

痢疾4206 44.2 3079 51.9

麻疹2813 29.6 1465 24.7

流脑1650 17.3 824 13.9

乙脑327 3.4 310 5.2

白喉524 5.5 256 4.3

────────────────────

合计9520 100.0 5934 100.0

━━━━━━━━━━━━━━━━━━━━

答:错。表中计算的是构成比,结论中误把它当成发病率来解释,犯了以比代率的错误。

医学统计学复习题65915

预防医学复习题(统计部分) 复习重点(及简答题) 1. 医学统计学的基本概念 如:总体与样本的联系区别 2. 资料的分类 如:请列举资料的类型并举例说明 3. 定量资料统计描述的指标(集中与离散趋势) 如:定量统计描述指标有哪些? 如:正态分布与偏态分布资料统计描述方法有何区别 4. 定性资料统计描述的指标 5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律 如:正态分布、标准正态分布与t分布的区别联系 6. 小概率事件在医学统计学的应用(P值的含义) 如:P值的含义是什么,对统计结论有何意义 7. 假设检验的基本原理与步骤 8. 四种主要统计假设检验方法及其应用场合 9. 统计表的绘制 选择题 1.样本是总体中: A、任意一部分 B、典型部分 C、有意义的部分 D、有代表性的部分 E、有价值的部分 2、参数是指: A、参与个体数 B、研究个体数 C、总体的统计指标 D、样本的总和 E、样本的统计指标 3、抽样的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 4、脉搏数(次/分)是: A、观察单位 B、数值变量 C、名义变量 D.等级变量 E.研究个体 5、疗效是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 6、统计学常将P≤0.05或P≤0.01的事件称 A、必然事件 B、不可能事件 C、随机事件 D、小概率事件 E、偶然事件7.统计中所说的总体是指:

A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体 8.概率P=0,则表示 A某事件必然发生B某事件必然不发生C某事件发生的可能性很小 D某事件发生的可能性很大E以上均不对 9.总体应该由 A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成 10. 在统计学中,参数的含义是 A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量 11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本 12.统计学中的小概率事件,下面说法正确的是: A.反复多次观察,绝对不发生的事件 B.在一次观察中,可以认为不会发生的事件 C.发生概率小于0.1的事件 D.发生概率小于0.001的事件 E.发生概率小于0.1的事件 13、统计上所说的样本是指: A、按照研究者要求抽取总体中有意义的部分 B、随意抽取总体中任意部分 C、有意识的抽取总体中有典型部分 D、按照随机原则抽取总体中有代表性部分 E、总体中的每一个个体 14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。 A、计算 B、计数 C、计量 D、等级 E、都对 15、红细胞数是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 16、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为: A.所有成年男子 B.该市所有成年男子 C.该市所有健康成年男子 D.120名该市成年男子 E.120名该市健康成年男子 17、某地区抽样调查1000名成年人的血压值,此资料属于: A、集中型资料 B、数值变量资料 C、无序分类资料 D、有序分类资料 E、离散型资料 18、抽样调查的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 19、测量身高、体重等指标的原始资料叫: A计数资料 B计量资料 C等级资料 D分类资料E有序分类资料 20、某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗数8 23 6 3 1

《医学统计学》期末模拟考试题(四)

《医学统计学》期末模拟考试题(四)学号______________ 姓名______________ 班级______________ 成绩 ____________ 一、是非题(每题1分,共20分) 1. 预试验的样本标准差s越小,所需样本含量越大。() 2. 等级相关系数的大小不可以反映两个现象间关系的密切程度。() 3. 在配对资料秩和检验中,两组数据统一从小到大编秩次。() 4. 对3个地区居民的血型构成作抽样调查后研究其差别,若有一个理论数小于5大于1,其余都大于5,可直接作χ2检验。() 5. 总例数等于60,理论数都大于5的四格表,对两个比例的差别作统计检验,不可用确切概率法。() 6. 双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。() 7. 随机区组方差分析中,只有当区组间差别的F检验结果P>0.05时,处理组间差别的F检验才是真正有 意义的。() 8. 完全随机设计资料方差分析中要求各组均数相差不大。() 9. 两次t检验都是对两样本均数的差别作统计检验,一次P<0.01,另一次P<0.05,就表明前者两样本均 数差别大,后者两样本均数相差小。() 10. 如果把随机区组设计资料用完全随机设计方差分析法作分析,前者的区组SS+误差SS等于后者的组内SS。()

11. 两分类Logistic回归模型的一般定义中,因变量(Y)是0~1变量。() 12. 作两样本均数差别的比较,当P<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。()<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。() 13. 方差分析的目的是分析各组总体方差是否不同。() 14. 在两组资料比较的秩和检验中,T值在界值范围内则P值小于相应的概率。()值在界值范围内则P值小于相应的概率。() 15. 无论什么资料,秩和检验的检验效率均低于t检验。()检验。() 16. 分类资料的相关分析中,检验的P值越小,说明两变量的关联性越强。() 17. 析因设计既可以研究各因素的主效应作用,又可以研究各因素间的交互作用。( ) 18. 当Logistic回归系数为正值时,说明该因素是保护因素;为负值时,说明该因素是危险因素。() 19. 常见病是指发病率高的疾病。( ) 20. 用某新药治疗高血压病,治疗前与治疗后病人的收缩压之差的平均数,经t检验,P<0.01。按a=0.05水准,可以认为该药治疗高血压病有效,可以推广应用。( ) 二、选择题(每题1分,共20分) 1.多重回归中要很好地考虑各因素的交互作用,最好选用________。 a. 最优子集法 b. 逐步法 c. 前进法 d. 后退法 e. 强制法 2.t r

医学统计学复习题

医学统计学复习题 一、名词解释 1、总体 2、样本 3、随机抽样 4、变异 5、概率 6、随机误差(偶然误差) 7、参数 8、统计量 9、算术均数 10、中位数 11、百分位数 12、频数分布表 13、几何均数 14、四分位数间距 15、方差 16、标准差 17、变异系数 18、标准正态分布 19、医学参考值范围 20、可信区间 21、统计推断 22、参数估计 23、标准误及 24、检验水准 25、检验效能 26、率 27、直线相关 28、直线回归 29、实验研究 30、回归系数 二、单项选择 1.观察单位为研究中的()。 A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标 2.总体是由( )组成。 A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标 3.抽样的目的是()。 A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征 4.参数是指( ) 。 A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标 5.关于随机抽样,下列哪一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随机抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.选择符合研究者意愿的样本 6.反映计量资料平均的指标是()。 A.频数 B.参数 C.百分位数 D.平均数 E.统计量 7.表示总体均数的符号是( ) 。 A.σ B.μ C.X D. S E. M

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

医学统计学第三版第四章课后习题答案

2. ANOVA 实验结果 Sum of Squares df Mean Square F Sig. Between Groups 43.194 3 14.398 13.697 .000 Within Groups 37.842 36 1.051 Total 81.036 39 Multiple Comparisons Dependent Variable: 实验结果 Dunnett t (2-sided)a (I) 分组(J) 分组Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 0.5 对照组-2.15000*.45851 .000 -3.2743 -1.0257 1.0 对照组- 2.27000*.45851 .000 - 3.3943 -1.1457 1.5 对照组-2.66000*.45851 .000 -3.7843 -1.5357 F=13.697 P=0.000004 P A=0.000113 P B=0.000051 P C=0.000004均小于0.001 根据完全随机资料的方差分析,按α=0.05水准,拒绝H0,接受H1,认为四组治疗组小白鼠的肿瘤重量总体均数不全相等,即不同剂量药物注射液的抑癌作用有差别。 3. Tests of Between-Subjects Effects Dependent Variable: 重量 Source Type III Sum of Squares df Mean Square F Sig. Hypothesis 99736.333 1 99736.333 58.489 .005 Error 5115.667 3 1705.222a 治疗 Hypothesis 6503.167 2 3251.583 44.867 .000 Error 434.833 6 72.472b 分组 Hypothesis 5115.667 3 1705.222 23.529 .001 Error 434.833 6 72.472b F:44.867 23.529 P:0.000246 0.001020<0.01 根据随机区组资料的方差分析,按α=0.05水准,拒绝H0,接受H1,三组注射不同剂量雌激素的大白鼠子宫重量总体均数不全相等,即注射不同剂量的雌激素对大白鼠子宫重量有影响 5.

医学统计学模拟试题

医学统计学模拟试题(A) 一、单选题:在A、B、C、D 和E 中选出一个最佳答案,将答案的字母填在相应下划线的空格里。 (每题1 分) 1. 卫生统计工作的基本步骤包括_____。 A 动物实验、临床试验、全面调查和抽样调查 B 资料整理、统计描述、参数估计和统计推断 C 实验设计、资料收集、资料整理和统计分析 D 资料收集、资料核对、资料整理和资料分析 E 统计设计、统计描述、统计估计和统计推断 2. 以下_____不属于定量资料。 A. 体块指数(体重/身高2) B. 白蛋白与球蛋白比值 C. 细胞突变率(%) D. 中性核细胞百分比(%) E. 中学生中吸烟人数 3. 关于频数表的制作, 以下_____论述是正确的。 A. 频数表的组数越多越好 B. 频数表的下限应该大于最小值 C. 频数表的上限应该小于最大值 D. 一般频数表采用等距分组 E. 频数表的极差是最小值与最大值之和 4. 比较身高与坐高两组单位相同数据变异度的大小,宜采用_____。 A. 变异系数(CV)B.标准差(s)C.方差(s2)D.极差(R)E.四分位间距 5. 从μ到μ+1.96s 范围外左右两则外正态曲线下的面积是_____ 。 A.2.5% B.95% C.5.0% D.99% E.52.5% 6. 关于假设检验的以下论述中,错误的是_____。 A. 在已知A药降血压疗效只会比B 药好或相等时, 可选单侧检验 B. 检验水准 定得越小, 犯I型错误的概率越小 C. 检验效能1- 定得越小, 犯II型错误的概率越小 D. P 值越小, 越有理由拒绝H0 E. 在其它条件相同时, 双侧检验的检验效能比单侧检验低 7. 两组数据中的每个变量值减同一常数后,做两个样本均数( X)差别的t 检验,____。 A. t 值不变B. t 值变小C. t 值变大 D. t 值变小或变大E. 不能判断 8. 将90 名高血压病人随机等分成三组后分别用A、B 和C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是____ 。 A. 作三个样本两两间差值比较的t 检验 B. 作三个样本差值比较的方差分析 C. 作服药前后配对设计资料的t 检验方差分析 D. 作配伍组设计资料的方差分析 E. 以上都不对

医学统计学复习习题2018

医学统计学期末复习题 一、单项选择题 1 下面的变量中是分类变量的是 A.身高 B.体重 C.年龄 D.血型 2 下面的变量中是是数值变量的是 A.性别 B.年龄 C.血型 D.职业 3.随机事件的概率 P 为 =0 B. P=1 C. P= D. 0

2017年人民大学统计学生物医学统计学考研参考书

2017年人民大学统计学生物医学统计学考研参考书 统计学:生物医学统计学 风险管理与精算学: 《概率论》,李贤平,高等教育出版社 《数理统计基础》,陆璇,清华大学出版社 《概率论与数理统计》,茆诗松、周纪芗,中国统计出版社 《应用回归分析》,何晓群等编,中国人民大学出版社 《统计学》,贾俊平等编,中国人民大学出版社 概率论与数理统计: 《数学分析》上、下册复旦大学数学系陈传璋、金福临等编高等教育出版社《高等代数》北京大学出版社 《概率论》李贤平高等教育出版社 《数理统计基础》陆璇清华大学出版社 《概率论与数理统计》茆诗松、周纪芗中国统计出版社 流行病与卫生统计学: 《流行病学》詹思延人民卫生出版社 《卫生统计学》方积乾、徐勇勇、陈峰编人民卫生出版社 (专业学位)应用统计: 《统计学》第四版贾俊平中国人民大学出版社配套习题 《应用回归分析》何晓群等编中国人民大学出版社 《多元回归分析》何晓群等编中国人民大学出版社 《抽样技术》金勇进等编中国人民大学出版社 《时间序列分析》易丹辉中国人民大学出版社 《概率论与数理统计》第三版刘次华高等教育出版社配套习题 2017年新祥旭考研全程复习计划

一、英语全程规划 基础阶段(3月-6月) 1.学习目标:完成至少1轮的单词背诵,巩固语法基础 2.阶段重点:英语单词、语法 3.复习建议: (1)英语每天抽空背背单词,建议时长0.5-1h;不管是用单词软件还是传统词书,不管是用词根词缀还是死记硬背,最重要的是每天都背。积累到某一天时,你会发现好多文章都看得懂了。 (2)英语基础不牢的童鞋,应该花点时间复习语法。语法知识能帮助你在读文章和翻译时更加流畅、对文章意思把握得更准确。 (3)多看看新闻,关注时事热点。近年来的英语作文和阅读都是涉及到热点话题的。 (4)不建议大家在这个阶段做习题集。 强化阶段(7月-10月) 1.学习目标:熟读并详细分析近10年真题 2.阶段重点:真题真题真题,重点是阅读 3.复习建议: (1)单词记忆每天进行,不间断。 (2)定时做真题阅读,做完后详细分析。 ①利用早上整段的时间做真题(作文可以不写),不要查单词,完全自己做,然后对答案,之后看一下答案分析。 ②每天分析2-3篇,分析包括:第一遍分析正确选项,第二遍分析错误选项的设置,第三遍在原位中找对应的句子,是每个选项对应的句子哟,分析为什么这样出题,第四遍,了解文章的背景,作者的情感。 ③此阶段不建议专门建立单词笔记本,重要的单词在分析时顺便查一下就好。 ④时间比较充足的童鞋可以全文翻译阅读原文。 (3)完成阅读后,用同样的方法完型、翻译和新题型。完型和新题型这两类题型不用全文

(完整word版)医学统计学上机考试复习题及答案

“医学统计学”上机考试模拟题A卷 1.测得10例某指标值治疗前后情况如下: 例号 1 2 3 4 5 6 7 8 9 10 治疗前76 64 60 62 72 68 62 66 70 60 治疗后74 62 64 58 68 70 56 60 66 56 1.用参数方法比较治疗前后该指标值的差异有无统计学意义,结果填入下表: 例数均数标准差治疗前 治疗后 差值(前-后) H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量t=2.512 P=0.0332 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即治疗前后该指标值有差异。 2.上题资料,用非参数方法比较治疗前后该指标值的差异有无统计学意义。结果填入下面空格。 H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量s=19.5 P=0.0547 统计结论:P>0.05,不拒绝H0,认为在α=0.05水平上差异无统计学意义,即治疗前后该指标值无差异。

3.测得10例正常儿童身高(cm)和体重(kg)如下: 例号 1 2 3 4 5 6 7 8 9 10 身高(X)120 133 126 130 121 122 131 128 110 124 体重(Y)20 27 23 25 25 18 22 25 15 22 (1)求身高和体重的相关系数,并作显著性检验。 相关系数r =0.81211 H0:p=0 H1:p≠0 P= 0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重存在正相关。 (2)求身高推算体重的直线回归方程,并作显著性检验。 直线回归方程:y=-32.964+0.443*x H0:β=0 H1:β≠0 P=0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重之间存在直线回归关系。 三.10名氟作业工人在工作前后测定尿氟(mg/L)排出量结果如下: 编号 1 2 3 4 5 6 7 8 9 10 工前 1.7 1.6 1.4 2.3 1.9 0.8 1.4 2.0 1.6 1.1 工后 2.7 3.1 3.2 2.1 2.7 2.4 2.6 2.4 2.3 1.4 1.计算工后比工前尿氟排出量增加值的均数,标准差,标准误,变异系数和中位数。 均数0.91,标准差0.635,标准误 0.201,变异系数 69.78,中位数 0.900 2.检验氟作业工人在工作前后尿氟排出量的差异有无统计学意义。 H0:氟作业工人在工作前后尿氟排出量的差异无统计学意义。 H1:氟作业工人在工作前后尿氟排出量的差异有有统计学意义 统计量t=4.532 P=0.0014

【孙振球第三版】医学统计学复习题

一、名词解释: 1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。 2、有限总体:是指空间、时间范围限制的总体。 3、无限总体:是指没有空间、时间限制的总体。 4、样本:从总体中随机抽取部分观察单位,其实测值的集合。 5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。 6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。 8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。 9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。 11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。检验水平,就是预先规定的允许犯I型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。 14、率:强度相对数,说明某现象发生的频率或强度。 15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。 16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。 17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。 18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。 20、相关系数:又称Pearson积差相关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1≤r≤1。相关系数的检验假设常用t检验。 21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。 22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。 23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。 (2)多分类:各类间互不相容。 25、期望寿命:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。 26、检验效能:表达式为1-β,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。 27、观察单位:亦称个体,是统计研究中的基本单位。它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。 28、样本含量:样本中包含观察单位数称为该样本的样本含量。 29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。 30、变量值:对变量的观测值称为变量值或观察值。 31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差②非系统误差。32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。 33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。 34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。

医学统计学模拟试卷与答案

医学统计学历年常考总结试题3元第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制() A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是() A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用() A 变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是() A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为() (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为() A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验() A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,

自由度是() (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映() A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的( ) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系 数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?() A t r>t b B t rχ20.05,ν可认为() A各总体率不同或不全相同B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数 4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为() A.pearson卡方检验 B.校正卡方检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;

医学统计学模拟试卷及答案

(注:红色字体表示已经改正,多余表示删除的内容) 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验(C) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A) A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小

医学统计学 练习题

1、某医院用中药治疗7例再生障碍性贫血患者,现将血红蛋白(g/L)变化的数据列在下面,假定资料满足各种参数检验所要求的前提条件,问:治疗前后之间的差别有无显著性意义?(15分) 患者编号 1 2 3 4 5 6 7 治疗前血红蛋白65 75 50 76 65 72 68 治疗后血红蛋白82 112 125 85 80 105 128 2、活动型结核患者的平均心率一般为86次/分,标准差为6.5次/分。现有一医生测量了36名该院的活动型结核患者的心率,得心率均数为90次/分,标准差为7.8次/分,试问该院活动型结核患者与一般活动型结核患者的心率有无差别? 3、某医院将200名乙型肝炎患者随机分为甲、乙两组,各100人。甲组患者用常规治疗法,乙组患者用常规治疗加心理治疗,用一种权威评分法对两组患者的疗效进行评价,结果测得甲组均数为75.78分,标准差为3分,乙组患者均数为89.45分,标准差为4分,问心理治疗有无效果?

4、某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记录如下表,问左右肾重量有无不同? 20例男性尸解时的左、右肾的称重记录 编号 左肾 (克) 右肾 (克) 编号 左肾 (克) 右肾 (克) 1 170 150 11 155 150 2 155 145 12 110 125 3 140 105 13 140 150 4 11 5 100 14 145 140 5 235 222 15 120 90 6 125 115 16 130 120 7 130 120 17 105 100 8 145 105 18 95 100 9 105 125 19 100 90 10 145 135 20 105 125 5、为了研究冠心病与血总胆固醇有无关系,某医生随机收集得冠心病患者和健康人的血总胆固醇(mmol/L)数据如下表,请作分析。 冠心病患者和健康人的血总胆固醇(mmol/L) 组别例数均数标准差 冠心病患者45 5.68 0.87 健康人46 4.91 0.86 6、为研究黄芪对细胞中RNA代谢的影响,在人肌皮肤二倍体细胞培养上进

医学统计学模拟试题B

医学统计学模拟试题(B) 一、单选题:在A,B,C,D,E 中选一个最佳答案, 将答案字母填在下划线里(每题1 分) 1. 在医学统计学中样本与总体的关系是__________。 A样本是总体中有代表性的一部分 B 样本是总体中最有特点的一部分 C 样本是总体中典型的一部分 D 样本是总体中有意义的一部分 E 样本是总体中精心挑选出来的一部分 2. 以下关于概率的定义中,__________是错误的。 A. 当概率小于0.05, 则为不可能事件 B. 当概率等于1, 则为必然事件 C. 当概率在0 至1 之间时, 为随机事件 D. 当重复实验次数足够大时, 事件发生频率接近概率 E. 当概率等于零, 则为非随机事件 3. 频数表不能__________。 A. 反映频数分布的特征 B. 方便进一步统计分析计算 C. 便于发现异常值 D. 精确估计算术均数的值 E. 用于分类资料 4. 在描述定量资料的集中趋势时, 以下论述中错误的是__________。 A. 均数适宜于对称分布资料 B. 几何均数和中位数都适宜于正偏倚分布 C. 同一正偏倚分布资料, 估计的均数值小于中位数值 D. 对称分布资料的均数值等于中位数值 E. 几何均数特别适宜于细菌学和免疫学检测指标的描述 5. 用大量来自同一总体的独立样本对总体参数作估计时,关于95%可信区间(CI),正确的说法是__________。 A. 大约有95%样本的95%CI覆盖了总体参数 B. 对于每一个95%CI而言,总体参数约有95%的可能落在其内 C. 各个样本的95%CI是相同的 D. 对于每一个95%CI而言,有95%的可能性覆盖总体参数 E. 以上说法都不对 6. 在假设检验中,关于P值与 值,下列说法不正确的是__________。 A. α值是决策者事先确定的一个可以忽略的、小的概率值 B. P值是在H0 成立的条件下,出现当前值以及更极端状况的概率 C. α值并不一定要取0.05, 根据实际需要甚至可以取到0.15 D. 在同一次假设检验中,作单侧检验时所得P值比作双侧检验时所得P值小 E. α值越小,所得结论越可靠 7. 当组数等于2 时,对于同一资料,方差分析与t 检验的关系是____ 。 A.完全等价且F=t B.方差分析结果更准确C.t 检验结果更准确 D.完全等价且t=FE.以上都不对 8. 下列关于方差分析的陈述中正确的是____。 A. 方差分析用于比较各组的总体方差是否相等

医学统计学复习题

中国医科大学网络教育学院 医学统计学复习题 一、最佳选择题 1. 下列资料何为定性资料? A 体重(kg) B 血型(A、B、O、AB) C 血红蛋白(g/L) D 坐高指数(%,坐高/身高) E 白细胞计数(个/L) 2. 下列资料属于等级资料的是_______ A 白细胞计数(个/L) B 血型(A、B、O、AB) C 体重(kg) D 病人的病情分级(轻、中、重) E 坐高指数(%,坐高/身高) 3.医学科学研究中的随机样本是指_______ A 总体中的一部分 B 研究对象的全体 C 总体中特殊的一部分 D 总体中有代表性的一部分 E 研究对象中一部分有特殊代表性的样本 4.统计工作的基本步骤是_______ A 设计、搜集资料、整理资料和分析资料 B 设计、统计分析、统计描述和统计推断 C 选择对象、计算统计指标、参数估计和假设检验 D 搜集资料、计算均数、标准差、标准误 E 搜集资料、整理资料和分析资料 5.统计学的小概率事件是指随机事件发生的概率_______ A 等于0.05 B 小于等于0.05 C 大于0.05 D 小于0.05 E 大于等于0.05 6.医学统计学的主要研究对象是_____。 A.随机事件B.必然事件C.不可能发生的事件D.发生可能性很小的事件E.发生可能性很大的事件 7.编制组段数为10的频数表,在确定组距时______ A 常取最大值的1/10取整作为组距 B 常取最小值的1/10取整作为组距 C 常取极差的1/10取整作为组距 D 组距等于极差 E 常取极差的一半取整作为组距 8.频数分布的两个重要特征是______ A 集中趋势和分布类型 B 集中趋势和离散趋势 C 标准差和离均差

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

相关主题
文本预览
相关文档 最新文档