当前位置:文档之家› 医学统计学课后答案

医学统计学课后答案

医学统计学课后答案
医学统计学课后答案

第二章

1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。

均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。

几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。

中位数和百分位数:

中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。

百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。

2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。

极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。

方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。

变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。

3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百

分之几,它是对比的最简单形式。其计算公式为

比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为:

比例基数(单位总数

可能发生某现象的观察单位数

实际发生某现象的观察率K ?=

构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或

分布,常以百分数表示,其计算公式为:

100%=

?某一组成部分的观察单位数

构成比同一事物内各组成部分的观察单位总数

4.答:当比较两类事物的总率时,如果此两同类事物的内部构成,特别是某项能影响指标水平的重要特征在构成上不同,往往会高估或低估总率。在这种情况下,直接进行两个总率的比较,会产生错误的结论。此时,必须首先设法消除这种内部构成上的差别,才能进行比较。统计学上将这种方法称为率的标准化(standardization method of rate),即采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,调整后的率为标准化率,简称为标化率。 5

(1) 编制频数分布表并绘制频数分布图,简述这组数据的分布特征;

组段 频数 频率(%) ;累计频数(%) 组中值 108 3 2.5 2.5 109.5 111~ 10 8.33 10.83 112.5 114~ 22 18.33 29.17 115.5 117~ 38 31.67 60.83 118.5 120~ 20 16.67 77.5 121.5 123` 18 15 92.5 124.5 126~ 7 5.83 98.33 126.5 129~132 2 1.67 100 129.5 合计

120

100

F r e q u e n c y

''height (cm)''

108.00

111.00

114.00

117.00

120.00123.00

126.00129.00132.00135.00

0.00

5.0010.0015.0020.0025.00

30.0035.00

(2) 计算中位数、均数、几何均数,用何者表示这组数据的集中位置好? 答:

()3109.510112.522115.538118.520121.518124.57126.52139.5/120

X ≈?+?+?+?+?+?+?+?

=119.4135 ()1lg lg 3109.5lg10112.5lg 22115.5lg 38118.5lg 20121.5lg18124.5lg 7126.5lg 2139.5/120g X -≈?+?+?+?+?+?+?+????? =119.25125

116.63d M =

用均数较好.

(3) 计算极差、标准差,用何者表示这组数据的离散趋势好? 答:极差:22.62

四分位数间距:5.915 标准差:4.380736

用标准差表示较好.

6.答:本例频数分布为偏态分布,长尾拖向x 轴正方向,故为正偏态。适宜用中位数表示其平均水平,中位数为4,四分位数间距为4。

7.40名麻疹易感儿童接种麻疹疫苗后一个月,血凝抑制抗体滴度如下表。试计算平均滴度。

抗体滴度 1:4 1:8 1:16 1:32 1:64 1:128 1:256 1:512

人数

1 5 6

2 7 10 4 5

几何均数:exp((ln(4)+5×ln(8)+16×ln(16)+2×ln(32)+7×ln(64)+10×ln(128)+4×ln(256)+5×ln(512))/40) =128

8.答:此医生的分析是不正确的,原因在于:

首先明确率的定义:)

比例基数(单位总数

可能发生某现象的观察单位数

实际发生某现象的观察率K ?=

发病率的分子为“某时期内发病人数”,而被观察对象某时期内可能发病多次,所以发病

人数是人次数;分母为“同时期平均人口数”,而按率的定义应为“同时期暴露总人数

该单位抽样检查2839名职工,其中高血压患者中,男性是178例,女性是49例,共227例,可以计算高血压患者占接受检查所有职工的构成比为7.995773%

至于40岁以上的患者占接受检查总人数的90.3%,也是构成比;60岁以上者占接受检查总人数的10.2%也是构成比,不能与发病率混为一谈。关于高血压与性别有关的结论也不妥。因为在接受检查人群中的男女内部构成比是不同的,要进行比较首先要设法消除内部构成比的差异,即就是率的标准化,然后比较。 第三章

1 正态分布与标准正态分布的区别:

正态分布是一簇单峰分布的曲线,μ和σ可以有任意取值;标准正态分布是一条单峰曲线,μ和σ有固定的值,μ=0,σ=1。

2 u = (x-μ)/σ= (μ-σ-μ)/σ= -1

查标准正态分布表,得Φ(-1)=0.1587,所以小于μ-σ者所占的比例为15.87%。

3 医学参考值范围的含义:是根据正常人的数据估计绝大多数正常人某项指标所在的范围。选定同质的正常人作为研究对象。所谓正常人是指不具有影响所测指标的因素或疾病的那类同质人群。

确定原则:①选定同质的正常人群作为研究对象 ②控制检测误差

③判断是否分组

④单、双侧问题

⑤选择百分界值

⑥确定可疑范围

方法:①正态分布法:适用于服从正态分布或近似正态分布的资料

②百分位数法:适用于不服从正态分布的资料

③对数正态分布法:适用于对数正态分布的资料

4 如果资料服从正态分布,那么双侧95%正常值范围为μ±1.96σ;如果资料不服从正态分布,那么双侧95%正常值范围就不能用正态分布来做。

5 1人以下的概率:P(x≤1)=P(0)+P(1)=C1000.200.810+C1010.210.89 =0.375

8人以上的概率:

P(X≥8)=P(8)+P(9)+P(10)=C1080.280.82+C1090.290.81+C10100.2100.80 =7.79×105

6 二项分布的应用条件:

①观察单位只能有互相对立的两种结果之一。

②已知发生某一结果的概率π不变,其对立结果的概率则为1-π

③n次试验在相同的条件下进行,且各观察单位的结果互相独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。

7 二项分布和正态分布之间的关系:随着n的增大,二项分布逐渐逼近正态分布。当nπ较大时,二项分布B(n,π)近似正态分布。

举例:病人的治愈与不治愈,理化检验结果的阴性与阳性,个体的发病与不发病等属于二项分布资料;某地区12岁男孩的身高,某学校同年级女生的体重等属于正态分布。

第四章

1

标准差标准误

不同:

意义上:描述一组变量值的离散程

描述样本均数的离散称度

应用上:1、标准差越小,说明变量

值围绕均值分布越紧密,均

数的代表性越好。1、标准误越小,说明样本均数和总体均数的差异越小,用样本均数估计总体均数的可靠性越大。

2、x u sα

±估计变量值的分布范围。2、用

x

x t s

α

±估计总体均数的可信区间。

与n的关系:n越大,标准差越稳定n越大,标准误越小相同:

1、都是描述变异度的统计指标

2、x

x n

σσ=

x σ与x σ成正比,与n 成反比;

3、n 一定时,同一组资料,标准差越大,标准误也越大。

2 α水准是在假设检验之前确定的,说明按不超过多大的误差为条件作结论,是犯Ⅰ型错误的最大风险,是事前概率;P 值是指由H 0所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量值得概率。标明以多大的误差拒绝H 0,是事后概率。

3 ①配对设计的差值的总体均数的可信区间表达公式:,1n d d t s α-±

两均数差值的总体均数的可信区间表达公式:

②可以用可信区间回答假设检验的问题。可信区间估计与假设检验时统计学中两种重要的、独特的思维方式,它们在原理上相通,均基于抽样误差理论,只是考虑问题的角度不同。例如:样本均数与总体均数的比较,用可信区间的估计方法,观察由样本信息估计的总体均数的可信区间是否包含已知的总体均数,即可推断该样本是否来自已知均数的总体;用假设检验的方法,先假设样本均数代表的总体均数等于某已知的总体均数,再判断样本提供的信息是否支持这种假设。

4 拒绝实际上成立的H 0,这类“弃真”的错误称为Ⅰ型错误或第一类错误;不拒绝实际上是不成立的H 0,这类“存伪”的错误称为Ⅱ型错误或第二类错误。第一类错误的概率用α表示,第二类错误的概率用β表示。α越大,β越小;反之,α越小,β越大。

拒绝H 0,只可能犯第一类错误,不可能犯第二类错误;不拒绝H 0,只可能犯第二类错误,不可能犯第一类错误。

由于假设检验中可能犯第一类错误或第二类错误,所以结论不能绝对化。

5 t 检验的应用条件:独立性、正态性、方差齐性。 u 检验的应用条件:适用于大样本资料。

t 检验和u 检验的关系:随自由度的增加,t 分布逐渐趋向于标准正态分布。因此u 检验是t 检验的一种近似检验方法。当自由度大于50时,近似程度比较满意。

6 假设检验的意义就是分辨所研究的样本是否分别属于不同的总体,并对总体做出适当的结论。

假设检验应注意的问题:

① 要有严密的抽样研究计划:要保证样本是从同质总体中随机抽取,除了对比的因

素外,其他影响结果的因素应一致。 ② 选用的假设检验方法应符合应用条件。 ③ 结论不能绝对化。

④ 正确理解差别有无显著性的统计意义:

()()???? ??+-+-+-±-n

n n

n s

n s n t x x 2121222211,2111211να

差别有统计意义或有显著性,指我们有很大的把握认为原假设不成立,并非是说它们有较大差别;差别无统计学意义或无显著性,我们只是认为以很大的把握拒绝原假设的理由还不够充分,并不意味着我们很相信它。 ⑤ 统计学意义与其他专业上的意义不同。

7 H 0:矽肺患者的血红蛋白与健康人相同,即μ=μ0 H 1:矽肺患者的血红蛋白与健康人不同,即μ≠μ0 α=0.05

t = =|12.5914.02|

2.77431.63/10-=

ν= 10-1=9,t 0.05,9=2.262

为矽肺患者的血红蛋白与健康人不同。

8 H 0:新药与常规药物的疗效没有差别,即μ1=μ2 H 1:新药与常规药物的疗效不同,即μ1≠μ2 α=0.05

=1.2823

ν=n 1+n 2-2=20-2=18,t 0.05,18=2.1010.05,不拒绝H 0,差别无统计学意义,尚不能认为新药与常规药物的疗效不同。

9⑴甲药:

H 0:甲药无效,即μd =0 H 1:甲药有效,即μd ≠0 α=0.05

=5.2372

ν= 10-1=9,t 0.05,9=2.262

乙药:

H 0:乙药无效,即μd =0 H 1:乙药有效,即μd ≠0 α=0.05 =5.3033

ν= 10 -1=9,t 0.05,9=2.262

⑵ H 0:甲乙两药的疗效没有差别,即μ1=μ2

n s x μ

-()()?

?

?

? ??+-+-+--=∑∑∑∑n n n n n x x n x x x x t 21212222

21212121112n

d t s d =n

d t s d

=

H 1:甲乙两药的疗效有差别,即μ1≠μ2

=1.6022

ν=n 1+n 2-2=20-2=18,t 0.05,18=2.101>t ,p>0.05,不拒绝H 0,差别无统计学意义,可以认为甲乙两药的疗效没有差别。

第六章

1不满足正态近似条件,所以采用直接计算概率法。 H 0:加维生素C 的治愈率与不加相同,即π=π0=0.6 H 1:加维生素C 的治愈率高于不加维生素C ,即π>π0 α=0.05

P(X≤8)=1-P(X≥9)=1-P(X=9)-P(X=10)=1-C 109*0.69*0.41-C 1010*0.610*0.40= 0.9536>0.05 不拒绝H 0,差别无统计学意义,可以认为加维生素C 的治愈率与不加相同。

2满足正态近似条件,采用正态近似法。

H 0:经健康教育后的高血压患病率与以前相同,即π=π0=0.6 H 1:经健康教育后的高血压患病率比以前降低,即π<π0 单侧α=0.05

()0

001/p u n

πππ-=

=- 4.9453536

u >u 0.05,单侧=1.64

p<0.05,拒绝H 0,接受H 1,差别有统计学意义,可以认为经健康教育后的高血压患病率与以前有差别。

3①建立检验假设和确定检验水准

H 0:男女大学生HBV 感染对其心理影响相同,即π1 =π2 H 1:男女大学生HBV 感染对其心理影响不同,即π1≠π2 检验水准α=0.05 ②计算检验统计量

χ2=(ad-bd )2*n/(a+b)(c+d)(a+c)(b+d)

=(250*213-246*320)/(250+320)(246+213)(250+246)(320+213)=9.651 ν=1

③确定p 值

查χ2届值表,得p<0.05 ④统计推断

按α=0.05水准,拒绝H O ,接受H 1,差别有统计学意义,可以认为HBV 感染对不同性别的大学生在心理行为方面的影响不同。

4①建立检验假设和确定检验水准 H 0:两组的治愈率相等,即π1 =π2

()()?

?

?? ??+-+-+--=

∑∑∑∑n

n n n n x x n x x x

x t 212122

22

212

12

12

1

1

12

H1:两组的治愈率不等,即π1≠π2

检验水准α=0.05

②Fisher精确概率法

|p1-p2| 概率P(i)序号治愈人数未愈人数缓解率p1与

p2

1 17 0 1.000 0.867

2 1

3 0.133

2 16 1 0.941 0.741

3 12 0.200

3 15 2 0.882 0.615

4 11 0.267

4 14 3 0.824 0.491

5 10 0.333

5 13 4 0.765 0.365

6 9 0.400

6 12 5 0.706 0.239

7 8 0.467

7 11 6 0.647 0.114

8 7 0.533

8 10 7 0.588 0.012

9 6 0.600

9 9 8 0.529 0.138

10 5 0.667

10 8 9 0.471 0.262

11 4 0.733

11 7 10 0.412 0.388

12 3 0.800

12 6 11 0.353 0.514

13 2 0.867

13 5 12 0.294 0.639

14 1 0.933

14 4 13 0.235 0.765

15 0 1.000

P(i) = 0.280>0.05

③统计推断

按α=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为两组治愈率有差别。5①建立检验假设和确定检验水准

H0:治疗三种类型病人的有效率相同,即π1=π2 =π3

H1:治疗三种类型病人的有效率不等或不全相等。

检验水准α=0.05

②计算检验统计量

()∑

∑???

? ??-=-=i

C R i

i i n n A n T T A 12

2

2

χ = 286*(712 + 272 +1042 + 422 + 242 +182 -1)=3.6389

199*98 87*98 199*146 87*146 199*42 87*42 ③确定p 值

查χ2界值表,得p>0.05 ④统计推断

按α=0.05水准,不拒绝H 0,拒绝H 1,差别无统计学意义,尚不能认为治疗三种类

型病人的有效率有差别。

6①建立检验假设和确定检验水准

H 0:该三种人群有相同的血型分布,即π1 =π2 =π3 H 1:该三种人群的血型分布不等或不全相等。 检验水准α=0.05 ②计算检验统计量 ()∑

∑???

? ??-=-=i

C R i

i i n n A n T T A 12

2

2

χ = 9312*(6792 +1342 + …… +4352 - 1)= 71.180

3720*1883 788*1883 546*6522 ③ 确定p 值

查χ2界值表,得p<0.05 ④统计推断

按α=0.05水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为三种人群的血型

分布不等或不全相等。

7①建立检验假设和确定检验水准

H 0:两种检验方法的结果相同,即总体B=C H 1:两种检验方法的结果不同,即总体B≠C 检验水准α=0.05 ②计算检验统计量 ()c

b c b +--=

2

2

1χ=1.1364

③ 确定p 值

查χ2界值表,得p>0.05 ④统计推断

按α=0.05水准,不拒绝H 0,差别无统计学意义,尚不能认为两种免疫学方法的阳性

率有差别。

第八章

1 答:适用于有序分类资料、偏态分布资料、 变异较大或方差不齐的资料、分布型不明的资料及有特大、特小值或数据的一端或两端有不确定数值的资料。

2答:属于非参数检验。

因为参数检验针对的是总体变量服从某种分布,即具有某个已知的函数形式,而其中的参数是未知的,统计分析的目的就是对这些未知参数进行估计或检验。但本题即使n1 > 10,n2-n1 > 10时采用的是u检验,但它比较的是分布而不是参数,所以它还是属于非差数检验。

3 答:有序分类资料可做秩和检验、等级相关分析。

4 答:(一)建立检验假设

H0:两种药的治疗效果总体分布相同;

H1:两种药的治疗效果总体分布不同;

α=0.05;

(二)编秩和求秩和T

两组治疗心绞痛疗效比较

疗效(1)

人数合计

(4)

秩次

范围

(5)

平均

秩次

(6)

秩和

缓释片

(2)

普通片

(3)

缓释片

(7)

普通片

(8)

显效有效无效加重62

18

5

3

35

31

14

4

97

49

19

7

1-97

98-146

147-165

166-172

49

122

156

169

3038

2196

780

507

1715

3782

2184

676

合计n1=88 n2=84 172 6521 8357

(三)计算检验统计量T

由于n1 > n2 , 则取n2 组的秩和为T,故检验统计量T=T2=8357。

(四)确定P值,做出推断结论

由于n2>10 ,T分布已接近均数为n1 (N+1)/2,方差为n1 n2 (N+1)/12的正态分布,按书上式(8.3)(8.4)求出u c =3.7439

u c > 2.56, P<0.01, 按α=0.05水准拒绝H0,接受H1,差异有统计学意义。可以认为缓释片和普通片治疗心绞痛的疗效有差别。

5 答:(一)建立检验假设

H0:治疗前后HCG值的总体分布相同;

H1:治疗前后HCG值的总体分布不同;

α=0.05;

(二)计算检验统计量T

肿瘤患者灌注治疗前后HCG值

病例号(1)治疗前

(2)

治疗后

(3)

差值

(4)

秩次

(5)

1 2 3 4 5 6 7 8 1280000

75500

12450

1500000

10000

9700

15588

4223

210000

3300

2210

93

2500

1203

4825

914

1070000

72200

10240

1499907

7500

8497

10763

3309

7

6

4

8

2

3

5

1

T+=36 T-=0

本例T+=36 ,T-=0,任取T+或(T-)作为检验统计量T,本例取T+=36 。

(三)确定P值,做出推断结论

由于n<50 ,查附表9,T界值表。本例n=8,T=36,查附表9,得α=0.05时的T界值为5-31,T在双侧界值范围外,故P<0.05。按α=0.05水准拒绝H0,接受H1,差异有统计学意义。可以认为肿瘤患者灌注治疗前后HCG值有差别。

6 答:(一)建立检验假设

H0:三种卵巢功能异常患者血清中促黄体素的含量的总体分布相同;

H1三种卵巢功能异常患者血清中促黄体素的含量的总体分布不全相同或全不相同;

α=0.05;

(二)计算检验统计量T

卵巢功能异常患者血清中促黄体素的含量

卵巢发育不良

(1)

秩次

(2)

丘脑性闭经

(3)

秩次

(4)

垂体性闭经

(5)

秩次

(6)

44.10 42.50 40.50 38.31 35.76 35.12 33.60 31.38 24

23

22

21

20

19

18

17

6.71

3.32

4.59

1.67

10.51

9.45

1.74

10.21

10

6

7.5

1

14

11.5

2

13

4.59

2.75

11.14

5.98

1.90

2.10

9.45

10.86

7.5

5

16

9

3

4

11.5

15

R i n i 164

8

65

8

71

8

按书上式(8.5)求出H=15.4184

(三)确定P值,做出推断结论

由于k=3,每组例数n i=9 ,查附表11,H界值表得P<0.01。按α=0.05水准拒绝H0,接受H1,差异有统计学意义。可以认为三种卵巢功能异常患者血清中促黄体素的含量有差别。

7 答:(一)建立检验假设

H0:针刺三个穴位的镇痛效果的总体分布相同;

H1:针刺三个穴位的镇痛效果的总体分布不全相同或全不相同;

α=0.05;

(二)计算检验统计量T

针刺三个穴位的镇痛效果

镇痛效果

各穴位的观察频数合计

(4)秩次

范围

(5)

平均

秩次

(6)

各穴位的观察频数

合谷足三里扶突(1)(2)(3)

合谷足三里扶突(1)(2)(3)

+++++++++38

44

12

24

53

29

28

16

47

23

19

33

138

96

59

73

1-138

139-234

235-293

294-366

69.5

186.5

264

330

2641

8206

3168

7920

3683.5

5408.5

7392

5280

3266.5

4289.5

5016

10890

合计118 126 122 366 21935 21764 23462 按书上式(8.5)求出H=2.4143

(三)确定P值,做出推断结论

由于k=3,每组例数n i>9 ,已超出附表11的范围,故按v=k-1=2,查附表8,χ2

界值表,得P>0.05。按α=0.05水准不拒绝H0,差异无统计学意义。故尚不能认为针刺

不同穴位的镇痛效果有差别。

8 答:(一)建立检验假设

H0:慢性胃炎病人服药前后胃痛疼痛次数的总体分布相同;

H1:慢性胃炎病人服药前后胃痛疼痛次数的总体分布不全相同或全不相同;

α=0.05;

(二)计算检验统计量T

慢性胃炎病人服药前后胃痛疼痛次数

患者编号治疗前治疗后两周治疗后四周治疗后六周

1 2 3 4 5 6 2(3.5)

3(4)

3(3.5)

5(4)

4(4)

6(4)

2(3.5)

2(3)

3(3.5)

4(3)

3(3)

4(3)

1(1.5)

1(2)

2(2)

3(2)

1(1.5)

3(2)

1(1.5)

0(1)

1(1)

2(1)

1(1.5)

1(1)

Ri 23 19 11 7

按书上式(8.7)求出M=16

(三)确定P值,做出推断结论

根据配伍组数b与处理组k查附表12,配伍组设计多组比较的F检验用M界值表,得P值范围。本例b=6,k=4,查表得:M0.05=7.600,得P<0.05。按α=0.05水准拒绝H0,接受H1 ,差异有统计学意义。故可认为慢性胃炎病人服药前后胃痛疼痛次数有差别。

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体与样本:总体就是根据研究目的确定的同质观察单位的全体。样 本就是从总体中随机抽取的部分观察单位。 (3) 参数与统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量与总体参数的差别称为抽样误 差。 (5) 概率:就是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 就是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1、 平均数 就是描述数据分布集中趋势(中心位置)与平均水平的指标 2、 标准差 就是描述数据分布离散程度(或变量变化的变异程度)的指标 3、 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4、 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4、 σ± σ96.1± σ58.2± 68、27% 95% 99% 5、 47、5% 6、均数、标准差 7、 全距、方差、标准差、变异系数

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学题库

1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0

医学统计学课后答案.

第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百 分之几,它是对比的最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

医学统计学知识点梳理

医学统计学知识点梳理 Revised as of 23 November 2020

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学课后思考题答案(李晓松版)

第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。第二章调查研究设计 1.调查研究主要特点是什么? 调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。 2.简述调查设计的基本内容。 ①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。 3.试比较常用的四种概率抽样方法的优缺点。 (1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。 (2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。 (3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。 (4)整群抽样优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学试题及答案

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

医学统计学课后习题与答案

医学统计学 第一章绪论 答案 名词解释: (1)同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。 (2)总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。 (3)参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4)抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。 (5)概率:是描述随机事件发生的可能性大小的数值,用p表示 (6)计量资料:由一群个体的变量值构成的资料称为计量资料。 (7)计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。。 (8)等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。 是非题: 1.× 2.× 3.× 4.× 5.√ 6.√ 7.× 单选题: 1.C 2.E 3.D 4.C 5.D 6.B 第二章计量资料统计描述及正态分布 答案 名词解释: 1. 平均数是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1.计量,计数,等级

2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99% 5. 47.5% 6.均数、标准差 7. 全距、方差、标准差、变异系数 8. σμ96.1± σμ58.2± 9. 全距 R 10. 检验水准、显著性水准、0.05、 0.01 (0.1) 11. 80% 90% 95% 99% 95% 12. 95% 99% 13. 集中趋势、离散趋势 14. 中位数 15. 同质基础,合理分组 16. 均数,均数,μ,σ,规律性 17. 标准差 18. 单位不同,均数相差较大 是非题: 1. × 2. √ 3. × 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √ 11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √ 21. √ 单选题: 1. B 2. D 3. C 4. A 5. C 6. D 7. E 8. A 9. C 10. D 11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C 21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D 31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B 41. C 42. B 43. D 44. C 45. B 问答题: 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5.

医学统计学重点总结

<<医学统计学>>重点总结 1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。 2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。 3. 同质:影响研究指标的主要因素易控制的因素基本上相同。 4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为。。。 5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。 6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/ 终止(研究时限已到而终止观察)。 7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。X2反应实现了实际频数与理论频数的吻合程度。如果检验假设成立,则A-T 一般不大,X2应很小,即出现大X2值概率很小。即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。若P>a则没有理由拒绝H0。 8. X2用途: (1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x 列表)。B两变量之间有无相互关系。C频数分布的拟合优度检验(判断次样本是否来自某种分布)。(2)某些分布可用X2近似。 (3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。 9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。 10. 假设检验中P,a,b(倍他)的关系及统计学意义: a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。 b:在T假设检验中,按照a检验标准,没有拒绝原来错误的无效假设,即犯了第2类错误,犯次错误的概率是b。 P:是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较,根据比较的结果作出统计判断。如果P≤a时,就怀疑假设的成立,拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0,接受H1的推论时犯错误的机会越小。 11.行x列表X2检验应注意: (1)行x列表中不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1,若发生上述情况可采用:A将理论频数过小的格子所在的行或列与性质相近的邻近行或列中的实际频数合并,使重新计算的理论频数增大。B删去理论频数过小的行或列。C增大样本含量以增大理论频数。 (2)当效应按强弱分为若干级别,则按实验结果可整理为单向有序行x列表,在比较各处理组的效应有无差别时,宜用秩和检验,ridit分析等。如作X2检验只说明各组构成比的差异有无统计学意义。

相关主题
文本预览
相关文档 最新文档