当前位置:文档之家› 医学统计学试卷A

医学统计学试卷A

医学统计学试卷A
医学统计学试卷A

卫生统计学试卷

学号 姓名 成绩

一、单项选择题(每题3分,共30分)

1. 四个样本率比较的卡方检验,如2

2

A. 各样本率不等或不全相等

B.

C. 各总体率均不相等

D. 各样本率均不相等

2. 欲反映某疾病对人群的威胁程度,应该计算________

A .某病病死率

B .某病患病率

C .某病构成比

D .某病死亡率

3. 某市250名10岁男孩体重有95%的人在18到30kg 范围内,由此可推知此250名男孩体重的标准差大约是________

A .2Kg

B .3.061Kg

C .6.122Kg

D . 2.326Kg

4. 均数与标准差的关系为_______

x x

D. s 越小,x 对变量值的代表性越好

5. 比较农村和城镇居民对遗体的捐献态度,调查了50名农村居民,愿意捐赠的有28人,而68名城镇居民中有55名愿意捐赠,应该选用________来比较

A. 卡方检验

B. 校正的卡方检验

C. 配对卡方检验

D. 四格表的确切概率法

6. 在一个数值变量资料的总体中进行抽样,产生抽样误差的原因是________ A .总体中的个体值存在变异 B .样本只包含总体的一部分 C .A 、B 均对 D .A 、B 均不对

7. 在同一总体中作样本含量相等的随机抽样,有95%的样本均数在下列哪个范围内________

A . 2.58x x s ± C . 2.58x x σ± D . 1.96x x σ± 8. 要评价某5岁儿童的智商是否正常,应当_______

A. 用所有人的智商的可信区间来评价

B. 用5岁儿童的智商的可信区间来评价

C. 用所有人的智商的正常值范围来评价

D. 用5岁儿童的智商的正常值范围来评价

9.均数为μ,标准差为σ的正态分布,95%的变量值分布范围是_________

A. μ±σ

B. μ±1.96σ

C. μ±2.58σ

D. μ±1.64σ

10.医学资料中参考值范围的制定要注意_________

A. 正态分布资料可以用均数标准差法

B. 偏态分布资料可以用均数标准差法

C. 偏态分布资料不可以用百分位数法

D. 以上都不对

二、名词解释(每题4分,共24分)

1.参考值范围

指某同质总体中某指标的大多数个体值的波动范围。

2.中位数

表示一组定量资料按从小到大的顺序排列后位于第50百分位位置的观测值。是描述定量资料集中趋势的指标。

3.标准化率

对于两组或多组总率进行比较时,由于内部构成不同,而不能进行直接比较,需要对各组采用共同的内部标准,消除混杂因素在进行比较的方法叫做标准化法,经标准化法处理之后得出的率称之为标准化率。

4.抽样误差

指在随机抽样研究中,由于抽样而引起的样本指标与参数间的相差,其大小随样本不同而改变。

5.小概率事件

6.个体变异

在自然状态下,同质群体的个体值之间参差不齐,千差万别的情况。

三、分析计算题(第一、第二题10分,第三题8分,共28分)

1. 为了考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校(UC Berkley)的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位:磅)。男婴x17.3 7.9 7.9 8.0 9.3 7.8 6.5 7.6 6.6 8.4 6.7 7.5 女婴x27.1 7.9 6.4 6.6 8.0 6.0 7.2 6.8 7.8 5.3 6.6 7.3

(1)该资料是数值变量资料还是分类资料?

(2)要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验?

成组t检验

(3)经过计算t值为2.16,已知自由度为22时,双侧面积0.05对应的t界值为2.07,自

由度为11时,双侧面积0.05对应的t界值为2.20。试写出假设检验的全过程并下结论。

2 比较甲乙两种疗法对某病的治疗效果,甲法治疗了44人,有效41人,乙法治疗了24人,有效18人。(1)用四格表表达本资料;(2)根据本题计算得χ2=4.47,校正的χ2=3.03。

2

0.05(1)3.84

χ=,2

0.05(4)9.49

χ=。试写出假设检验详细步骤,并作结论。3比较甲乙两医院对某病的治疗效果

病情

甲院乙院

病人数治愈数治愈率病人数治愈数治愈率

轻80 72 0.90 60 54 0.90

重120 84 0.70 40 28 0.70

合计200 156 0.78 100 82 0.82 先标化,再比较。

四、简答题(每题6分,共18分)

1描述数值变量资料(计量资料)的集中程度有哪些指标,有何适用条件?

算数均数(正态分布或近似正态分布),几何均数,中位数,百分位数

2某地1岁婴儿平均血红蛋白的95%可信区间为116.2~130.1(g/L),表示什么意义?该地1岁正常婴儿的血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义?

3简述标准差(s)与均数的标准误(x s)的区别和联系。

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 0 推断正确(1?ɑ) 不正确推断正确(1?β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同 等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的 可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意 扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示 =S/√n 为S x ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n 7.方差分析 方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。 (方差分析的基本思想:把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义) 二、问题 1.集中趋势与离散趋势描述的常用指标、适用范围与优缺点 ㈠描述集中趋势的常用指标:

医学统计学试卷-2

《医学统计学》期末试卷(考查) 姓 名: 学 号: 班 级: ---------------------------------------- 说明:本试卷总计100分,全试卷共3页,完成答卷时间2小时。 ---------------------------------------- 一、判断题(本大题共10题,每题1分,共10分,对的打“√”,错的打“×”) 1、 参数(parameter )是根据总体分布的特征而计算的总体数值,如:总体均数用μ表示。( ) 2、 将一组观察值按大小顺序排列,位次居中的数值即算术均数,统计符号为X 。( ) 3、 标准差可以反映抽样误差的大小。( ) 4、 假设检验有两类错误,其中,拒绝了实际上是成立的0H ,为第一类错误。( ) 5、 两样本均数比较,经t 检验差别有统计学意义时,P 越小,说明两总体均数差别越大。( ) 6、 方差分析后,各总体均数不等,要想分析多个试验组与对照组均数比较,需用SNK-q 检验。( ) 7、 拉丁方设计可用来进行因素间的交互作用分析。( ) 8、 正交表48(42)L ? ,表示最多可观察5个因素,其中1个因素为4水平,4个因素为2水平。( ) 9、 分类资料常用率表示某一事物内部各组成部分所占的比重或分布。( ) 10、有序分类资料不是等级资料( )。 二、填空题(本大题共10题,每题1分,共10分) 1、四分位数间距与 可用来描述偏态分布资料的分布特征。 2、当均数相差很大或单位不同时,比较多个样本资料的离散趋势指标应选 。 3、总体服从正态分布的数值资料,常用 与 来描述其集中趋势与离散趋势。 4、标准正态分布的均数和标准差分别为 。 5、t 曲线是以 为中心,左右对称的一簇曲线。 6、已知一个样本来自正态分布的总体,样本均数为x ,样本含量为n ,总体标准差为σ,试估计总体均数的99%可信区间: 。 7、完全随机化设计的方差分析,根据方差分析的基本思想,可将总变异分解为两部分:

医学统计学课后答案.

第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百 分之几,它是对比的最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

医学统计学01护理学(本科)期末考试试卷A卷

山东中医药大学 专业 年级(本科) 《医学统计学01》期末考试试卷(A 卷) 姓 名: 学 号: 班 级: 考试时间:2010.6 补(重)考:(是、否) 题号 一 二 三 四 五 六 七 八 总分 核分人 得分 ---------------------------------------- 说明:本试卷总计100分,全试卷共3页,完成答卷时间90分钟。 ---------------------------------------- 一、单项选择题(本大题共5题,每题2分,共10分) 1、某医院一年内收治202例腰椎间盘后突病人,其年龄的频数分布如下: 年龄(岁) 10~ 20~ 30~ 40~ 50~ 60~ 人数 6 40 50 85 20 1 为了形象表达该资料,适合选用:() A 、线图 B 条图 C 直方图 D 圆图 2、成组设计的两样本比较的秩和检验,其检验统计量是( )。 A 、 以例数较小者为 B 、以例数较大者为 C 、以秩和较小者为 D 、以秩和较大者为。 3、当组数等于 2 时,对于同一资料,方差分析与 t 检验的关系是____ 。 A .完全等价且 F=t B.方差分析结果更准确 C.t 检验结果更准确 D.完全等价且 t 2=F 4、Poisson 分布独有的特征是______。 A. 离散型分布 B. 参数是总体均数 C. 方差等于均数 D. 当样本较小时是偏倚分布 5、甲、乙两个医院某传染病各型治愈率 病 型 患者数 治愈率(%) 甲 乙 甲 乙 普通型 300 100 60.0 65.0 重 型 100 300 40.0 45.0 暴发型 100 100 20.0 25.0 合 计 500 500 48.0 45.0 由于各型疾病的人数在两个医院的内部构成不同,从内部看,乙医院各型治愈率都高于甲医院,但根据栏的结果恰好相反,纠正这种矛盾现象的统计方法是:() A 、重新计算,多保留几位小数 B 、对率进行标准化 C 、对各医院分别求平均 D 、增大样本含量,重新计算 得分 阅卷人 (签全名)

医学统计学重点要点

医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。 4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

医学统计学期末考试模拟题(三)

《医学统计学》期末模拟考试题(三)一.是非题(每题1分,共20分)1.评价某人的某项指标是否正常,所用的范围是。()t2.配对资料若用成组检验处理,就降低了统计效率。() 3.因为两类错误的存在,所以不能凭假设检验的结果下结论。() 4.随机区组设计的区组变异和误差两部分相当于完全随机设计方差分析的组内变异。()P5.抗体滴度资料经对数转换后可做方差分析,若方差分析得<0.05,则可认为实测数据的各总体算术均数不全相等。() 6.五个百分率的差别的假设检验,>,可认为各组总体率都不相同。() ZZZ4.在两样本均数比较的检验中,若≥,则在α=0.05水平上可认为两总体均数不等。0.05()P5.在t检验中,若拒绝H, 值越小,则说明两总体均数差别越大。()06.对三个地区 血型构成(A、B、O、AB型),作抽样调查后比较,若有一个 理论频数小于5大于1且n>40,必须作校正检验。() 7.如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。() 8.Ⅱ期临床试验是指采用随机盲法对照实验,评价新药的有效性及安全性,推荐临床给药剂量。()9.临床试验中,为了避免人为主观因素的影响,保证结果的真实性,通常不让受试者及其家属知道他参与这项试验。()10.假定变量X与Y的相关系数r是0.8,P<0.05;变量M与N的相关系数r为-0.9,P<0.05,1122则X与Y的相关密切程度较高。与Y的相关系数r是0.8,P<0.05;变量M与N

的相关系11数r为-0.9,P<0.05,则X与Y的相关密切程度较 高。()2211.临床试验必须符合《赫尔辛基宣言》和国际医 学科学组织委员会颁布的《人体生物医学研究国际道德指南》 的道德原则。() 12.当直线相关系数r=0时,说明变量之 间不存在任何相关关系。=0时,说明变量之间不存在任何相 关关系。() 13.偏回归系数表示在除X以外的自变量固定 不变的条件下,X每改变一个单位的平均变ii化。以外的自变 量固定不变的条件下,X每改变一个单位的平均变化。()i 14.单盲法是让病人知道自己在实验组或对照组,但不知道用 什么处理。() 15.重复原则是指少选择样本例数。()16.越小,所需样本含量越大。() 17.在相同条件下完全 随机设计比随机区组设计更节约样本含量。() 18.配对符号 秩和检验中,有差值绝对值相等时,可不计算平均秩次。()19.非参数统计的检验效能总是低于参数检验。() nTnTT20.两样本比较的秩和检验,现=15,=153,=10,=126,则 检验统计量=126。()1122二.选择题(每题1分,共20分)1.一种新药可以控制某病,延长寿命,但不能治愈其病,如果 某地采用该药则该地。a.该病发病率将增加 b.该病 发病率将减少c.该病患病率将增加 d.该病患病率将减少e.以上都不对2.用触诊和X摄片对100名妇女作乳癌检查, 触诊有40名阳性,X摄片有70名阴性,两种方法均阳性者10 名,两种方法检查均为阴性的人数是。 a.20 b.30

医学统计学课后答案解析

第二章 1?答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表 示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓开口”资料, 是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。 即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2?答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1?不灵敏;2?不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q= Q u —Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反 映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance , CV)亦称离散系数(coefficient of dispersion ), 为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3?答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百 分之几,它是对比的最简单形式。其计算公式为比二A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分 率(%。)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: 率.= 实际发生某现象的观察单位数迸比例基数(K) 可能发生某现象的观察单位总数 构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学第二版高等教育出版社课后习题答案剖析

第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就

医学统计学试卷-1

《医学统计学》考查试卷(必修) ---------------------------------------- 说明:本试卷总计100分,全试卷共4页,完成答卷时间2小时。 ---------------------------------------- 一、填空(10小题,每小题2分,共计20分。) 1、统计学分为 和 两大部分。 2、统计思想是用样本 估计(或推测)总体 ,它是通过 和 来实现的。 3、统计步骤包括 、 、 、 。 4、统计资料分为 和 ,后者又分为 、 和 。 5、总体服从正态分布的数值资料,常用 与 来描述其集中趋势与离散趋势。 6、假设检验的原理是 。 7、假设检验得到 ,可认为差别无统计学意义, ,可认为差别有 统计学意义, ,可认为差别有高度统计学意义。

8、直线回归反映两个变量的 ,而直线相关反映的是两个变量的 。 9、2x 检验的思想可以概述为看 和 吻合程度如何。 10、秩和检验和Ridit 分析均属 ,前者关键是 ,后者关键是 。 二、选择题(有单选和多选,10小题,每小题1分,共计10分。) 1、当均数相差很大或量刚不同时,比较多个样本资料的离散趋势指标 应选 。 (1)极差 (2)变异系数 (3)方差 (4)标准差 2、总体均数95%的可信区间为 。 (1))96.1,96.1(s x s x +- (2))58.2,58.2(s x s x +- (3))96.1,96.1(x x s x s x +- (4))58.2,58.2(x x s x s x +- 3、四个样本均数的比较,参数假设检验为 。 (1)0H :4321x x x x === (2) 1H :4321x x x x ≠≠≠ (3)0H :4321μμμμ=== (4)1H :4321μμμμ≠≠≠ 4、两样本均数比较,经t 检验差别有统计学意义时,P 越小,说明: 。 (1)两样本均数差别越大 (2)两总体均数差别越大 (3)越有理由认为两总体均数不同 (4)越有理由认为两样本均数不同 5、分类资料的配对设计差异性(或优势性)检验需选用 。 (1)Pearson-2x 检验 (2)CMH-2x 检验

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

医学统计学重点图表总结

定量资料统计描述常用的统计指标及其适用场合 描述内容指标意义适用场合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平 均值 正偏峰分布资料 变异度全距观察值取值范围不拘分布形式,概略分析 标准差(方差)观察值平均离开均 数的程度 对称分布,特别是正态分布资料 四分位数间距居中半数观察值的 全距 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 变异系数标准差与均数的相 对比 ①不同量纲的变量间比较;②量纲相同但数量级相 差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 1

1 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97 .5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99 .5 P 1 P 99 1.标准差与标准误的区别与联系?

医学统计学课后习题答案(第2版高等教育出版社)

医学统计学课后习题答案(第2版高等教育出版社) 第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。

当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。 第二章调查研究设计 1.调查研究主要特点是什么? 调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。 2.简述调查设计的基本内容。 ①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。 3.试比较常用的四种概率抽样方法的优缺点。 (1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。 (2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。 (3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用

医学统计学总结重点笔记复习

章第一1 选2)是根据研究目的确定的同质观察单位(研究对象)的全体,population总体:总体(实际上是某一变量值的集合。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。总体population根据研究目的而确定的同质观察单位的全体。)。样样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。从总体中随机抽得的部分观察单位,其实测值的集合。样本sample1 3选(即在大量重复试验中出现的频率非常低)的事件小概率事件:我们把概率很接近于0 称为小概率事件。值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得P 值:P 认为有高 P ≤0.01 P 到的P 值反应结果真实程度,一般以≤ 0.05 认为有统计学意义,或0.01。度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 值是:P 1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。 2) 拒绝原假设的最小显著性水平。实例的) 显著性水平。3) 观察到的( 4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。统计学中,一 0.01的概率为小概率。般认为等于或小于0.05或 1)资料的类型(3选)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称1(其变量值是定量.为计量资料(measurement data)。计量资料亦称定量资料、测量资料。、红细胞(kg)的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重12L分)、血压(KPa(10/)等。)、脉搏(次/计数numerical quantitative data数值变量资料计量资料measurement data定量资料variable 为观测每个观察单位某项指标的大小,而获得的资料。)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料2()。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相count data(容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、 O 四种血型的人数等。ABA、B、、无效的人数;调查一批少数民族居民的unordered qualitative data定性资料无序分类变量资料enumeration data 计量资料nominal variable 名义变量资料categorical variable 为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。. )等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察3()。等级资料又称有序变量。如患者的治疗结果可ordinal data单位数,称为等级资料(分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但等。、+++这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++等级资料ranked data半定量资料semi-quantitative data有序分类变量ordinal categorical variable资料 为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 两种误差(2选1) 抽样误差(sampling error )由于抽样而引起的总体指标(参数)与样本指标(统计数)之间的差异。抽样误差是由个体变异或其它随机因素造成的,是不可避免的,但误差分布有规律可循,可

医学统计学试题及答案完整版

医学统计学试题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

医学统计学试题及答案 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分 布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n 1和n 2 ,在进行成组设计资料的 t检验时,自由度是( D ) (A)n 1+ n 2 (B)n 1+ n 2 –1 (C)n 1+ n 2 +1 (D)n 1+ n 2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小

相关主题
文本预览
相关文档 最新文档