第一章绪论
1.下列关于概率的说法,错误的是
A. 通常用P表示
B. 大小在0%与100%之间
C. 某事件发生的频率即概率
D. 在实际工作中,概率是难以获得的
E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件
[参考答案] C. 某事件发生的频率即概率
2.下列有关个人基本信息的指标中,属于有序分类变量的是
A. 学历
B. 民族
C. 血型
D. 职业
E. 身高
[参考答案] A. 学历
3.下列有关个人基本信息的指标,其中属于定量变量的是
A. 性别
B. 民族
C. 职业
D. 血型
E. 身高
[参考答案] E. 身高
4.下列关于总体和样本的说法,不正确的是
A. 个体间的同质性是构成总体的必备条件
B. 总体是根据研究目的所确定的观察单位的集合
C. 总体通常有无限总体和有限总体之分
D. 一般而言,参数难以测定,仅能根据样本估计
E. 从总体中抽取的样本一定能代表该总体
[参考答案] E. 从总体中抽取的样本一定能代表该总体5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是
A. 所有糖尿病患者
B. 所有成都市居民
C. 2007年所有成都市居民
D. 2007年成都市居民中的糖尿病患者
E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民
6.简述小概率事件原理。
答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。
7.举例说明参数和统计量的概念
答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的
8.举例说明总体和样本的概念
答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从
此总体中随机抽取2000人,分别测得其红细胞数,组成样本,其样本含量为2000。
第二章调查研究设计
1. 以下五个问题中,最符合调查问卷设计要求的是
A.你一个月工资多少?
B.你一个月吃多少克盐?
C.你是否有婚外恋:①有②无
D.你和你的妈妈认为女孩几岁结婚比较好?
E.如果只生一个孩子,你希望孩子的性别是:①女②男③男女均可
[参考答案]E.如果只生一个孩子,你希望孩子的性别是:①女②男③男女均可2.普查是一种全面调查的方法,与抽样调查相比,叙述正确的是
A.确定对象较为简单
B.适于发病率较低疾病的调查
C.不易获得反映平均水平的统计指标
D.因涉及面广,可产生较大的抽样误差
E.更易统一调查技术,提高调查质量[参考答案]A.确定对象较为简单
3. 欲了解某地区狂犬病死亡人数上升的原因,较适宜的抽样方式为
A.单纯随机抽样
B.整群抽样
C.分层抽样
D,典型调查
E.普查
[参考答案]D.典型调查
4. 某县有30万人口,其中农村人口占80%,现欲对农村妇女的计划生育措施情况进行调查,调查对象应为
A. 该县所有的已婚夫妻
B.该县所有的农村妇女
C.该县所有的育龄期妇女
D.该县所有的已婚妇女
E.该县所有已婚育龄期农村妇女
[参考答案]E.该县所有已婚育龄期农村妇女
5. 为了解乌鲁木齐市儿童的肥胖状况,分别从汉族、维吾尔族、哈族、回族等民族中随机抽取部分儿童进行调查,这种抽样方法属于
A. 单纯随机抽样
B.系统抽样
C.整群抽样
D.分层抽样
E.多阶段抽样
[参考答案]B.系统抽样
6. 下列关于调查设计的叙述,正确的是
A. 明确调查目的是调查研究最核心的问题
B.采用抽样调查还是普查是由该地区的经济水平决定的
C.调查设计出现缺陷时,可以通过相应的统计分析方法弥补
D.一旦制定了调查研究计划,在实际操作过程中,就不可改变
E.调查的质量控制主要在调查问卷设计阶段
[参考答案]A.明确调查目的是调查研究最核心的问题
7. 条件相同时,下列抽样方法中抽样误差最大的是
A. 单纯随机抽样
B.系统抽样
C.整群抽样
D.分层抽样
E.无法直接比较
[参考答案]E.整群抽样
8. 以下抽样方法中不属于概率抽样的是
A. 单纯随机抽样
B.系统抽样
C.整群抽样
D.分层抽样
E.雪球抽样
[参考答案]E.雪球抽样
9. 实验性研究与观察性研究的根本区别在于
A. 抽样方法不同
B.研究对象不同
C.是否设立对照组
D.假设检验方法不同
E.是否人为施加干预措施
[参考答案]E.是否人为施加干预措施
10. 简述调查问题的顺序安排。
答:调查问题顺序安排总原则:①符合逻辑;②一般问题在前,特殊问题在后;③易答题在前,难答题在后;④如果采用封闭式和开放式相结合的问题,一般先设置封闭式问题;⑤敏感问题一般放在最后。此外,在考虑问题顺序时,还应注意问题是否适合全部调查对象,并采用跳答的形式安排问题和给出指导语。
11. 常用的非概率抽样方法有哪些?答:常用的非概率抽样方法有偶遇抽样、立意抽样、定额抽样、雪球抽样等。
12. 试比较常用的四种概率抽样方法的优缺点。
答:单纯随机抽样的优点是均数(或率)及标准误的计算简便。缺点是当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。系统抽样的优点是:①易于理解,简便易行;
②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。系统抽样的缺点是:①当总体的观察单位按顺序有周期趋势或单调增(或减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不得随意更改,否则可能造成另外的系统误差。②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。分层抽样的优点是:①减少抽样误差:分层后增加了层内的同质性,因而观察值的变异度减小,各层的抽样误差减小,在样本含量相等的情况下其标准误一般均小于单纯随机抽样、系统抽样和整群抽样的标准误;②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施;③还可对不同层进行独立分析。其缺点是当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。整群抽样的优点是便于组织,节省经费,容易控制调查质量。缺点是当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差。
13. 简述调查设计的基本内容。
答:调查设计的基本内容包括:①明确调查目的和指标;②确定调查对象和观察单位;③确定调查方法;④确定调查方式;
⑤确定调查项目和调查表;⑥制定资料整理分析计划;⑦制定调查的组织计划。
14. 调查研究的主要特点是什么?
答:调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施。②不能用随机化分组来平衡混杂因素对调查结果的影响。
第三章实验研究设计
1. 药品上市后应用阶段进行的临床试验属于
A. I期临床试验
B. II期临床试验
C. III期临床试验
D. IV期临床试验
E.现场试验
[参考答案] D. IV期临床试验
2. 临床试验的统计分析主要包括
A.可比性分析、疗效评价、安全性评价
B.可比性分析、优效性分析、劣效性分析
C.可比性分析、安全性评价、可行性分析
D.优效性分析、等效性分析、安全性评价
E.疗效评价、安全性评价、可行性分析
[参考答案] A.可比性分析、疗效评价、安全性评价
3. 在某临床试验中,将180例患者随机分为两组,试验组给予试验药+对照药的模拟剂,对照给予对照药+试验药的模拟剂,整个过程中受试对象和研究者均不知道受试对象的分组。本试验中采用控制偏倚的方法有
A.单盲、多中心
B.随机化、多中心
C.随机化、单盲
D.随机化、双盲双模拟
E.双盲双模拟、多中心
[参考答案] D.随机化、双盲双模拟
4. 将两个或多个处理因素的各水平进行组合,对所有可能的组合都进行实验,该实验设计方案是
A.随机区组设计
B.完全随机设计
C.析因设计
D.配对设计
E.交叉设计
[参考答案] C.析因设计
5. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成
A.选择性偏倚
B.测量性偏倚
C.混杂性偏倚
D.信息偏倚
E.失访性偏倚
[参考答案] C.混杂性偏倚
6. 观察指标应具有
A.灵敏性、特异性、准确度、精密度、客观性
B.灵敏性、变异性、准确度、精密度、客观性
C.灵敏性、特异性、变异性、均衡性、稳定性
D.特异性、准确度、稳定性、均衡性、客观性
E.灵敏性、变异性、准确度、精密度、均衡性
[参考答案] A.灵敏性、特异性、准确度、精密度、客观性
7. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅给予实验组该疗法治疗,不给予对照组任何治疗。7天后观察两组幼猪的存活情况。该研究采用的是
A. 空白对照
B. 安慰剂对照
C. 实验对照
D. 标准对照
E. 自身对照
[参考答案] A. 空白对照
8. 实验组与对照组主要不同之处在于
A.处理因素
B.观察指标
C.抽样误差
D.观察时间
E. 纳入、排除受试对象的标准
[参考答案] A.处理因素
9. 实验设计的三个基本原则是
A.随机化、对照、重复
B.随机化、对照、盲法
C.随机化、重复、盲法
D.均衡、对照、重复
E.盲法、对照、重复
[参考答案] A.随机化、对照、重复
10. 实验设计的三个基本要素是
A.处理因素、实验效应、实验场所
B.处理因素、实验效应、受试对象
C.受试对象、研究人员、处理因素
D.受试对象、干扰因素、处理因素
E.处理因素、实验效应、研究人员
[参考答案] B.处理因素、实验效应、受试对象
11. 某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠体内血管紧张素的影响,并分析两药的交互作用。你认为该研究最好采用何种实验设计方案?并说明理由。答:该研究最好采用2×2析因设计的实验方案,如表所示。因为析因设计不仅可以检验两因素各水平之间的差异有无统计学意义,而且可以检验两因素间有无交互作用。因此本例采用2×2析因设计既可分析MEL和TXL对糖尿病模型大鼠血管紧张素的影响,又可分析两药合用时的交互效应。
12. 某研究欲了解褪黑素(MEL)和通心络超微粉(TXL)对糖尿病模型大鼠体内血管紧张素的影响,并分析两药的交互作用。请帮该研究者实现32只大鼠的随机分组。
答:对于2×2析因设计,可采用完全随机化的方法将所有受试对象分到4个处理组。先将32只大鼠按体重从小到大的顺序编号。再从随机数字表中任一行,如第2列最上端开始纵向连续取32个两位数字。对随机数字从小到大排序,事先规定,序号为1~8的豚鼠分为A 组,序号为9~16的大鼠分为B组,序号为17~24的大鼠分为C组,序号为25~32的大鼠分为D组
13. 某研究人员欲将12只小鼠按月龄、体重相近的原则配成对,然后将每一对中的小鼠随机分配到实验组和对照组,应如何分组?
答:先将6对小鼠按体重从小到大的顺序编号,再从随机数字表中任一行或列,如第18行最左端开始横向连续取12个两位数字。事先规定,每一对中,随机数较小者序号为1,对应于A组,随机数较大者序号为2,对应于B组。
14. 欲将16只豚鼠随机分为两组,某研究员闭上眼睛从笼中抓了8只豚鼠作为实验组,剩下8只作为对照组。该分组方法是否正确?若不正确,请说明理由。
答:该分组方法不正确,不是随机分组的方式。随机不等于随便,随机的含义是指每只动物都有相同机会进入实验组或对照组,而该分组方法由于豚鼠活跃程度不相同,进入各组的机会就不同,较活跃的豚鼠进入实验组的机会增大,破坏了随机化原则。
15. 三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。该结论是否正确?如果不正确,请说明理由。
答:该结论不正确。研究某治疗方案对某疾病的治疗效果需进行临床试验,应遵循实验设计的三个基本原则,即对照、随机化和重复。只有正确设立对照才能较好地控制非处理因素对实验结果的影响,不设立对照往往会误将非处理因素造成的偏倚当成处理效应,从而得出错误的结论。此研究仅纳入了38例消化性溃疡患者,并未设立相应的对照组。而且这38例患者接受治疗的时间为2000年至2006年,时间跨度太大,对研究结果造成影响的因素很多,在没有对照的情况下,不能控制非处理因素对试验结果的影响,其研究结论不具有说服力。
16临床试验中使用安慰剂的目的是什
么?
答:临床试验中使用安慰剂,目的在于控制由于受试对象和试验观察者的心理因素引起的偏倚,提高依从性,还可控制疾病自然进程的影响,显示试验药物的效应。
17. 什么是交叉设计?它有何优缺点?答:交叉设计是一种特殊的自身对照设计,它按事先设计好的实验次序,在各个时期对受试对象先后实施各种处理,以比较处理组间的差异。其中2′2交叉设计是最为简单的一种交叉设计,首先将同质个体随机分为两组,每组先接受一种处理措施,待第一阶段实验结束后,经过适当的时间间隔(即清理阶段),两组再交换处理措施进行第二阶段的实验,这样每个个体都接受了两种处理。当然阶段数和处理数都可以扩展,成为多种处理多重交叉实验。交叉设计一般不适用于具有自愈倾向或病程较短的疾病研究。交叉设计的优点有:①节约样本含量;②能够控制个体差异和时间对处理因素的影响;③在临床试验中同等地考虑了每个患者的利益。其缺点有:①处理时间不能太长;②当受试对象的状态发生根本变化时,如死亡、治愈等,后一阶段的处理将无法进行;③受试对象一旦在某一阶段退出试验,就会造成数据缺
失,增加统计分析的困难;④不能用于具有自愈倾向或病程较短的疾病研究。
18. 什么是配对设计?它有何优缺点?答:配对设计是将受试对象按一定条件配成对子,再将每对中的两个受试对象随机分配到不同处理组。配对的因素应为可能影响实验结果的主要混杂因素。在动物实验中,常将窝别、性别、体重等作为配对因素;在临床试验中,常将病情、性别、年龄等作为配对因素。配对设计和完全随机设计相比,其优点在于可增强处理组间的均衡性、提高实验效率;其缺点在于配对条件不易严格控制,当配对失败或配对欠佳时,反而会降低实验效率。在临床试验中,配对的过程还可能延长实验时间。
19. 实验研究中,随机化的目的是什么?答:实验研究中,随机化的目的在于使非处理因素在实验组和对照组中的影响相当,提高对比组间的可比性,使实验结论的外推具有科学性和可靠性。随机化是对数据资料进行统计推断的前提。
20. 实验研究根据对象的不同可分为哪几类?
答:根据受试对象不同,实验研究可分为动物实验、临床试验和现场试验三类。动物实验的受试对象可以是动物,或者是器官、细胞、血清等生物材料;临床试验的受试对象通常为患某种疾病的患者,持续时间可以较长,目的在于评价药物或治疗方法的疗效;现场试验的受试对象通常是正常人群,持续时间一般较长,目的是通过干扰某些危险因素或施加某些保护性措施,了解其在人群中产生的预防效果。
第四章定量资料的统计描述
1.正态分布曲线下(μ±1.64σ)区间的面积占总面积的
A. 90%
B. 95%
C. 97.5%
D. 99%
E. 不能确定
[参考答案] A. 90%
2. 关于均数与标准差,下列说法正确的是
A. 均数可能是负数,标准差不可能
B. 标准差可能是负数,均数不可能
C. 两者都不可能为负数
D. 两者都可能为负数
E. 以上都不对
[参考答案] A. 均数可能是负数,标准差不可能
3. CV越大,表示
A. 资料变异程度越大
B. 资料变异程度越小
C.均数越大
D. 样本含量越大
E. 均数的代表性越好
[参考答案] A. 资料变异程度越大
4.当资料两端含有不确切值时,描述其变异度宜用
A. R
B.CV
C. S2
D.S
E.四分位数间距
[参考答案] E.四分位数间距
5.以下分布形式或资料类型中,适宜用均数与标准差进行统计描述的是
A.正偏态分布
B.负偏态分布
C.对称分布
D.开口资料
E.任意分布
[参考答案] D. 开口资料
6.开医学研究中,反映一组血清抗体滴度资料的平均水平,根据经验,常选用口资料
A.算数均数
B.中位数
C.几何均数
D.众数
E.和
[参考答案] C.几何均数
7.数据分布类型无法确定时,描述集中位置宜选用
A.算数均数
B.中位数
C.几何均数
D.众数
E.和
[参考答案] B.中位数
8.描述一组正态分布资料变量值的平均水平,宜选用A.变异系数
B.方差
C.几何均数
D.标准差
E.算数均数
[参考答案] E.算数均数
9.频数分布的两个重要特征是
A. 总体与样本
B. 集中趋势与离散趋势
C. 统计量与参数
D. 标准差与标准误
E. 样本均数与总体均数
[参考答案] B. 集中趋势与离散趋势
10.抽样调查某市45~55岁健康男性居民的血脂水平,184名45~55岁健康男性居民的血清总胆固醇(TC)的xbar=4.84mmol/L,s=0.98mmol/L,已知健康人的血清总胆固醇服从正态分布。估计该市45~55岁健康男性居民中,血清总胆固醇在3.25mmol/L~5.25mmol/L范围内的比例。
答:45~55岁健康男性居民的血清总胆固醇分布为非标准正态分布,需作标准化变换后,查表确定正态分布曲线下面积。由于是大样本,可用样本均数和样本标准差作为总体均数和总体标准差的点估计值。
查标准正态分布曲线下的面积表(附表2)得:
该市45~55岁健康男性居民中,血清总胆固醇在3.25 mmol/L~5.25mmol/L范围内的比例为61.79%
11.抽样调查某市45~55岁健康男性居民的血脂水平,184名45~55岁健康男性居民的血清总胆固醇(TC)的xbar=4.84mmol/L,s=0.96mmol/L,已知健康人的血清总胆固醇服从正态分布。估计该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围
答:已知健康人的血清总胆固醇服从正态分布,故采用正态分布法制定95%
的参考值范围
该市45~55岁健康男性居民的血清总胆固醇的95%参考值范围为2.96 mmol/L~6.72mmol/L
12.某省抗癌协会癌症康复会对189名会员进行了生存质量评价,量表包括躯体功能、心理功能、症状不良反应和社会功能四个维度,共计22个条目,总分为220分,得分越高则生存质量越高。资料如下,据此资料计算集中位置指标和离散程度指标。计算结果为: 集中位置指标xbar=135.77分,离散程度指标s=30.60
分。以上分析是否恰当?为什么?
答:大多数观察值集中在较大值一端,呈负偏态分布,故不宜使用均数和标准差。应计算中位数和四分位数间距,计算结果为 集中位置指标:M=139分
离散程度指标:四分位数间距QU-QL=157-119=38分
13.什么情况下用正态分布法或百分位数法制定医学参考值范围? 答:①通过大量调查证实或经正态性检验符合正态分布的指标或近似正态分布的指标,可按正态分布曲线下面积分布的规律制定医学参考值范围;服从对数正态分布的指标,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数即可;②对于经正态性检验不服从正态分布的指标,应使用百分位数法制定医学参考值范围。 14.何谓医学参考值范围?制定参考值范围的一般步骤有哪些? 答:医学参考值范围指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标观察值的波动范围,一般用作判定正常和异常的参考标准。制定医学参考值范围的步骤包括确定观察对象和抽取足够的观察单位、统一测定方法、决定是否分组制定参考值范围、确定取双侧或单侧参考值范围、选定适当的百分界限、选择制定医学参考值范围的方法。 15.正态分布有哪些基本特征? 答:正态分布的特征:①正态曲线在横轴上方均数处最高;②正态分布以均数为中心,左右对称;③正态分布有两个参数,即位置参数μ和形态参数σ;④正态曲线下的面积分布有一定的规律,正态曲线与横轴间的总面积恒等于1,曲线下区间(μ-1.96σ, μ+1.96σ)内的面积为
95.00%,区间(μ-2.58σ, μ+2.58σ)内的面积为99.00%。
16.极差、四分位数间距、标准差、变异系数的适用范围有何异同?
答:极差、四分位数间距、标准差、变异系数四者的相同点是都用于描述资料的离散程度。不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度;②四分位数间距可用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度;③标准差用于描述正态分布或近似正态分布资料的离散程度;④变异系数用于比较各组计量单位不同或均数相差悬殊的正态分布资料的离散程度。
17.均数、中位数、几何均数的适用范围有何异同?
答:均数、中位数、几何均数三者的相同点是都用于描述定量资料的集中位置。不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料;②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是经过对数变换后呈正态分布或近似正态分布的资料;③中位数用于不对称分布资料、两端无确切值以及分布不明确的资料。
第五章定性资料的统计描述
1 计算标准化率时,宜采用间接法的情况是
A.已知被标准化组的年龄别死亡率与年龄别人口数
B.已知被标准化组的死亡总数与年龄别人口数
C.已知标准组年龄构成与死亡总数D.已知标准组的人口总数与年龄别人口数E.被标化组各年龄段人口基数较大
[参考答案] B.已知被标准化组的死亡总数与年龄别人口数2 下列不属于相对比的指标是
A. RR
B. OR
C. 病死率
D. CV
E. 性别比
[参考答案] C. 病死率
3经调查得知甲、乙两地的恶性肿瘤的粗死亡率均为89.94/10万,但经过标准化后甲地恶性肿瘤的死亡率为82.74/10万,而乙地为93.52/10万,发生此现象最有可能的原因是
A. 甲地的诊断技术水平更高
B. 乙地的恶性肿瘤防治工作做得比甲地更好
C. 甲地的老年人口在总人口中所占比例比乙地多
D. 乙地的老年人口在总人口中所占比例比甲地多
E. 甲地的男性人口在总人口中所占比例比乙地多
[参考答案] C. 甲地的老年人口在总人口中所占比例比乙地多
4.标准化死亡比SMR最初含义是指
A. 实际死亡数/预期死亡数
B. 预期死亡数/实际死亡数
C. 实际发病数/预期发病数
D. 预期发病数/实际发病数
E. 预期发病数/预期死亡
[参考答案] A. 实际死亡数/预期死亡数5.某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为
A. 率
B. 构成比
C. 发病率
D. 相对比
E. 时点患病率
[参考答案] B. 构成比
6.试就表5-4资料分析比较甲、乙两厂职工的高血压患病率。
答:因为甲乙两厂的年龄构成有所不同,为了消除年龄构成的不同对高血压患病率的影响,应先进行标准化再进行比较。根据本题资料,以两厂合计人口为标准人口,已知被标化组的年龄别患病率,采用直接法计算标准化患病率
7.表5-2为一抽样研究资料,试填补空白处数据并根据最后三栏结果作简要分析。
答:最后三栏结果的简要分析:恶性肿瘤死亡占总死亡的比例(%)为:各年龄组恶性肿瘤死亡数除以各年龄组总死亡人数后乘100得到的值,表示各年龄组死亡人口中,恶性肿瘤死亡
所占的比例。恶性肿瘤死亡率(1/10万)为:各年龄组恶性肿瘤死亡数除以各年龄组总人数后乘100000得到的值,表示各年龄组总人口中,恶性肿瘤死亡出现的频率。年龄别死亡率(‰)为:各年龄组死亡数除以各年龄组总人数后乘1000得到的值,表示各年龄组总人口中,死亡出现的频率。
8.某地人口数:男性13,697,600人,女性13,194,142人;五种心血管疾病的死亡人数:男性16774人,女性23334人;其中肺心病死亡人数:男性13952人,女性19369人。可计算出这样一些相对数,依次说明各指标的含义
答:
9.某地1965年和1970年几种主要急性传染病发病情况如表5-1。某医师根据此资料中痢疾与乙脑由1965年的44.2%与3.4%分别增加到1970年的51.9%和5.2%,认为该地1970年痢疾与乙脑的发病率升高。该结论是否正确?为什么?
答:该结论不正确。因为该医生所计算的指标是构成比,只能说明不同年份,痢疾与乙脑在几种传染病发病人数中所占的比重发生了变化,不能说明两种传染病感染发生的频率或强度,该医生犯了以构成比代替率的错误。
10.率的标准化需要注意哪些问题?
答:①标准化法的目的是为了通过选择同一参照标准,消除混杂因素的影响,使算得的标准化率具有可比性。但标准化率并不代表真实水平,选择标准不同,计算出的标准化率也不相同。因此标准化率是用
于相互间的比较,实际水平应采用未标化率来反映。②样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。
③注意标准化方法的选用。如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率。但当被标化组各年龄段人口数太少,年龄别死亡率波动较大时,宜采用间接法。④各年龄组率若出现明显交叉,或呈非平行变化趋势时,则不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其它条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。
11.常用动态数列分析指标有哪几种?各有何用途?
答:常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内各环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展程度;平均增长速度是说明事物在一定时期内逐年的平均增长程度。
标准化率计算的直接法和间接法的应用有何区别?
对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法计算标准化率;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。
12.为什么不能以构成比代替率?
答:率是指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或强度大小。两者在实际应用时容易混淆,要注意区别。
13.应用相对数时需要注意哪些问题?答:①计算相对数应有足够的观察单位数;
②分析时不能以构成比代替率;③计算观察单位数不等的几个率的合计率或平均率时,不能简单地把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率或平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样本率或样本构成比的比较应作假设检验;⑥某些情况下只能使用绝对数。
第六章总体均数的估计
1.假设某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg,标准差为11.2 mmHg,从该地随机抽取20名35岁以上正常成年男性,测得其平均收缩压为11
2.8 mmHg,又从该地随机抽取10名7
岁正常男孩,测得其平均收缩压为
90.5mmHg,标准差为10.4 mmHg,7岁正常男孩收缩压的总体均数的95%置信区间为A.90.5±1.96×10.4
B.90.5±t0.05/2,9×10.4/?10 C.120.2±1.96×10.4
D.120.2±t0.05/2,9×10.4
E.120.2±t0.05/2,9×10.4/?10
[参考答案] B.90.5±t0.05/2,9×
10.4/?10
2.假设某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg,标准差为11.2 mmHg,从该地随机抽取20名35岁以上正常成年男性,测得其平均收缩压为112.8 mmHg,又从该地随机抽取10名7
岁正常男孩,测得其平均收缩压为
90.5mmHg,标准差为10.4 mmHg,则下列说法正确的是
A.112.8mmHg与120.2mmHg不同是由于系统误差
B.112.8mmHg与120.2mmHg不同是由于两总体均数不同
C.90.5mmHg与112.8mmHg不同是由于抽样误差
D.90.5mmHg与120.2mmHg不同是由于抽样误差
E.90.5mmHg与112.8mmHg不同是因为两总体均数不同
[参考答案] E.90.5mmHg与112.8mmHg不同是因为两总体均数不同
3.假设某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg,标准差为11.2 mmHg,后者反映的是
A.个体变异的大小
B.抽样误差的大小
C.系统误差的大小
D.总体的平均水平
E.样本的平均水平
[参考答案] A.个体变异的大小
4.总体均数的95%置信区间的含义是A.总体95%的个体值在该区间内
B.样本95%的个体值在该区间内
C.平均每100个总体均数,有95个在该区间内
D.平均每100个样本(样本含量相同)均数,有95个在该区间内
E.平均每100个样本(样本含量相同),有95个样本所得的区间包含总体均数
[参考答案] E.平均每100个样本(样本含量相同),有95个样本所得的区间包含总体均数。
5.关于置信区间,下列叙述中错误的是A.99%置信区间优于95%置信区间
B.置信区间的精确度反映在区间的长度C.当样本含量确定时,准确度与精确度是矛盾的
D.置信区间的准确度反映在置信度1-a 的大小上
E.当置信度1-a确定时,增加样本含量可提高精确度
[参考答案] A.99%置信区间优于95%置信区间6.从同一总体中随机抽取多个样本,分别估计总体均数的95%置信区间,则精确度较高的是
A.均数大的样本
B.均数小的样本
C.标准差小的样本
D.标准误大的样本
E.标准误小的样本
[参考答案] E.标准误小的样本
7.关于t分布,下列叙述错误的是
A.分布是以0为中心,左右对称的一簇单峰曲线
B.自由度越小,曲线越低平
C.当自由度为¥时,t分布就是标准正态分布
D.自由度相同时,|t|越大,其尾部概率值P越小
E.自由度越大,尾部概率相同时,t界值越大
[参考答案] E.自由度越大,尾部概率相同时,t界值越大
8.表示均数抽样误差大小的统计指标是A.全距
B.标准差
C.标准误
D.变异系数
E.四分位数间距
[参考答案] C.标准误
9.某实验室随机测定了100名正常成人血浆内皮素(ET)含量(ng/L),得均数为81.0(ng/L),标准差18.2(ng/L)。①计算抽样误差;②试估计正常成人ET含量(ng/L)总体均数的95%置信区间。
答:①标准误为1.82;②由于该样本为大样本, 故用公式
估计正常人ET含量的95%置信区间为(77.38, 84.60)ng/L。
10.从某疾病患者中随机抽取25例,其红细胞沉降率(mm/h)的均数为9.15,标准差为2.13。试估计其总体均数的95%置信区间和99%置信区间。
答:由于该样本为小样本,故用公式
估计总体均数95%置信区间为
(8.27,10.03)mm/h;
估计总体均数99%置信区间为(7.96, 10.34)mm/h。
11.2005年随机抽取某市400名7岁男孩作为研究对象, 计算得其平均身高为122.5 cm, 标准差为5.0 cm。请估计该市7岁男孩身高的总体均数。某学生的回答如下:“该市2005年7岁男孩平均身高的点估计值为122.5 cm,按公式计算得到其总体均数的95%置信区间为(112.7, 132.3) cm”。请问该学生的回答是否恰当?为什么?
答:该学生误用医学参考值范围的公式来计算总体均数的95%置信区间。医学参考值范围与均数的置信区间的主要区别在于,计算医学参考值范围时应该用标准差,计算置信区间时应该用标准误。此例中样本含量较大,可用Z值代替t值,故置信区间的计算公式为。根据置信区间的公式算得2005年该市7岁男孩身高的95%置信区间为(122.0,123.0)cm。
12.如何运用抽样分布规律估计总体均数?
答:数理统计的中心极限定理:从均数为m,标准差为s的正态总体中进行独立随机抽样,其样本均数服从均数为m,标准差为s/?n的正态分布;即使是从非正态总体(均数为m,标准差为s)中进行独立随机抽样,当样本含量逐渐增加时,其样本均数的分布逐渐逼近于均数为m,标准差为
s/?n的正态分布。标准误越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之,标准误越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。
13.阐述标准差与标准误的区别与联系。
答:标准差与标准误的区别与联系,见表6-1:
14.样本均数的抽样分布有何特点?
答:样本均数的抽样分布的特点有:①各样本均数未必等于总体均数;②样本均数之间存在差异;③样本均数基本服从正态分布;④样本均数的变异范围较原变量的变异范围小;⑤随着样本含量的增加,样本均数的变异范围逐渐缩小。
15.什么是均数的抽样误差?决定均数的抽样误差大小的因素有哪些?
答:抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。
16.阐述总体均数的置信区间与医学参考值范围的区别。
答:总体均数置信区间与医学参考值范围的区别见表
6-2
第七章假设检验
1.下列关于I型错误概率α和II型错误概率b的说法不正确的是
A.当样本量确定时,α越小,b越大B.当样本量确定时,α越大,b越小C.欲减小犯I型错误的概率,可取较小αD.欲减小犯II型错误的概率,可取较大α
E.若样本含量足够大,可同时避免犯这两型错误[参考答案] E.若样本含量足够大,可同时避免犯这两型错误
2.样本均数与已知总体均数比较的t检验时,P值越小说明
A.样本均数与已知总体均数差别越小B.样本均数与已知总体均数差别越大C.样本所对应的总体均数与已知总体均数差别越大
D.越有理由认为样本均数与已知总体均数不同
E.越有理由认为样本所对应的总体均数与已知总体均数不同
[参考答案] E.越有理由认为样本所对应的总体均数与已知总体均数不同
3.下列关于单侧检验和双侧检验的说法正确的是
A.采用单侧检验更好
B.采用双侧检验更好
C.采用单、双侧检验都无所谓
D.根据专业知识确定采用单侧检验还是双侧检验
E.根据检验统计量的计算结果确定采用单侧检验还是双侧检验
[参考答案] D.根据专业知识确定采用单侧检验还是双侧检验
4.在样本均数与已知总体均数比较的t检验中,结果t=3.24,t0.05/2,n=2.086,t0.01/2,n=2.086,按检验水准α=0.05,可认为此样本均数
A.与该已知总体均数不同
B.与该已知总体均数差异很大
C.所对应的总体均数与已知总体均数差异很大
D.所对应的总体均数与已知总体均数相同E.所对应的总体均数与已知总体均数不同[参考答案] E.所对应的总体均数与已知总体均数不同
5.有关样本均数的与总体均数的比较,检验统计量t越大
A.说明总体参数差别越大
B.说明总体参数差别越小
C.说明样本统计量差别越大
D.说明样本统计量差别越小
E.越有理由认为两总体参数不等
[参考答案] E.越有理由认为两总体参数不等
6.假设检验时,所犯II型错误概率最小的检验水准α为
A.0.01
B.0.025 C.0.05
D.0.10
E.0.20
[参考答案] E.0.20
7.假设检验时,若检验水准α=0.05,则下列关于检验结果的说法正确的是
A.若P≤0.05,则不拒绝H0,此时可能犯II型错误
B.若P≤0.05,则拒绝H0,此时可能犯II型错误
C.若P≤0.05,则不拒绝H0,此时可能犯I型错误
D.若P>0.05,则拒绝H0,此时可能犯I 型错误
E.若P>0.05,则不拒绝H0,此时可能犯II型错误
[参考答案] E.若P>0.05,则不拒绝H0,此时可能犯II型错误
8.假设检验的基本步骤是
A.计算检验统计量、确定P值、做出推断结论
B.建立无效假设、建立备择假设、确定检验水准
C.建立无效假设、计算检验统计量、确定P值
D.确定单侧检验或双侧检验、选择
E.检验、估计I型错误概率和II型错误概率
[参考答案]E.检验、估计I型错误概率和II型错误概率
9.比较两药疗效时,下列可作单侧检验的情形是
A.已知A药与B药均有效
B.已知A药与B药均无效
C.已知A药不会优于B药
D.已知A药与B药差不多好
E.不知A药好还是B药好
[参考答案] C.已知A药不会优于B药
10.为了比较非洛地平与常规药物治疗高血压的疗效差异,某医生随机抽取100名
原发性高血压患者,分别测量患者接受非洛地平治疗前后的血压差值,计算得其均数为21.5mmHg,标准差为8.0mmHg。现已知常规药能使高血压患者的血压平均下降20mmHg。该医生对其进行了t检验,零假设是m=m0,备择假设是m≠m0,检验水准a=0.05。计算得t=1.875,按n=100查t 界值表,得0.05
答:该结论是错误的。因为在进行两均数比较的假设检验时,当P≤0.05时,说明两总体均数相同是一小概率事件,我们认为在一次试验中几乎不会发生,于是得出拒绝H0,接受H1的结论,即使犯错误,概率也小于5%;但是当P>0.05时,对于不拒绝H0认为两总体均数相同这一结论无任何概率保证,得出错误结论的概率可能很大。故本例正确的说法应该是:按
a=0.05水准,不拒绝H0,差异无统计学意义,尚不能认为非洛地平与常规药物治疗高血压的疗效不同
11.解释I型错误、II型错误和检验效能,并说明它们之间的关系。
答:拒绝实际成立的H0所犯的错误称为I 型错误,记为a。不拒绝实际不成立的H0所犯的错误称为II型错误,记为b。如果两个总体参数间确实存在差异,即H1成立(例如m≠m0),按照现有检验水准,使用假设检验方法能够发现这种差异(即拒绝H0)的能力被称为检验效能,记为(1-b)。三者的关系为:当样本量固定时,a与b 成反比,与(1-b)成正比。如果把a设置得很小,势必增大犯II型错误的概率,从而降低检验效能;反之,如果重点在于减少b,势必增加犯I型错误的概率,从而降低了置信度
12.举例说明单侧检验与双侧检验的选择。答:选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。例如,在临床试验中,比较甲、乙两种治疗方法的疗效是否有差异,目的只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。如果有充分的理由认为甲法疗效不比乙法差,此时应选用单侧检验。若从专业角度无法确定的情况下,一般应采用双侧检验。
13.简述假设检验的基本步骤。
答:假设检验的基本步骤如下:(1)建立检验假设,确定检验水准;(2)计算检验统计量;(3)确定P值,做出统计推断
14.解释零假设与备择假设的含义。
答:零假设又称无效假设,记为H0,表示其差异是由抽样误差引起的;备择假设又称对立假设,记为H1,表示其差异是因为比较的对象之间存在本质不同造成的。
15.经研究显示,汉族正常成年男性无名指长度的均数为10.1cm。某医生记录了某地区12名汉族正常成年男性无名指长度(cm)资料如下:
10.05 10.33 10.49 10.00 9.89 10.15 9.52 10.33 10.16 10.37 10.11 10.27
问该地区正常成年男性无名指长度是否大于一般汉族成年男性?
答:本题是样本均数与总体均数的比较,用单样本资料的t检验
16.已知服用某种营养素一个疗程后,受试者某项生化指标平均增加52个单位。一家研究所对该营养素进行改进后,随机抽取受试者36名服用新产品一个疗程,测得该生化指标平均增加了53个单位,标准差为2.0个单位。问该营养素新产品是否比旧产品的效果好?
第八章 t检验
1.为研究两种方法的检测效果,将24名患者配成12对,采用配对t检验进行统计分析,则其自由度为:A. 24
B. 12
C. 11
D. 23
E. 2
医学统计学期末复习题 一、单项选择题 1 下面的变量中是分类变量的是 A.身高 B.体重 C.年龄 D.血型 2 下面的变量中是是数值变量的是 A.性别 B.年龄 C.血型 D.职业 3.随机事件的概率 P 为 A.P=0 B. P=1 C. P=-0.5 D. 0
第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2
医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-
医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。
《医学统计学》期末模拟考试题(四)学号______________ 姓名______________ 班级______________ 成绩 ____________ 一、是非题(每题1分,共20分) 1. 预试验的样本标准差s越小,所需样本含量越大。() 2. 等级相关系数的大小不可以反映两个现象间关系的密切程度。() 3. 在配对资料秩和检验中,两组数据统一从小到大编秩次。() 4. 对3个地区居民的血型构成作抽样调查后研究其差别,若有一个理论数小于5大于1,其余都大于5,可直接作χ2检验。() 5. 总例数等于60,理论数都大于5的四格表,对两个比例的差别作统计检验,不可用确切概率法。() 6. 双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。() 7. 随机区组方差分析中,只有当区组间差别的F检验结果P>0.05时,处理组间差别的F检验才是真正有 意义的。() 8. 完全随机设计资料方差分析中要求各组均数相差不大。() 9. 两次t检验都是对两样本均数的差别作统计检验,一次P<0.01,另一次P<0.05,就表明前者两样本均 数差别大,后者两样本均数相差小。() 10. 如果把随机区组设计资料用完全随机设计方差分析法作分析,前者的区组SS+误差SS等于后者的组内SS。()
11. 两分类Logistic回归模型的一般定义中,因变量(Y)是0~1变量。() 12. 作两样本均数差别的比较,当P<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。()<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。() 13. 方差分析的目的是分析各组总体方差是否不同。() 14. 在两组资料比较的秩和检验中,T值在界值范围内则P值小于相应的概率。()值在界值范围内则P值小于相应的概率。() 15. 无论什么资料,秩和检验的检验效率均低于t检验。()检验。() 16. 分类资料的相关分析中,检验的P值越小,说明两变量的关联性越强。() 17. 析因设计既可以研究各因素的主效应作用,又可以研究各因素间的交互作用。( ) 18. 当Logistic回归系数为正值时,说明该因素是保护因素;为负值时,说明该因素是危险因素。() 19. 常见病是指发病率高的疾病。( ) 20. 用某新药治疗高血压病,治疗前与治疗后病人的收缩压之差的平均数,经t检验,P<0.01。按a=0.05水准,可以认为该药治疗高血压病有效,可以推广应用。( ) 二、选择题(每题1分,共20分) 1.多重回归中要很好地考虑各因素的交互作用,最好选用________。 a. 最优子集法 b. 逐步法 c. 前进法 d. 后退法 e. 强制法 2.t r 中国医科大学网络教育学院 医学统计学复习题 一、最佳选择题 1. 下列资料何为定性资料? A 体重(kg) B 血型(A、B、O、AB) C 血红蛋白(g/L) D 坐高指数(%,坐高/身高) E 白细胞计数(个/L) 2. 下列资料属于等级资料的是_______ A 白细胞计数(个/L) B 血型(A、B、O、AB) C 体重(kg) D 病人的病情分级(轻、中、重) E 坐高指数(%,坐高/身高) 3.医学科学研究中的随机样本是指_______ A 总体中的一部分 B 研究对象的全体 C 总体中特殊的一部分 D 总体中有代表性的一部分 E 研究对象中一部分有特殊代表性的样本 4.统计工作的基本步骤是_______ A 设计、搜集资料、整理资料和分析资料 B 设计、统计分析、统计描述和统计推断 C 选择对象、计算统计指标、参数估计和假设检验 D 搜集资料、计算均数、标准差、标准误 E 搜集资料、整理资料和分析资料 5.统计学的小概率事件是指随机事件发生的概率_______ A 等于0.05 B 小于等于0.05 C 大于0.05 D 小于0.05 E 大于等于0.05 6.医学统计学的主要研究对象是_____。 A.随机事件B.必然事件C.不可能发生的事件D.发生可能性很小的事件E.发生可能性很大的事件 7.编制组段数为10的频数表,在确定组距时______ A 常取最大值的1/10取整作为组距 B 常取最小值的1/10取整作为组距 C 常取极差的1/10取整作为组距 D 组距等于极差 E 常取极差的一半取整作为组距 8.频数分布的两个重要特征是______ A 集中趋势和分布类型 B 集中趋势和离散趋势 C 标准差和离均差 《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关 7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描 医学统计学模拟试题(A) 一、单选题:在A、B、C、D 和E 中选出一个最佳答案,将答案的字母填在相应下划线的空格里。 (每题1 分) 1. 卫生统计工作的基本步骤包括_____。 A 动物实验、临床试验、全面调查和抽样调查 B 资料整理、统计描述、参数估计和统计推断 C 实验设计、资料收集、资料整理和统计分析 D 资料收集、资料核对、资料整理和资料分析 E 统计设计、统计描述、统计估计和统计推断 2. 以下_____不属于定量资料。 A. 体块指数(体重/身高2) B. 白蛋白与球蛋白比值 C. 细胞突变率(%) D. 中性核细胞百分比(%) E. 中学生中吸烟人数 3. 关于频数表的制作, 以下_____论述是正确的。 A. 频数表的组数越多越好 B. 频数表的下限应该大于最小值 C. 频数表的上限应该小于最大值 D. 一般频数表采用等距分组 E. 频数表的极差是最小值与最大值之和 4. 比较身高与坐高两组单位相同数据变异度的大小,宜采用_____。 A. 变异系数(CV)B.标准差(s)C.方差(s2)D.极差(R)E.四分位间距 5. 从μ到μ+1.96s 范围外左右两则外正态曲线下的面积是_____ 。 A.2.5% B.95% C.5.0% D.99% E.52.5% 6. 关于假设检验的以下论述中,错误的是_____。 A. 在已知A药降血压疗效只会比B 药好或相等时, 可选单侧检验 B. 检验水准 定得越小, 犯I型错误的概率越小 C. 检验效能1- 定得越小, 犯II型错误的概率越小 D. P 值越小, 越有理由拒绝H0 E. 在其它条件相同时, 双侧检验的检验效能比单侧检验低 7. 两组数据中的每个变量值减同一常数后,做两个样本均数( X)差别的t 检验,____。 A. t 值不变B. t 值变小C. t 值变大 D. t 值变小或变大E. 不能判断 8. 将90 名高血压病人随机等分成三组后分别用A、B 和C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是____ 。 A. 作三个样本两两间差值比较的t 检验 B. 作三个样本差值比较的方差分析 C. 作服药前后配对设计资料的t 检验方差分析 D. 作配伍组设计资料的方差分析 E. 以上都不对 预防医学复习题(统计部分) 复习重点(及简答题) 1. 医学统计学的基本概念 如:总体与样本的联系区别 2. 资料的分类 如:请列举资料的类型并举例说明 3. 定量资料统计描述的指标(集中与离散趋势) 如:定量统计描述指标有哪些? 如:正态分布与偏态分布资料统计描述方法有何区别 4. 定性资料统计描述的指标 5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律 如:正态分布、标准正态分布与t分布的区别联系 6. 小概率事件在医学统计学的应用(P值的含义) 如:P值的含义是什么,对统计结论有何意义 7. 假设检验的基本原理与步骤 8. 四种主要统计假设检验方法及其应用场合 9. 统计表的绘制 选择题 1.样本是总体中: A、任意一部分 B、典型部分 C、有意义的部分 D、有代表性的部分 E、有价值的部分 2、参数是指: A、参与个体数 B、研究个体数 C、总体的统计指标 D、样本的总和 E、样本的统计指标 3、抽样的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 4、脉搏数(次/分)是: A、观察单位 B、数值变量 C、名义变量 D.等级变量 E.研究个体 5、疗效是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 6、统计学常将P≤0.05或P≤0.01的事件称 A、必然事件 B、不可能事件 C、随机事件 D、小概率事件 E、偶然事件7.统计中所说的总体是指: A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体 8.概率P=0,则表示 A某事件必然发生B某事件必然不发生C某事件发生的可能性很小 D某事件发生的可能性很大E以上均不对 9.总体应该由 A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成 10. 在统计学中,参数的含义是 A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量 11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本 12.统计学中的小概率事件,下面说法正确的是: A.反复多次观察,绝对不发生的事件 B.在一次观察中,可以认为不会发生的事件 C.发生概率小于0.1的事件 D.发生概率小于0.001的事件 E.发生概率小于0.1的事件 13、统计上所说的样本是指: A、按照研究者要求抽取总体中有意义的部分 B、随意抽取总体中任意部分 C、有意识的抽取总体中有典型部分 D、按照随机原则抽取总体中有代表性部分 E、总体中的每一个个体 14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。 A、计算 B、计数 C、计量 D、等级 E、都对 15、红细胞数是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 16、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为: A.所有成年男子 B.该市所有成年男子 C.该市所有健康成年男子 D.120名该市成年男子 E.120名该市健康成年男子 17、某地区抽样调查1000名成年人的血压值,此资料属于: A、集中型资料 B、数值变量资料 C、无序分类资料 D、有序分类资料 E、离散型资料 18、抽样调查的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 19、测量身高、体重等指标的原始资料叫: A计数资料 B计量资料 C等级资料 D分类资料E有序分类资料 20、某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗数8 23 6 3 1 第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百 分之几,它是对比的最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或 “医学统计学”上机考试模拟题A卷 1.测得10例某指标值治疗前后情况如下: 例号 1 2 3 4 5 6 7 8 9 10 治疗前76 64 60 62 72 68 62 66 70 60 治疗后74 62 64 58 68 70 56 60 66 56 1.用参数方法比较治疗前后该指标值的差异有无统计学意义,结果填入下表: 例数均数标准差治疗前 治疗后 差值(前-后) H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量t=2.512 P=0.0332 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即治疗前后该指标值有差异。 2.上题资料,用非参数方法比较治疗前后该指标值的差异有无统计学意义。结果填入下面空格。 H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量s=19.5 P=0.0547 统计结论:P>0.05,不拒绝H0,认为在α=0.05水平上差异无统计学意义,即治疗前后该指标值无差异。 3.测得10例正常儿童身高(cm)和体重(kg)如下: 例号 1 2 3 4 5 6 7 8 9 10 身高(X)120 133 126 130 121 122 131 128 110 124 体重(Y)20 27 23 25 25 18 22 25 15 22 (1)求身高和体重的相关系数,并作显著性检验。 相关系数r =0.81211 H0:p=0 H1:p≠0 P= 0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重存在正相关。 (2)求身高推算体重的直线回归方程,并作显著性检验。 直线回归方程:y=-32.964+0.443*x H0:β=0 H1:β≠0 P=0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重之间存在直线回归关系。 三.10名氟作业工人在工作前后测定尿氟(mg/L)排出量结果如下: 编号 1 2 3 4 5 6 7 8 9 10 工前 1.7 1.6 1.4 2.3 1.9 0.8 1.4 2.0 1.6 1.1 工后 2.7 3.1 3.2 2.1 2.7 2.4 2.6 2.4 2.3 1.4 1.计算工后比工前尿氟排出量增加值的均数,标准差,标准误,变异系数和中位数。 均数0.91,标准差0.635,标准误 0.201,变异系数 69.78,中位数 0.900 2.检验氟作业工人在工作前后尿氟排出量的差异有无统计学意义。 H0:氟作业工人在工作前后尿氟排出量的差异无统计学意义。 H1:氟作业工人在工作前后尿氟排出量的差异有有统计学意义 统计量t=4.532 P=0.0014 一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ~9.1×109 /L ,其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料 第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体 [参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007 医学统计学历年常考总结试题3元第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制() A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是() A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用() A 变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是() A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为() (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为() A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验() A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时, 自由度是() (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映() A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的( ) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系 数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?() A t r>t b B t r 一、名词解释: 1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。 2、有限总体:是指空间、时间范围限制的总体。 3、无限总体:是指没有空间、时间限制的总体。 4、样本:从总体中随机抽取部分观察单位,其实测值的集合。 5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。 6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。 8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。 9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。 11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。检验水平,就是预先规定的允许犯I型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。 14、率:强度相对数,说明某现象发生的频率或强度。 15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。 16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。 17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。 18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。 20、相关系数:又称Pearson积差相关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1≤r≤1。相关系数的检验假设常用t检验。 21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。 22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。 23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。 (2)多分类:各类间互不相容。 25、期望寿命:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。 26、检验效能:表达式为1-β,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。 27、观察单位:亦称个体,是统计研究中的基本单位。它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。 28、样本含量:样本中包含观察单位数称为该样本的样本含量。 29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。 30、变量值:对变量的观测值称为变量值或观察值。 31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差②非系统误差。32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。 33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。 34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。 第二章 1?答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表 示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓开口”资料, 是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。 即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2?答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1?不灵敏;2?不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q= Q u —Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反 映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance , CV)亦称离散系数(coefficient of dispersion ), 为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3?答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百 分之几,它是对比的最简单形式。其计算公式为比二A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分 率(%。)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: 率.= 实际发生某现象的观察单位数迸比例基数(K) 可能发生某现象的观察单位总数 构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或 医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr医学统计学复习题
医学统计学试题及答案
医学统计学模拟试题
医学统计学复习题65915
医学统计学课后答案.
(完整word版)医学统计学上机考试复习题及答案
医学统计学练习题与答案
医学统计学部分试题及答案解析
医学统计学模拟试卷与答案
【孙振球第三版】医学统计学复习题
医学统计学课后答案解析
医学统计学试题及答案