当前位置:文档之家› 医学统计学

医学统计学

医学统计学
医学统计学

医学统计学

概念

1.观察性研究:又称调查研究,是指在没有任何干预措施的条件下客观的观察和记录研究对象的现状及其相关特征,客观地反映事物的实际情况,已了解疾病的发生和发展规律。

2.实验性研究:是对研究对象人为施加干预的研究方法。在干预前,研究对象来自同一总体,研究者通过随机分组对不同组的研究对象施加不同的干预,从而比较不同干预措施结果间的差异。

3.概率:是描述某事件发生可能性大小的度量。

4.小概率事件:在统计学上,统计推断的结论都是基于一定的概率得出的,习惯上将P≤0.05或P<0.01的事件成为小概率事件,表示在一次试验中发生的可能性很小。

5.第Ⅰ类错误:当H0为真时,假设检验结论拒绝H0,接受H1,这类错误称为Ⅰ类错误。

6.第Ⅱ类错误:当真实情况为H0不成立时,假设检验结论不拒绝H0,这类错误叫做Ⅱ类错误。

7.相对数:是两个有关的绝对数之比,也可以是两个有关联统计指标之比。

8.相对比:是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B的若干倍或百分之几,通常用倍数或百分数表示。

9.相关系数:又称Pearson积差相关系数,是说明具有直线相关关系的两个数值变量间相关的密切程度和相关方向的统计量。

10.文献:记录有知识的一切载体,该定义揭示了文献所包含的知识内容、信息符号和载体材料、记录方式四个基本要素。

11.期刊写法:作者(多位作者著录到第三位,后加等).文题[J].刊名,年,卷(期):页码.

12.X20.05,1=3.84 X20.01,1=6.63

填空

1.描述平均水平的指标有均数和中位数。正态分布是均数,偏态分布是中位数。

2.医学统计学的基本内容:统计设计、数据整理、统计描述和统计推断。

3.离散:四分位数间距

4.调查问卷考评:信度、效度、可接受性

5.实验对照形式:空白对照、安慰剂对照、标准对照、实验对照、自身对照、相互对照、历史对照。

6.常用调查研究方法:调查问卷法、访谈法、敏感问题调查法、医学检查

7.文献按出版形式分类:科技图书、科技期刊、会议文献、学位论文、科技报告、政府出版物、专利文献、标准文献。

8.常用的概率抽样:简单随机抽样、机械抽样、整群抽样、分层抽样。

选择

1.事先给定的概率1-α称为可信度(通常取0.95或0.99),计算得到的区间称为可信区间。

2.总体均数估计的95%可信区间表示该区间包括均数μ的概率为95%。学会表达P53

3.99%可信区间的计算:均数±2.58*S/根号N。

4.相关系数r没有单位,取值范围是-1≤r≤1。r>0表示正相关,r<0表示负相关。相关系数的绝对值越接近1,相关越密切;越接近0,相关越不密切。

5.正态分布:μ±1.966 95% μ±2.586 99%

6.定量数据:身高、体重、血压、温度/家庭成员数、脉搏、白细胞计数等

定性计数:性别分男女,血型分A.B.O

有序数据:特点是有顺序,如药物治疗分为有效,好转,无效等

7.误差分类:系统误差、随机测量误差、抽样误差(不可避免)

8.统计图:直方图:身高,正常与糖尿病患者对比

线图:死亡率散点图:变异间相互关系直条图:相对独立对比

构成图:构成比

简答

一.文献信息数据库检索途径:(可能填空,四个)

1.自由词检索

2.主题词检索

3.分类检索

4.机构检索

5.刊名检索

6.题名检索

二.实验性研究和观察性研究的区别

1.有无人为干预措施

2.是否随机分组

3.是否控制非处理因素

三.什么是调查问卷?调查问卷的考评?

调查问卷是观察性研究中,用来搜集资料的一种测量工具,主要由一系列与研究内容和分析指标相关的问题构成。

1.信度:通过问卷获得的结果的一致性和稳定性,即精确度。

分为重测信度、分半信度、内部一致信度。

2.效度:调查问卷是否真正反映被调查者的实际情况。

分为内容效度、结构效度、标准关联效度、

3.可接受性。

四.为什么要进行率的标准化?

五.医学(科学)研究的基本程序?

1.立题:提出问题和解决问题。

2.设计:研究对象、方法、分组、处理因素、观察指标、误差控制。

3.实践:观察法、实验法等。

六.实验设计三要素及针对这些要素应注意的问题

1.研究对象

a研究对象应具有明确的纳入标准和排除标准

b选择对处理因素敏感性强的研究对象

c选择依存性好的患者作为研究对象

d注意医学伦理学问题

2.处理因素

a处理因素要标准化

b明确处理因素和非处理因素

3.实验效应

a主观指标和客观指标

b选择灵敏度和特异度高耸的指标

c观察指标的准确度和精密度

六.实验设计的三原则及为什么要遵循?

1.对照原则指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。

2.随机化原则指每个受试对象有相同的概率或机会被分配到不同的处理组

3.重复原则指在相同实验条件下重复进行多次观察

原因在医学实验研究中,由于存在各种非处理因素的干扰,可能使实验结果产生偏移。为了减少偏移,研究设计时,必须遵循实验设计的基本统计原则。

七.科研论文内容包括?

1.题目

2.作者姓名、作者单位、最高学历

3.摘要

4.关键词

5.导言或引言

6.对象(材料)与方法

7.结果8.讨论

9.结论或小结10.致谢

11.参考文献12.附录

医学统计学案例分析 (1)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学案例分析(1) 案例分析四格表确切概率法【例 1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将 27 例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表 1-4。 经检验,得连续性校正 2 =3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表 1-4 两种药物治疗急性心肌梗塞的疗效比较药物中药西药合计有效 12(9.33) 6(8.67)无效 2(4.67) 7(4.33)合计 14 13 27 有效率(%) 85.7 46.2 66.7 18 9 【问题 1-5】(1)这是什么资料?(2)该资料属于何种设计方案?(3)该医师统计方法是否正确?为什么?【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27 例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数 n=27<40,该医师用 2 检验是不正确的。 当 n<40 或 T<1时,不宜计算 2 值,需采用四格表确切概率法(exact probabilities in 22 table)直接计算概率案例分析-卡方检验(一)【例 1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取 140 例胃炎患者分成中药组和西药组,结果中药组治疗 80 例,有效 64 例,西药组治疗 60例,有效 35 例。 1 / 5

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

医学统计学分析计算题_与解析

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012 ·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学试题与答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

医学统计学-应用题模板

统计学个人整理 (仅针对昆明医科大学劳动与社会保障专业2010级学生) 【t检验】 一.完全随机设计的两样本均数的t检验 Copd患者。。。 正常人。。。 问:运用配对t检验的方法是否正确? 答:不正确。对完全随机设计的资料不宜使用配对t检验。本资料应用完全随机设计的两样本均数比较的t检验,目的是判断两样本均数分别代表的两总体均数是否相同。 步骤: 1.建立假设检验,确定检验水准 Ho: Copd患者与正常人的C-FPWV的总体均数相同; H1: Copd患者与正常人的C-FPWV的总体均数不同。α=0.05 2.运用完全随机设计的两样本均数的t检验计算检验统计量t值和P值。 3.如果P≤0.05,拒绝Ho,接受H1,差异有统计学意义,可认为Copd患者与正常人的 C-FPWV的总体均数不同;如果P>0.05,不拒绝Ho,差异无统计学意义,尚不可认为Copd患者与正常人的C-FPWV的总体均数相同。 二.对数转换后的t检验:白喉抗体效价 男生320 20 320 640 80 320 160 40 女生20 20 160 40 160 80 20 40 20 问:经完全随机设计两样本均数比较的t检验,方差齐,比较得出结论的方法是否正确?答:不正确。由于抗体效价是等比资料,服从对数正态分布,各组的平均效价应用几何均数G描述,其假设检验不能直接用完全随机设计两样本均数比较的t检验,而应将观察值进行对数转换后再用t检验。 三.配对t检验 答①: 1.建立假设检验,确定检验水准。 Ho: 病人治疗前和治疗后血红素总体均数相同; H1: 病人治疗前和治疗后血红素总体均数不同。α=0.05 2.运用配对t检验得到t值和P值。 3.如果P≤0.05,拒绝Ho,接受H1,差异有统计学意义,可认为病人治疗前和治疗后血 红素总体均数不同;如果P>0.05,不拒绝Ho,差异无统计学意义,尚不可认为病人治

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学案例分析(1)

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药 6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的 X2检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10 (7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值 具体计算略。

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学分析题

五、分析应用题(4题,共40分) 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较 疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何?请说出理由(6分) 1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。 2、24名志愿者完全随机地分成两组,接受降胆固醇试验。甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表, 甲组乙组 受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 (1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分) (2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分) 2、答:(1)欲分析两种治疗方法是否有效,可用治疗前后比较,属配对设计(2分),应用配对t检验(3分)。(2)如判断两种方法的效果有无差别,则属成组设计(2分),应用两样本均数比较的t检验(3分)。 3、检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问:⑴若要判断能否用乙法推算甲法,又用何统计方法?(6分) ⑵欲比较甲乙两法检出血磷是否相同,用何统计方法?(6分) 3、答:(1)根据题意,应用回归分析(6分) (2)这是配对设计计量资料(2分),应用配对t检验(4分) 4、某单位对常住本市5年以上,从未接触过铅作业,也未服过含铅药物或其它重金属,饮用自来水,无肝、肾疾患及贫血,近日未使用利尿剂的健康成年,用乙酸乙酰法测24小时尿δ-ALA的结果如下,欲制定其95%正常值范围。请问:用何种估计方法?说出理由并给出计算公式。(10分) δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计

医学统计学知识点梳理

医学统计学知识点梳理 Revised as of 23 November 2020

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

医学统计学案例分析

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3) 该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。(3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1 时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法? 【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见 表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10(7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学总结

医学统计学总结 一.绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某 项特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总 体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代 表性。代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学案例分析报告.doc

医学统计学案例分析评述 医学期刊论著:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄45.6 岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查?如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的? 【统计方法】 (1)本论著未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。 (2)文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确

EXCEL在医学统计学中的应用(一)

EXCEL 在医学统计学中的应用(一)——概述 倪关森,金正均本课程所需所有EXCEL 示例程序,请下载: 一般函数解释.xls ,统计函数解释.xls , 统计分析工具解释.xls ,统计程序设计解释.xls , EXCEL 实用临床统计程序.xls 。 1.概述 统计学是医学科学的基础学科,对临床医学和实验研究有重要的 指导价值[1]。对大多数临床医师而言,在正确应用统计分析和计 算时常感力不从心。为此,早在十几年前,就有统计学工作者应 用BASIC 语言编写统计程序[2],以后随着微机的软件和硬件技术 的发展,为统计学计算带来了飞跃发展,但建筑在DOS 操作系统 和数据库基础上的统计软件包需要培训,故其普及和推广应用受 到一定限制[3]。近年来,建筑在Windows 操作平台的OFFICE 软 件得到迅速普及,其中EXCEL 优越的数据处理性能和强大的统计 计算功能开始为大家所熟悉,在国外有许多医院和实验室已经用 EXCEL 进行医学数据资料的统计计算的报道[4],国内也有这方面 的报道[5],经推广使用和《好医生》网站交流,颇受欢迎。 EXCEL 不仅具有现有的的强大的编程和统计功能,更有利于医学 资料和统计资源的共享。EXCEL 是一个很有发展潜力的软件,其 宏命令和VBA(Visual Basic for Application)更为EXCEL 扩展功能 提供了界面,以编程方式对数据分析功能的访问是所有表处理软 件中最高级的;EXCEL 提供了电子邮件的内部特性的功能,使创 建的文件可以和INTERNET 上其他人提供的文件进行联接,下载 工作簿到用户计算机,也可上载工作簿到FTP(文件传输协议)站 点,其数据交换和网络通讯,为统计学工作者数据资料的收集、 处理和统计分析提供了更广阔的范围。 2.EXCEL 在医学统计中的应用 在电子表格上,编制了一些常用的医学统计程序,经实际使用以 及和SAS 、SPSS 对比,计算结果一致。现把如何应用介绍如 下: 2.1进入统计程序 每一张电子表格是一个统计程序,当进入EXCEL ,打开卫生统计 工作簿时,用鼠标点开标签,则该统计程序的电子表格就显示在 屏幕上,就可直接使用该统计程序。 2.2常用统计程序 2.2.1计量资料的统计程序 U 检验、t 检验、几何均数t 检验、配对t 检验、t'检验、方差分析 (三样本)、配伍方差分析、方差分析(四样本)、随机区组方差分 析、拉丁方设计方差分析、无重复试验的两因素方差分析、重复 试验的两因素方差分析、几个处理组均数与一个对照组均数比 较、多个样本两两比较(Newman-Keuls 法)、例数相等协方差分 析、例数不相等协方差分析、2X2析因方差分析、2X2X2方差分 析、直线回归与相关。详细请见EXCEL 实用临床统计程序.xls 2.2.2计数资料的统计程序 1.概述 2.EXCEL 在医学统计中的应用2.1进入统计程序2.2常用统计程序2.3使用方法和注意要点

医学统计学重点总结

<<医学统计学>>重点总结 1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。 2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。 3. 同质:影响研究指标的主要因素易控制的因素基本上相同。 4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为。。。 5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。 6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/ 终止(研究时限已到而终止观察)。 7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。X2反应实现了实际频数与理论频数的吻合程度。如果检验假设成立,则A-T 一般不大,X2应很小,即出现大X2值概率很小。即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。若P>a则没有理由拒绝H0。 8. X2用途: (1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x 列表)。B两变量之间有无相互关系。C频数分布的拟合优度检验(判断次样本是否来自某种分布)。(2)某些分布可用X2近似。 (3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。 9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。 10. 假设检验中P,a,b(倍他)的关系及统计学意义: a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。 b:在T假设检验中,按照a检验标准,没有拒绝原来错误的无效假设,即犯了第2类错误,犯次错误的概率是b。 P:是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较,根据比较的结果作出统计判断。如果P≤a时,就怀疑假设的成立,拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0,接受H1的推论时犯错误的机会越小。 11.行x列表X2检验应注意: (1)行x列表中不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1,若发生上述情况可采用:A将理论频数过小的格子所在的行或列与性质相近的邻近行或列中的实际频数合并,使重新计算的理论频数增大。B删去理论频数过小的行或列。C增大样本含量以增大理论频数。 (2)当效应按强弱分为若干级别,则按实验结果可整理为单向有序行x列表,在比较各处理组的效应有无差别时,宜用秩和检验,ridit分析等。如作X2检验只说明各组构成比的差异有无统计学意义。

医学统计学知识点

实用标准 文档大全第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB 等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。

相关主题
文本预览
相关文档 最新文档