当前位置:文档之家› 医学统计学案例分析

医学统计学案例分析

医学统计学案例分析
医学统计学案例分析

医学统计学案例分析评述

医学期刊论著:《口岸出入境人员预防接种统计分析》

【题目】口岸出入境人员预防接种统计分析

【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。

【研究人群】2010年1 月--2012 年5 月口岸接受预防接种的出入境人员6870

位,其基本资料如下:男3678 人,女3021人;年龄在3-79岁之

间,平均年龄45.6岁。经免疫前检查和询问,研究对象均无严重

的疾病,且无接种疫苗过敏史及禁忌症。

【资料类型】本资料是计数资料。

(1)原文:研究对象:选择我处2010 年1月-2011年4 月,2011 年5月-2012

年5月两个时间段6870位出入境人员,将其按公务人员、船员、劳

务人员、留学人员、旅游探亲及商务等进行分组。

(2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。

②文献中未提及“6870位出入境人员”是如何产生的,即是普查,

还是抽样调查?如果是抽样调查,未明确抽样的方法,是如何应用

随机抽样的方法选择这6870位研究对象的?

【统计方法】

(1)本论著未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选

用秩和检验。

一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果

进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是

否出错,也就无法对结论进行准确判断。

(2)文献尽管在“1.4统计学处理”中提及了“使用SPSSl5.2 软件进行统计学

分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确

采用了那种统计方法,即是卡方检验还是秩和检验等。

(3)在没有提及统计方法的前提下,全文也没有表示统计结果,即具体的计算值和相对应的P值,只有P<0.05,表述不完整。

正确的统计分析方法、具体的统计量值和P值是最终准确推断结论的重要依据,三者缺一不可。所以,具体的P值和统计量应在论文表格或文字描述中说明。

(4)统计符号书写不规范:

检验水准表述有误,原文“检验水平取P=0.05”,应改为“检验水准ɑ=0.05”。

【结果表达】

(1)在“2.1 不同时间段接种人数比较”中:

①原文:研究将研究对象按照2010年1月-2011年4月,2011 年5月-2012 年

5 月分为两个时间段进行研究,第一个时间段接种人数为4606人,第

二时间段接种人数为2264 人。第二时间段较第一时间段接种人数明显

减少,且具有显著差异性(P<0.05)。

②错误:结果表述有误:“第二时间段较第一时间段接种人数明显减少,且具有

显著差异性”。2个时间段研究对象数量不同,通过统计分析不能得出

“人数明显较少”的结论,应表述为:按ɑ=0.05水准,差别有统计学意

义,可以认为2个时间段接种人数不同。

(2)在“结果2.2和2.3”的结论中:

①错误:均未明确具体的统计值及相对应的P值,“具有显著性差异”应改为“差

别有统计学意义”。

(3)统计表表示不正确:

①统计表为三线表,在有“合计”一项时,应加一条分隔线。

《小剂量米非司酮在子宫腺肌病治疗中的临床疗效分析》【题目】《小剂量米非司酮在子宫腺肌病治疗中的临床疗效分析》

【研究目标】探讨米非司酮治疗子宫腺肌病的临床疗效。

【研究人群】:72 例依临床症状、彩色超声或腔镜检查诊断为子宫腺肌病的患者

【资料类型】:此资料为计量资料

【所用统计分析方法名称】:t检验

【结果表达规范情况】:统计表有问题。

首先,无数字的地方没有用“—”表示,而是直接空格。

其次,P值表达的意思与文中所论述的不同,文中说是将治疗后3个月与6个月分别与治疗前比较得出P值,而表格中表达出的含义是P值是由三组数据一起

比较得出的。

再次,统计表并不能完整地表达文中所论述的情况,例数为什么减少这个信息这个并没有在表格中表达出来。虽然文章中说明了情况,但是信息有些杂乱,使用统计表可以使重要的信息一目了然,为读者提供便利。

【应用的分析方法是否正确】:个人认为应用的分析方法不正确。

首先,它并未说做过方差齐性检验,

其次,它看不出使用的是哪种t检验,不是单样本资料的t检验,也不是独立样本的t检验,若说是配对样本的t检验,它每次的观察例数不相同,治疗前是72例,治疗后3个月是56例,治疗后6个月又变成62例。

再次,它将治疗后3个月与6个月分别与治疗前比较,割裂了原来的整体设计方案, 资料的利用率及结论的可靠性低,应采用方差分析进行处理。

【结果解释是否正确】:结果描述中,“32例病人的月经情况与治疗前比较差异有统计学意义”这句话中,32例病人来的莫名其妙,看不出是从哪里来的,可能是笔误。

【如何修正】:应采用方差分析进行处理。

医学期刊论著研究案例分析

2010年中国60岁以上居民高血压和糖尿病及血脂异常状况调查

一、论文题目

《2010年中国60岁以上居民高血压和糖尿病及血脂异常状况调查》

二、研究目的

凋查2010年中困60岁以上居民高血压、糖尿病及血脂异常状况。

随着我国人口老龄化程度的加剧,高血压、糖尿病和心脑血管疾病等慢性病的患病率逐年增长。高血压与脑卒中关系密切,70%以上脑卒巾患者患有高血压弘。。糖尿病患者发生高血压的风险是非糖尿病患者的2~3倍,糖尿病患者的脑梗死发生率也明显高于非糖尿病者。血清TC或LDL—C升高均是冠心病和缺血性脑卒中的独立危险。笔者利用2010年中国慢性病监测数据,分析了我国不同地区60岁以上居民的高血压、糖尿病及血脂异常状况。

三、研究人群

对象:2010年在中国内地31个省(自治区、直辖市)及新疆建设兵团开展了中国慢性病及其危险因素监测调查。该调查采用多阶段整群随机抽样方法,在全国疾病监测系统的162个监测点进行。调查对象为监测点18岁以上的常住居民(在该地区居住6个月以上的居民),纳人分析的有效样本量共为97 187名,其中60岁以上居民共19 981名。所有调查对象均签署了知情同意书,本研究通过巾国CDC伦理委员会审查。

四、资料类型

本次调查项目包括问卷调查,体重、身高和血压测量,以及血糖与血脂的检测。

问卷调查:包括家庭问卷和个人问卷。家庭问卷内容包括家庭成员人口学基本信息、家庭经济和饮食状况;个人问卷内容主要包括吸烟、饮酒、饮食、身体活动状况,以及高血压、糖尿病、慢性阻塞性肺病(COPD)、肿瘤等主要慢性病的患病情况。

计量资料:体重、身高、血压、血糖、血脂

二分类变量:性别、是否患病

五、统计分析方法

统计学分析:对≥60岁居民监测数据,以性别、年龄、城乡和地域(东、中、西部)作为分层因素进行统计分析。按照同家统计局的分类方法,将全国所有的县(区)按照地域分成东、中、西部;将县、县级市和旗定义为农村(参与本次调

查的新疆建设兵团某部被定义为农村),其他为城市。采用患病率指标,运用2χ

检验分析各层内及各年龄组之间的高血压、糖尿病以及血脂异常的差别。

所有结果(患病率)均经过复杂加权调整,按照2010年中国慢性病监测的抽样方案计算了抽样权重,计算权重的过程和方法详见文献。应用SAS 9.2统计软件进行数据分析,以P<0.05为差异有统计学意义。

纠错:

统计学分析方法中说明了本文使用2χ检验来分析各层内及各年龄组之间的

高血压、糖尿病以及血脂异常的差别。虽然没有什么错误。但我认为最好先说明资料类型之后再说明具体使用哪种2 检验才比较合适。

六、结果表达

(1)高血压、糖尿病及各项血脂异常患病情况:经过复杂加权计算后,我国60岁以上居民高血压患病率为66.9%,东部高于西部;糖尿病患病率为19.6%,东部高于西部,城市高于农村,女性高于男性;3项血脂异常患病率均呈现女性高于男性,城市高于农村,高甘油三酯血症是血脂异常的主要类型,患病率为10.8%(表1)。

结论:

高血压患病率为66.9%,东部高于西部(分别为67.9%和62.5%)(P<0.05),城乡差异无统计学意义(P>0.05)。

糖尿病患病率为19.6%,东部高于西部(分别为21.5%和17.7%)(P<0.05),城市高于农村(分别为25.O%和17.0%)(P<0.05)。

纠错:

(1)假设检验结果结果正确表达方法:

应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,以及可信区间、检验统计量、P值;然后根据P值做出统计学推断,并作出相应的医学专业结论。

以上面的结论为例:

对于高血压患病率东部高于西部这个结论来说,不仅没有给出统计量卡方值,也没有写出在α=0.05的检验水准。而且在下面的表1中是对东、西、中部进行了卡方检验,并没有看到两两比较的结果,这显然是不对的,而且也没有给出95%可信区间。

(2)线条使用错误:

至少用三条线,表格的顶线和底线将表格与文章的其它部分分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。部分表格可再用横线将合计分隔开,或用横线将两重纵标目分割开。其它竖线和斜线一概省去。

本篇文章的统计表违背了三线表的基本原则。

(3)组段分组方法错误:

本例中组段为为60~64,65~69,70~74,75~79

这样划分年组段的问题是:64岁零几个月的人就不能归到任何一个年龄组中,这是不对的。而本文列表中的表述方法,实际只是各相应年龄组,而不是组段。

根据组段划分原则:

1、确定各组段上下限时,各组段要连续但不重叠。除去最后一个组段,其余组段应包含下限值,不包含上限值。

2、同时分组不宜过粗,也不宜过细。通常分为10~15个组。本文中的组段较少,应再细分。

3、第一组段应包含最小值,最后一组段应包含最大值。本例中最后一组并无最大值。

相关主题
文本预览
相关文档 最新文档