当前位置:文档之家› 现场调查资料分析

现场调查资料分析

现场调查资料分析
现场调查资料分析

现场流行病学调查资料分析

第一节 资料分析计划

一、 现场流行病学调查资料分析步骤

二、 资料的整理

在设计调查表时,应对调查表中每一个变量的规定取值方法进行详细地描述。例如如果确定“性别”一项中“女性”用2表示,不详用9

表示,就要在调查表中详细描述,使录入资料时有章可循,正确地处理不可接受的数值。通常用调查表来收集现场流行病学调查资料,输入计算机进行整理、分析。在现场调查完成之后,应该对每张调查表进行审查,对调查表的审查可与资料的录入同时进行,前提是所用的录入软件能对录入的资料进行质量控制,建议使用Epidata 进行录入,详见本书附录。在进行资料整理时,应及时发现和纠正数据错误。在

现场调查阶段,由于工作比较繁忙很容易遗忘,如果在资料整理时也是如此,待到计算结果并得出结论后,再返回来寻找错误,往往很难发现错误,从而导致错误的结论。

列出病例一览表。

三、资料分析策略的制定

在资料分析之前,必须制定分析策略。毫不夸张地说,分析策略的制定可与成文之前的论文提纲相媲美。它是资料分析的重要环节之一,将为实际资料分析提供纲领和指南。制定一个完美的分析策略,对资料分析将起到促进作用。

资料整理表的设计是制定分析策略的重要一步。整理表包括频数分布表和四格表等,这些表已经提供了资料整理的框架,甚至已标明了表目,只是缺少表中数据,这些数据将在资料分析过程中填充。根据分析计划,通常要草拟出一系列的资料整理表,可按逻辑顺序或由简单(描述流行病学)到复杂(分析流行病学)的次序排列。整理表通常表明分析指标,如OR值和统计量χ2值。通常需要以下整理表:

整理表1:临床资料,如临床症状和体征,实验确诊的百分比,住院或死亡的百分比等。

整理表2:描述流行病学资料,如果病例的三间分布等。在时间分布方面,通常绘制直方图或流行曲线。在地区分布方面,常用标点地图、散点图等。在人群分布方面,常用构成比图来描述研究对象的年龄、种族、性别等分布特征。

如为描述性研究则到此为止,如为分析性研究,还包括以下内容。

整理表3:因素和疾病之间联系的四格表。

整理表4:在表3基础上,为评价混杂因素和效应修正作用设计的分层分析表。

整理表5:在表3基础上,为分析剂量反应关系、灵敏度和特异度等而设计的分析表。

整理表6:特异性分组分析。

第二节描述性分析

一、临床资料的描述

1、体征和症状的频率表

一种疾病一般可根据观察到的各种症状和体征的相对频率来描述。频率表是描述在至少1组30个病例中观察到的体征或症状的次数,如果想使结果更为准确,病例数则应更多。若有足够多的被检病例数,可将疑似病例、临床诊断病例、确诊病例, 或轻型和重型病例的疾病资料分开单独制成图表(见表1)。

2、疾病过程的描述

每一种症状或体征有出现的时间和消失的时间,如果有足够数量的被检病例,可将体征和症状的频率从起病到康复按一定的时间间隔列成表格,或绘成曲线图,了解疾病过程中体征和症状的动态情况。

表1 拉沙热症状和体征的频率分布

(摘自疾病爆发紧急行动指南,以34-44个病例为基数;由于有关症状和体征的记录不全,分母各不相同)

表2 某地2004年4月病毒性脑膜炎爆发病例症状分布

*调查病例101例数,记录齐全

二、流行强度的描述

(一)常用指标:计算罹患率(总罹患率)、死亡率、感染率。

(二)基本概念:散发、爆发、流行

三、三间分布的描述

将疾病流行情况按三间分布来统计和描述疾病的流行特点,从而揭示某些因素与疾病的相关关系。

1、时间分布:绘制疾病暴发的时间分布图(线图或直方图),表示暴发的开始、高峰、终止的整个时间动态过程。

流行曲线:有助于对卫生事件作出定量的评价,并提出有关键问题的起因、病原体传播来源与传播方式、病因的性质和潜伏期的假设,此外从流行曲线外推有助于预测疾病爆发的终点或估计额外病例的发生。

2、地点分布:按病例的不同地点进行统计,计算罹患率。也可按病例的发病地点绘制标点地图,或按照居住地、工作地、学习、娱乐、近期旅游等活动场所或其他有关资料(如停留时间)等特定的居住区和/或暴露区。

对于有些疾病,描述流行病学更加注重其广泛的地理分布。所研究的地理参数包括疾病发生的地理区域和地形、地界、气候、不同的天气类型或纬度,以及其他生态、环境因素等。

3、人群分布:按人群特征进行流行病学分析的目的,在于全面描述病例特征,并发现病例与普通人群的不同。这将有助于提出与危险因素有关的宿主特征,其他潜在危险因素以及传染源、传播方式和传播速度的假设。

病例分组(或分类)可以按下列属性进行:人口统计学特征(年龄、性别、种族或民族)、社会经济状况、受教育程度、职业、婚姻状况,以及其他个人的变量(如血型、免疫状况、怀孕、患病、服药情况等)或就餐地点等分组,计算罹患率。

四、有关事件的时间顺序

1、危险因素或致病因子暴露的时间或时期;

2、病例及接触者中出现临床表现的时间;

3、采取治疗、预防、控制等干预措施的时间;

4、潜在的相关事件或异常情况出现的时间。

五、潜伏期的计算

1、暴露时间明确(如一次性同源爆发),计算平均潜伏期

正态分布资料——算术平均数;偏态分布资料——几何平均数;资料不明确——中位数

2、暴露时间不明确,推算共同暴露时间

(1)潜伏期推算法:

首例病例发病时间→最短潜伏期

末例病例发病时间→ 最长潜伏期

发病高峰→ 常见潜伏期(或平均潜伏期)

(2)公式推算法:(适用于对数正态分布资料且潜伏期较短的疾病)

设M1、M0 、M2分别为16%、50%、84%位数发病时点,平均潜伏期为X

则,平均潜伏期X =(M2-M0)(M0-M1)/[(M2-M0)-(M0-M1)]

共同暴露时间:T=M0-X

六、确定诊断

依据:临床特点(症状和体征表现),流行特征(三间分布)和检验结果

七、推断暴发性质和类型

1、同源暴发:包括共同传播媒介和共同暴露,可有一次暴露,也可多次暴露。

(1)一次暴露的特点:

时间分布:流行曲线快速上升快速下降,呈单峰型,全部病例均发生在一个潜伏期全距内。

地点分布:病例集中发生在与共同传播因素有关的单位内

人群分布:基本无差异,发病人群均有共同暴露于某因素的历史。

(2)二次暴露特点:有两个发病高峰,时间与二次暴露时间一致。发病超过一个潜伏期全距。

(3)多次暴露特点:高峰宽,可有多个高峰。

(4)连续暴露特点:流行曲线在高水平。

2、非同源暴发:

暴发时流行曲线可单峰(峰宽),也可多峰,病例在单位内分布不均匀,有聚集家庭或班组性,呈辐射状分布等。

3、混合传播:即同源和非同源均存在。往往在同源暴发后有发生非同源暴发。

混合传播时流行曲线上往往出现“拖尾现象”。

八、传播途径的分析和判断

1、判断依据:

(1)流行特征

(2)传播实现的条件(致病因子污染的可能性、人群暴露机会)

(3)实验室检查

2、分析步骤:

(1)分析流行特征

(2)确定共同暴露时间

(3)确定传播因素

(4)确定污染原因

(5)实验室检查

第三节联系的测量

测定联系就是要量化暴露因素与卫生事件之间的统计学联系的强度和大小。在队列研究时,联系的测量最常采用相对危险度,而病例对照研究时,比值比最为常用。在横断面研究时,可以计算患病率比值(prevalence ratio)或患病率比值比(prevalence odds ratio)。

一、四格表

可以说,几乎每一种流行病学研究都能总结为四格表。在许多流行病学研究中,暴露因素和疾病都能作为两分变量(例如是或否)来定义,故暴露因素和疾病的关系能够概括为四格表(2×2交叉表),见表2。四格表中放置数据的行列称为格子,4个格子分别用a、b、c、d作标记,代表暴露因素和疾病的不同情况。

例如c表示病例组中非暴露因素者。横行合计用h

1和h

表示,纵列合计标记为

v 1和v

o

;四格表中研究对象总合计用t或n表示。在特定的研究期间内,发病者

占所有观察对象的比例即罹患率(attack rates)有时也在四格表的最右一列中显示。

表3 标准四格表的数据位置和标记

有病无病合计罹患率

暴露h1a/h1

非暴露h0c/h0

合计v1v0t v1/t

二、相对危险度

相对危险度(relative risk,risk ratio,RR)是暴露组与非暴露组危险性之比。即:

RR=暴露组危险性/非暴露组危险性=(a/h

1)/(c/h

o

相对危险度分别为暴露组与非暴露组的率,RR表明暴露组发病或死亡的危险是非暴露组的多少倍。在急性爆发疫情中,这种危险性也可用罹患率来表示。由表3资料可见,食用肉包者发生胃肠炎的相对危险度为:0.564/0.122=4.6,即:吃肉包者发生胃肠炎的危险性是不吃肉包者的4.6倍。当相对危险度大于I 时,说明暴露组发病危险性大于非暴露组,暴露因素称为危险因素。反之,当相对危险度小于1,说明暴露组的发病危险性小于非暴露组,该暴露因素为保护性因素。例如以疫苗接种作为暴露因素时,接种组发病危险性小于非接种组。当然,在下结论前应考虑RR值的95%可信区间是否包含了1(详见本章第五节)。

表4 2004年某市沙门菌胃肠炎爆发与食用肉包的关系

有病无病合计罹患率(%)

暴露204 56.4

非暴露41 12.2

合计120 125 245 49.0

三、 比值比

在许多病例对照研究中,由于不知道暴露和非暴露人群的真正大小,无法知道确切的分母计算发病率或危险性,因此,无法计算出RR 值,此时,只能用比值比(0dds Ratio ,OR)来代替。所谓比值是指某事物发生的可能性与不发生的可能性之比。在病例对照研究中病例组的暴露比值为:

(a/v1)/(c/v1)=a/c 对照组的暴露比值为: (b/v0)/(d/v0)=b/d

比值与概率是两种不同的概念。概率的分母中包括未发生的事件数,而比值的分母中不包括未发生的事件数。因此比值的取值在0~∞之间,而概率取值恒在0~1之间。比值比的计算公式如下:

比值比(0R)=ad /bc

以某社区医院中A 群链球菌引起的外科伤口感染的爆发为例,在17个月中,有10例病人发生,研究人员采用随机数目表法,从同期施行过外科手术的2600名病人中选取对照,但由于外科伤口A 群链球菌感染者的感染来源可能来自手术室工作人员中A 群链球菌携带者,故研究人员对与每一位伤口感染者有接触的医护人员进行了调查,设计了暴露于每一位医护人员的四格表,并计算了比值比。表4是暴露于护士A 与发病关系的四格表,OR 计算结果是:(8×49)/(2×5)=39.2,这表明A 群链球菌伤口感染者与对照组相比,暴露于护土A 的机会高38倍。换言之,与护士A 接触发生A 群链球菌伤口感染的危险性是非接触者的39倍。对一罕见疾病,比如发病率小于5%,OR 与RR 接近。本例在2600名外科病人中,仅发现10例A 群链球菌感染者,故表4计算所得的OR ,可近似看作RR ,也就是说,与护士A 接触发生外科伤口感染的危险性是非接触者的39倍。

表4 外科伤口感染和护士A 的关系

有病 无病 合计

是否与护士A 接触

暴 露 24 非暴露 52

合 计

10

54

64

OR 是各种流行病学联系强度测定时最有用的方法。当疾病少见时,病例对照研究计算的OR 值与定群研究得到的RR 相近。

四、 患病率比和患病率比值比

横断面调查通常要对人群中某病的患病(即新旧病人)情况进行测定,而不仅是发病(仅为新病人)情况。由于患病率与发病率(发病危险性)和病程有关,因此,测定患病状况与暴露因素的联系,就应将暴露因素对发病状况及其病程或生存期限的影响予以综合衡量。与RR 和OR 相对应,用于测定暴露与患病联系强度的指标分别为患病率比(prevalence ratio)和患病率比值比(prevalence odds ratio)。

表5 横断面调查中联系强度的测定

如表8—5中四格表资料所示,患病率比计算如下:0.20/0.05=4.0;也就

是说,暴露者息某病的可能性是非暴露者的4倍。根据表5资料,患病率比值比为(20×380)/(80×20)=4.75;即暴露组患病的机会是非暴露组的4.75倍。当患病率较低时,患病率比值与患病率比值比接近。

第四节统计学检验

当暴露因素实际与疾病发生无关,仅由于偶然的原因,造成观察结果与实际情况不符时,这种可能性究竟有多大,可通过统计学显著性检验来确定。在本节中,我们将用四格表资料的统计学检验方法来进行介绍。

χ2值计算是统计学显著性检验的常用方法,阐明了如果无效假设确实成立,得出暴露与疾病有关这一结论的概率大小,用P值来表示。P值越小,意味着拒绝无效假设的可能性越大,即无效假设是成立的。当P值小于某一事先确定的界值,如0.05或5%,就可以拒绝无效假设,接受备择假设,认为联系有统计学显著性。

无效假设和备择假设需要事先确定。如果对暴露因素与疾病的联系知之甚少,可以做出暴露与疾病无关的无效假设(RR=1或OR=1),相应的备择假设是,暴露国素与疾病有关(RR或OR≠1)。值得指出,备择假设中所指的暴露因素,可以是危险因素(如吸烟),也可以是保护性因素(如接种疫苗)。

当暴露因素与疾病的联系较明确,就可以确定较窄范围的假设,或称为有方向性假设。例如当已明确暴露可使疾病危险性增加,如吸烟与肺癌的关系,就可作出这样的无效假设:即暴露不会增加疾病危险性(RR或0R≤1),相应的备择假设是,暴露会增加疾病危险性(RR或0R>l)。与此相似,如果已确定了暴露是疾病的保护性因素,如麻疹—腮腺炎—风疹三联疫苗(MMR)接种与麻疹发病的关系,就可以确定无效假设为RR≥1,则备择假设为RR<1。

无方向性假设可采用双侧检验,而有方向性假设要选择单侧检验。一般来说,单侧检验的显著性界值是双侧检验的二倍,即是0.10而不是0.05。由于拒绝无效假设的界值增高,增加了犯第一类错误的可能性。在现场流行病学研究中,最常用双侧检验。

有两种不同的显著性检验方法常用于四格表资料的统计学处理,即Fisher 精确概率法和χ2检验。值得一提的是这两种方法无特异性,可适用于任何暴露与疾病联系的测量,而与RR或OR计算无关。

1、联系的测量与显著性检验的关系

联系的测量如RR和OR值,反映了暴露与疾病之间关系的强度,一般来说,可以认为它们是对总人群中暴露与疾病联系程度的最好推测。但这种联系还不一

定是因果关系。

统计显著性检验是表示联系的观察值(如RR或OR)由于偶然原因造成的可能性大小。所以,联系的测量和显著性检验之间提供了互补的信息。

2、统计学检验结果的解释

“无显著性”并不意味着“无联系”。联系的测量(RR和OR值)表明了联系的强度和方向,而统计学检验则说明了联系的观察值由于偶然原因造成的可能性大小。无显著性不能说明总体人群中暴露与疾病之间无联系,也可能是样本例数偏小,无法对总体的真实联系作出反映。

统计显著性本身无法表明因果关系。由于偶然原因、选择性偏倚、信息偏倚、混杂和其他存在于研究设计、实施和分析阶段的误差,使观察值反映的联系不呈现因果联系。统计检验结果仅能说明联系由于偶然原因造成的可能性大小,具有显著性仅说明由偶然原因造成的可能性很小,还需要考虑与其他类似研究结果的一致性、暴露与疾病的时间关系、生物学可靠性、以及其他病因推断的标准。本章随后还将对这些问题进行讨论。

最后,还须指出,统计显著性与公共卫生意义也没有必然关系。通过—个大规模的研究,对大众健康影响极小的因素可能出现统计显著性,而通常与大众健康或疾病有关的因素,也可能会因为样本例数较小而无统计学意义。

抽样调查资料可以做哪些统计分析

抽样调查资料可以做哪些统计分析 篇一:以下内容是某地区对居民消费支出抽样调查汇总资料进行分析的结果,其中不属 一、整体解读 试卷紧扣教材和考试说明,从考生熟悉的基础知识入手,多角度、多层次地考查了学生的数学理性思维能力及对数学本质的理解能力,立足基础,先易后难,难易适中,强调应用,不偏不怪,达到了“考基础、考能力、考素质”的目标。试卷所涉及的知识内容都在考试大纲的范围内,几乎覆盖了高中所学知识的全部重要内容,体现了“重点知识重点考查”的原则。 1.回归教材,注重基础 试卷遵循了考查基础知识为主体的原则,尤其是考试说明中的大部分知识点均有涉及,其中应用题与抗战胜利70周年为背景,把爱国主义教育渗透到试题当中,使学生感受到了数学的育才价值,所有这些题目的设计都回归教材和中学教学实际,操作性强。 2.适当设置题目难度与区分度 选择题第12题和填空题第16题以及解答题的第21题,都是综合性问题,难度较大,学生不仅要有较强的分析问题和解决问题的能力,以及扎实深厚的数学基本功,而且还要

掌握必须的数学思想与方法,否则在有限的时间内,很难完成。 3.布局合理,考查全面,着重数学方法和数学思想的考察 在选择题,填空题,解答题和三选一问题中,试卷均对高中数学中的重点内容进行了反复考查。包括函数,三角函数,数列、立体几何、概率统计、解析几何、导数等几大版块问题。这些问题都是以知识为载体,立意于能力,让数学思想方法和数学思维方式贯穿于整个试题的解答过程之中。篇二:如何做好统计结果分析 如何做好统计结果分析 在做社会科学研究的时候,调查是必不可少的一个环节。我们做一个调查,花费了大量的人力、物力,得到了大量的一手数据,然而,如果我们在做数据分析的时候采取的方法不科学的话,可能会导致分析结果与真实情况存在偏差,甚至得到相反的结果。 举个简单的例子,某政府关于某个项目出台了A、B两套拟案,分别在甲、乙两个地区做民意调查,调查的数据统计如下表1所示: 表1 两套拟案的满意度数据 根据这个统计结果,哪个方案更让人们满意呢?我们

访谈资料的整理和分析方法

论调查中定性研究访谈资料的整理和分析方法 日期:2006-04-24 点击: 作者:中调网来源:中调网~我要投稿! 近年来,定性研究方法,尤其是访谈技术在我国的应用日益普及,然而各界关注的焦点主要集中于资料收集技术的探讨,对原始资料的分析却没有引起足够的重视。 从某种意义上说,资料分析比资料收集更为重要也更为复杂。优秀的访谈只有通过优秀的分析才能将所收集的资料转换成对研究者有意义的结论,从而达到研究的目的。但是访谈资料往往因数量庞大、结构零乱而难以处理。因此,研究者需要将浩如烟海的资料“打散”、“重组”和“浓缩”,最终对资料进行意义解释。这些过程可以归结为“组织”和“连结”两部分,前者是对资料的整理过程,后者则是对资料的进一步深入分析和解释。但在实际过程中,二者是紧密相连、相互交织的。 因此,本文结合“互联网与创造力研究”的个案,对访谈资料的整理和分析进行了简单的梳理和介绍,并对某些方法提出了自己的改进意见。文章第一部分简要介绍访谈资料整理和分析的特点,第二、三部分分别论述了“组织”和“连结”的具体方法,并对不同方法进行比较。最后一部分探讨了恰当使用回溯重组方法对提高分析的效率与质量的意义。 关键词:定性研究访谈组织连结 八十年代以来,西方学者对社会、人文学科研究方法的探讨经历了三个重要转向:方法的研究让位于方法论的探讨;定量方法的优势地位被定性方法所取代;从社会调查的阶段性过程观念转向研究的社会过程观念。这些转向大大促进了定性方法在各领域的研究和应用,相关论著不断涌现,或全面介绍定性方法,或专门探讨资料收集技术、分析技术、定性与定量结合等问题。在资料分析领域,Glaser和Strauss提出的扎根理论(grounded theory)已经产生巨大影响。同时,许多定性分析软件也得以开发,如NUDIST、Ethnograph等。 相比之下,我国定性研究水平较为薄弱。一方面,对定性研究存在某些误解,认为它是可以随意进行的,主观性较强,并非科学实证的方法。因此,在一般介绍社会或市场研究方法的论著中,定性方法往往只是作为定量方法的补充而一笔带过。 另一方面,对定性方法的关注集中在资料收集技术层面。近年来,定性方法尤其是深度访谈、小组座谈日益普及,不少研究机构都已配备先进的小组座谈设施,这是令人可喜的。但是,研究者关注的焦点多在技术操作层面,尤其是资料收集技术,而对资料分析方法以及定性研究背后的方法论传统却缺乏足够的重视,研究者往往只凭主观判断得出研究结论。 事实上,仅有精湛的资料收集技术,而没有对资料的深入挖掘,是不能充分获得有价值的信息、实现研究目的的。英国经验主义科学家培根曾经指出,科学研究的工作应该像蜜蜂一样,“既从花园里采集资料,又对这些资料进行消化和加工,酿出蜂蜜”。 然而,定性分析是一个极为复杂的过程,具有极大的弹性,不同领域、不同研究目的需要采取不同的分析策略。因此,有些西方学者致力于收集各领域研究者的定性分析策略,在此基础上,探讨其基本规律。 在国内,规范的定性分析实例尚不多见,对分析技术的研究更为困难。北京大学陈向明教授的专著《质的研究方法与社会科学研究》,从方法论到具体操作层面对定性方法做了系统的介绍。然而,其中的资料分析技术主要侧重于理论建构目的,遵循的是扎根理论思想,且多以教育学等领域的个案为例。与大陆相比,台湾、香港的学者更早接触定性研究,已出版不少译著,以综合介绍型为主,主要应用于护理、教育、社会学等,而对传播学、市场研究等领域定性分析技术的探讨尚属少见。 因此,本文试图结合传播学中的研究实例——互联网与创造力的关系,提出笔者对定性分析的管窥之见,以期达到抛砖引玉的目的。为了对互联网与创造力的关系做一个初步的理论探讨,提出研究的理论假设,我们在文献分析的基础上,对传播学、心理学、传播心理学领域

问卷调查的常用统计分析

最近做问卷调查的统计分析,找到一篇很好的文章,是关于如何使用SPSS 输入各种问卷题型,如何进行统计分析,对于初涉采用统计软件处理调查问卷的人来说,是很实用的!在此与大家分享!特别是,关于不同的题型如何输入,是很详细的! SPSS问卷分析最白痴问题---编码录入及描述统计详解 问卷调查的方法用得很广泛,对于没有接触过spss的人第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS的同学也能做简单的分析。后面还有分析时的操作步骤,以及比较适用的深入统计分析方法的简单介绍。自己写的,错误之处请指正, 调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。 SPSS的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale 是定量、Ordinal是定序、Nominal是指定类;二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下: 问卷调查的方法用得很广泛,对于没有接触过spss的人第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS的同学也能做简单的分析。后面还有分析时的操作步骤,以及比较适用的深入统计分析方法的简单介绍。自己写的,错误之处请指正, 调查分析问卷回收,在经过核实和清理后就要用SPSS做数据分析,首先的第一步就是把问题编码录入。 SPSS的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale 是定量、Ordinal是定序、Nominal是指定类;二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下: 1 、单选题:答案只能有一个选项 例一当前贵组织机构是否设有面向组织的职业生涯规划系统? A有 B 正在开创 C没有 D曾经有过但已中断 编码:只定义一个变量,Value值1、2、3、4分别代表A、B、C、D 四个选项。

第十一章 资料分析

第十一章资料分析讲课稿 本章介绍了资料分析的类型,并重点说明了资料定量分析即统计分析中各种分析类型的具体方法,阐述了资料定性分析的内容,介绍了资料理论分析的几种主要方法。另外,还对计算机统计分析作了简要说明。其中重点是掌握这些分析的概念、特点和大致内容。至于具体操作方法,主要一般了解即可。因为当前资料分析工作已经计算机化了。 一、资料分析的概念 资料分析是运用科学的逻辑思维方法对社会调查所获得资料进行研究、判断和推测,以揭示社会事物或现象的性质、特征与规律的过程。一般认为它包括三方面内容,即定性分析、定量分析和理论分析。定性分析是对调查资料所反映的社会事物或现象的性质的分析方法,着重于确定研究对象具有哪种性质及特征。定量分析也叫统计分析,是运用统计学原理对资料进行定量的研究、判断和推测,以揭示事物内部数量关系及其变化规律的分析方法。理论分析是对调查资料进行系统化的理性认识的分析方法,着重于对感性资料的理论升华与总结,揭示社会事物或现象的本质及规律。 二、资料的定量分析 传统的资料分析主要是定性分析和理论分析,直至今天,这两种分析仍然发挥着重要的作用。但当前最流行和最受重视的是定量分析即统计分析。统计分析也是最复杂的资料分析。 统计分析按照性质可以分为两类,一类是描述性分析,是客观描述调查对象数量情况而不做更多分析推论的分析;另一类是推论性分析,它是以样本的实际资料为依据,计算一定的样本指标,并用以对总体做出数量上的估计和判断的分析。统计分析按照涉及变量的多少,又可以分为单变量分析、双变量分析和多变量分析三类。资料分析中常见的相对指标分析、集中量数和离中量数分析、因素分析、动态分析等都属于描述性分析,其中集中量数和离中量数分析以及动态分析主要是单变量分析,相对指标分析和因素分析主要是双变量分析、多变量分析;相关和回归分析、抽样推断分析、预测分析、综合评价分析等都属于推论性分析,它们一般是双变量分析或多变量分析。 统计分析是非常复杂和烦琐的工作,过去只有那些既受过数理统计专业训练的研究人员才能承担这项工作。但是即使是这些专业人员,在人工操作或自己编写程序在计算机上运行时,也常常感到难以应付,而且容易出现错误,不够规范。20世纪中叶以来,计算机技术的发展使这一问题得到了根本的解决,电脑统计分析软件应运而生,成为普通大众也可以熟练应用的、简便易行的资料统计分析工具。

(完整版)问卷调查的常用统计分析方法

问卷调查的常用统计分析方法 问卷调查的方法用得很广泛,对于没有接触过spss 的人第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS 的同学也能做简单的分析。后面还有分析时的操作步骤,以及比较适用的深入统计分析方法的简单介绍。 调查分析问卷回收,在经过核实和清理后就要用SPSS做数 据分析,首先的第一步就是把问题编码录入。 SPSS 的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal 是指定类;二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下: 问卷调查的方法用得很广泛,对于没有接触过spss 的人第一步面临的就是问卷编码问题,有很多外专业的同学都在问这个问题,现在通过举例的方法详细讲解如下,以方便第一次接触SPSS 的同学也能做简单的分析。后面还有分析时的操作步骤,

以及比较适用的深入统计分析方法的简单介绍。自己写的,错误之处请指正, 调查分析问卷回收,在经过核实和清理后就要用SPSS做数 据分析,首先的第一步就是把问题编码录入。 SPSS 的问卷分析中一份问卷是一个案,首先要根据问卷问题的不同定义变量。定义变量值得注意的两点:一区分变量的度量,Measure的值,其中Scale是定量、Ordinal是定序、Nominal 是指定类;二注意定义不同的数据类型Type 各色各样的问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,我们详细举例介绍如下: 1 、单选题:答案只能有一个选项 例一当前贵组织机构是否设有面向组织的职业生涯规划系统? A有B正在开创C没有D曾经有过但已中断 编码:只定义一个变量,Value 值1、2、3、4 分别代表A、B、C、D 四个选项

调查资料的整理与分析

第7章调查资料的整理与分析 调查资料的整理 调查资料的分析 第一节资料整理的意义和一般步骤 一、资料整理的意义 二、资料整理的原则 三、资料整理的一般步骤 一、资料整理的意义 所谓资料整理,是指运用科学的方法,将调查所得的原始资料按调查目的进行审核、汇总与初步加工,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的过程。 是对调查调查资料的全面检查,是进一步分析研究资料的基础,保存资料的客观要求 二、资料整理的原则:真实性;准确性;完整性;统一性;简明性 三、资料整理的一般步骤 1、资料的审核 2、资料的编码 3、资料的分组 4、资料的汇总 5、制作统计表和统计图 第二节资料的审核与汇总 一、资料审核的一般要求: 1、真实性:来源的客观性;本身的真实性 2、准确性:检查含糊不清、相互矛盾; 3、完整性:资料总体的完整性;每份调查资料的完整性 二、资料审核的方法 逻辑审核;计算审核 调查当天结束时,需要进行初步的整理,重点审核资料的真实性、准确性和完整性 三、资料的编码 将问卷或调查表中的信息转化成计算机能识别的数字符号。 举例:山东农村养老状况与需求调查 四、资料的分类和汇总 1)对量化资料进行分类和汇总 (1)分类标志应根据研究的目的和统计分析的要求而定 (2)使用的间隔要使最常出现的答案在中间 (3)分类间隔多比分类间隔少好 (4)学会使用复合分类,在不知道要做何种分析时,应该使用复合分类 2)对定性资料进行分类和汇总 (1) 在分类前,看是否有一定量的回答存在 (2) 使用的分类标准与其他的资料相适应,以利于比较 (3) 分类是简洁互斥的,每个回答只能放在一个间隔里 (4) 包容所有可能的回答。通常用“其他”来包括所有没有指出的答案选择

资料的整理与分析方法

资料的整理与分析方法 我们在前面两文中分别谈到收集“事实资料”和“文献资料”的方法,这无形之中好象将资料分成了“事实资料”和“文献资料”两种,显然这不是一种严格意义上的分类(只是按照收集的方法来考虑的),因为“文献资料”中也可以有“事实资料”(当然不是第一手资料),它们之间有交叉的成分,由此为研究方便起见,可将其分为“事实资料”与“理性资料”;如果从资料的性质来考虑,资料还可以分为定量资料(主要是各种数据)与定性资料(主要是文字材料)。收集到大量的资料之后,一般就要进行适当的筛选、整理和分析。本文就要谈谈如何做好这些方面的工作。 一.筛选 有些研究,需要收集的资料比较多,面对这成堆的资料,首要的任务就是要在初步阅读(当然需要做简单的分析)的基础之上做适当的筛选。筛选的主要目的在于“去伪存真”,“由表及里”,即只保留对本课题研究有参考价值的资料而删去其余。通常,对于“理性资料”要求它有:可靠性,正确性,权威性;对于“事实资料”要求它有:真实性,典型性,浓缩性。 二.整理 整理也就是要分门别类,并以某一种或几种方法表示出来,以便于下一步的分析。对于各种数据,首先是分类,通常有两类:计数数据和测量数据,其中后者又有四种水平:类别的,顺序的,等距的,比率的;然后进行适当的整理,通常采用的方法有两种:频数分布表和频数分布图,其中前者有简单次数分布表、相对次数分布表、累积次数分布表、累积相对次数分布表、累积百分数次数表等,后者又有散点图、线形图、条形图(也叫直方图)、圆形图(也称饼形图)之分。 对于定性资料,通常是按照一定的标准进行分类。比如对某一课题资料,可以按历史线索分类;可以按不同的观点分类;可以按研究的问题的性质分类;还可以按子课题分类,等等。 三.定性分析与定量分析 对资料的分析,从方法论角度,一般可分为定性分析和定量分析,而且通常在实际分析过程中,要把这两种方法结合起来,交互使用。因为定性分析与定量分析相互补充,相得益彰,处在统一的连续体之中,定性分析为定量分析提供基础,定量分析的结果要通过定性分析来解释和理解。 (一)定性分析的方法 定性分析即为对资料的质的规定性做(整体的)分析,除了要运用一些哲学的观点和方法如辨证唯物主义和历史唯物主义、分析哲学、现象学、解释学等外,主要使用诸如比较、归纳、演绎、分析、综合等逻辑方法;同时还要求对分析结果的信度、效度和客观度等可靠性指标进行检验和评价。 (二)定量分析的方法 这里需要区分两种情况:一是如果收集到的资料已经是一些数据,我们只需根据条件和需要选用适当的统计分析方法(下文介绍)进行处理和分析便可;另一种就是对收集到的定性资料做进一步的定量分析。比如要研究某一学科教材的结构问题,我们可能收集了这一学科及相关学科的许多版本的教材(包括现在的和过去的),显然首先需要进行比较,如何比较?可能就需要数量化处理,定量分析;还比如要对学生在某一门学科学习中的错误进行分析,收集到各种事实的文字材料之后,定量分析可能也是十分重要的。

资料的统计分析

第十二章资料的统计分析 第二节集中量数分析 一、集中量数也称集中趋势,它是一组数据的代表值,代表着现象的一般水平,别的数值围绕着它的周围。 常用的集中数有:算术平均数、中位数、众数。 二、算术平均数:是以总体各单位数值之和除以总体单位总数的商。即, 各单位的标志数值之和 算术平均数= 总体单位总数 (一)简单算术平均数法: X1+X2+…X n ∑X X = = n n 其中,符号X代表算术平均数;X1,X2,…X n分别代表各个具体的标志数值,n表示总体单位数(即总体中个案的数目),∑表示将各个具体的标志数值相加求和。 (二)加权算术平均数: X1f1+ X2f2+…X n f n ∑Xf X = = f1+ f2 +…f n∑f 其中,f为权数,即变量在总体中出现的次数。 1、由单项分组资料求算术平均数。 ∑Xf X = ∑f 2、由组距分组资料求算术平均数。 先计算出组中距,然后再使用加权算术平均数的公式进行计算。 组中值的符号为:X mid 下组限+上组限 X mid = 2 由组距分组资料计算算术平均数的公式就变为: ∑f X mid X = ∑f

三、中位数 中位数是把调查到的数据资料按照标志值大小顺序排列,处于中央位置的标志值表示中间位置的平均数,也称位置平均数。 (一)由原始资料计算中位数 原始资料是以单项标志值形式表现的。先把各个标志值按照大小顺序排列,然后用总体单位数加1除以2,即n+1 ,就可以求出中位数的位次。 2 (二)对经过资料计算中位数 1、由单项分组资料求中位数。 n+1 中位数的位次= 2 2、由组距分组资料计算中位数。 ∑f 由组距分组资料计算中位数,应先用 2 公式确定中位数所在组的位置,然后再用下限公式计算中位数的值。下限公式为: ∑f-cf m -1 M d= ×i+L f m 为中位数所在组以下的累计次其中,M d为中位数,f m为中位数所在组的次数,cf m -1 数,∑f为累计数,i为中位数所在组的组距,L为中位数所在组的下限。 四、众数 众数是指在一组数据中重复次数最多的标志值。 (一)从单项分组数据资料中计算众数 一般采用直接观察法即可。 (二)从组距分组资料中计算众数 一种是组中值法,另一种是摘补法。 L+U 其公式为:众数= 2 其中,L代表众数所在组的组下限,U代表众数所在组的组上限。

广告调查数据统计分析

调查统计数据分析 平顶山市大学生考研意向调查问卷 亲爱的同学: 您好!我们正在进行一项关于大学生考研意向的调查,目的是了解大学生考研意向并给出相关建议。本问卷所有的调查项目无对错之分,问卷实行不记名调查,请客观、真实地做出选择。为获得一手资料特设计这份问卷,恳请您在百忙之中抽出几分钟帮我们完成问卷。非常感谢你的参与和帮助! 1、您的性别? A.男 B.女 分析:统计结果显示本次调查对象的男性比例偏高,因为调查对象中有相当一部分来自河南城建学院——一所理工类院校,这就直接导致调查对象中男性占多数。 2、您所在的年级? A.大一 B.大二 C.大三 D.大四 分析:考虑到与考研的联系紧密度,本次调查对象以大二、大三年级的学生为主,该阶段的学生逐渐将考研相关问题纳入考虑范围。

3、您的专业所属的学科门类是? A.哲学 B.法学 C.文学 D.理学 E.工学 F.农学 G.医学 H.经济学 I.教育学 J.历史学 K.军事学 L.管理学 M.艺术学 分析:该条型统计图反映了本次调查对象所属的学科门类的分布,其中人数最多学科门类前三位分别是工学、艺术和文学,由于平顶山的高校数量不多且缺乏名校,有些学科门类没有院校开设或该门类的学生数量很少,如“军事”。 4、您得过奖学金的次数? A.0次 B.一次 C.二次 D.三次 E.四次 F.四次以上

分析:该条型统计图反映了大多数学生所获奖学金的次数为零次或一次,这和大学生的一般学习水平相符合。 5、您对考研的了解程度? A.完全不了解 B.不是很了解 C.了解 D.比较了解 E.非常了解 分析:该条型统计图反映了不论调查对象是否有考研意向,大多数学生对考研并不是很了解。 6、您周围同学对于考研的意向如何?

流行病学调查资料分析4节

流行病学调查资料分析4节流行病学是研究疾病在人群中发生、发展及其分布的原因,以及制订预防、控制和消灭这些疾病和促进健康的对策与措施的科学。 流行病学是从群体水平研究疾病,现在几乎没有流行病学不研究的病种和医学问题。是一门研究人类的生理、病理、心理的群体现象的方法学,有着极强的应用性。流行病学的研究及应用范围极广,使用的方法和技术很多。 流行病学研究方法 一、观察法 1.描述性研究(descriptive study):描述流行病学(descriptive epidemiology)提出线索或假说 2.分析性研究(analytical study):分析流行病学(analytical epidemiology)验证所提出的假说。 ①病例对照研究--回顾性(retrospective)研究: 从疾病(结果)去寻找原因(病因)的方法叫病例对照研究(case-control study)。 病例对照研究的特点 1.是分析流行病学最基本、最重要的研究类型之一 回顾性从果查因的研究方法,是在疾病发生之后去追溯假定的病因因素 2.病例对照研究的四大要素:人群、对照、病例和暴露 明确产生病例的人群,从中正确地挑选对照,并正确地收集暴露资料是病例对照研究的精髓 3.对照不必代表所有未患研究疾病的病人,同样也不必代表所有总体人群 病例不必代表患有该种疾病的全部病人,也不可能做到这一点 4.选择病例原则 符合病例的定义,就应当收入病例组,不受其暴露状态的影响,避免产生选择偏倚 5.新发病例比现患病例好 回忆暴露及暴露与疾病的时序关系时更明确 新发病例与现患病例暴露分布没有差别,也可用现患病例 研究先天畸形和某些非致死性慢性疾病,如肥胖、糖尿病等用现患病例 死亡病例省时省钱,很快可以提供研究线索 6.正确地选择对照是病例对照研究成败的关键

第十一章资料分析

第十一章资料分析 本章介绍了资料分析的类型,并重点说明了资料定量分析即统计分析中各种分析类型的具体方法,阐述了资料定性分析的内容,介绍了资料理论分析的几种主要方法。另外,还对计算机统计分析作了简要说明。其中重点是掌握这些分析的概念、特点和大致内容。至于具体操作方法,主要一般了解即可。因为当前资料分析工作已经计算机化了。 一、资料分析的概念——一般了解 资料分析是运用科学的逻辑思维方法对社会调查所获得资料进行研究、判断和推测,以揭示社会事物或现象的性质、特征与规律的过程。一般认为它包括三方面内容,即定性分析、定量分析和理论分析。定性分析是对调查资料所反映的社会事物或现象的性质的分析方法,着重于确定研究对象具有哪种性质及特征。定量分析也叫统计分析,是运用统计学原理对资料进行定量的研究、判断和推测,以揭示事物内部数量关系及其变化规律的分析方法。理论分析是对调查资料进行系统化的理性认识的分析方法,着重于对感性资料的理论升华与总结,揭示社会事物或现象的本质及规律。 二、资料的定量分析——一般了解 传统的资料分析主要是定性分析和理论分析,直至今天,这两种分析仍然发挥着重要的作用。但当前最流行和最受重视的是定量分析即统计分析。统计分析也是最复杂的资料分析。 统计分析按照性质可以分为两类,一类是描述性分析,是客观描述调查对象数量情况而不做更多分析推论的分析;另一类是推论性分析,它是以样本的实际资料为依据,计算一定的样本指标,并用以对总体做出数量上的估计和判断的分析。统计分析按照涉及变量的多少,又可以分为单变量分析、双变量分析和多变量分析三类。资料分析中常见的相对指标分析、集中量数和离中量数分析、因素分析、动态分析等都属于描述性分析,其中集中量数和离中量数分析以及动态分析主要是单变量分析,相对指标分析和因素分析主要是双变量分析、多变量分析;相关和回归分析、抽样推断分析、预测分析、综合评价分析等都属于推论性分析,它们一般是双变量分析或多变量分析。 统计分析是非常复杂和烦琐的工作,过去只有那些既受过数理统计专业训练的研究人员才能承担这项工作。但是即使是这些专业人员,在人工操作或自己编写程序在计算机上运行时,也常常感到难以应付,而且容易出现错误,不够规范。20世纪中叶以来,计算机技术的发展使这一问题得到了根本的解决,电脑统计分析软件应运而生,成为普通大众也可以熟练应用的、简便易行的资料统计分析工具。 目前最流行的专业电脑统计分析软件是SPSS软件。另外应用比较普遍的还有Office 中的Excel 等。 三、资料的定性分析——重点掌握 资料定性分析是对调查所收集资料的质的分析,是确定研究对象是否具有某种性质、特征的分析。其基本内容主要是识别属性、要素分析和归类。识别属性就是分辨事物有哪种或哪些特征,使之得以存在并与其它事物区别开来。识别属性的结果,最后通过形成明确的概念或定义表现出来。要素分析是对构成事物诸要素及其联系的分析。确定一事物的性质,必须以确定其各组成要素的性质为前提,因此,实现了研究对象各要素及其联系的认识,也就基本把握了研究对象的本身的特征及性质。归类就是将事物归入具有相同属性的一组事物中去。它是以识别属性为基础的。通过对各类事物的识别和比较,既可以明确事物之间的联系,又可以认清了事物之间性质的差异。在社会调查研究前期准备阶段和资料整理阶段,已进行了大量这方面的工作。资料分析阶段的定性分析相对简单,它可以说是对此前定性分析结果的进一步确认、更新和补充。其主要任务是:进一步明确概念的内涵和外延;对原来调查资料的分类以及所使用的概念、变量间关系做进一步的分析、确认;根据整理后的调查资料,从定性角度对原定的研究假设和理论建构证实或证伪,或提出新的理论观点。 在社会调查研究的历史上,定性分析曾经长期占据着主导地位。进入现代社会以来,随着统计

《统计学》-第二章-统计调查

第二章统计调查 (一)填空题 1、按调查对象包括的范围的不同来划分,统计调查可分为全面调查和非全面调查。 2、按调查登记的时间是否连续来划分,统计调查可分为经常性调查和一次性调查。 3、按组织形式的不同来划分,统计调查可分为统计报表调查和专门调查。 4、一般来说,统计调查方案的内容必须包括:调查的目的、调查对象和调查单位、调查项目和调查表、调查时间和调查期限。 5、调查单位是标志的承担者,而填报单位则是的单位。 6、普查的组织方式有和。 7、重点调查是一种,它所选择的重点单位的总量占总体全部单位的总量的绝大部分。 8、抽样调查特点可概括为和。 9、普查是一种专门组织的一次性的全面性调查,它主要用来调查一定时点上的社会经济现象总量。 10、统计报表是按照国家有关法规的规定,自上而下地统一布置,定期的自下而上地逐级提供统计资料的一种统计调查方式方法。 11、统计报表按报表内容和实施范围的不同,可分为国家统计报表、部门统计报表和地方统计报表。 12、统计报表按报送周期长短不同,可分为日报、周报、旬报、月报、季报、半年报和年报。 13、统计报表资料来源于基层单位的原始记录,从原始记录到统计报表,中间还要经过统计台帐和企业内部报表。 14、统计台帐是基层单位根据和本单位的需要而设置的一种系统的表册。 (二)单项选择题(在每小题备选答案中,选出一个正确答案) 1、在国有工业企业设备普查中,每一个国有工业企业是( C) A. 调查对象 B. 调查单位 C. 填报单位 D. 调查项目 2、通过调查大庆、胜利等几大主要油田来了解我国石油生产的基本情况,这种调查方式属于( C ) A、普查 B、典型调查 C、重点调查 D、抽样调查 3、区别重点调查和典型调查的标志是( C ) A. 调查单位数目不同 B. 收集资料方法不同 C. 确定调查单位标准不同 D. 确定调查单位目的不同 4、了解某企业的期末在制品数量,由调查人员亲自到现场观察计数,这种收集资料的方式属于( B )。 A、采访法 B、直接观察法 C、大量观察法 D、报告法 5、非全面调查中最完善、最有计量科学根据的方式是( C ) A. 重点调查 B. 典型调查 C. 抽样调查 D. 非全面统计报表 6、我国目前收集统计资料的主要形式是( D ) A、全面调查 B、普查 C、抽样调查 D、统计报表 7、统计调查时间是( B ) A. 调查工作的时限 B. 调查资料所属时间 C. 调查登记的时间 D. 调查期限

调查报告数据分析

三、数据统计和分析 问卷情况:见附录(含调查问卷和结果分析表格各一份)。问卷共发放41份,收回有效问卷40份。发放以我们周围的同学为主,基本上做到了随机发放。我们在下面对有代表性的几项进行了具体分析。 1、月生活费:统计结果表明,每月的生活费主要集中在300—500元和500—1000元之间,两种极限情况A(350以下)和D(1200以上)的选择较少,比较符合实际情况。 2、生活资金来源及家庭收入:百分之九十以上的被调查者的生活费主要由父母或家庭提供,全靠家里提供生活费的学生占到52.5%,只有极少数学生经济独立,不需要依靠父母。有相当一部分学生一方面需要家里的资助,另一方面靠校外兼职、做家教来贴补日用,产生这种情况主要有三方面的原因:一是通过兼职来锻炼自己,增加社会经验;二是迫于大学消费的压力,追求品位和档次;三是渴望自己经济尽早独立,也可为家里减轻负担。 3、生活费主要的支出:大学生主要的消费支出在饮食、通讯、娱乐、服饰等方面。现主要分析饮食和通讯这两方面的支出。 饮食支出:从表中数据可看出,饮食方面支出居于200—300元的人数最多,占总消费的比例较高; 通讯支出:根据随机问卷得到的结果,被调查人数中全部都拥有手机,可见大学校园手机的普及率之高。上大学以前就买了手机的人数占拥有人数的33.3%左右,在大一买手机的人数高达100%。在拥有手机的群体中,月花费主要集中在20—50元,50—100元之间,也有部分同学的月消费在100元以上的。大学生必要的联系并不多,在手机消费方面,存在着一些不理性、高开销的情况。 4、校外兼职目的方面:大学生多有在校外打工或兼职的经历,或有些这方面的打算,其主要目的的排序为:增加社会经验;贴补日用;渴望独立;闲着没事干。 最高的选项是增长社会经验,主要的原因是大学生有感于大学生就业的压力,希望通过兼职来锻炼自己,了解社会,增加自己的就业筹码,为将来打基础。同时也说明,大学生如果不盲目攀比,是有钱应付日常支出的。 感到自己的支出对家庭有“比较大”和“很大”负担的同学占到被调查总人数的35%,感到周边同学的消费“比较高”的同学占到被调查总人数的45%,可见大学生的消费还是趋高,通过兼职来补贴日用,也就顺理成章了。很多大学生虽然在经济上还没有独立,但渴望尽早独立,由此可看出大学生精神状态比较积极的一面。选择“闲着没事干”的同学占到被调查总人数的17.5%,可以看出大学生普遍的空虚、无聊。 5、理财观念和能力:结果显示,对自己的所有或比较大的支出有记录的同学占被调查者的42.5%,“很少记帐”或“向来没有记帐习惯”的同学占被调查者的57.5%;对生活费有预算的同学占被调查者的57.5%,对生活费没有什么安排,想用就用的同学占到被调查者的42.5%等。由此可见,大学生的理财观念比较淡薄,随意性比较大,有待加强。也一定反映了大学生消费的脆弱心理。 大学生消费的一些共性特点: 综合以上的数据我们可以看出,中国的大学生目前正受到市场经济的强力冲击。大学生群体中,包容着具有多种经济状况和消费能力的个体,同时可以划分为不同的层次,并且区分程度相对稳定。这种经济上的差异和分层不仅取决于他们不同的价值取向、思维方式和性格特征,而且也是地域经济差异性的反映。但是大学生作为一个群体在消费方面是有一些共性的特点的。

市场调查资料的统计与分析

市场调查资料的统计与分析 1、原始资料的逻辑处理 ⒈鉴别和验收;⒉分类和编码;⒊录入及相关处理。 2、资料处理与分析的一般过程。 ⒈现场控制;⒉逻辑处理:⑴鉴别;⑵分类;⑶编码;⑷录入;⑸筛选;⒊数学处理: ⑴数字运算;⑵统计分析;⑶建模与解模;⒋系统研究;⒌编写图表文字。 3、基本统计分析 ⒈计数。资料分析过程的第一步是要对各个分类中所有观察值的出现频数进行统计,计算出符合特定条件的全部个体数目。 ⒉加总。对符合特定条件的全部个体的参数值求和,以得到样本或总体的某一方面的总量。 ⒊比例。是样本或总体的一个组成部分相对于整体的相对数,通常用百分数来表示。 ⒋分布。是样本或总体的结构或构成情况的反映,包含着对应变量的全部信息,分布是统计学最为重要的概念。 ⒌平均数与标准差。平均数说明样本或总体某一变量的一般水平,标准差则刻画样本或 总体某一变量相对于平均数的差异大小。 4、高级统计分析 ⒈回归分析。是对自变量、相依变量(因变量)的调查数据进行分析、计算、归纳出一个反映相依变量与自变量之间统计数量关系的经验公式。 ⒉因素分析和相关分析。一件事情或一种产品是由很多因素组成或影响的,使用因素分 析法,就是要分析消费者对这件事情或这种产品中的哪些因素最感兴趣。 相关分析是通过对变量之间的相关系数计算,假设的检验来研究统计资料中各变量之间的相互有没有关系,以及相关程度的大小。 ⒊判别分析。在市场分析中,往往会碰到一些判别的问题,这些问题都要选出判别因素,用判别分析方法来处理。 ⒋多维分析法。就是把一种产品或一种市场现象,放到一个两维以上的空间坐标上来进行分析。⒌⒍⒎⒏⒐⒑5、统计汇总⒈统计分组:就调查内容进行分组。⑴不漏;⑵不重; ⑶不空。本文来源:考试大网⒉统计汇总表:列联分析中使用的纵横交叉数据表是统计表的基本形式,在统计分析和统计汇总过程中极为有用,而且也极为常用;⒊统计图:在多数场

现场调查资料分析

现场流行病学调查资料分析 第一节 资料分析计划 一、 现场流行病学调查资料分析步骤 二、 资料的整理 在设计调查表时,应对调查表中每一个变量的规定取值方法进行详细地描述。例如如果确定“性别”一项中“女性”用2表示,不详用9 表示,就要在调查表中详细描述,使录入资料时有章可循,正确地处理不可接受的数值。通常用调查表来收集现场流行病学调查资料,输入计算机进行整理、分析。在现场调查完成之后,应该对每张调查表进行审查,对调查表的审查可与资料的录入同时进行,前提是所用的录入软件能对录入的资料进行质量控制,建议使用Epidata 进行录入,详见本书附录。在进行资料整理时,应及时发现和纠正数据错误。在

现场调查阶段,由于工作比较繁忙很容易遗忘,如果在资料整理时也是如此,待到计算结果并得出结论后,再返回来寻找错误,往往很难发现错误,从而导致错误的结论。 列出病例一览表。 三、资料分析策略的制定 在资料分析之前,必须制定分析策略。毫不夸张地说,分析策略的制定可与成文之前的论文提纲相媲美。它是资料分析的重要环节之一,将为实际资料分析提供纲领和指南。制定一个完美的分析策略,对资料分析将起到促进作用。 资料整理表的设计是制定分析策略的重要一步。整理表包括频数分布表和四格表等,这些表已经提供了资料整理的框架,甚至已标明了表目,只是缺少表中数据,这些数据将在资料分析过程中填充。根据分析计划,通常要草拟出一系列的资料整理表,可按逻辑顺序或由简单(描述流行病学)到复杂(分析流行病学)的次序排列。整理表通常表明分析指标,如OR值和统计量χ2值。通常需要以下整理表: 整理表1:临床资料,如临床症状和体征,实验确诊的百分比,住院或死亡的百分比等。 整理表2:描述流行病学资料,如果病例的三间分布等。在时间分布方面,通常绘制直方图或流行曲线。在地区分布方面,常用标点地图、散点图等。在人群分布方面,常用构成比图来描述研究对象的年龄、种族、性别等分布特征。 如为描述性研究则到此为止,如为分析性研究,还包括以下内容。 整理表3:因素和疾病之间联系的四格表。 整理表4:在表3基础上,为评价混杂因素和效应修正作用设计的分层分析表。 整理表5:在表3基础上,为分析剂量反应关系、灵敏度和特异度等而设计的分析表。 整理表6:特异性分组分析。 第二节描述性分析 一、临床资料的描述 1、体征和症状的频率表 一种疾病一般可根据观察到的各种症状和体征的相对频率来描述。频率表是描述在至少1组30个病例中观察到的体征或症状的次数,如果想使结果更为准确,病例数则应更多。若有足够多的被检病例数,可将疑似病例、临床诊断病例、确诊病例, 或轻型和重型病例的疾病资料分开单独制成图表(见表1)。 2、疾病过程的描述 每一种症状或体征有出现的时间和消失的时间,如果有足够数量的被检病例,可将体征和症状的频率从起病到康复按一定的时间间隔列成表格,或绘成曲线图,了解疾病过程中体征和症状的动态情况。

数据的整理与分析报告

第一单元数据收集整理 教材分析:本单元学生主要学习一些简单的统计图表知识,初步体验数据的收集、整理、描述和分析的过程,学会用简单的方法收集和整理数据,掌握统计数据的记录方法,并能根据统计图表的数据提出并回答简单的问题,使学生了解统计的意义和作用,初步了解统计的基本思想方法,认识统计的作用和意义,逐步形成统计观念,进而养成尊重事实、用数据说话的态度。 学情分析:上学期学生已经学习了比较、分类,能正确地进行计数,所以填写统计表时不会感到太困难,其关键在于引导学生学会收集信息,整理数据,根据统计表解决问题。学生在生活中积累了较多的生活经验,能利用统计图表中的数据作出简单的分析,能和同伴交流自己的想法,体会统计的作用。本单元教材选择了与学生生活密切联系的生活场景,激发了学生的学习兴趣。如,学生的校服、讲故事比赛、春游的人数情况统计等,同时渗透一些生活基本常识,使学生明确统计的知识是为生活服务的。教学容更加注重对统计数据的初步分析。在教学时,教师要注意让学生经历统计活动的全过程,要鼓励学生参与到活动之中,在活动中不断培养动手实践能力和独立思考能力,并加强与同伴的合作与交流。 教学目标知识技能: 使学生经历数据的收集、整理、描述和分析的过程,能利用统计表的数据提出问题并回答问题。数学思考:了解统计的意义,学会用简单的方法收集和整理数据。问题解决:能根据统计图表中的数据提出并回答简单的问题,并能够进行简单的分析。情感态度:通过对周围现实生活中有关事例的调查,激发学生的学习兴趣,培养学生的合作意识和创新精

神。 教学重点:使学生初步认识简单的统计过程,能根据统计表中的数据提出问题、回答问题,同时能够进行简单的分析。教学难点:使学生亲历统计的过程,在统计中发展数学思考,提高学生解决问题的能力。 课时安排:3课时 1.数据收集整理………………………………2课时 2.练习一………………………………………1课时 数据收集整理 教学目标: 1.体验数据收集、整理、描述和分析的过程,了解统计的意义。 2.能根据统计表中的数据提出并回答简单的问题,同时能够进行简单的分析。根据统计表的数据提出有价值的数学问题及解决策略。 教学重点、难点: 1.重点:使学生初步认识简单的统计过程,能根据统计表中的数据提出问题、回答问题,同时能够进行简单的分析。 2.难点:引导学生通过合作讨论找到切实可行的解决统计问题的方法。 教学准备:多谋体课件、表格

统计学计量资料的统计描述方法

计量资料的统计描述方法 怎样表达一组数据? 描述计量资料的常用指标— A、描述平均水平(中心位置): 均数X、中位数和百分位数、几何均数G、众数(mode) B、描述数据的分散程度: 标准差、四分位数间距、变异系数、方差、全距 (一)均数mean和标准差standard deviation 1. (算术)均数X 均数是描述一组计量资料平均水平或集中趋势的指标。 *直接计算公式: 应用条件:适用于对称分布,特别是正态分布资料。 2. 中位数(median)M和百分位数(percentile) A.中位数M 是将一组观察值从小到大排序后,居于中间位置的那个值或两个中间值的平均值。 应用条件: 用于任何分布类型,包括偏态资料、两端数据无界限的资料。 计算: n为奇数时-- n为偶数时-- 9人数据:12,13,14, 14, 15, 15, 15, 17, 19天 B.百分位数

是将N 个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X 百分位数。中位数是第百分50位数。 四分位数间距(quartile range ) = 第25百分位数(P25)~第75百分位数(P75)。 四分位数间距用于描述偏态资料的分散程度(代替标准差S ),包含了全部观察值的一半。 百分位数计算(频数表法): X L :第X 百分位数所在组段下限 L Σf :小于X L 各组段的累计频数 X i :第X 百分位数所在组段组距 n :总例数 f x :所在组段频数 注:有的教材X= r ; L f =C 例:求频数表的第25、第75百分位数(四分位数间距) 组段 频数f 累积频数∑f 56~ 2 2 59~ 5 7 62~ 12 19 ∑f 25 L 25 65~ 15 34 P 25在此 68~ 25 59 71~ 26 85 ∑f 75 L 75 74~ 19 104 P 75在此 77~ 15 119 80~ 10 129 83~85 1 130 合 计 130 ① 确定Px 所在组段: P 25所在的组段:n X %=130×25%=, 65~组最终的累积频数=34,落在65~组段内; P 75所在的组段:n X %=130×75%=, 此值落在74~组段

计数资料的统计学分析 (1)

[模拟] 计数资料的统计学分析 A型题题干在前,选项在后。有A、B、C、D、E五个备选答案其中只有一个为最佳答案。 第1题: 计数资料又称如下哪一种资料 A.数量资料 B.抽样资料 C.普查资料 D.调查资料 E.定性资料 参考答案:E 答案解析: 第2题: 计数资料是指将观察单位按下列哪一种分组计数所得的资料 A.数量 B.体重 C.含量 D.属性或类型或品质 E.放射性计数 参考答案:D 答案解析: 第3题: 计数资料的初步分析常常要用下列哪些相对数 A.频数 B.频数和频率指标 C.率、构成比和相对比 D.构成指标和相对比 E.比和构成比 参考答案:C 答案解析: 第4题: 频率指标,它说明某现象发生的如下哪一种

B.强度 C.比重大小 D.例数 E.各组的单位数 参考答案:B 答案解析: 第5题: 构成指标,它说明一事内部各组成部分所占的如下哪一种大小 A.比重 B.强度 C.频数 D.频率 E.例数 参考答案:A 答案解析: 第6题: 对480人进行老年性白内障普查,分60岁一、70岁一和80岁一三个年龄组受检人数分别为300、150和30人,白内障例数分别为150、90和24人。回答70岁一年龄组的患病率(%)是多少 A.5 B.50 C.60 D.80 E.20 参考答案:C 答案解析: 第7题: 对1000人进行老年性白内障普查,分50岁一和60岁一两个年龄组,受检人数分别为480人和520人,白内障例数分别为120人和280人。回答患者50岁一年龄构成比(%)是多少 A.53.9 B.12 C.30 D.28

参考答案:C 答案解析: 第8题: 在计数资料计算相对数时,应注意如下哪些问题 A.分母不宜过大 B.可比性 C.随机性 D.分母不宜过小 E.分母宜中 参考答案:D 答案解析: 第9题: 在计数资料进行相对数间比较时,应注意如下哪些问题 A.分母不宜太小 B.可比性 C.可用频率指标代替构成指标 D.随机性和正态分布 E.其可比性和遵循随机抽样 参考答案:E 答案解析: 第10题: X2检验是要计算检验统计量X2值、X2值是反应如下哪种情况 A.实际频数大于理论频数 B.理论频数大于实际频数 C.实际频率和理论频率的吻合程度 D.实际频数和理论频数的吻合程度 E.实际频率大于理论频率 参考答案:D 答案解析: 第11题: X2值愈大,则X2值的概率P值如下哪种情况

相关主题
文本预览
相关文档 最新文档