当前位置:文档之家› 卡方检验

卡方检验

卡方检验
卡方检验

第十二章假设测定I V:卡方测定

(The Chi Square Test)

壹、本单元目标

1、举例说明卡方测定适用的情况。

2、解释双变项交叉表(bivariate table)的结构,以及如何将独立性

(independence)的概念应用到交叉表的期待次数(expected frequencies)与观察次数(observed frequencies)之间的关系上。

3、说明如何将假设测定的逻辑运用在交叉表的分析上。

4、以五个假设测定的步骤说明卡方测定,以及正确的解释测定的结

果。

5、说明卡方测定的限制,以及统计显著性与实质重要性的差异。

贰、简介

本章要介绍的Chi Square (χ2) test(卡方测定)大概是社会科学研究中,最常看到的一种假设测定方法。这是因为此测定方法相当容易符合假设测定第一个步骤─基本假定设定─的要求。此测定方法是两个名目尺度变项间之假设测定的方法。因此在level of measurement 的要求方面是最基本的nominal level of measurement。这名目尺度变项不限于是二分的,也可适用在其它尺度测量的变项上。而χ2test 也是一种无参数的测定,因此在基本假定部分,我们无须知道母群体之分配特性(distribution-free)。χ2之抽样分配是一种已知之理论分配,就叫χ2分配。(所谓Chi Square是χ这个希腊字母的发音加上「平方(square)」的英文)。

这种可以相当容易符合基本假定要求的无参数测定方法,可以让我们在做拒绝虚无假设的决策时,比较有信心。这是因为做假设测定时,如果在基本假定设定(测定的第一个步骤)中的任一要求或虚无假设(测定的第二个步骤)是错误时,我们就可拒绝虚无假设。但在无参数测定方法的情况下,我们比较容易符合基本假定的要求,因此可专注在判断虚无假设是否为错误,决策的结果也比较有信心。

参、双变项交叉表

卡方测定的进行要用到双变项交叉表。此交叉表同时呈现出两个不同变项间次数分配的情况。因此,双变项交叉表可用来探索这两个变项间是否有明显的关系存在。例如,以下是表示性别与教育程度间关系的一个双变项的交叉表:

表1性别与教育程度(N=100)

性别

教育程度男女合计

大专50 边缘总数大专以下50

50 50 100

双变项交叉表由栏(columns)与列(rows)组成。各栏与各列交会的部份就是表示两个变项共同次数的格(cells)。通常我们会将自变项放在栏的位置,应变项则放在列的位置(但研究者也可能会将位置调换)。一个交叉表中的每一栏及每一列,还会有该栏或该列的总数合计(subtotals),也称之为边缘总数(marginals)。整个交叉表的样本数,则是放在栏边缘总数与列边缘总数交会处。一个交叉表应该有清楚描述此表的表名。各栏及各列也要有变项名称,以及清楚表示变项类别的标题。

很明显的是,以上的交叉表还缺乏各格的讯息。一个完整之表自然是将上面每格内填入次数。各格的次数是将样本中每一个案,依照其在两个变项上所测量到类别或分数,一一放入各格中。

参、卡方测定的逻辑

χ2test有几种不同的用法,在此我们只讨论两种,一种是所谓的「独立性考验」(the test for independence),另一为「适合度考验」(the test of goodness of fit)。

以前我们已经碰到过所谓两样本抽样时要独立抽样之概念。在此情况下,这个概念是说:选取一个样本中之个案时,不会影响到选取另一个案之机率。在χ2 test之讨论中,独立性(independence)之意义略有不同。在此测定方法的情况中,独立性的意义是指变项间的关系,而非样本。当两个变项间的关系为独立时,则一个案分类到第一个变项中某一类别的机率,是和此个案出现在另一个变项之某一类别的机率无关。一个简单的两变项间关系为独立的例子是,做为一个男人或女人(性别)和他或她是否会结婚(婚姻状况)无关。但如果两个变项的关系不是独立的话,那么一个案出现在第一变项中某一类别之机

率,是会和此个案出现在另一变项之某一类别的机率则会有关系。设想另一种极端的状况是,如果是男性就一定是大专程度的话,当我们知道某一个按为男性时,我们也就知道其为大专程度的机率为100%。

以前面的例子来说,如果性别和教育程度并无关系,即两变项为独立时,则50位男性有大专学历及大专以下程度的机率应相当接近。就如同掷一个好的骰子一样,50个男生中,应该是有一半人为大专程度,另一半为大专以下程度。50位女性的情况,也是一样。事实上如果100人平均分在4格中,自是表示说一个人到那个格中是一个random chance。因此,当两变项为独立时,样本中个案到四格之任何一格的机率均等。这种机率均等的情况,就是χ2独立性考验之虚无假设的意义。因此,χ2 test of independence之虚无假设为「变项间之关系是独立的」。

肆、卡方的计算及测定的步骤

在χ2 test of independence之虚无假设「变项间之关系是独立的」情况下,即在说如果null hypothesis为真的话,则每格中之次数(即一变项之某一类别与另一变项之某一类别间之交集的次数)是在random chance下发生的。这种虚无假设下所产生(或算出)之次数称为「期待次数」(expected frequencies)或「理论次数」。χ2test of independence即在比较实际观察到的次数(observed frequencies)与期待次数之间的差距是否大到一显著水平下所期待的。基本上,我们是要计算一检定统计值,χ2(obtained),然后和χ2(critical)值来比较。

χ2(obtained)=Σ(f o-f e)2/f e,

其中

f o=实际观察到之每一格的次数

f e=为变项间若是独立时,每一格之期待次数

而一个f e=(相对应之列边缘合计)×(相对应之行边缘合计)/N

以下就以一例来说明χ2 test of independence之步骤。

表2 性别与教育程度(N=100)

性别

教育程度男女合计

大专30 10 40

大专以下25 35 60

合计55 45 100

1、基本假定:

Model:独立随机样本(Independent random samples)

测量尺度为名目(Level of measurement is nominal)

2、虚无假设:

H o:两变项是独立的。(亦即性别与教育程度无关)

(H1:两变项并非独立的)。

3、选出抽样分配及建立临界区

样本χ2值之抽样分配和Z或t分配不同,是一个正偏之分配,亦即大部分样本之χ2值在分配之左侧,而临界区是设在the upper tail,即右侧之尾端部分,此分配之状态也和自由度有关。

图1不同自由度之χ2的抽样分配

图2χ2 test之临界区设定

正如以往一样,在χ2抽样分配下之各种不同显著水平之χ2(critical)是早已算出(见Appendix C)。而χ2 test下之自由度(df),是以

df=(r-1)(c-1)算出,其中

df=自由度,r=列之数目,c=行之数目。

以我们之例来说,则

Sampling distribution=χ2distribution

α=0.05

df=1

χ2(critical)=3.841

〔χ2基本上是两尾测定,但因我们只关心是否(f o-f e)2>0,故图2

之临界区是在右侧尾端。〕

4、计算检定统计值

以f e之计算方式,我们可求出每一格之期待次数如下表所示:

表3 〔表2〕各格之期待次数(N=100)

性别

教育程度男女合计

大专22 18 40

大专以下33 27 60

合计55 45 100

上面f e计算方法,可从两种不同的角度来看前面说明在虚无假设下,各格次数发生的机率应是一种random chance的意义。首先,就性别来看,男性有55人,女性有45人。如果性别和教育程度无关,则男性(或女性)上大专或大专以下的比例就会和大专或大专以下之

边缘总数的比例相同。换言之,55位男性中会有40%的人上大专,而同样的女性45人中也会有40%的人上大专。之所以说是40 %人会上大专,不论男女,是因为100人中,不论男女,有40人是有大专程度的。上表中男性上大专之f e计算的方式就可看成是55×(40/100)。其余的可类推。

另一个角度是,当性别与教育程度无关时,大专程度的40人中,男生的比例会是55%,而女生的比例就是45%。同样的,大专以下程度之性别比例的分配也是这样。这个道理和上面所说的相同。

所以,χ2(obtained)=Σ(f o-f e)2/f e

=(30-22)2/22 + (10-18)2/18+(25-33)2/33

+(35-27)2/27

=10.78

5、决策并解释测定的结果

∵10.78>3.84

∴两变项间不是独立的,亦即,性别和教育程度有关

伍、χ2之适合度考验(The goodness of fit test)

上面是利用χ2 test做两变项间之独立测定。我们也可以用χ2分配来看一个变项之次数分配是否达到显著水平。其道理和上述相似,我们也是看:是否观察到的次数分配和理论次数的差距很大(达到显著水平)。如果observed和expected很接近,则我们说这是“good fit”。(good fit不一定是我们要的,以目前的讨论为例,good fit即是不能拒绝虚无假设)。

适合度考验与前述之考验不同之处,是在期待次数计算方法上。在此我们也是依照虚无假设来设定期待次数为何。例如以抛一个铜币为例,如果铜币没有问题的话(虚无假设),则在一连串的抛投后,您应会期待正反面出现之机会均等,此即依虚无假设定出期待值之例。以下另以书中所列之例(P.294)来看χ2之goodness of fit的测定。

<例>如果你收集了某一地区之一年内各月份犯罪案件之统计,你想知道是否犯罪情况会随季节而改变,在此您只有一个变项,即犯罪案件,其分配是依月份而变化,如果犯罪率不随月份变化的话,则您可期待每月犯罪案件应和全年犯罪案件总数除以12相接近。

在此虚无假设即为「犯罪率不因时间或月份而有不同」,而期待次数即以全年犯罪次数除以12计算出,然后和观察到之次数做比较。

表4每月犯罪次数

月份犯罪次数

1 190

2 152

3 121

4 110

5 147

6 199

7 250

8 247

9 201

10 150

11 193

12 212

合计2172

1、基本假定:

Model:Random Sampling

Level of Measurement is nominal

2、虚无假设:H0:每月份犯罪率并无不同

(H1:每月份犯罪率是不同的)

3、选出抽样分配及建立临界区:

在χ2 goodness of fit test中,df=k-1,而k是指类别数(在此

即为12个月份)

故Sampling distribution=χ2 distribution

α=0.05

df=12-1=11

χ2(critical)=19.675

4、计算检定统计值

χ2(obtained)=Σ(f o-f e)2/f e

在此f e=2172/12=181

故χ2(obtained)=(190-181)2/181+(152-181)2/181

+……+(212-181)2/181

=125.02

5、决策并解释测定的结果

∵125.02>19.675

∴在α=0.05之显著水平下,拒绝H0,亦即犯罪率依月份而不同。

陆、χ2 test之限制

虽然χ2 test很有弹性,可以适用在不同测量尺度的变项上,但是当变项有许多类别时,就难以一目了然交叉表中的情形。例如,当一个5×5的交叉表有25个格时,我们不容易知道理解变项间的关系。通常我们使用卡方测定时,各变项的类别数最好是4个或以下。

做χ2 test时还要特别留意两种与样本数大小有关的情况:

1、当样本数小的时候

在χ2 test之情况,小样本的定义是当交叉表有相当高比例之格数之期待次数是5或小于5时,所谓「高比例」事实上统计学家有不同的看法,保守的做法自是当任何一格有期待次数是5或小于5时,就应采取补救措施,理由是当样本小时,我们不能够假定样本χ2值之抽样分配是和理论上之χ2分配一样。

在一2×2交叉表之情况下,我们可用耶兹氏校正(Yate’s correction of continuity)的方法来计算χ2(obtained),其公式为

χ2c=Σ(|f o-f e|-0.5)2/f e

当交叉表大于2×2时,我们可以合并变项中某些类别之方法来增加格内之次数。当然要如何合并须有正当之理论根据,如果实在无法合并,你只好用未修正之χ2计算法算出χ2值,然后警告读者要小心判定之结果了。

2、当样本很大时

您也许已发现当您的样本数目增加一位数(如由100变成1000),χ2(obtained)值也增加一位,换言之,χ2值是受到样本数变化之影响极大。

因此,在做χ2 test时,您要特别注意,达到统计显著水平与是否有理论或实质上之意义或重要性是不同的。另一方面,统计显著测定本身在社会学研究有重要的角色。只要是用随机样本,我们就必须要确定观察到的是否是by mere random chance。在确定观察到的结果是达统计显著后,以χ2 test之情况来说,我们还可继续算出两变项关系之强弱为何,这些就有待以后讨论了。

最新卡方检验表

文化程度识字量X2 P 100个以下100个上 3.44 0.100 高中以上16 13 高中以下0 3 X=4.74 X=6.399 保育员高级操作技能考核复习提纲

一、简答题(每题10分,共30分) 1. 请简述幼儿园日常消毒的内容有哪些? (10分) 常用物品清洁消毒、物体表面清洁消毒、空气清洁消毒、手清洁消毒、垃圾及排泄物处理。 ... 2. 请简要阐述保育员全日观察的内容有哪些?(10分) 如发热答:观察幼儿精神状况,面色、食欲,大便性质、次数和睡眠等。幼儿发热时:观察其精神状态、面色、呼吸及其他伴随症状如:呕吐、头痛、皮疹等。 3. 请简要阐述急救的原则有哪些?(10分) 4. 请简述培养婴幼儿文明进餐习惯的注意事项。(10分) 答:进餐定时定位,饮食定量,专心进餐,不偏食,注意饮食卫生,学习餐桌文明。 5. 请简要阐述照料体弱儿进餐的原则有哪些?(10分) (1)区分体弱儿与正常儿 (2)根据体弱儿的特点进行个别照顾; (3)循序渐进地养成体弱儿的良好饮食习惯 (4)照顾体弱儿的进进餐需要,但不强迫体弱儿进餐。 6. 请简要阐述如何培养婴幼儿的良好睡眠习惯?(10分) ?培养婴幼儿独自入睡的习惯 ?培养婴幼儿按时睡眠和按时起床的习惯 ?培养婴幼儿正确的睡眠姿势 7. 请简述组织婴幼儿盥洗的原则有哪些?(10分) ?强调盥洗的纪律要求,卫生要求以及注意事项 ?对盥洗的组织应该有计划性 ?全面照顾,及时督促,仔细检查,达到清洁自身同时对他们有教育作用 ?培养婴幼儿自理能力 ?尽量减少婴幼儿的等待时间 ?培养婴幼儿良好的盥洗习惯 ?组织形式灵活 8. 请简要阐述组织婴幼儿盥洗的方法。(10分) 9. 请简要阐述对肥胖儿进餐的照顾方法有哪些?(10分) ?限制进食量

第七章 列联表分析

第七章列联表分析 7.1 列联表(Crosstabs)分析的过程 7.2 列联表的实例分析 7.1 列联表 (Crosstabs) 分析的过程 列联表分析的过程是对两个变量之间关系的分析方法。被分析的变量可以是定类变量也可以是定序变量。系统是通过生成列联表对两个变量进行列联表分析的。 列联表分析的功能可以通过下述操作来实现。 图7-1 列联表分析对话框 1.打开列联表分析对话框 执行下述操作: Analyze→Descriptive→Crosstabs 打开Crosstabs 对话框如图7-1 所示。 2.确定列联分析的变量 从左侧的源变量窗口中选择两个定类变量或定序变量分别进入Row(s)(行)窗口和Column(s)(列)窗口。进入Row(s)窗口的变量的取值将作为行的标志输出,而进入Column(s)窗口的变量的取值将作为列的标志输出。Display clustered bar charts 是在输出结果中显示聚类条图。Suppress table 是隐藏表格,如果选择此项,将不输出R×C 列联表。 3.选择统计分析内容 单击statistics 按钮,打开statistics 对话框,如图7-2 所示。

图7-2statistics 对话框 下面介绍该对话框中的选项和选项栏的内容: (1)Chi-square 是卡方(X2)值选项,用以检验行变量和列变量之间是否独立。适用于定类变量和定序变量。 (2)Correlations 是皮尔逊(Pearson)相关系数r 的选项。用以测量变量之间的线性相关。适用于定序或数值变量(定距以上变量)。 (3)Nominal 是定类变量选项栏。选项栏中的各项是当分析的两个变量都为定类变量时可以选择的参数。 1)Contingency coefficient:列联相关的C 系数,由卡方系数修正而得。 2) Phi and Cramer's V:列联相关的V 系数,由卡方系数修正而得。 3)Lambda:λ系数。 4)Uncertainty Coefficient:不定系数。 (4)Ordinal 是定序变量选项栏。选项栏中的各项是当分析的两个变量都为定序变量时可以选择的参数。 1)Gramma:Gramma 等级相关系数。 2)Somers’d:Somers 等级相关d 系数。 3)Kendall’s tau-b:肯得尔等级相关tau-b 系数。 4)Kendall’s tau-c:肯得尔等级相关tau-c 系数。 (5)Nominal by Interval 选项栏中的Eta 是当一个变量为定类变量,另一个变量为数值变量时,测量两个变量之间关系的相关比率。 系统默认状态是不输出上述参数。如需要可自行选择。上述选择做完以后,单击Continue 返回到Crosstabs 对话框。 4.确定列联表内单元格值的选项 单击Cells(单元格)按钮,打开Cell Display 对话框,如图7-3 所示。

卡方检验法

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数 (f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布, 可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况:

非参数统计列联表卡方检验

非参数统计期末大作业 一、Wilcoxon符号秩检验 某个公司为了争夺竞争对手的市场,决定多公司重新定位进行宣传。在广告创意中,预计广告投放后会产生效果。一组不看广告组和一组看广告,抽取16位被 调查者,让起给产品打分。现有数据如下 不看广告62 83 96 99 71 60 97 100 看广告87 92 90 86 94 95 82 91 分析广告效应是否显著。 1、手算 建立假设: H0:广告效应不显著 H1:广告效应显著 不看广告组记为x,看广告组记为y。 X Y D=x-y |D| |D|的秩D的符号 62 87 -25 25 7 - 83 92 -9 9 2.5 - 96 90 6 6 1 + 99 86 13 13 4 + 71 94 -23 23 6 - 60 95 -35 35 8 - 97 82 15 15 5 + 100 91 9 9 2.5 + 由表可知: T+=1+4+5+2.5=12.5 T-=7+2.5+6+8=23.5 根据n=8,T+和T-中较大者T-=23.5,查表得,T+的右尾概率为0.230到0.273,在显著性水平下,P值显然较大,故没有理由拒绝原假设,表明广 告效应不显著。

2、Spss 在spss中输入八组数据(数据1): 选择非参数检验中的两个相关样本检验 对话框中选择Wilcoxon,输出如下结果(输出1): Ranks N Mean Rank Sum of Ranks 看广告- 不看广告Negative Ranks 4a 3.12 12.50

Positive Ranks 4b 5.88 23.50 Ties 0c Total 8 a. 看广告< 不看广告 b. 看广告> 不看广告 c. 看广告= 不看广告 由上表,负秩为4,正秩也为4,同分的情况为0,总共8。负秩和为12.5,正秩和为23.5,与手算结果一致 Test Statistics b 看广告- 不看广 告 Z -.771a Asymp. Sig. (2-tailed) .441 a. Based on negative ranks. b. Wilcoxon Signed Ranks Test 由上表,Z为负,说明是以负秩为基础计算的结果,其相应的双侧渐进显著性结果为0.441,明显大于0.05,因此在的显著性水平下,没有理由拒绝原假设,即表明广告效应不显著,与手算的结论一致。 3、R语言(R语言1) 输入语句: x=c(62,83,96,99,71,60,97,100) y=c(87,92,90,86,94,95,82,91) wilcox.test(x,y,exact=F,cor=F) 输出结果: Wilcoxon rank sum test data: x and y W = 33, p-value = 0.9164 alternative hypothesis: true location shift is not equal to 0 由输出结果可知,P=0.9164,远大于 =0.05,因此没有理由拒绝原假设,即广告效应并不显著,与以上结果一致。

卡方检验临界值表

自由度 0.50 0.25 0.10 0.05 0.03 0.01 10.455 1.323 2.706 3.841 5.024 6.6352 1.386 2.773 4.605 5.9917.3789.2103 2.366 4.108 6.2517.8159.34811.3454 3.357 5.3857.7799.48811.14313.2775 4.351 6.6269.23611.07012.83315.0866 5.3487.84110.64512.59214.44916.8127 6.3469.03712.01714.06716.01318.47587.34410.21913.36215.50717.53520.09098.34311.38914.68416.91919.02321.666109.34212.54915.98718.30720.48323.2091110.34113.70117.27519.67521.92024.7251211.34014.84518.54921.02623.33726.2171312.34015.98419.81222.36224.73627.6881413.33917.11721.06423.68526.11929.1411514.33918.24522.30724.99627.48830.5781615.33819.36923.54226.29628.84532.0001716.33820.48924.76927.58730.19133.4091817.33821.60525.98928.86931.52634.8051918.33822.71827.20430.14432.85236.1912019.33723.82828.41231.41034.17037.5662120.33724.93529.61532.67135.47938.9322221.33726.03930.81333.92436.78140.2892322.33727.14132.00735.17238.07641.6382423.33728.24133.19636.41539.36442.9802524.33729.33934.38237.65240.64644.3142625.33630.43535.56338.88541.92345.6422726.33631.52836.74140.11343.19546.9632827.33632.62037.91641.33744.46148.2782928.33633.71139.08742.55745.72249.5883029.33634.80040.25643.77346.97950.8923130.33635.88741.42244.98548.23252.1913231.33636.97342.58546.19449.48053.4863332.33638.05843.74547.40050.72554.7763433.33639.14144.90348.60251.96656.0613534.33640.22346.05949.80253.20357.3423635.33641.30447.21250.99854.43758.6193736.33642.38348.36352.19255.66859.8933837.33543.46249.51353.38456.89661.1623938.33544.53950.66054.57258.12062.4284039.33545.61651.80555.75859.34263.6914140.33546.69252.94956.94260.56164.9504241.33547.76654.09058.12461.77766.2064342.33548.84055.23059.30462.99067.45944 43.33549.91356.36960.48164.20168.710 显著性水平(a )卡方检验临界值表

卡方检验模型验证方法

卡方检验模型验证方法模型参数的验证方法主要使用卡方拟合度检验( Chi-square Goodness-of-fit Test )结合最大似然 估计( Maximum Likelihood Estimation ),并且使用QQ图(Quantile-Quantile Plot)证明验证结果。 具体的说,就是先假定采集的样本数据符合某一分布,通过最大似然估计方法估计出该分布的参数,然后代入并用卡方检验计算相对于该分布的偏差。实践中我们对于一组样本数据,计算所有常见分布的偏差值,选取偏差最小的分布做为该样本的拟合结果。另外,从QQ图直观上看,该分布做为拟合结果描绘出的曲线 必须近似为接近参考线的直线(见3.3),否则我们就将数据拆分为多个部分进行分段的拟合(如对终端请求包大小的拟合)。 1.1 卡方拟合度检验卡方检验是一种大样本假设检验法,用于检验随机事件中提出的样本数据是否符合某一给定分布。 它需要较 大量的样本数据及已知的待检验概率分布函数。 1.1.1 卡方检验原理对于一个服从二项分布的随机变量Y服从Binomial( n, p) ,均值为,方差 。 由中心极限定理,符合标准正态分布N (0, 1),所以服从自由度为1的卡方分布。 设服从Binomial( n, p1 ), , , 则 有 所以 同理对于k个随机变量,均值分别为 , 在数据拟合时,先对数据分组,每组数据的实际个数即为随机变量

,,,则数据拟合即为判断 是否符合分布, 该卡方分布的自由度为k-1-nep(k为随机变量个数,nep为估计参数的个数)。 1.1.2 卡方检验步骤:假定样本服从某一给定分布。根据样本数据用最大似然法估计分布的密度函数参数。设定置信度,对n个样本数据排序。 把排序后的数据分成k组,确定每组的上下限,(上下限确定方法不同对验证能力有影响, 每组数据不少于5个),为了方便起见,本项目中采用平均划分分组间隔,即使为常数, 对于所有的成立。 计算每组数据实际个数,第i组实际个数为。 计算每组数据期望个数,第i组期望个数为: 连续:,其中F(x)为待验证的概率分布函数, 离散:。 计算。 理论上说如果,则数据符合分布函数为F(x)的分布, 其中,nep为估计的参数的个数。但是由于实际采集的数据并非完全地符合某一分布, 总存在一定的偏差,计算出的值并不满足这个条件, 所以我们使用的拟合标准为采用卡方估计值最小的分布作为验证结果。

卡方检验法

记数数据统计法—卡方检验法 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

统计方法卡方检验

卡方统计量 卡方检验用途: 可以对两个率或构成比以及多个率或构成比间的差异做统计学检验 第一节. 四格表资料的χ2检验 例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别? 表8.1 两组人群尿棕色素阳性率比较 组别阳性数阴性数合计阳性率% 病人29(18.74) 7(17.26) 36 80.56 对照9(19.26)28(17.74) 37 24.32 合计38 35 73 52.05 卡方检验的基本思想 表1中29、7、9、28是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料 四格表卡方检验的步骤 以例8.1为例 1.建立假设: H0:π1 = π2 H1:π1≠π2 α=0.05 四格表的四格子里的数字是实际数,在表1中四个数字旁边括号中的四个数字为理论数,其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。 若H0:π1=π2成立→p1=p2=p 即假设两组间阳性率无差别,阳性率都是等于合计的52.05%,那么 铅中毒病人36人,则理论上有 36 ╳52.05%=18.74人为阳性; 对照组37人,则理论上有 37 ╳52.05%=19.26人为阳性。 故每个实际数所对应的理论数算法是,该实际数对应的行和乘列和再除以总的N样本含量。 即TRC=nR nC / n 2.计算理论数 第1行1列: T11=36×38/73= 18.74 依次类推T12 = 17.26 T21 = 19.26 T22 = 17.74 四格表中理论数的两大特征: (1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同; (2)各个基本格子实际数与理论数的差别(绝对值)相同。 一、卡方检验基本公式

卡方检验临界值表

卡方检验临界值表 自由度显著性水平(a) 0.500.250.100.050.030.01 10.4551.3232.7063.8415.0246.635 2 1.3862.7734.6055.9917.3789.210 3 2.3664.1086.2517.8159.34811.345 4 3.3575.3857.7799.48811.14313.277 5 4.3516.6269.23611.07012.83315.086 6 5.3487.84110.64512.59214.44916.812 7 6.3469.03712.01714.06716.01318.475 87.34410.21913.36215.50717.53520.090 98.34311.38914.68416.91919.02321.666 109.34212.54915.98718.30720.48323.209 1110.34113.70117.27519.67521.92024.725 1211.34014.84518.54921.02623.33726.217 1312.34015.98419.81222.36224.73627.688 1413.33917.11721.06423.68526.11929.141 1514.33918.24522.30724.99627.48830.578 1615.33819.36923.54226.29628.84532.000 1716.33820.48924.76927.58730.19133.409 1817.33821.60525.98928.86931.52634.805 1918.33822.71827.20430.14432.85236.191 2019.33723.82828.41231.41034.17037.566 2120.33724.93529.61532.67135.47938.932 2221.33726.03930.81333.92436.78140.289 2322.33727.14132.00735.17238.07641.638 2423.33728.24133.19636.41539.36442.980 2524.33729.33934.38237.65240.64644.314 2625.33630.43535.56338.88541.92345.642 2726.33631.52836.74140.11343.19546.963 2827.33632.62037.91641.33744.46148.278 2928.33633.71139.08742.55745.72249.588 3029.33634.80040.25643.77346.97950.892 3130.33635.88741.42244.98548.23252.191 3231.33636.97342.58546.19449.48053.486

卡方检验临界值表

卡方检验临界值表 自由度显著性水平(a ) 0.50 0.25 0.10 0.05 0.03 0.01 1 0.455 1.323 2.706 3.841 5.024 6.635 2 1.386 2.77 3 4.605 5.991 7.378 9.210 3 2.366 4.108 6.251 7.815 9.348 11.345 4 3.357 5.38 5 7.779 9.488 11.143 13.277 5 4.351 6.62 6 9.236 11.070 12.833 15.086 6 5.348 7.841 10.645 12.592 14.449 16.812 7 6.346 9.037 12.017 14.067 16.013 18.475 8 7.344 10.219 13.362 15.507 17.535 20.090 9 8.343 11.389 14.684 16.919 19.023 21.666 10 9.342 12.549 15.987 18.307 20.483 23.209 11 10.341 13.701 17.275 19.675 21.920 24.725 12 11.340 14.845 18.549 21.026 23.337 26.217 13 12.340 15.984 19.812 22.362 24.736 27.688 14 13.339 17.117 21.064 23.685 26.119 29.141 15 14.339 18.245 22.307 24.996 27.488 30.578 16 15.338 19.369 23.542 26.296 28.845 32.000 17 16.338 20.489 24.769 27.587 30.191 33.409 18 17.338 21.605 25.989 28.869 31.526 34.805 19 18.338 22.718 27.204 30.144 32.852 36.191 20 19.337 23.828 28.412 31.410 34.170 37.566 21 20.337 24.935 29.615 32.671 35.479 38.932 22 21.337 26.039 30.813 33.924 36.781 40.289 23 22.337 27.141 32.007 35.172 38.076 41.638 24 23.337 28.241 33.196 36.415 39.364 42.980 25 24.337 29.339 34.382 37.652 40.646 44.314 26 25.336 30.435 35.563 38.885 41.923 45.642 27 26.336 31.528 36.741 40.113 43.195 46.963 28 27.336 32.620 37.916 41.337 44.461 48.278 29 28.336 33.711 39.087 42.557 45.722 49.588 30 29.336 34.800 40.256 43.773 46.979 50.892 31 30.336 35.887 41.422 44.985 48.232 52.191 32 31.336 36.973 42.585 46.194 49.480 53.486

如何用excel数据表计算卡方检验的p值

如何用EXCEL的统计函数进行统计卡方检验(χ2) 卡方(χ2)常用以检验两个或两个以上样本率或构成比之间差别的显著性分析,用以说明两类属性现象之间是否存在一定的关系。 卡方检验常采用四格表,如图5-4-18所示,比较的A、B两组数据分别用a、b、c、d表示,a为A组的阳性例数,b 为A组的阴性例数,c为B组的阳性例数,d为B组的阴性例数。 用EXCEL进行卡方检验时,数据的输入方式按实际值和理论值分别输入四个单元格,如图5-4-18所示。 (1)比较的A、B两组数据分别用a、b、c、d表示。a=52,为A组的阳性例数;b=19,为A组的阴性例数;c=39,为B组的阳性例数;d=3,为B组的阴性例数。根据公式计算理论值T11、T12、、T21和T22。将实际值和理论值分别输入如图所示的四个单元格(图5-4-19)。 选择表的一空白单元格,存放概率p值的计算结果,将鼠标器移至工具栏的“fx”处,鼠标器左键点击工具栏的“fx”快捷键,打开函数选择框。 (2)在函数选择框的“函数分类”栏选择“统计”项,然后在“函数名”栏内选择“CHITEST”函数,用鼠标器点击“确定”按钮,打开数据输入框(图5-4-20)。 (3)在“Actual_range”项的输入框内输入实际值(a、b、c、d)的起始单元格和结束单元格的行列号,在“Expected_range”项的输入框内输入理论值(T11、T12、T21、T22)的起始单元格和结束单元格的行列号,起始单元格和结束单元格的行列号之间用“:”分隔(图5-4-20)。 在数据输入完毕后,p值的计算结果立即显示。用鼠标器点击“确定”按钮,观察计算结果。 图5-4-18 四格表图5-4-19 四格表数据输入

卡方检验

第十二章假设测定I V:卡方测定 (The Chi Square Test) 壹、本单元目标 1、举例说明卡方测定适用的情况。 2、解释双变项交叉表(bivariate table)的结构,以及如何将独立性 (independence)的概念应用到交叉表的期待次数(expected frequencies)与观察次数(observed frequencies)之间的关系上。 3、说明如何将假设测定的逻辑运用在交叉表的分析上。 4、以五个假设测定的步骤说明卡方测定,以及正确的解释测定的结 果。 5、说明卡方测定的限制,以及统计显著性与实质重要性的差异。 贰、简介 本章要介绍的Chi Square (χ2) test(卡方测定)大概是社会科学研究中,最常看到的一种假设测定方法。这是因为此测定方法相当容易符合假设测定第一个步骤─基本假定设定─的要求。此测定方法是两个名目尺度变项间之假设测定的方法。因此在level of measurement 的要求方面是最基本的nominal level of measurement。这名目尺度变项不限于是二分的,也可适用在其它尺度测量的变项上。而χ2test 也是一种无参数的测定,因此在基本假定部分,我们无须知道母群体之分配特性(distribution-free)。χ2之抽样分配是一种已知之理论分配,就叫χ2分配。(所谓Chi Square是χ这个希腊字母的发音加上「平方(square)」的英文)。 这种可以相当容易符合基本假定要求的无参数测定方法,可以让我们在做拒绝虚无假设的决策时,比较有信心。这是因为做假设测定时,如果在基本假定设定(测定的第一个步骤)中的任一要求或虚无假设(测定的第二个步骤)是错误时,我们就可拒绝虚无假设。但在无参数测定方法的情况下,我们比较容易符合基本假定的要求,因此可专注在判断虚无假设是否为错误,决策的结果也比较有信心。 参、双变项交叉表 卡方测定的进行要用到双变项交叉表。此交叉表同时呈现出两个不同变项间次数分配的情况。因此,双变项交叉表可用来探索这两个变项间是否有明显的关系存在。例如,以下是表示性别与教育程度间关系的一个双变项的交叉表:

8.2 多个独立样本R×C列联表资料的卡方检验

第八章c 2 检验 二、多个独立样本R×C列联表资料的c 2 检验

表 8-5 三种不同治疗方法治疗慢性支气管炎的疗效组别 有效 无效 合计 有效率% A 药 35 5 40 87.50 B 药 20 10 30 66.67 C 药 7 25 32 21.88 合计62 40 102 60.78 (24.31) ( ) A T T c - = ? 2 22 2 11 (1)32.74 R C i j i j i j A n n m c == =-= ?? 2.1 频率的比较

表 8-5 三种不同治疗方法治疗慢性支气管炎的疗效 组别 有效 无效 合计 有效率% A 药 35 5 40 87.50 B 药 20 10 30 66.67 C 药 7 25 32 21.88 合计62 40 102 60.78 2.1 多个独立样本频率的比较 (24.31) ( ) A T T c - = ? 2 22 2 11 (1)32.74 R C i j i j i j A n n m c == =-= ?? c 2 (A, B ) =4.419,P =0.036,P ’=0.108

2.2 独立样本频率的比较 表 8-6 儿童急性白血病患者与成年人急性白血病患者的血型分布 分组A 型 B 型 O 型 AB 型合计 儿童30 38 32 12 112 成人19 30 19 9 77 合计49 68 51 21 189 c 2 0.75,3 =1.21,P >0.75 2 2 11 (1)0.695 R C i j i j i j A n n m c == =- = ??

卡方检验

作业2 卡方测验 (一)1.资料:P144习题7.4。 2.数据说明:大麦杂交F2代芒性状表型有钩芒、长芒、短芒三种,测验三种性状是否符 合9:3:4比例。 3.结果。 FREQ 过程 检验 gouxing 频数百分比百分比 --------------------------------------- 钩芒 348 56.13 56.25 长芒 115 18.55 18.75 短芒 157 25.32 25.00 指定比例的 卡方检验 ------------------------- 卡方 0.0409 自由度 2 渐近的 Pr >卡方 0.9798 精确的 Pr >= 卡方 0.9797 样本大小 = 620 4.分析。 H0:三种性状符合9:3:4;H A:不符合。显著水平:α=0.05 υ=2 χ20.05,2=5.99>χ2.因此接受无效假设,无显著差异。 5.程序代码。 optionps=32767ls=255nocenter; data xiti7_4; x 'F:'; x 'cd "F:\"'; infile 'xiti7_4.csv' dsd; inputgouxing$ zhushu; run; procfreq data=xiti7_4 order=data; weightzhushu; tablesgouxing/nocumtestp=(56.2518.7525);/*ratio of 9:3:4*/ exactpchi; run; (二)1.资料:P144习题7.6。

2.数据说明:某杂交组F2得到四种表型,B_C_,B_cc,bbC_,bbcc。判断四种表型实际 观察次数是否符合9:3:3:1的比例,判断是连锁遗传还是独立遗传。 3.结果。 FREQ 过程 检验 biaoxing 频数百分比百分比 ---------------------------------------- B-C- 132 58.41 56.25 B-cc 42 18.58 18.75 bbC- 38 16.81 18.75 bbcc 14 6.19 6.25 指定比例的 卡方检验 ------------------------- 卡方 0.6431 自由度 3 渐近的 Pr >卡方 0.8865 精确的 Pr >= 卡方 0.8915 样本大小 = 226 4.分析。 H0:四种表型符合9:3:3:1;H A:不符合。显著水平:α=0.05 υ=3 χ20.05,3=7.815>χ2.因此接受无效假设,无显著差异。 5.程序代码。 optionps=32767 ls=255 nocenter; data xiti7_6; filenamedatafile 'F:\xiti7_6.csv'; infiledatafilefirstobs=9 dsd; lengthbiaoxing $4; inputbiaoxing $ guanchacishu; run; proc freq data=xiti7_6 order=data; weightguanchacishu; tablesbiaoxing / nocumtestp=(56.25 18.75 18.75 6.25);/*ratio of 9:3:3:1*/ exactpchi; run;

相关主题
文本预览
相关文档 最新文档