当前位置：文档之家› x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算

x2检验（chi-square test）或称卡方检验

x2检验（chi-square test）或称卡方检验，是一种用途较广的假设检验方法。可以分为成组比较（不配对资料）和个别比较（配对，或同一对象两种处理的比较）两类。

一、四格表资料的x2检验

例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者，结果如表

20-11，问两种疗法有无差别？

表20-11 两种疗法治疗卵巢癌的疗效比较

表内用虚线隔开的这四个数据是整个表中的基本资料，其余数据均由此推算出来；这四格资料表就专称四格表（fourfold table），或称2行2列表（2×2 contingency table）从该资料算出的两种疗法有效率分别为44.2%和77.3%，两者的差别可能是抽样误差所致，亦可能是两种治疗有效率（总体率）确有所不同。这里可通过x2检验来区别其差异有无统计学意义，检验的基本公式为：

式中A为实际数，以上四格表的四个数据就是实际数。T为理论数，是根据检验假设推断出来的；即假设这两种卵巢癌治疗的有效率本无不同，差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率，即53/87=60.9%，以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。

检验步骤：

1.建立检验假设：

H0：π1=π2

H1：π1≠π2

α=0.05

2.计算理论数（TRC），计算公式为：

TRC=nR.nc/n 公式（20.13）

式中TRC是表示第R行C列格子的理论数，nR为理论数同行的合计数，nC为与理论数同列的合计数，n为总例数。

第1行1列： 43×53/87=26.2

第1行2列： 43×34/87=16.8

第2行1列： 44×53/87=26.8

第2行2列： 4×34/87=17.2

以推算结果，可与原四项实际数并列成表20-12：

表20-12 两种疗法治疗卵巢癌的疗效比较

因为上表每行和每列合计数都是固定的，所以只要用TRC式求得其中一项理论数（例如T1.1=26.2），则其余三项理论数都可用同行或同列合计数相减，直接求出，示范如下：

T1.1=26.2

T1.2=43-26.2=16.8

T2.1=53-26.2=26.8

T2.2=44-26.2=17.2

3.计算x2值按公式20.12代入

4.查x2值表求P值

在查表之前应知本题自由度。按x2检验的自由度v=（行数-1）（列数-1），则该题的自由度v=（2-1）（2-1）=1，查x2界值表（附表20-1），找到x20.001（1）=6.63，而本题x2=10.01即x2＞x20.001（1），P＜0.01，差异有高度统计学意义，按α=0.05水准，拒绝H0，可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。

通过实例计算，读者对卡方的基本公式有如下理解：若各理论数与相应实际数相差越小，x2值越小；如两者相同，则x2值必为零，而x2永远为正值。又因为每一对理论数和实际数都加入x2值中，分组越多，即格子数越多，x2值也会越大，因而每考虑x2值大小的意义时同时要考虑到格子数。因此自由度大时，x2的界值也相应增大。

二、四格表的专用公式

对于四格表资料，还可用以下专用公式求x2值。

式中a、b、c、d各代表四格表中四个实际数，现仍以表20-12为例，将上式符号标记如下（表20-13），并示范计算。

表20-13 两种疗法治疗卵巢肿瘤患者的疗效

计算结果与前述用基本公式一致，相差0.01用换算时小数点后四舍五入所致。

三、四格表x2值的校正

x2值表是数理统计根据正态分布中的定义计算出来的。

是一种近似，在自由度大于1、理论数皆大于5时，这种近似很好；当自由度为1时，尤其当1＜T＜5，而n＞40时，应用以下校正公式：

如果用四格表专用公式，亦应用下式校正：

例20.8某医师用甲、乙两疗法治疗小儿单纯性消化不良，结果如表20-14.试比较两种疗法效果有无差异？

表20-14 两种疗法效果比较的卡方较正计算

从表20-14可见，T1.2和T2.2数值都＜5，且总例数大于40，故宜用校正公式（20.15）检验。步骤如下：

1.检验假设：

H0：π1=π2

H1：π1≠π2

α=0.05

2.计算理论数：（已完成列入四格表括弧中）

3.计算x2值：应用公式（20.15）运算如下：

查x2界值表，x20.05（1）=3.84，故x2＜x20.05（1），P＞0.05.

按α=0.05水准，接受H0，两种疗效差异无统计学意义。

如果不采用校正公式，而用原基本公式，算得的结果x2=4.068，则结论就不同了。

如果观察资料的T＜1或n＜40时，四格表资料用上述校正法也不行，可参考预防医学专业用的医学统计学教材中的精确检验法直接计算概率以作判断。

四、行×列表的卡方检验（x2test for R×C table）

适用于两个组以上的率或百分比差别的显著性检验。其检验步骤与上述相同，简单计算公式如下：

式中n为总例数；A为各观察值；nR和nC为与各A值相应的行和列合计的总数。

例20.9北方冬季日照短而南移，居宅设计如何适应以获得最大日照量，增强居民体质，减少小儿佝偻病，实属重要。胡氏等1986年在北京进行住宅建筑日照卫生标准的研究，对214幢楼房居民的婴幼儿712人体检，检出轻度佝偻病333例，比较了居室朝向与患病的关系。现将该资料归纳如表20-15作行×列检验。

表20-15居室朝向与室内婴幼儿佝偻病患病率比较

/P>

该表资料由2行4列组成，称2×4表，可用公式（20.17）检验。

（一）检验步骤

1.检验假设

H0：四类朝向居民婴幼儿佝偻病患病率相同。

H1：四类朝向居民婴幼儿佝偻病患率不同。

α=0.05

2.计算x2值

3.确定P值和分析

本题v=（2-1）（4-3）=3，据此查附表20-1：

x20.01（3）=11.34，本题x2=15.08，x2＞x20.01（3），P＜0.01，按α=0.05水准，拒绝H0，可以认为居室朝向不同的居民，婴幼儿佝偻病患病率有差异。

（二）行×列表x2检验注意事项

1.一般认为行×列表中不宜有1/5以上格子的理论数小于5，或有小于1的理论数。当理论数太小可采取下列方法处理：①增加样本含量以增大理论数；②删去上述理论数太小的行和列；③将太小理论数所在行或列与性质相近的邻行邻列中的实际数合并，使重新计算的理论数增大。由于后两法可能会损失信息，损害样本的随机性，不同的合并方式有可能影响推断结论，故不宜作常规方法。另外，不能把不同性质的实际数合并，如研究血型时，不能把不同的血型资料合并。

2.如检验结果拒绝检验假设，只能认为各总体率或总体构成比之间总的来说有差别，但不能说明它们彼此之间都有差别，或某两者间有差别。

五、配对计数资料x2检验（x2test of paired comparison of enumeration data）

在计量资料方面，同一对象实验前后差别或配对资料的比较与两样本均数比较方法有所不同；在计数资料方面亦如此。例如表20-16是28份咽喉涂抹标本，每份按同样条件分别接种在甲、乙两种白喉杆菌培养基中，观察白喉杆菌生长情况，试比较两种培养基的效果。

表20-16 两种白喉杆菌培养基培养结果比较

从表中资料可见有四种结果：（a）甲+乙+，（b）甲+乙-（c）甲-乙+，（d）甲-乙-；如果我们目的是比较两种培养基的培养结果有无差异，则（a）、（d）两种结果是一致的，对差异比较毫无意义，可以不计，我们只考虑结果不同的（b）和（c），看其差异有无意义，可以应用以下简易公式计算：

检验步骤：

1.检验假设

H0：π1=π2

H1：π1≠π2

α=0.05

2.计算x2值

3.确定P值和分析配对资料v=1，查附表20-1得知x20.05（1）=3.84，x2＞x0.05（1），P＜0.05，按α=0.05水准，拒绝H0，可以认为甲培养基的白喉杆菌生长效率较高。

如果b+c＞40，则可采用：

此外还有两种以上处理方法的比较，可参阅预防医学专业的医学统计方法有关章节。

附表20-1 x2界值表

卡方检验习题

2 检验练习题一、最佳选择题 1．四格表的周边合计不变时，如果实际频数有变化，则理论频数（）。 A．增大 B．减小 C．不变 D．不确定 E．随a格子实际频数增减而增减 2．有97份血液标本，将每份标本一分为二，分别用血凝试验法和ELISA法对轮状病毒进行诊断，诊断符合情况见下表，欲比较何种诊断方法的诊断符合率较高，用（）统计方法两种诊断方法的诊断结果血凝试验法ELISA法合计符合不符合符合74882

不符合14115 合计88997 A．连续性校正2χ检验 B．非连续性校正2χ检验 C．确切概率法 D．配对2χ检验（McNemar检验） E．拟合优度2χ检验 3．做5个样本率的2检验，每组样本量均为50，其自由度为（）。 A 249 B 246 C 1 D 4 E 9 4．对四格表资料做2χ检验时，如果将四格表的行与列对调，则对调前后的（）。 A．校正2χ值不等 B．非校正2χ值不等 C．确切概率检验的P值不等 D．非校正2χ值相等 E．非校正2χ值可能相等，也可能不等

二、问答题 1．简述2χ检验的基本思想。 2．四格表2χ检验有哪两种类型各自在运用上有何注意事项 3．什么情况下使用Fisher确切概率检验两个率的差别 4．在回顾性研究和前瞻性研究的四格表中，各自如何定义优势比三、计算题 1．前列腺癌患者121名中，82名接受电切术治疗，术后有合并症者11人；39名接受开放手术治疗，术后有合并症者1人。试分析两种手术的合并症发生率有无差异 2．苏格兰西南部两个地区献血人员的血型记录见下表，问两地的血型分布是否相同两地献血人员的血型分布地区血型合计A B O AB

spss中怎样进行fisher精确概率法统计

spss中怎样进行fisher精确概率法统计最短距离法是把两个类之间的距离定义为一个类中的所有案例与另一类中的所有案例之间的距离最小者.缺点是它有链接聚合的趋势,因为类与类之间的距离为所有距离中最短者,两类合并以后,它与其他类之间的距离缩小了,这样容易形成一个较大的类.所以此方法效果并不好,实际中不太用. 2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离. 3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛. 4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离. 5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加

最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,使用较广. 个独立样本率比较的χ2检验属四格表资料χ2检验。这类资料在医学研究中较为多见。例如比较两种方法治疗某种疾病的有效率是否相同治疗结果如下：有效无效有效率（％）试验组 12 1 对照组 3 8 可以在SPSS中进行统计分析，具体操作详见附件中的.EXE文件。在读取统计结果时，应当注意χ2检验的适用条件，正确选择Pearson卡方检验、Yates校正卡方检验、Fisher 精确概率法（本法不属于χ2检验）。第三节四格表资料的Fisher确切概率法前面提及，当四格表资料中出现，或，或用公式(8-1)与公式(8-4)计算出值后所得的概率时，需改用四格表资料的Fisher确切概率(Fisher probabilities in 2×2 table)。该法是由年)提出的，其理论依据是超几何分布(hypergeometric distribution)，并非检验的范畴。但由于在实际应用中常用它作为四格表资料假设检验的补充，故把此法列入本章。下面以例8-1介绍其基本思想与检验步骤。例8-1 某医师为研究乙肝免疫球蛋白预防胎儿宫内感染HBV的效果，将33例HBsAg阳性孕妇随机分为预防注射组和非预防组，结果见表8-3。问两组新生儿的HBV总体感染率有无差别？

SPSS非参数检验之卡方检验

SPSS 中非参数检验之一：总体分布的卡方（Chi-square ）检验在得到一批样本数据后，人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断，则需要使用非参数检验的方法。其中总体分布的卡方检验（也记为χ2检验）就是一种比较好的方法。一、定义总体分布的卡方检验适用于配合度检验，是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。它的零假设H0：样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。总体分布的卡方检验的原理是：如果从一个随机变量尤中随机抽取若干个观察样本，这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布，这个多项分布当k 趋于无穷时，就近似服从X 的总体分布。因此，假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数，并依据下面的公式计算统计量Q ()2 1 k i i i i O E Q E =-=∑ 其中，Oi 表示观察频数；Ei 表示期望频数或理论频数。可见Q 值越大，表示观察频数和理论频数越不接近；Q 值越小，说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量，由于Q 统计量服从K-1个自由度的X 平方分布，因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平，则应拒绝零假设H0，认为样本来自的总体分布形态与期望分布或理论分布存在显著差异；如果相伴概率值大于显著性水平，则不能拒绝零假设HO ，认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。因此，总体分布的卡方检验是一种吻合性检验，比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据，而非频数数据。二、实例某地一周内各日患忧郁症的人数分布如下表所示，请检验一周内各日人们忧

卡方检验 (Chi-square)

卡方检验(Chi-square) ?参数与非参数检验 ?卡方匹配度检验 ?卡方独立性检验 ?卡方检验的前提和限制 ?卡方检验的应用参数与非参数检验 ?参数检验 ◆用于等比/等距型数据 ◆对参数的前提：正态分布和方差同质 ?非参数检验 ◆不用对参数进行假设 ◆对分布较少有要求，也叫d i s t r i b u t i o n-f r e e t e s t s ◆用于类目/顺序型数据 ◆没有参数检验敏感，效力低 ◆因此在二者都可用时，总是用参数检验卡方匹配度检验 ?用样本数据检验总体分布的形状或比率，以确定与假设的总体性质的匹配度?是对次数分布的检验 ?研究情境 ◆在医生职业中，男的多还是女的多？ ◆在三种咖啡中，哪种被国人最喜欢？ ◆在北京大学中，各国留学生的比例有代表性吗？卡方匹配度检验的公式 ?χ2=∑[(f0-f e)2/f e] ?f e=p n ?d f=C-1 ◆F0：观察次数 ◆f e：期望次数 ◆C：类目的个数 ◆Χ2：统计量卡方独立性检验 ?检验行和列的两个本来变量彼此有无关联卡方独立性检验的公式 ?χ2=∑[(f0-f e)2/f e] ?f e=（r o w t o t a l）（c o l u m n t o t a l）/n， ?d f=（R-1）（C-1）

◆F0：观察次数 ◆f e：期望次数 ◆R：行类目的个数C：列类目的个数◆Χ2：统计量例：х2检验 1.计算期望次数fe=(fc*fr)/n 2.计算每个单位格的х2值 22 df=(R-1)(C-1)= (3-1)(2-1)=2，х2的临界值为5.99 拒绝Ho，对手表显示的偏好程度与被试的年龄段有关

非参数检验(卡方检验)实验报告

大理大学实验报告课程名称生物医学统计分析实验名称非参数检验（卡方检验）专业班级姓名学号实验日期实验地点 2015—2016学年度第 2 学期

一、实验目的对分类资料进行卡方检验。二、实验环境 1、硬件配置：处理器：Intel（R）Core(TM) i5-4210U CPU @1.7GHz 1.7GHz 安装内存（RAM）：4.00GB 系统类型：64位操作系统 2、软件环境：IBM SPSS Statistics 19.0软件三、实验内容 (包括本实验要完成的实验问题及需要的相关知识简单概述) （1）课本第六章的例6.1-6.5运行一遍，注意理解结果；（2）然后将实验指导书的例1-4运行一遍，注意理解结果。四、实验结果与分析（包括实验原理、数据的准备、运行过程分析、源程序（代码）、图形图象界面等）例6.1 表1 灭螨A和灭螨B杀灭大蜂螨效果的交叉制表效果杀灭未杀灭合计组别灭螨A 32 12 44 灭螨B 14 22 36 合计46 34 80 分析：表1是灭螨A和灭螨B杀灭大蜂螨效果的样本分类的频数分析表，即交叉列联表。表2 卡方检验 X2值df 渐进Sig. (双侧) 精确Sig.(双侧) 精确Sig.(单侧) Pearson 卡方9.277a 1 .002 连续校正b7.944 1 .005 似然比9.419 1 .002 Fisher 的精确检验.003 .002

有效案例中的N 80 a. 0 单元格(.0%) 的期望计数少于5。最小期望计数为15.30。 b. 仅对2x2 表计算分析：表2是卡方检验的结果。因为两组各自的结果互不影响，即相互独立。对于这种频数表格式资料，在卡方检验之前必须用“加权个案”命令将频数变量定义为加权变量，才能进行卡方检验。 Pearson 卡方：皮尔逊卡方检验计算的卡方值（用于样本数n≥40且所有理论数E≥5）；连续校正b：连续性校正卡方值（df=1，只用于2*2列联表）；似然比：对数似然比法计算的卡方值（类似皮尔逊卡方检验）； Fisher 的精确检验:精确概率法计算的卡方值（用于理论数E<5）。不同的资料应选用不同的卡方计算方法。例6.1为2*2列联表，df=1，须用连续性校正公式，故采用“连续校正”行的统计结果。 X2=7.944，P（Sig）=0.005<0.01，表明灭螨剂A组的杀螨率极显著高于灭螨剂B组。例6.2 表3 治疗方法* 治疗效果交叉制表计数治疗效果 1 2 3 合计治疗方法 1 19 16 5 40 2 16 12 8 36 3 15 13 7 35 合计50 41 20 111 分析：表3是治疗方法* 治疗效果资料分析的列联表。表4 卡方检验 X2值df 渐进Sig. (双侧) Pearson 卡方 1.428a 4 .839 似然比 1.484 4 .830 线性和线性组合.514 1 .474

SPSS 确切概率法(1)

SPSS 确切概率法 1.什么时候使用确切概率？当n很小时，因为不服从卡方分布（不能有单元格的期望小于1，不能有20%以上的单元格期望值小于5），所以不能用卡方检验,这时系统会在分析结果的最后给出警告（WARNING: 50% of the cells have expected counts less than 5. Chi-Square may not be a valid test），提示用户采用确切概率法分析。 2.确切概率的思想是什么？ fisher精确检验其思想是在固定各边缘和的条件下，根据超几何分布（见概率分布），可以计算观测频数出现任意一种特定排列的条件概率。把实际出现的观测频数排列，以及比它呈现更多关联迹象的所有可能排列的条件概率都算出来并相加，若所得结果小于给定的显著性水平（比如给定的显著水平为0.05），则判定所考虑的两个属性存在关联，从而拒绝h0。 3.怎么操作？例1.（1）录入数据

（1）加权：Data——Weight Cases:Weight case by(选入“频数”）（3）卡方检验：Analyze——Descriptive

Statistics——Crosstabs：Row（选入性别），Column（选入咨询内容）；点击Statistics：选择Chi-square；点击Continue，点击OK。见图3，4。 4 分析结果：χ2值与P值，依次看“Chi-Square Tests”表的第1行，红色字体部分。

补充：第2行是校正的卡方值与P值，第4行是Fisher确切概率法计算的P值。通常规定：（1）当两组总样本量n≥40且所有的单元格的理论频数T≥5时，看第1行的结果；当P≈检验水准时，看第4行的结果。（2）当两组总样本量n≥40但有1≤理论频数T＜5时，看第2行的结果；或者看第4行的结果。（3）当两组总样本量n＜40，或最小理论频数T＜1时，看第4行的结果。例2某研究者调查了一匹高血压患者的血压控制情况和肥胖度，数据见文件tables.sav，为列举格式。汇总如下表，试分析两者之间有无关系。

SPSS非参数检验之一卡方检验

SPSS中非参数检验之一：总体分布的卡方(Chi-square )检验在得到一批样本数据后，人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断，则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为x2佥验)就是一种比较好的方法。一、定义总体分布的卡方检验适用于配合度检验，是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。总体分布的卡方检验的原理是：如果从一个随机变量尤中随机抽取若干个观察样本，这些观察样本落在X的k个互不相交的子集中的观察频数服从一个多项分布，这个多项分布当k趋于无穷时，就近似服从X的总体分布。因此，假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数，并依据下面的公式计算统计量Q O i E i E i 其中，Oi表示观察频数；Ei表示期望频数或理论频数。可见Q值越大，表示观察频数和理论频数越不接近；Q值越小，说明观察频数和理论频数越接近。SPSS 将自动计算Q统计量，由于Q统计量服从K-1个自由度的X平方分布，因此SPSS 将根据X 平方分布表给出Q统计量所对应的相伴概率值。如果相伴概率小于或等于用户的显著性水平，则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异；如果相伴概率值大于显著性水平，则不能拒绝零假设HO,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。因此，总体分布的卡方检验是一种吻合性检验，比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据，而非频数数据。二、实例某地一周内各日患忧郁症的人数分布如下表所示，请检验一周内各日人们忧郁数是否满足1:1:221:1:1。

统计方法卡方检验

卡方统计量卡方检验用途：可以对两个率或构成比以及多个率或构成比间的差异做统计学检验第一节. 四格表资料的χ2检验例8.1 为了解铅中毒病人是否有尿棕色素增加现象，分别对病人组和对照组的尿液作尿棕色素定性检查，结果见表8.1，问铅中毒病人和对照人群的尿棕色素阳性率有无差别? 表8.1 两组人群尿棕色素阳性率比较组别阳性数阴性数合计阳性率% 病人29(18.74) 7(17.26) 36 80.56 对照9(19.26)28(17.74) 37 24.32 合计38 35 73 52.05 卡方检验的基本思想表1中29、7、9、28是构成四格表资料的四个基本格子的数字，其余行合计和列合计以及总的合计都可以根据该四个数字推算出来，故该类资料被称为四格表资料四格表卡方检验的步骤以例8.1为例 1.建立假设： H0：π1 = π2 H1：π1≠π2 α＝0.05 四格表的四格子里的数字是实际数，在表1中四个数字旁边括号中的四个数字为理论数，其含义是当无效假设成立的时候，理论上两组人群各有多少阳性和阴性的人数。若H0：π1＝π2成立→p1＝p2＝p 即假设两组间阳性率无差别，阳性率都是等于合计的52.05%，那么铅中毒病人36人，则理论上有 36 ╳52.05%=18.74人为阳性；对照组37人，则理论上有 37 ╳52.05%=19.26人为阳性。故每个实际数所对应的理论数算法是，该实际数对应的行和乘列和再除以总的N样本含量。即TRC=nR nC / n 2.计算理论数第1行1列: T11＝36×38/73= 18.74 依次类推T12 = 17.26 T21 = 19.26 T22 = 17.74 四格表中理论数的两大特征：（1）理论频数表的构成相同，即不但各行构成比相同，而且各列构成比也相同；（2）各个基本格子实际数与理论数的差别（绝对值）相同。一、卡方检验基本公式

非参数检验(卡方检验)实验报告

. . 大学实验报告课程名称生物医学统计分析实验名称非参数检验（卡方检验）专业班级姓名学号实验日期实验地点 2015—2016学年度第 2 学期

a. 不假定零假设。 b. 使用渐进标准误差假定零假设。分析：表11为LPA和FA两种检测结果的的一致性检验。Kappa值是部一致性系数，除数据P值判断一致性有无统计学意义外，根据经验，Kappa≥0.75，表明两者一致性较好0.7>Kappa ≥0.4，表明一致性一般，Kappa<0.4，则表明一致性较差。本例Kappa值为0.680，P=0.000<0.01，拒绝无效假设，即认为两种检测方法结果存在一致性，Kappa值=0.680，0.7>Kappa≥0.4，表明一致性一般。例1 表12 周日频数表观察数期望数残差 1 11 16.0 -5.0 2 19 16.0 3.0 3 17 16.0 1.0 4 1 5 16.0 -1.0 5 15 16.0 -1.0 6 16 16.0 .0 7 19 16.0 3.0 总数112 分析：表12结果显示一周各日死亡的理论数（Expected）为16.0，即一周各日死亡均数；还算出实际死亡数与理论死亡数的差值（Residual）。表13 检验统计量周日卡方 2.875a df 6 渐近显著性.824 a. 0 个单元 (.0%) 具有小于 5 的期望频率。单元最小期望频率为 16.0。分析：Chi-Square过程，调用此过程可对样本数据的分布进行卡方检验。卡方检验适用于配合度检验，主要用于分析实际频数与某理论频数是否相符。卡方值X2=2.875，自由度数（df）=6，P=0.824>0.05，差异不显著，即可认为一周各日的死亡危险性是相同的。例2 表14 二项式检验类别N 观察比例检验比例精确显著性（双侧）性别组 1 0 12 .30 .50 .017 组 2 1 28 .70