当前位置:文档之家› χ2检验

χ2检验

χ2检验
χ2检验

检验(chi-square test)检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。

一、四格表资料的检验

例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表20-11,问两种疗法有无差别?

表20-11 两种疗法治疗卵巢癌的疗效比较

组别有效无效合计有效率(%)

化疗组19244344.2化疗加放疗组34104477.3

合计53348760.9表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过检验来区别其差异有无统计学意义,检验的基本公式为:

式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。

检验步骤:

1.建立检验假设:

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算理论数(TRC),计算公式为:

公式(20.13)

式中TRC是表示第R行C列格子的理论数,n R为理论数同行的合计数,n C为与理论数同列的合计数,n为总例数。

第1行1列:43×53/87=26.2

第1行2列:43×34/87=16.8

第2行1列:44×53/87=26.8

第2行2列:4×34/87=17.2

以推算结果,可与原四项实际数并列成表20-12:

表20-12 两种疗法治疗卵巢癌的疗效比较

组别有效无效合计

化疗组19(26.2)24(16.8)43化疗加放疗组34(26.8)10(17.2)44合计533487因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下:

T1.1=26.2

T1.2=43-26.2=16.8

T2.1=53-26.2=26.8

T2.2=44-26.2=17.2

3.计算值按公式20.12代入

4.查值表求P值

在查表之前应知本题自由度。按检验的自由度

ν=(行数-1)?(列数-1)

则该题的自由度ν=(2-1)(2-1)=1,查界值表(附表20-1),找到(1)=6.63,而本题=10.01即>(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。

通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,值越小;如两者相同,则值必为零,而永远为正值。又因为每一对理论数和实际数都加入值中,分组越多,即格子数

越多,值也会越大,因而每考虑值大小的意义时同时要考虑到格子数。因此自由度大时,的界值也相应增大。

二、四格表的专用公式

对于四格表资料,还可用以下专用公式求值。

式中a、b、c、d各代表四格表中四个实际数,现仍以表20-12为例,将上式符号标记如下(表20-13),并示范计算。

表20-13 两种疗法治疗卵巢肿瘤患者的疗效

组别有效无效合计

化疗组19(a)24(b)43(a+b)化疗加放疗组34(c)10(d)44(c+d)

53(a+c)34(b+d)87(n)计算结果与前述用基本公式一致,相差0.01用换算时小数点后四舍五入所致。

三、四格表值的校正

值表是数理统计根据正态分布中的定义计算出来的。是一种近似,在自由度大于1、理论数皆大于5时,这种近似很好;当自由度为1时,尤其当1<T<5,而n>40时,应用以下校正公式:

如果用四格表专用公式,亦应用下式校正:

例20.8某医师用甲、乙两疗法治疗小儿单纯性消化不良,结果如表20-14.试比较两种疗法效果有无差异?

表20-14 两种疗法效果比较的卡方较正计算

疗法痊愈数未愈数合计

甲26(28.82)7(4.18)33

乙36(33.18)2(4.82)38

合计62971

从表20-14可见,T1.2和T2.2数值都<5,且总例数大于40,故宜用校正公式(20.15)检验。步骤如下:

1.检验假设:

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算理论数:(已完成列入四格表括弧中)

3.计算值:应用公式(20.15)运算如下:

查界值表,(1)=3.84,故<(1),P>0.05.

按α=0.05水准,接受H0,两种疗效差异无统计学意义。

如果不采用校正公式,而用原基本公式,算得的结果=4.068,则结论就不同了。

如果观察资料的T<1或n<40时,四格表资料用上述校正法也不行,可参考预防医学专业用的医学统计学教材中的精确检验法直接计算概率以作判断。

四、行×列表的卡方检验(test for R×C table)

适用于两个组以上的率或百分比差别的显著性检验。其检验步骤与上述相同,简单计算公式如下:

式中n为总例数;A为各观察值;n R和n C为与各A值相应的行和列合计的总数。

例20.9北方冬季日照短而南移,居宅设计如何适应以获得最大日照量,增强居民体质,减少小儿佝偻病,实属重要。胡氏等1986年在北京进行住宅建筑日照卫生标准的研究,对214幢楼房居民的婴幼儿712人体检,检出轻度佝偻病333例,比较了居室朝向与患病的关系。现将该资料归纳如表20-15作行×列检验。

表20-15居室朝向与室内婴幼儿佝偻病患病率比较

检查结果

居室朝向合

计南西、西南东、东南北、东北、西北

患病

18

1412065

37

9

无病

20

168433

33

3

合计

38

3020498

71

2

患病率(%)

47.

4

46.758.866.3

53.

2

该表资料由2行4列组成,称2×4表,可用公式(20.17)检验。

(一)检验步骤

1.检验假设

H0:四类朝向居民婴幼儿佝偻病患病率相同。

H1:四类朝向居民婴幼儿佝偻病患率不同。

α=0.05

2.计算值

3.确定P值和分析

本题=(R-1)(C-1)=(2-1)(4-3)=3,据此查附表20-1:

0.01(3)=11.34,本题=15.08,>0.01(3),P<0.01,按α=0.05水准,拒绝H0,可以认为居室朝向不同的居民,婴幼儿佝偻病患病率有差异。

(二)行×列表检验注意事项

1.一般认为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数。当理论数太小可采取下列方法处理:①增加样本含量以增大理论数;②删去上述理论数太小的行和列;③将太小理论数所在行或列与性质相近的邻行邻列中的实际数合并,使重新计算的理论数增大。由于后两法可能会损失信息,损害样本的随机性,不同的合并方式有可能影响推断结论,故不宜作常规方法。另外,不能把不同性质的实际数合并,如研究血型时,不能把不同的血型资料合并。

2.如检验结果拒绝检验假设,只能认为各总体率或总体构成比之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。

五、配对计数资料检验(test of paired comparison of enumeration data)

在计量资料方面,同一对象实验前后差别或配对资料的比较与两样本均数比较方法有所不同;在计数资料方面亦如此。例如表20-16是28份咽喉涂抹标本,每份按同样条件分别接种在甲、乙两种白喉杆菌培养基中,观察白喉杆菌生长情况,试比较两种培养基的效果。

表20-16 两种白喉杆菌培养基培养结果比较

甲培养基

乙培养基

合计+-

+11(a)9(b)20

-1(c)7(d)8

合计121628从表中资料可见有四种结果:(a)甲+乙+,(b)甲+乙-(c)甲-乙+,(d)甲-乙-;如果我们目的是比较两种培养基的培养结果有无差异,则(a)、(d)两种结果是一致的,对差异比较毫无意义,可以不计,我们只考虑结果不同的(b)和(c),看其差异有无意义,可以应用以下简易公式计算:

检验步骤:

1.检验假设

H0:π1=π2

H1:π1≠π2

α=0.05

2.计算值

3.确定P值和分析配对资料=1,查附表20-1得知0.05(1)=3.84,>0.05(1),P<0.05,按α=0.05水准,拒绝H0,可以认为甲培养基的白喉杆菌生长效率较高。

如果b+c>40,则可采用:

附表20-1界值表

p p

0.050.010.0010.050.010.001

1 3.84 6.6310.8316 26.3032.0039.25

2 5.999.2113.8117 27.5933.1440.79

3 7.8111.3416.2718 28.8734.1842.31

4 9.4913.2818.4719 30.1436.1943.82

5 11.0715.0920.5220 31.4137.5745.32

6 12.5916.8122.4621 32.6738.9346.80

7 14.0718.4824.3222 33.9240.2948.27

8 15.5120.0926.1223 35.1741.6449.73

9 16.9221.6727.8824 36.4242.9851.18

10 18.3123.2129.5925 37.6544.3152.62

11 19.6824.7231.2626 38.8945.6454.05

12 21.0326.2232.9127 40.1146.9655.48

13 22.3627.6934.5328 41.3448.2856.89

14 23.6829.1436.1229 42.5649.5958.30

15 25.0030.5837.7030 43.7750.8959.70

分布临界值表(卡方分布)下载

P

n'

0.995 0.99 0.975 0.95 0.9 0.75 0.5 0.25 0.1 0.05 0.025 0.01 0.005

1 …………0.0

2 0.1 0.45 1.32 2.71 3.84 5.02 6.6

3 7.88

2 0.01 0.02 0.02 0.1 0.21 0.58 1.39 2.77 4.61 5.99 7.38 9.21 10.6

3 0.07 0.11 0.22 0.35 0.58 1.21 2.37 4.11 6.25 7.81 9.35 11.3

4 12.84

4 0.21 0.3 0.48 0.71 1.06 1.92 3.36 5.39 7.78 9.49 11.14 13.28 14.86

5 0.41 0.55 0.83 1.15 1.61 2.67 4.35 6.63 9.24 11.07 12.83 15.09 16.75

6 0.68 0.8

7 1.24 1.64 2.2 3.45 5.35 7.84 10.64 12.59 14.45 16.81 18.55

7 0.99 1.24 1.69 2.17 2.83 4.25 6.35 9.04 12.02 14.07 16.01 18.48 20.28

8 1.34 1.65 2.18 2.73 3.4 5.07 7.34 10.22 13.36 15.51 17.53 20.09 21.96

9 1.73 2.09 2.7 3.33 4.17 5.9 8.34 11.39 14.68 16.92 19.02 21.67 23.59

10 2.16 2.56 3.25 3.94 4.87 6.74 9.34 12.55 15.99 18.31 20.48 23.21 25.19

11 2.6 3.05 3.82 4.57 5.58 7.58 10.34 13.7 17.28 19.68 21.92 24.72 26.76

12 3.07 3.57 4.4 5.23 6.3 8.44 11.34 14.85 18.55 21.03 23.34 26.22 28.3

13 3.57 4.11 5.01 5.89 7.04 9.3 12.34 15.98 19.81 22.36 24.74 27.69 29.82

14 4.07 4.66 5.63 6.57 7.79 10.17 13.34 17.12 21.06 23.68 26.12 29.14 31.32

15 4.6 5.23 6.27 7.26 8.55 11.04 14.34 18.25 22.31 25 27.49 30.58 32.8

16 5.14 5.81 6.91 7.96 9.31 11.91 15.34 19.37 23.54 26.3 28.85 32 34.27

17 5.7 6.41 7.56 8.67 10.09 12.79 16.34 20.49 24.77 27.59 30.19 33.41 35.72

18 6.26 7.01 8.23 9.39 10.86 13.68 17.34 21.6 25.99 28.87 31.53 34.81 37.16

19 6.84 7.63 8.91 10.12 11.65 14.56 18.34 22.72 27.2 30.14 32.85 36.19 38.58

20 7.43 8.26 9.59 10.85 12.44 15.45 19.34 23.83 28.41 31.41 34.17 37.57 40

21 8.03 8.9 10.28 11.59 13.24 16.34 20.34 24.93 29.62 32.67 35.48 38.93 41.4

22 8.64 9.54 10.98 12.34 14.04 17.24 21.34 26.04 30.81 33.92 36.78 40.29 42.8

23 9.26 10.2 11.69 13.09 14.85 18.14 22.34 27.14 32.01 35.17 38.08 41.64 44.18

24 9.89 10.86 12.4 13.85 15.66 19.04 23.34 28.24 33.2 36.42 39.36 42.98 45.56

25 10.52 11.52 13.12 14.61 16.47 19.94 24.34 29.34 34.38 37.65 40.65 44.31 46.93

26 11.16 12.2 13.84 15.38 17.29 20.84 25.34 30.43 35.56 38.89 41.92 45.64 48.29

27 11.81 12.88 14.57 16.15 18.11 21.75 26.34 31.53 36.74 40.11 43.19 46.96 49.64

28 12.46 13.56 15.31 16.93 18.94 22.66 27.34 32.62 37.92 41.34 44.46 48.28 50.99

29 13.12 14.26 16.05 17.71 19.77 23.57 28.34 33.71 39.09 42.56 45.72 49.59 52.34

30 13.79 14.95 16.79 18.49 20.6 24.48 29.34 34.8 40.26 43.77 46.98 50.89 53.67 40 20.71 22.16 24.43 26.51 29.05 33.66 39.34 45.62 51.8 55.76 59.34 63.69 66.77 50 27.99 29.71 32.36 34.76 37.69 42.94 49.33 56.33 63.17 67.5 71.42 76.15 79.49 60 35.53 37.48 40.48 43.19 46.46 52.29 59.33 66.98 74.4 79.08 83.3 88.38 91.95 70 43.28 45.44 48.76 51.74 55.33 61.7 69.33 77.58 85.53 90.53 95.02 100.42 104.22 80 51.17 53.54 57.15 60.39 64.28 71.14 79.33 88.13 96.58 101.88 106.63 112.33 116.32 90 59.2 61.75 65.65 69.13 73.29 80.62 89.33 98.64 107.56 113.14 118.14 124.12 128.3 100 67.33 70.06 74.22 77.93 82.36 90.13 99.33 109.14 118.5 124.34 129.56 135.81 140.17

t检验(t-test)临界值表(临界置信水平)下载

P(2): 0.5 0.2 0.1 0.05 0.02 0.01 0.005 0.002 0.001 n’

P(1): 0.25 0.1 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005

1 1 3.078 6.314 12.706 31.821 63.657 127.321 318.309 636.619

2 0.816 1.886 2.92 4.30

3 6.965 9.925 14.089 22.327 31.599

3 0.765 1.638 2.353 3.182 4.541 5.841 7.453 10.215 12.924

4 0.741 1.533 2.132 2.776 3.747 4.604 5.598 7.173 8.61

5 0.727 1.47

6 2.015 2.571 3.365 4.032 4.773 5.893 6.869

6 0.718 1.44 1.943 2.44

7 3.143 3.707 4.317 5.20

8 5.959

7 0.711 1.415 1.895 2.365 2.998 3.499 4.029 4.785 5.408

8 0.706 1.397 1.86 2.306 2.896 3.355 3.833 4.501 5.041

9 0.703 1.383 1.833 2.262 2.821 3.25 3.69 4.297 4.781

10 0.7 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587

11 0.697 1.363 1.796 2.201 2.718 3.106 3.497 4.025 4.437

12 0.695 1.356 1.782 2.179 2.681 3.055 3.428 3.93 4.318

13 0.694 1.35 1.771 2.16 2.65 3.012 3.372 3.852 4.221

14 0.692 1.345 1.761 2.145 2.624 2.977 3.326 3.787 4.14

15 0.691 1.341 1.753 2.131 2.602 2.947 3.286 3.733 4.073

16 0.69 1.337 1.746 2.12 2.583 2.921 3.252 3.686 4.015

17 0.689 1.333 1.74 2.11 2.567 2.898 3.222 3.646 3.965

18 0.688 1.33 1.734 2.101 2.552 2.878 3.197 3.61 3.922

19 0.688 1.328 1.729 2.093 2.539 2.861 3.174 3.579 3.883

20 0.687 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.85

21 0.686 1.323 1.721 2.08 2.518 2.831 3.135 3.527 3.819

22 0.686 1.321 1.717 2.074 2.508 2.819 3.119 3.505 3.792

23 0.685 1.319 1.714 2.069 2.5 2.807 3.104 3.485 3.768

24 0.685 1.318 1.711 2.064 2.492 2.797 3.091 3.467 3.745

25 0.684 1.316 1.708 2.06 2.485 2.787 3.078 3.45 3.725

26 0.684 1.315 1.706 2.056 2.479 2.779 3.067 3.435 3.707

27 0.684 1.314 1.703 2.052 2.473 2.771 3.057 3.421 3.69

28 0.683 1.313 1.701 2.048 2.467 2.763 3.047 3.408 3.674

29 0.683 1.311 1.699 2.045 2.462 2.756 3.038 3.396 3.659

30 0.683 1.31 1.697 2.042 2.457 2.75 3.03 3.385 3.646

31 0.682 1.309 1.696 2.04 2.453 2.744 3.022 3.375 3.633

32 0.682 1.309 1.694 2.037 2.449 2.738 3.015 3.365 3.622

33 0.682 1.308 1.692 2.035 2.445 2.733 3.008 3.356 3.611

34 0.682 1.307 1.091 2.032 2.441 2.728 3.002 3.348 3.601

35 0.682 1.306 1.69 2.03 2.438 2.724 2.996 3.34 3.591

36 0.681 1.306 1.688 2.028 2.434 2.719 2.99 3.333 3.582

37 0.681 1.305 1.687 2.026 2.431 2.715 2.985 3.326 3.574

38 0.681 1.304 1.686 2.024 2.429 2.712 2.98 3.319 3.566

39 0.681 1.304 1.685 2.023 2.426 2.708 2.976 3.313 3.558

40 0.681 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551 50 0.679 1.299 1.676 2.009 2.403 2.678 2.937 3.261 3.496 60 0.679 1.296 1.671 2 2.39 2.66 2.915 3.232 3.46 70 0.678 1.294 1.667 1.994 2.381 2.648 2.899 3.211 3.436 80 0.678 1.292 1.664 1.99 2.374 2.639 2.887 3.195 3.416 90 0.677 1.291 1.662 1.987 2.368 2.632 2.878 3.183 3.402 100 0.677 1.29 1.66 1.984 2.364 2.626 2.871 3.174 3.39 200 0.676 1.286 1.653 1.972 2.345 2.601 2.839 3.131 3.34 500 0.675 1.283 1.648 1.965 2.334 2.586 2.82 3.107 3.31 1000 0.675 1.282 1.646 1.962 2.33 2.581 2.813 3.098 3.3 ∞0.6745 1.2816 1.6449 1.96 2.3263 2.5758 2.807 3.0902 3.2905

x2检验练习题

2χ检验 练 习 题 一、单项选择题 1. 利用2χ检验公式不适合解决的实际问题是 A. 比较两种药物的有效率 B. 检验某种疾病与基因多态性的关系 C. 两组有序试验结果的药物疗效 D. 药物三种不同剂量显效率有无差别 E. 两组病情“轻、中、重”的构成比例 2.欲比较两组阳性反应率, 在样本量非常小的情况下(如1210,10n n <<), 应采用 A. 四格表2χ检验 B. 校正四格表2χ检验 C. Fisher 确切概率法 D. 配对2χ检验 E. 校正配对2χ检验 3.进行四组样本率比较的2χ检验,如22 0.01,3χχ>,可认为 A. 四组样本率均不相同 B. 四组总体率均不相同 C. 四组样本率相差较大 D. 至少有两组样本率不相同 E. 至少有两组总体率不相同 4. 从甲、乙两文中,查到同类研究的两个率比较的2χ检验,甲文22 0.01,1χχ>,乙文22 0.05,1χχ>,可认为 A. 两文结果有矛盾 B. 两文结果完全相同 C. 甲文结果更为可信 D. 乙文结果更为可信 E. 甲文说明总体的差异较大 5. 两组有效率比较检验功效的相关因素是 A. 检验水准和样本率 B. 总体率差别和样本含量 C. 样本含量和样本率 D. 总体率差别和理论频数 E. 容许误差和检验水准

答案:C C E C B 二、计算与分析 1.某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义 2.某医院研究中药治疗急性心肌梗死的疗效,临床观察结果见下表。问接受两种不同疗法的患者病死率是否不同 两种药治疗急性心肌梗死的疗效 组别存活死亡合计病死率(%) 中药组65368 非中药组12214 合计77582 3.某医师观察三种降血脂药A,B,C的临床疗效,观察3个月后,按照患者的血脂下降程度分为有效与无效,结果如下表,问三种药物的降血脂效果是否不同 三种药物降血脂的疗效 药物有效无效合计 A12025145 B602787 C402262 4.为研究某补钙制剂的临床效果,观察56例儿童,其中一组给与这种新药,另一组给与钙片,观察结果如表,问两种药物预防儿童的佝偻病患病率是否不同 表两组儿童的佝偻病患病情况 组别病例数非病例数合计患病率(%) 新药组83240

x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算 x2检验(chi-square test)或称卡方检验 x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理的比较)两类。 一、四格表资料的x2检验 例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如表 20-11,问两种疗法有无差别? 表20-11 两种疗法治疗卵巢癌的疗效比较 表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为: 式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。

检验步骤: 1.建立检验假设: H0:π1=π2 H1:π1≠π2 α=0.05 2.计算理论数(TRC),计算公式为: TRC=nR.nc/n 公式(20.13) 式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC为与理论数同列的合计数,n为总例数。 第1行1列: 43×53/87=26.2 第1行2列: 43×34/87=16.8 第2行1列: 44×53/87=26.8 第2行2列: 4×34/87=17.2 以推算结果,可与原四项实际数并列成表20-12: 表20-12 两种疗法治疗卵巢癌的疗效比较

t检验和x2检验doc

---------------------------------------------------------------最新资料推荐------------------------------------------------------ t检验和x2检验doc 实验一 t-检验实验目的及要求掌握利用Excel 数据分析中提供t-检验工具进行假设检验的方法,并能够解释实验结果。 实验内容及步骤例1-7: 双样本等均值检验是在一定置信水平之下, 在两个总体方差相等的假设之下,检验两个总体均值的差值等于指定平均差的假设是否成立的检验。 假设某工厂为了比较两种装配方法的效率,分别组织了两组员工,每组9 人,一组采用新的装配方法,另外一组采用旧的装配方法。 18个员工的设备装配时间图1-18 中表格所示。 根据以下数据,是否有理由认为新的装配方法更节约时间?图1-18 操作步骤: STEP1: 选择工具菜单的数据分析子菜单,双击t-检验: 双样本等方差假设选项,则弹出图1-19 所示对话框。 (注: 如果没有数据分析,则请加载分析工具库加载宏。 操作方法: 在工具菜单上,单击加载宏。 在可用加载宏列表中,选中分析工具库框,再单击确定。 如果必要,请按安装程序中的指示进行操作。 1 / 5

) 2)在数据分析对话框中,单击t-检验,再单击确定。 3)在出现的对话框中,设置所需的参数。 图1-19 STEP2: 分别填写变量1 的区域: $B$1: $B$10,变量2 的区域: $D$1: $D$10,由于我们进行的是等均值的检验,填写假设平均差为0,由于数据的首行包括标志项选择标志选项,所以选择标志选项,再填写显著水平为0. 05, 然后点击确定按扭。 则可以得到图1-20所示的结果。 图1-20 结果分析: 如图1-20中所示,表中分别给出了两组装配时间的平均值、方差和样本个数。 其中,合并方差是样本方差加权之后的平均值, Df 是假设检验的自由度它等于样本总个数减2, t 统计量是两个样本差值减去假设平均差之后再除于标准误差的结果, P(T=t) 单尾是单尾检验的显著水平, t 单尾临界是单尾检验t 的临界值, P(T=t) 双尾是双尾检验的显著水平, t 双尾临界是双尾检验t 的临界值。 由下表的结果可以看出t 统计量均小于两个临界值,所以,在5%显著水平下,不能拒绝两个总体均值相等的假设,即两种装配方法所耗时间没有显著的不同。 Excel 中还提供了以下类似的假设检验的数据分析工具,它们的名称和作用如下:

X2检验

X2检验 X2检验是用途广泛的假设检验方法,它的原理是检验实际分布和理论分布的吻合程度。主要用途有:两个及以上样本率(或构成比)之间差异比较,推断两变量间有无相关关系,检验频数分布的拟合优度。X2检验类型有:四格表资料X2检验(用于两样本率的检验),行×列表X2检验(用于两个及两个以上样本率或构成比的检验), 行×列列联表X2检验(用于计数资料的相关分析)。在SPSS中,所有X2检验均用Crosstabs完成。 Crosstabls过程用于对计数资料和有序分类资料进行统计描述和统计推断。在分析时可以产生二维至n维列联表,并计算相应的百分数指标。统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)。如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies 过程实现。 界面说明 【Rows框】 用于选择行*列表中的行变量。 【Columns框】 用于选择行*列表中的列变量。 【Layer框】 Layer指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置。如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层。Layer在这里用的比较少,在多元回归中我们将进行详细的解释。 【Display clustered bar charts复选框】 显示重叠条图。 【Suppress table复选框】 禁止在结果中输出行*列表。 【Statistics】按钮

χ2检验

表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。这里可通过检验来区别其差异有无统计学意义,检验的基本公式为: 式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表20-11资料为例检验如下。 检验步骤: 1.建立检验假设: H0:π1=π2 H1:π1≠π2 α=0.05 2.计算理论数(TRC),计算公式为: 公式(20.13)

因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直接求出,示范如下: T1.1=26.2 T1.2=43-26.2=16.8 T2.1=53-26.2=26.8 T2.2=44-26.2=17.2 3.计算值按公式20.12代入 4.查值表求P值 在查表之前应知本题自由度。按检验的自由度 ν=(行数-1)?(列数-1) 则该题的自由度ν=(2-1)(2-1)=1,查界值表(附表20-1),找到(1)=6.63,而本题=10.01即>(1),P<0.01,差异有高度统计学意义,按α=0.05水准,拒绝H0,可以认为采用化疗加放疗治疗卵巢癌的疗效比单用化疗佳。 通过实例计算,读者对卡方的基本公式有如下理解:若各理论数与相应实际数相差越小,值越小;如两者相同,则值必为零,而永远为正值。又因为每一对理论数和实际数都加入值中,分组越多,即格子数

x2检验

x2检验 x2检验亦称卡方检验。统计学中假设检验的方式之一。x是一个希腊字母,x2可读音为卡方,所以译为卡方检验。卡方检验主要用于定类或定序变量的假设检验,在社会统计中应用非常广泛。 卡方检验的步骤一般为: (1)建立假设,确定显著水平a与自由度df、查x2值表得到否定域的临界值; (2)由样本资料计算x2值; (3)将计算所得的x2值与临界x2值(负值都取绝对值)作比较,若计算值大于临界值,则否定Ⅱ0;反之,则承认Ⅱ0。 计算卡方值的公式一般可表示为:x2=∑[(fo—fc)2/fc] 式中:fo表示实际所得的次数,fc表示由假设而定的理论次数,∑为加总符号。 x2检验对于定类与定类或定类与定序变量之间的相关检验应用较多。 相关检验又称独立性检验。进行相关检验时,要先根据交互分类表中的边缘次数分配来计算出各格中的理论次数fcij。计算理论次数的一般公式为:fcij=Fxi·Fyi/n 式中,Fxi表示x变量各类别的边缘次数分配,Fyj表示y变量各类别的边缘次数分配,n为总次数。 例如对下面的2×2表:xi/x1 x2fc11=Fx1·Fy1/nfc12=Fx1·Fy2/nfc21=Fx2·Fy1/nfc22=Fx2·Fy2/n 对于其它形式交互分类表如2×3表、3×2表,3×3表可依上面的方法分别计算它们的理论次数。现对如下资料进行相关检验。 性别与最大志愿的关系 第一步,根据已有资料建立对总体的假设:Ⅱ1:性别与最大志愿相关Ⅱ0:性别与最大志愿不相关确定a≤0. 01,查x2值表得x2 0.01(1≥ 6. 635 ,x2 0.01 (1)下标中的(1)表示自由度为1,因为在上面的2×2表中,df = (2—1)×(2—1)=1; 第二步,根据样本资料计算x2值,因为: fc11=80×74/164=36.1fc12=80×90/164=43.9fc21=84×74/164=37.9fc22=84×90/164=46.1所以,第三步,进行比较,因为x2= 47.3 > X0.01(1)=6. 635所以否定对于总体的虚无假设而肯定研究假设,即总体中,性别与最大志愿是相关的。 X2检验还可用于检验总体的次数分配是否属于正态分布及进行成对资料的符号检验、两组或两组以上资料的中位数检验等。

x2检验

第四章x2检验 一.本章教学简介 本章介绍第二个统计推断工具,非参数检验类的X2检验,内容包括X2检验的性质、原理、类型、方法和应用。 本章重点是X2检验两种类型的应用,难点是X2检验的原理。 本章要求学员学习后能了解X2检验的性质和原理,掌握X2检验的生物学应用,能熟练使用计算器解题,有条件的学员能用电脑SPSS操作,并将结果进行比较。 教材提示:教材77-85页详细阅读。 二.本章教学内容 一.适用特征和功效 1.适用特征: (1)样本资料为非连续性变量(离散量资料,或称计数性资料); (2)总体分布未知; (3)非参数性检验,而是分布性检验。 2.功效: 基于非连续性变量(即计数性资料)的非参数检验。 说明:对质量性状的资料研究常用方法,比数量性状资料研究难。 x2检验,平均数对它无意义,属于非参数性的属性检验,适合对质量性状的检验,对原始数据的要求比t检验低,原始数据即观察数往往只是归类计数的频次,都是整数,无分数小数。 二.类型 1.适合性(符合性,拟合优度)检验:判断Oi与Ei是否一致。 2.独立性检验:通过Oi与Ei是否一致来判断因素之间是否独立。 三.原理和方法 ㈠适合性检验 Oi :观察数(实际数) Ei :期望数(理论数) 适合性检验就是检验Oi与Ei是否一致(即是否有显著差异),解决Oi与Ei是否在统计学意义上相等的问题。 适合性检验的方法也是典型的统计检验“五步法”。 1.H0(无效假设):Oi=Ei (或Oi-Ei=0) 2.建立适当的分布(x2分布)并计算: x2c =∑(Oi-Ei)2/Ei df=n-1 适合性检验中df等于相加项数-1 3.查表:x20.05(df)= ? x20.01(df)= ? 4.比较: (1)当x2c〈x20.05,接受H0, Oi与Ei无显著差异,P>0.05 (2)当x20.05〈x2c〈x20.01,拒绝H0 ,Oi与Ei有显著差异,P<0.05 (3)当x2c〉x20.01,拒绝H0 ,Oi与Ei有极其显著差异,P<0.01

X2检验

第七章 X2检验 Chi-square test X2分布——计数资料 第一节四格表资料的X2检验 一、X2检验的基本思想 1、X2分布 (1)X2分布是一种连续型分布:X2分布(chi-square distribution)只有一个参数,即自由度。 当自由度V《2时,曲线呈L形 随着V的增加,曲线逐渐趋于对称 当自由度V—00无穷时,X2分布趋近正态分布 (2)X2分布的一个基本性质是它的可加性:(X1+X2)——X2 (V1+V2) (3)X2 分布的界值:X2值愈大,P值愈小;反之,X2值愈小,P值愈大。 2、X2检验的基本思想 四格表(fourfold table)资料 PearsonX2——X2={Σ(A-T)2/T } V =(行数-1)(列数-1) A为实际频数(actual frequency) T为理论频数(theoretical frequency)——根据检验假设H0:π1=π2确定的。 T(RC)=nRnC/n T(RC)为第R行(row)第C列(column)的理论频数, nR为相应行的合计,nC为相应列的合计,n为总列数。 X2值反映了实际频数与理论频数的吻合程度。 3、X2检验的步骤 H0::π1=π2,即试验组与对照组——总体有效率相等 H1::π1≠π2,即——————————————不等 ɑ=0.05 ——T值——V——P值 二、四格表资料X2检验的专用公式 X2=(ad-bc)2n/(a+b)(a+c)(d+b)(d+c) a,b,c,d为四格表的实际频数;(a+b)(a+c)(d+b)(d+c)是周边合计数;n为总例数,n=a+b+c+d. 四格表资料X2检验的校正公式 三、X2C=(Iad-bcI-n/2)2n/(a+b)(a+c)(d+b)(d+c) (1)当n》40且所有的T》5时,用X2检验的基本公式或四格表资料X2检验的专有公式;(2)当n》40但有1《T《5时,用四格表资料X2检验的校正公式。 (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 第二节配对四格表资料的X2检验 计数资料的配对设计常用于两种检验方法、培养方法、诊断方法的比较。 其特点是对样本中各观察单位分别用两种方法处理,然后观察两种处理方法的某两分类变量的计数结果。 检验假设McNemar test X2=(b-c)2/b+c . V=1 ————(b+c)》40 X2=(Ib-cI-1)2/b+c ,v=1 ————(b+c)<40 一般用于样本含量不太大的资料。 检验步骤:

相关主题
相关文档 最新文档