当前位置:文档之家› (新)高中数学第一章统计案例1_1独立性检验卡方检验素材新人教B版选修1-21

(新)高中数学第一章统计案例1_1独立性检验卡方检验素材新人教B版选修1-21

(新)高中数学第一章统计案例1_1独立性检验卡方检验素材新人教B版选修1-21
(新)高中数学第一章统计案例1_1独立性检验卡方检验素材新人教B版选修1-21

2

χ

检验

(一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2

χ检验。

(1) 四格表2

χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2

χ检验。 3. 行?列表的2

χ检验。 (二) 熟悉内容

频数分布拟合优度的2

χ检验。 (三) 了解内容 1.2

χ分布的图形。

2.四格表的确切概率法。

(一) 2χ检验的用途

2χ检验(Chi-square test )用途较广,主要用途如下:

1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2

χ检验的基本思想

1.2

χ检验的基本思想是以2

χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2

χ值不应该很大,若实际计算出的2

χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。

2. 基本公式:()∑

-=

T

T A 2

2

χ,A 为实际频数(Actual Frequency ),T 为理论频数

(Theoretical Frequency )。四格表2

χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2

χ值是一致的。

(三)率的抽样误差与可信区间 1.率的抽样误差与标准误

样本率与总体率之间存在抽样误差,其度量方法:

n

p )

1(ππσ-=

,π为总体率,或 (8-1)

n

p p S p )

1(-=

, p 为样本率; (8-2)

2.总体率的可信区间

当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2

χ检验的基本计算

见表8-1。

表8-1 2

χ检验的用途、假设的设立及基本计算公式

资料形式 用途 0H 、1H 的设立与计算公式

自由度 四格表

①独立资料两 样本率的比较

②配对资料两 样本率的比较

0H :两总体率相等 1H :两总体率不等

①专用公式

))()()(()(22

d b c a d c b a n

bc ad ++++-=χ

②当n ≥40但1≤T<5时,校正公式

)

)()()(()2/(2

2

d b c a d c b a n n bc ad ++++--=

χ ③配对设计c

b c b +--=

2

2

)1(χ

1

R ?C 表

①多个样本率、 构成比的比较

②两个变量之 间关联性分析 0H :多个总体率(构成比)相等

(0H :两种属性间存在关联)

1H :多个总体率(构成比)不全相等 (0H :两种属性间存在关联)

)1(

2

2

-=∑

C

R n n A n χ

(R-1)(C-1)

频数分布表

频数分布的拟合优度检验

0H :资料服从某已知的理论分布 1H :资料不服从某已知的理论分布

-T

T A 2

)(

据频数表的组数而定

(五)四格表的确切概率法

当四格表有理论数小于1或n <40时,宜用四格表的确切概率法。

(六)2χ检验的应用条件及注意事项

1.分析四格表资料时,应注意连续性校正的问题,当140时,用连续性校正

2

χ检验;T ≤1,或n ≤40时,用Fisher 精确概率法。

2.对于R ?C 表资料应注意以下两点:

(1)理论频数不宜太小,一般要求:理论频数<5的格子数不应超过全部格子的1/5; (2)注意考察是否有有序变量存在。对于单向有序R ?C 表资料,当指标分组变量是有序的时,宜用秩和检验;对于双向有序且属性不同的R ?C 表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R ?C 表资料,为考察两种方法检测的一致性,应选用Kappa 检验。

典型试题分析

(一)单项选择题

1.下列哪项检验不适用2

χ检验( )

A . 两样本均数的比较

B . 两样本率的比较

C . 多个样本构成比的比较

D . 拟合优度检验 答案:A

[评析] 本题考点:2

χ检验的主要用途。2

χ检验不能用于均数差别的比较。 2.分析四格表时,通常在什么情况下需用Fisher 精确概率法( )

A .140

B .T <5

C .T 1≤或n 40≤

D .T 1≤或n 100≤ 答案: C

[评析] 本题考点:对于四格表,当T 1≤或n 40≤时,不宜用2

χ检验,应用Fisher 精确概率法。

3.2

χ值的取值范围为

A .∞-<2

χ<∞+ B .+∞≤≤2

0χ C .12

≤χ D .02

≤≤∞-χ

答案: B

[评析]根据2χ分布的图形或2χ的基本公式可以判断2

χ值一定是大于等于零且没有上界的,故应选B 。

(二)是非题 两样本率的比较可以采用2

χ检验,也可以采用双侧u 检验。 答案:正确。

[评析]就两个样本率的比较而言,双侧u 检验与2

χ检验是等价的。 (三)简答题

1.四格表的2

χ检验和u 检验有何联系与区别?

答案:相同点:凡是能用u 检验进行的两个率比较检验的资料,都可用2

χ检验,两者是等价的,即2

2

χ=u ;相异点:(1)u 检验可进行单侧检验;(2)满足四格表u 检验的资料,

计算两个率之差的可信区间,可从专业上判断两率之差有无实际意义;(3)2

χ检验可用于2?2列联表资料有无关联的检验。

2.R ?C 表2

χ检验的适用条件及当条件不满足时可以考虑的处理方法是什么? 答案:R ?C 表2χ检验的适用条件是理论频数不宜过小,否则有可能产生偏性。当条件不满足时有三种处理方法:①增大样本例数使理论频数变大;②删去理论数太小的行或列;③将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论频数变大。但②、③法都可能会损失信息或损害样本的随机性,因此应慎用。

(四)计算题

1.为研究静脉曲张是否与肥胖有关,观察122对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。

表8-2 122对同胞兄弟静脉曲张发生情况

正常体重 肥胖

合计 发生 未发生 发 生

19 5 24 未发生 12 86 98 合 计

31 91

122

[评析]这是一个配对设计的资料,因此用配对2

χ检验公式计算。 H 0:肥胖者与正常体重者的静脉曲张发生情况无差别 H 1:肥胖者与正常体重者的静脉曲张发生情况不同 05.0=α c

b c b +--=

2

2)1(χ=

()12.212

511252

=+--,1=ν

2χ=2.11<2

1,05.0χ,P >0.05,尚不能认为静脉曲张与肥胖有关。

2.某卫生防疫站在中小学观察三种矫正近视眼措施的效果,近期疗效数据见表8-3。试对这三种措施的疗效作出评价。

表8-3 三种措施的近期有效率比较 矫治方法 有效人数 无效人数 合计

有效率(%)

夏天无眼药水 51 84 135 37.78 新医疗法 6 26 32 18.75 眼保健操 5 13 18 27.78 合计

62 123 185

33.51

[评析]

0H :三种措施有效率相等

1H :三种措施有效率不相等或不全相等 05.0=α

)1(2

2

-=∑c

r n n A n χ=185?

?

??

? ??-?+?+?+?+?+?1181231318625321232632626135123841356251222222=4.498,ν=(2-1)(3-1)=2

查表得0.25>P >0.10,按0.05α=水准不拒绝0H ,尚不能认为三种措施有效率有差别。 3.某医院以400例自愿接受妇科门诊手术的未产妇为观察对象,将其分为4组,每组100例,分别给予不同的镇痛处理,观察的镇痛效果见表8-4,问4种镇痛方法的效果有无差异?

表8-4 4种镇痛方法的效果比较 镇痛方法 例数 有效率(%) 颈麻 100 41 注药 100 94 置栓 100 89 对照 100 27

[评析] 为了应用2

χ检验,首先应计算出有效和无效的实际频数,列出计算表,见表8-5。

表8-5 4种镇痛方法的效果比较

镇痛方法 有效例数 无效例数 合计 颈麻 41 59 100 注药 94 6 100 置栓 89 11 100 对照 27 73 100 合计 251 149 400 0H :4种镇痛方法的效果相同 1H :4种镇痛方法的效果不全相同

05.0=α

)1(22

-=∑c r n n A n χ=400???

? ??-?++?+??110014973...1001495910025141222=146.175, ν=(4-1)(2-1)=3

查表得P <0.05,按0.05α=水准拒绝0H ,接受1H ,即4种镇痛方法的效果不全相同。

四、习 题

(一) 单项选择题

1. 关于样本率p 的分布正确的说法是: A . 服从正态分布 B . 服从2

χ分布

C . 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布

D . 服从t 分布 2. 以下说法正确的是: A . 两样本率比较可用u 检验 B . 两样本率比较可用t 检验 C . 两样本率比较时,有2

χ=u D . 两样本率比较时,有22

χ=t 3. 率的标准误的计算公式是: A .

)1(p p - B .

n p p )

1(- C.1-n p D.

n

p p )

1(- 4. 以下关于2χ检验的自由度的说法,正确的是: A .拟合优度检验时,2-=n ν(n 为观察频数的个数) B .对一个43?表进行检验时,11=ν C .对四格表检验时,ν=4

D .若2

,05.02,05.0ηνχχ>,则ην>

5. 用两种方法检查某疾病患者120名,甲法检出率为60%,乙法检出率为50%,甲、乙法一致的检出率为35%,问两种方法何者为优?

A .不能确定

B .甲、乙法一样

C .甲法优于乙法

D .乙法优于甲法 6.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,适当的方法是:

A .分性别比较

B .两个率比较的2χ检验

C .不具可比性,不能比较

D .对性别进行标准化后再做比较 7.以下说法正确的是

A .两个样本率的比较可用u 检验也可用2χ检验

B .两个样本均数的比较可用u 检验也可用2χ检验

C .对于多个率或构成比的比较,u 检验可以替代2χ检验

D .对于两个样本率的比较,2χ检验比u 检验可靠 (二) 名词解释

1. 实际频数与理论频数 2. 2χ界值表 3. 拟合优度 4. 配对四格表

5. 双向有序分类资料 6. 率的标准误

7. 多个率的两两比较 8. Fisher 精确概率 9. McNemar 检验 10. Yates 校正 (三) 是非题

四个样本率做比较,2

)3(05.02χχ> ,可认为各总体率均不相等。

(四) 计算题

1.121名前列腺癌患者中,82名接受电切术治疗,术后有合并症者11人;39名接受开放手术治疗,术后有合并症1人。试分析两种手术的合并症发生率有无差异?

2.某厂在冠心病普查中研究冠心病与眼底动脉硬化的关系,资料见表8-6。问两者是否存在一定的关系?

表8-6 冠心病诊断结果与眼底动脉硬化级别的关系 眼底动脉硬化级别 冠心病诊断结果

合计 正常 可疑 冠心病 0 340 11 6 357

I 73 13 6 92 II 97 18 18 133 III 3 2 1 6 合计 513 44 31

588

3.表8-7是用两种方法检查已确诊的乳腺癌患者120名的检查结果,问:两种方法何者为优?

表8-7 两种方法检查结果比较

乙法 甲法

合计

+ - +

42 18 60 - 30 30 60 合计

72 48 120

4.用噬菌体治疗小儿细菌性痢疾结果见表8-8,问两组阴转率有无显著差异?

表8-8 两种方法检查结果比较 组 别

观察人数 粪见检阴性人数 阴转率(%)

试验组 29 25 86.2 对照组 28 17 60.7 合 计 57 42

73.7

5.某医院用冠心2号方治疗心绞痛患者,经三个月疗程后,疗效见表8-9,问三个疗程组的有效率之间有无显著差异?

表8-9 冠心2号方治疗心绞痛的有效率

疗 程

例数 有效例数 有效率(%) 一疗程 110 82 74.5 二疗程 150 130 86.7 三疗程 63 56 88.9 合 计

323 268 83.0

6.某医院比较急性黄疸型肝炎与正常人在超声波波型上的表现,见表8-10。问两组肝

波型的差异有无显著性?

表8-10 急性黄疸型肝炎与正常人的超声波波形

组别波型

合计

正常可疑较密

黄疸型肝炎组12 43 232 287

正常人组277 39 11 327 合计289 82 243 614

7.有人研究惯用手与惯用眼之间是否存在一定关系,得资料如表8-11,试作统计分析。

表8-11 冠心2号方治疗心绞痛的有效率

惯用左眼两眼并用惯用右眼合计惯用左手34 62 28 124 两手并用27 28 20 75

惯用右手57 105 52 214

合计118 195 100 413

8.苏格兰西南部两个地区献血人员的血型记录如下表(表8-12),问两地的血型分布是否相同?

表8-12 两个地区献血人员的血型分布

地区血型

合计

A B O AB

Eskdale 33 6 56 5 100

Annandale 54 14 52 5 125 合计87 20 108 10 225

五、习题答题要点

(一)单项选择题

1.C

2.A

3.D

4.D

5.A

6.D

7.A

(二)名词解释

1.实际频数:actual frequency,即实际观察值。理论频数:theoretical frequency,在假设多个率或构成比相等的前提下,由合计率(构成比)推算出来的频数。

χ界值表:将2χ分布右侧尾部面积等于α时所对应的2χ值称为2χ分布的临界值,2.2

χ界值表。

对于不同的自由度及α有不同的临界值,由这些临界值构成的表即2

3.拟合优度:goodness of fit,指一种度量某事物的频数分布是否符合某一理论分布或数据是否与模型吻合的方法。

4.配对四格表:为了控制随机误差而采用配对设计方案,将条件相似的两个受试对象配成一对,然后随机地让其中一个接受A处理,另一个接受B处理,每种处理的反应都按二项分类。全部n对实验结果的资料以表8-12表示,这样的表称为配对四格表。

表8-12 配对四格表的形式 A 处理 B 处理 + - + a b -

c

d

5. 双向有序分类资料:对于R ?C 表资料,当两个定性变量都有序时,这样的资料称为双向有序分类资料,如“急性放射病分度与放射烧伤面积占不同体表面积的百分比”,这里的两个变量均为有序的。

6. 率的标准误:用以衡量由于抽样引起的样本率与总体率之间的误差的统计量,记为

P σ。n

p )

1(ππσ-=

,π为总体率,n 为样本容量;当总体率π未知时,以样本率P 作为π

的估计值,率的标准误为n

p p S p )

1(-=

。 7. 多个率的两两比较:指当假设检验确定了多个率之间存在差别后,检验哪两个两个样本率之间的差别具有统计学意义的方法。

8. Fisher 精确概率: 指当四格表中出现理论数小于1或n <40时,用R.A.Fisher (1934)提出的方法直接计算出的有利于拒绝H 0的概率。

9. McNemar 检验:McNemar’s test for correlated proportions,是分析配对四格表资料的方法,其计算公式为c

b c b +--=

2

2

)1(χ,v =1。

10.Yates 校正:英国统计学家Yates F 认为,由于2χ分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的2χ值不连续,尤其是自由度为1的四格表,求出的概率P 值可能偏小,此时需对2χ值作连续性校正(correction of continuity ),这一校正即所谓的Yates 校正(Yates’ correction)。

(三) 是非题

错。多个样本率做比较时,H 1为各总体率不全相等,所以当接受H 1时,并不能说明各总体率均不相等。

(四) 计算题:

1.将资料整理成四格表

手术方法 合并症

电切术 开放手术

用四格表校正公式算得37.22=χ,P >0.05,尚不能认为两种手术的合并症发生率有差异。 2.该资料属双向有序分类资料,用2χ检验解决。

H 0: 冠心病诊断结果与眼底动脉硬化级别无关联 H 1: 冠心病诊断结果与眼底动脉硬化级别有关联

05.0=α

2χ=61.59, 2χ<2

6,01.0χ,P <0.05,

按05

α水准拒绝H0接受H1,故可认为冠心病与眼底动脉硬化有关联。

.0

=

3.采用配对2

χ检验。

H0:两法不分优劣

H1: 两法能分优劣05

α

.0

=

2

α水准不拒绝H0,尚不能认为检出率有差别。

χ=3.00,按05

.0

=

4.可用u检验或2χ检验。用2χ检验时,首先将资料整理成四格表形式,然后再代入

α水准拒绝H0接受H1,认为两组阴转率差别有统计学意义。公式。算得2

χ=4.774,按05

=

.0

α水准拒绝H0接受5.用R?C表2χ检验公式算得2χ=8.539,v=2,P<0.05,,按05

=

.0

H1,三个疗程有效率的差异有统计学意义。

α水准拒绝H0接6.用R?C表2χ检验公式算得2χ=443.456,v=2,P<0.05,,按05

=

.0

受H1,两组肝波型的差异有统计学意义。

α水准不拒绝H0,尚不能认7.由2

χ检验公式算得2χ=4.020,v=4,P>0.05,,按05

=

.0

为惯用手与惯用眼之间存在关系。

8.本例只有一个格子的理论频数小于5,故仍可用2

χ检验。2χ=5.710,v=3,P>0.05,,α水准不拒绝H0,尚不能认为两地的血型分布不同。

按05

.0

=

高中数学第三章统计案例3.1独立性检验假设检验(hypothesistesting素材苏教版选修2_3202012251102

假设检验(hypothesis testing) 方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA) ?概述 假设检验是分析数据的一种方法。回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?” 最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。最有名的分布就是正态分布,它是:检验的基础。t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。 ?适用场合 ·想知道一组或更多组数据的平均值、比例、方差或其他特征时; ·当结论是基于更大总体中所取得的样本时。 例如: ·想确定一个过程的均值或方差有否改变; ·想确定很多数据集的均值或方差是否不同: ·想确定两组不同的数据集的比例是否不同; ·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。 ?实施步骤 假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。 如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。这些定义解释了假设检验的慨念,然后再回来看这个步骤。 本书不可能详细地涉及假设检验。这个步骤是个综述和快速参考。要得到更多的信息,查阅统计学参考书或请教统计学家。 1确定要从数据中获得的结论。选择适当的检验方法。用哪种检验取决于检验的目的和数据的种类。可以用表5.7和表5.8概括的常用的假设检验,或者请教统计学家以得到帮助。 2建立零假设和备择假设。确定问题是属于双尾检验、左尾检验还是右尾检验。 3选择显著性水平。。 4计算检验统计量,可借助计算机软件。 5用统计分布的统计表或计算机程序等来确定检验统计量的P值。对于z检验可用表A.1正态曲线以下的曲线。 6把P值与左尾或右尾检验的α或者双尾检验的α/2作比较,如果P值较小,那么拒绝零假设并会得到备择假设可能正确的结论。否则,不能拒绝零假设,并得出没有足够证据支持备择假设的结论。 ?备择步骤 步骤1~4同上。然后: 5用统计表或计算机程序确定如下所示的检验统计量的临界值和拒绝域。以z检验作为示例,对t检验、F检验或卡方检验,用统计量f、F或χ2来替换z。 6比较检验统计量和拒绝域。如果检验统计量值落在拒绝域内,拒绝零假设,结论是备择假设可能止确。否则,不拒绝零假设,结论是没有足够的证据支持备择假设。 ?示例:t检验

2020_2021学年高中数学课时素养评价三1.2.2~1.2.4独立性检验独立性检验的基本思想独立

课时素养评价三独立性检验独立性检验的基本思想独立性检验 的应用 (20分钟·50分) 一、选择题(每小题5分,共20分) 1.经过对χ2的研究,得到了若干个临界值,当χ2≤ 2.706时,我们认为事件A与B ( ) A.有95%的把握认为A与B有关系 B.有99%的把握认为A与B有关系 C.没有充分理由说明事件A与B有关系 D.不能确定 【解析】选C.当χ2>2.706时,有90%以上的把握说明A与B有关系,但当χ2≤2.706时,只能说明A与B是否有关系的理由不够充分. 2.利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得χ2≈7.245,参照下表:得到的正确结论是( ) P(χ2≥x0) 0.01 0.05 0.025 0.010 0.005 0.001 x0 2.706 3.841 5.024 6.635 7.879 10.828 A.有99%以上的把握认为“爱好该项运动与性别无关” B.有99%以上的把握认为“爱好该项运动与性别有关” C.有95%的把握认为“爱好该项运动与性别有关” D.有95%的把握认为“爱好该项运动与性别无关” 【解析】选B.由χ2≈7.245>6.635,可得有99%以上的把握认为“爱好该项运动与性别有关”. 3.为了研究性格和血型的关系,抽查80人试验,血型和性格情况如下:O型或A型者是内向型的

有18人,外向型的有22人,B型或AB型是内向型的有12人,外向型的有28人,则有多大的把握认为性格与血型有关系( ) A.95% B.99% C.没有充分的证据显示有关 D.1% 【解析】选C. χ2=错误!未找到引用源。=1.92<2.706,所以没有充分的证据显示有关. 4.以下关于独立性检验的说法错误的是( ) A.独立性检验依赖小概率原理 B.独立性检验得到的结论一定正确 C.样本不同,独立性检验的结论可能有差异 D.独立性检验不是判定两事物是否相关的唯一方法 【解析】选B.受样本选取的影响,独立性检验得到的结论不一定正确. 二、填空题(每小题5分,共10分) 5.以下三个命题中:①在回归分析中,可用相关系数r的值判断模型的拟合效果,|r|(|r|≤1)越大,模拟的拟合效果越好;②在一组样本数据(x1,y1),(x2, y2),…,(x n,y n)(n≥2,x1,x2,…,x n不全相等)的散点图中,若所有样本点(x i, y i)(i=1,2,…,n)都在直线y=-错误!未找到引用源。x+1上,则这组样本数

2独立性检验

1.2独立性检验的基本思想及其初步应用 根据表中数据得到 2 50181589 27232426 k () ??-? =≈ ??? 5.059,因为p(K2≥5.024)=0.025, 则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为() (A)97.5% (B) 95% (C)90% (D)无充分根据 2.(2011?湛江一模)利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅表格来确定“X和Y有关 A.5% B.75% C.99.5% D.95% 3.(2012?泰安一模)下列说法: ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位; ③线性回归方程必过; ④在一个2×2列联表中,由计算得K2=13.079,则有99%的把握确认这两个变量间有关系; 其中错误的个数是() A.0 B.1 C.2 D.3 4.(2010?泰安二模)某医疗研究所为了检验新开发的流感疫苗对甲型H1N1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算出P(Χ2≥6.635)≈0.01,则下列说法正确的是() A.这种疫苗能起到预防甲型H1N1流感的有效率为1% B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型H1N1 C.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用” D.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用” 5.(2012?枣庄一模)通过随机询问100名性别不同的大学生是否爱好踢毪子运动,得到如下的列联表: 随机变量,经计算,统计量K2的观测值k≈4.762,参照附表,得到的正

高二数学1-2 独立性检验

独立性检验 教学重点、独立性检验的基本方法,独立性检验的步骤 难点:.基本思想的领会及方法应用. 知识点 一、独立性检验的基本概念和原理 独立性检验是研究相关关系的方法。 1.分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量.比如男女、是否吸烟、是否患癌症,宗教信仰、国籍等等。 2列联表:分类变量的汇总统计表(频数表). 一般我们只研究每个分类变量只取两个 3.条形图 为了更清晰地表达这个特征,我们还可用如下的等高条形图表示两种情况下患肺癌的比例.如图3.2一3 所示,在等高条形图中,浅色的条高表示不患肺癌的百分比;深色的条高表示患肺癌的百分比. 通过分析数据和图形,我们得到的直观印象是“吸烟和患肺癌有关”.那么我们是否能够以一定的把握认为“吸烟与患肺癌有关”呢? 4.独立性检验的步骤 为了回答下面问题,我们先假设H :吸烟与患肺癌没有关系,看看能够得到什么样 的结论。 不患肺癌患肺癌合计不吸烟 a b a+b 吸烟 c d c+d 合计a+c b+d a+b+c+d 样本容量 n=a+b+c+d 如果“吸烟与患肺癌没有关系”,则吸烟者中不患肺癌的的比例应该与不吸烟者中相应的比例差不多,即:

()()() ()()()() 2 2 0a c a c d c a b ad b c a b c d ad bc ad bc n ad bc k a b c d a c b d n a b c d ≈?+≈+?-≈++---= ++++=+++因此 : 越小, 说明吸烟与患肺癌之间关系越弱. 越大, 说明吸烟与患肺癌之间关系越强构造随机变量 其中 为样本容量 若 H 0 成立,即“吸烟与患肺癌没有关系”,则 K “应该很小.根据表3一7中的数据,利用公式(1)计算得到 K “的观测值为 ()2 2 996577754942209956.63278172148987491 K ?-?=≈???, 这个值到底能告诉我们什么呢? 统计学家经过研究后发现,在 H 0成立的情况下, 2( 6.635)0.01P K ≥≈. (2) (2)式说明,在H 0成立的情况下,2 K 的观测值超过 6. 635 的概率非常小,近似为0 . 01, 是一个小概率事件.现在2 K 的观测值k ≈56.632 ,远远大于6. 635,所以有理由断定H 0 不成立,即认为“吸烟与患肺癌有关系”.但这种判断会犯错误,犯错误的概率不会超过0.01,即我们有99%的把握认为“吸烟与患肺癌有关系” . 在上述过程中,实际上是借助于随机变量2 K 的观测值k 建立了一个判断H 0是否成立的规则: 如果k ≥6. 635,就判断H 0不成立,即认为吸烟与患肺癌有关系;否则,就判断H 0成立,即认为吸烟与患肺癌没有关系. 在该规则下,把结论“H 0 成立”错判成“H 0 不成立”的概率不会超过 2( 6.635)0.01P K ≥≈, 即有99%的把握认为H 0不成立. 假设检验 备择假设H 1 不成立的前提下进行推理 10成立 推出有利于H 1成立的小概率事件(概率不超过α的事件)发 生,意味着H 1成立的可能性(可能性为(1-α))很大 下任上例的解决步骤 第一步:提出假设检验问题 H 0:吸烟与患肺癌没有关系? H 1:吸烟与患肺癌有关系 第二步:选择检验的指标 2 2 ()K ()()()() n ad bc a b c d a c b d -=++++ (它越小,原假设“H 0:吸烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1:吸烟与患肺癌有关系”成立的可能性越大. 第三步:查表得出结论

(新)高中数学第一章统计案例1_1独立性检验假设检验素材新人教B版选修1-21

假设检验 1、某厂生产的化纤纤度服从正态分布 )04.0,(2 μN 。某天测得25根纤维的纤度的均值39.1=x ,问与原设计的标准值1.40有无显著差异?(取05.0=α) 解 设厂生产的化纤纤度为X ,则总体)04.0,(~2μN X ,且总体方差2204.0=σ已 知。顾客提出要检验的假设为 40 .1:0=μH , 40.1:1≠μH 因为已知总体标准差04.0=σ,所以选用U 检验,且在0H 成立的条件下有 )1,0(~25 04.00 N X U μ-= 针对备择假设40.1:1≠μH ,拒绝域的形式可取为 } /{0 c n X U W >-= =σμ 为使犯第一类错误的概率不超过05.0=α,就要在40.10 =μ时,使临界值c 满足 ()05 .0=>c U P 成立。由此,在给定显著性水平05.0=α时,得到临界值为 96 .1975.02/1===-u u c α 故相应的拒绝域为

{} 96.1>=U W 利用来自总体的样本值求得 25 .125 /04.040.139.1-=-= u 即 975 .096.125.1u u =<= 成立。显然,样本未落在拒绝域内,因此在05.0=α水平上认为纤维的纤度与原设计的标准值1.40没有显著差异。 2、设某厂生产的洗衣机的使用寿命(单位:小时)X 服从正态分布),(2σu N 但2 ,σu 未 知。随机抽取20台,算得样本均值1832=X ,样本标准差=S 497,检验该厂生产的洗衣机的平均使用时数“2000=μ”是否成立?(取检验水平05.0=α) 解 待检验假设 2000 0=μ:H 20001≠μ:H H 的拒绝域: 21α - >t T =2.093 T 的观测值 512 .1/2000 -=-=n S X T W ∈ 不能拒绝 H ,可以认为洗衣机的平均使用时数“2000=u ”. 3、在正常情况下,某炼钢厂的铁水含碳量(%)X ~ ),.(2 554σN (σ未知)。一日测得5炉铁水含碳量如下:

高中数学 怎样进行独立性检验(b版)解题方法谈

怎样进行独立性检验(B 版) 一、独立性检验的基本思想 独立性检验的基本思想类似于数学中的反证法.其目的是为了确认“两个分类变量有关系”这一结论成立的可信程度.它首先假设结论不成立,即“两个分类变量没有关系”成立,在该假设下,构造的随机变量2X 的值应该很小.如果由观测数据计算得到的2X 的观测值很大,则在一定程度上说明假设不合理.因此可以根据随机变量2X 的含义来确定该假设不合理的程度.如果2X >6.635,则说明该假设不合理的程度是99%,从而可认为“两个分类变量有关系”这一结论成立的可信程度为99%. 二、独立性检验的相关概念 1.2×2列联表 一般地,如果有两个分类变量X 和Y ,它们的值域分别是1212{}{}x x y y ,,,,它们的样本频数列联表(见下表)称为2×2列联表. 2. 2X 统计量 2X 统计量是统计学中的一个非常有用的统计量,它是根据概率的统计定义和事件的独 立性得到的,其计算公式是2 2 112212211212 ()n n n n n n n n n ++++-=X .利用它的大小可以决定是否拒绝原来 的统计假设,如果计算出的2X 值较大,就拒绝假设;如果2 X 值较小,就接受假设. 3.临界值 通过对2 X 统计量分布和大量的试验数据的研究,已经得到了一些临界值,其中比较常用的有两个:3.841和6.635.在对具体问题进行独立性检验时,把计算出的2 X 值与以上两个临界值进行对比,从而确定两个事件的关系. 三、独立性检验步骤 使用2 X 统计量作2×2列联表的独立性检验的步骤是: (1)检查2×2列联表中的数据是否符合要求;

统计案例一_----独立性检验

统计案例一独立性检验 研修学院数学教研室闻岩 一、课标要求 学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。 内容与要求 1.统计案例(约14课时) 通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。 (1)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用。 (2)通过对典型案例(如“质量控制”“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用(参见例1)。------删掉了 (3)通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。------删掉了 (4)通过对典型案例(如“人的体重与身高的关系”等)的探究,进一步了解回归的基本思想、方法及初步应用。 说明与建议 1.统计案例的教学中,应鼓励学生经历数据处理的过程,培养他们对数据的直观感觉,认识统计方法的特点(如统计推断可能犯错误,估计结果的随机性),体会统计方法应用的广泛性。应尽量给学生提供一定的实践活动机会,可结合数学建模的活动,选择1个案例,要求学生亲自实践。对于统计案例内容,只要求学生了解几种统计方法的基本思想及其初步应用,对于其理论基础不作要求,避免学生单纯记忆和机械套用公式进行计算。 2.教学中,应鼓励学生使用计算器、计算机等现代技术手段来处理数据,有条件的学校还可运用一些常见的统计软件解决实际问题。 例1某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的。今研制一种新的预防药,任选5只羊做实验,结果这5只羊服用此药后均未患病。问此药是否有效。 初看起来,会认为这药一定有效,因为服药的羊均未患病。但细想一下,会有问题,因为大部分羊不服药也不会患病,患病的羊只占0.4左右。这5只羊都未患病,未必是药的作用。分析这问题的一个自然想法是:若药无效,随机抽取5只羊都不患病的可能性大不大。若这件事发生的概率很小,几乎不会发生,那么现在我们这几只羊都未患病,应该是药的效果,即药有效。 现假设药无效,5只羊都不生病的概率是 (1-0.4)5≈0.078. 这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明我们的假设不对,药是有效的。 这里的分析思想有些像反证法,但并不相同。给定假设后,我们发现,一个概率很小几乎不会发生的事件却发生了,从而否定我们的“假设”。 应该指出的是,当我们作出判断“药是有效的”时,是可能犯错误的。犯错误的概率是0.078。也就是说,我们有近92%的把握认为药是有效的。 二、全国考纲的要求 17.统计案例 了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. ①独立检验 列联表)的基本思想、方法及简单应用. 了解独立检验(只要求22

高中数学 选修1-2 3.独立性检验

3.独立性检验 教学目标 班级____姓名________ 1.了解分类变量、列联表、随机变量2 K . 2.了解独立性检验的基本思想和方法. 教学过程 一、知识要点. 1.分类变量:变量不同的值表示个体所属的类别不同. 2.列联表:两个分类变量的频数表. 3.随机变量:) )()()(()(22 d b c a d c b a bc ad n K ++++-=,010.0)635.6(2 ≈≥K P (小概率事件) 4.独立性检验:运用统计分析的方法确定分类变量的关系. (1)要判断“两个分类变量有关系”; (2)假设结论不成立,即“0H :两个分类变量没有关系”; (3)确定一个判断规则的临界值0k :当02k K ≥时,认为“两个分类变量有关系”,否则认为“两个分类变量没有关系”;(0k 是根据允许误判概率的上限来确定的) (4)按照上述规则,误判概率为)(02k K P ≥. 0k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82 )(02k K P ≥ 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 (5)拓展: ①令|| d c c b a a W +-+=,则) )(() )((22d b c a d c b a n W K ++++?=; ②令) )(() )((00d c b a n d b c a k w ++++? = ; ③02 k K ≥等价于0w W ≥,所以)(0w W P ≥等价于)(02 k K P ≥; ④可以用)(0w W P ≥来作为判断依据. 二、例题分析. 例1:研究吸烟与患肺癌的关系. 1.确定研究对象:吸烟与患肺癌的关系.

高中数学统计案例--独立性检验 同步练习

统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?

8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?

回归分析及独立性检验的基本知识点及习题集锦

回归分析的基本知识点及习题 本周题目:回归分析的基本思想及其初步应用 本周重点: (1)通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别; (2)尝试做散点图,求回归直线方程; (3)能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法――相关指数和残差分析。 本周难点: (1)求回归直线方程,会用所学的知识对实际问题进行回归分析. (2)掌握回归分析的实际价值与基本思想. (3)能运用自己所学的知识对具体案例进行检验与说明. (4)残差变量的解释; (5)偏差平方和分解的思想; 本周内容: 一、基础知识梳理 1.回归直线: 如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。 求回归直线方程的一般步骤: ①作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系→②求回归系数→ ③写出回归直线方程,并利用回归直线方程进行预测说明. 2.回归分析: 对具有相关关系的两个变量进行统计分析的一种常用方法。 建立回归模型的基本步骤是: ①确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; ②画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系). ③由经验确定回归方程的类型. ④按一定规则估计回归方程中的参数(最小二乘法); ⑤得出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等. 3.利用统计方法解决实际问题的基本步骤: (1)提出问题; (2)收集数据; (3)分析整理数据; (4)进行预测或决策。 4.残差变量的主要来源: (1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。 可能存在非线性的函数能够更好地描述与之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差。这 种由于模型近似所引起的误差包含在中。 (2)忽略了某些因素的影响。影响变量的因素不只变量一个,可能还包含其他许多因素(例如在描述身高和体重 关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),但通常它们每一个因素的影响可能都是比较小的,它们的影响都体现在中。 (3)观测误差。由于测量工具等原因,得到的的观测值一般是有误差的(比如一个人的体重是确定的数,不同的秤可 能会得到不同的观测值,它们与真实值之间存在误差),这样的误差也包含在中。 上面三项误差越小,说明我们的回归模型的拟合效果越好。

高中数学选修1-2《独立性检验基本思想及其初步应用》教案

高中数学选修1-2《独立性检验基本思想及其初步应用》教案 High school mathematics elective 1-2 "basic idea of independe nce test and its preliminary application" teaching plan

高中数学选修1-2《独立性检验基本思想及 其初步应用》教案 前言:数学是研究数量、结构、变化、空间以及信息等概念的一门学科,从某种角 度看属于形式科学的一种,在人类历史发展和社会生活中,数学发挥着不可替代的 作用,是学习和研究现代科学技术必不可少的基本工具。本教案根据数学课程标准 的要求和教学对象的特点,将教学诸要素有序安排,确定合适的教学方案的设想和 计划、并以启迪发展学生智力为根本目的。便于学习和使用,本文档下载后内容可 按需编辑修改及打印。 教学要求:通过探究“吸烟是否与患肺癌有关系”引出 独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性. 教学重点:理解独立性检验的基本思想及实施步骤. 教学难点:了解独立性检验的基本思想、了解随机变量 的含义. 教学过程: 教学过程: 一、复习准备: 独立性检验的基本步骤、思想

二、讲授新课: 1.教学例1: 例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效? ① 第一步:教师引导学生作出列联表,并分析列联表,引导学生得出“秃顶与患心脏病有关”的结论; 第二步:教师演示三维柱形图和二维条形图,进一步向学生解释所得到的统计结果; 第三步:由学生计算出的值; 第四步:解释结果的含义. ② 通过第2个问题,向学生强调“样本只能代表相应总体”,这里的数据来自于医院的住院病人,因此题目中的结论能够很好地适用于住院的病人群体,而把这个结论推广到其他群体则可能会出现错误,除非有其它的证据表明可以进行这种推广.

高中数学教学案例分析(独立性检验)

高中数学人教A版选修2-3第三章3.2独立性检验的基本思 想及其初步应用教学设计 一、教材分析 本节课是人教A版(选修)2—3第三章第二单元第二节第一课时的内容.在本课之前,学生已经学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节,也是高考的重要考点。 在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。独立性检验的基本思想和反证法类似,它们都是假设论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。 学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。在大数据时代,我们每天都会接触到影响生活的统计方面的信息,因此具备一些统计知识已经成为现代人已具备的一种数学素养。 二、学情分析 授课对象:高二理科15班(重二班)。 知识上:学生已经学习过统计、变量回归分析等知识,这为本节课的学习提供了知识基础。但本节课的内容独立性检验对学生来说是新的内容,为什么有这么一个方法?为什么要学习这个方法?通过课前的新闻引入可以让学生体会到本节课知识的应用性。独立性检验相当于建立一个判别“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有有关系”错判成“两个分类变量之间有关系”的概率。所以首先要教会学生的是了解并初步理解这个规则,而后才是会用这个规则解决问题。 能力方面:学生具备了一定的认知、分析、归纳能力;能够进行小组活动。 但学生缺少深入探究问题的方法;运算能力和语言表达能力有待提高。针对这个问题,课堂上我通过适时引导学生探究,鼓励学生积极展示来解决。

高中数学 第一章 统计案例 1.2.2 独立性检验 2.3 独立性检验的基本思想 2.4 独立性检验的应用学案 北师大版

2.2 独立性检验 2.3 独立性检验的基本思想 2.4 独立性检验的应用 1.了解独立性检验的基本思想方法.(重点) 2.了解独立性检验的初步应用.(难点) [基础·初探] 教材整理1 独立性检验 阅读教材P21~P24第1行部分,完成下列问题. 设A,B为两个变量,每一个变量都可以取两个值,变量A:A1,A2=A1;变量B:B1,B2=B1,有下面2×2列联表: B B1B2总计 A A1a b a+b A2c d c+d 总计a+c b+d n=a+b+c+d 111取B2时的数据;c表示变量A取A2,且变量B取B1时的数据;d表示变量A取A2,且变量B取B2时的数据. 某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:

文艺节目 新闻节目 总计 20至40岁 40 18 58 大于40岁 15 27 42 总计 55 45 100 由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”). 【解析】 因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即b a + b =1858,d c + d =27 42,两者相差较大,所 以,经直观分析,收看新闻节目的观众与年龄是有关的. 【答案】 是 教材整理2 独立性检验的基本思想 阅读教材P 24“练习”以下至P 25“练习”以上部分,完成下列问题. 在2×2列联表中,令χ2= n ad -bc 2 a +b c +d a +c b +d ,当数据量较大时, 在统计中,用以下结果对变量的独立性进行判断: (1)当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的; (2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联. 对分类变量X 与Y 的统计量χ2的值说法正确的是( ) A .χ2越大,“X 与Y 有关系”的把握性越小 B .χ2越小,“X 与Y 有关系”的把握性越小 C .χ2越接近于0,“X 与Y 无关系”的把握性越小

高中数学 第三章 统计案例 3.1 独立性检验 卡方检验素材 苏教版选修2-3

2 χ 检验 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2 χ检验。 (1) 四格表2 χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2 χ检验。 3. 行?列表的2 χ检验。 (二) 熟悉内容 频数分布拟合优度的2 χ检验。 (三) 了解内容 1.2 χ分布的图形。 2.四格表的确切概率法。 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2 χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公 式与用基本公式计算出的2χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间 当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。 总体率的可信区间:(p p S u p S u p ?+?-2/2/,αα)。 (8-3) (四)2 χ检验的基本计算

高中数学苏教版选修2-3:课下能力提升(十八)独立性检验Word版含解析

课下能力提升(十八)独立性检验 一、填空题 1.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算χ2=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的.(有关,无关) 2.若两个研究对象X和Y 则X与Y之间有关系的概率约为________. 3.在吸烟与患肺病这两个对象的独立性检验的计算中,下列说法正确的是________.(填序号) ①若χ2=6.635,则我们认为有99%的把握认为吸烟与患肺病有关系.那么在100个吸烟的人中必有99人患肺病. ②从独立性检验的计算中求有99%的把握认为吸烟与患肺病有关系时,我们认为如果某人吸烟,那么他有99%的可能患肺病. ③若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. ④以上三种说法都不正确. 4.调查者询问了72名男女大学生在购买食品时是否观看营养说明得到如下2×2列联表: 从表中数据分析大学生的性别与看不看营养说明之间的关系是________.(填“有关”或“无关”) 5 则由表可知大约有________的把握认为多看电视与人变冷漠有关系. 二、解答题 6.为研究学生的数学成绩与对学习数学的兴趣是否有关,对某年级学生作调查,得到如下数据: 学生的数学成绩好坏与对学习数学的兴趣是否有关?

7.考察小麦种子经过灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下列联表. 试按照原试验目的作统计推断. 8.为了调查某生产线上质量监督员甲是否在生产现场对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试用独立性检验的方法分析监督员甲是否在生产现场对产品质量好坏有无影响. 答案 1.解析:由χ2值可判断有关. 答案:有关 2.解析:因为 χ2= (5+15+40+10)×(5×10-40×15)2 (5+15)×(40+10)×(5+40)×(15+10) ≈18.8,查表知 P (χ2≥10.828)≈0.001. 答案:99.9% 3.解析:由独立性检验的意义可知,③正确. 答案:③ 4.解析:提出假设H 0:大学生的性别与看不看营养说明无关,由题目中的数据可计算χ2= 72×(28×20-16×8)2 44×28×36×36 ≈8.42,因为当H 0成立时,P (χ2≥7.879)≈0.005,这里的χ2≈ 8.42>7.879,所以我们有99.5%的把握认为大学生的性别与看不看营养说明有关. 答案:有关 5.解析:由公式得 χ2= 168×(68×38-42×20)2 110×58×88×80 ≈11.377>10.828,所以我们有99.9%

统计案例之独立性检验

统计案例之独立性检验 班级姓名学号 参考公式:,其中. 1.在中学生综合素质评价某个维度的测评中,分优秀、合格、尚待改进三个等级进行学生 互评.某校高一年级有男生500人,女生400人,为了了解性别对该维度测评结果的影响, 采用分层抽样方法从高一年级抽取了45名学生的测评结果,并作出频数统计表如下: 表一:男生表二:女生 (1)从表二的非优秀学生中随机抽取2人交谈,求所选2人中恰有1人测评等级为合格的概率; (2)由表中统计数据填写下面的列联表,并判断是否有90%的把握认为“测评结果优秀与性别有关”.

2.东亚运动会将于2013年10月6日在天津举行.为了搞好接待工作,组委会打算学习北 京奥运会招募大量志愿者的经验,在某学院招募了16名男志愿者和14名女志愿者,调查发现,男女志愿者中分别有10人和6人喜爱运动,其余人不喜欢运动. (1)根据以上数据完成以下2×2列联表: 喜爱运动不喜爱运动总计 男10 16 女 6 14 总计30 (2)根据列联表的独立性检验,能否在犯错误的概率不超过0.10的前提下认为性别与喜爱运动有关? (3)如果从喜欢运动的女志愿者中(其中恰有4人会外语),抽取2名负责翻译工作,那么抽出的志愿者中至少有1人能胜任翻译工作的概率是多少? 3.某中学拟在高一下学期开设游泳选修课,为了了解高一学生喜欢游泳是否与性别有关, 现从高一学生中抽取人做调查,得到如下列联表: 已知在这人中随机抽取一人抽到喜欢游泳的学生的概率为, (Ⅰ)请将上述列联表补充完整,并判断是否有%的把握认为喜欢游泳与性别有关? 并说明你的理由;

(Ⅱ)针对问卷调查的名学生,学校决定从喜欢游泳的人中按分层抽样的方法随机抽取 人成立游泳科普知识宣传组,并在这人中任选两人作为宣传组的组长,求这两人中至少有一名女生的概率, 4.某学校高三年级有学生 1 000名,经调查,其中750名同学经常参加体育锻炼(称为A 类同学),另外250名同学不经常参加体育锻炼(称为B类同学),现用分层抽样方法(按A 类、B类分两层)从该年级的学生中共抽查100名同学,如果以身高达165 cm作为达标的标准,对抽取的100名学生,得到以下列联表: 身高达标身高不达标总计 经常参加体育锻炼40 不经常参加体育锻炼15 总计100 (1)完成上表; 5.某校进行文科、理科数学成绩对比,某次考试后,各随机抽取100名同学的数学考试成绩进行统计,其频率分布表如下.

人教版 高中数学【选修 2-1】第一章独立性检验Word版

人教版高中数学精品资料 重点列表: 重点名称重要指数 重点1 独立性检验★★★ 重点2 独立性检验与概率交汇综合问题. ★★★★ 重点详解: 重点1:独立性检验 【要点解读】 1.独立性检验的两个关键,一是是正确列出2×2列联表,二是准确理解并计算出2 K的值. 2.弄清判断两变量有关的把握性与犯错误概率的关系,根据题目要求作出正确的回答. 3.独立性检验中统计量K2的观测值k的计算公式较为复杂,在解题中应明确数据的意义,代入公式准确计算.准确计算2k的值是正确判断的前提. 【考向】独立性检验 【例题】 【2016辽宁省沈阳质量监测一】为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下: 现从所有试验动物中任取一只,取到“注射疫苗”动物的概率为2 5 . (Ⅰ)求22 ?列联表中的数据x,y,A,B的值;(Ⅱ)能够有多大把握认为疫苗有效? 附: 2 2 () ()()()() n ad bc a b a c c d b d χ- = ++++ 未发病发病合计未注射疫苗20 x A 注射疫苗30 y B 合计50 50 100

【答案】(Ⅰ)10y =,40B =,40x =,60A =.(Ⅱ)至少有99.9%的把握认为疫苗有效. 【名师点睛】 1.独立性检验是对两个变量有关系的可信程度的判断,而不是对其是否有关系的判断. 2.独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表.在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果做出错误的解释. 重点2:独立性检验与概率交汇综合问题 【要点解读】 在近几年高考中统计案例与概率结合的解答题所占比例较往年有所增加,重点考查回归直线方程的求解和应用、独立性检验及概率的知识,注重考查考生对相关数据的统计、分析与应用的能力,此类试题一般为中档题. 【考向】独立性检验与概率交汇综合问题 【例题】【2016吉林长春质量监测二】近年来我国电子商务行业迎来篷布发展的新机遇,2015年双11期间,某购物平台的销售业绩高达918亿人民币.与此同时,相关管理部门也推出了针对电商的商品和服务的评价体系.现从评价系统中选出200次成功的交易,并对其评价进行统计,对商品的好评率为 35,对服务的好评率为3 4 ,其中对商品和服务都做出好评的交易为80次. (1)是否可以在犯错误概率不超过0.1%的前提下,认为商品好评与服务好评有关? (2)若针对商品的好评率,采用分层抽样的方式从这200次交易中取出5次交易,并从中选择两次交易进行客户回访,求只有一次好评的概率. 2()0.150.100.050.0250.0100.0050.001 2.072 2.706 3.841 5.024 6.6357.87910.828 P K k k ≥

高中数学 3.2 独立性检验(一)教案 北师大选修2-3

3.2 独立性检验 教学目标 (1)通过对典型案例的探究,了解独立性检验(只要求22?列联表)的基本思想、方法 及初步应用; (2)经历由实际问题建立数学模型的过程,体会其基本方法. 教学重点、难点:独立性检验的基本方法是重点.基本思想的领会及方法应用是难点. 教学过程 一.问题情境 5月31日是世界无烟日。有关医学研究表明,许多疾病,例如:心脏病、癌症、脑血管病、慢性阻塞性肺病等都与吸烟有关,吸烟已成为继高血压之后的第二号全球杀手。这些疾病与吸烟有关的结论是怎样得出的呢?我们看一下问题: 1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515 个成年人,其中吸烟者220人,不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病. 问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 二.学生活动 为了研究这个问题,(1)引导学生将上述数据用下表来表示: (2)估计吸烟者与不吸烟者患病的可能性差异: 在吸烟的人中,有 3716.82%220≈的人患病,在不吸烟的人中,有21 7.12%295 ≈的人患病. 问题:由上述结论能否得出患病与吸烟有关?把握有多大? 三.建构数学 1.独立性检验: (1)假设0H :患病与吸烟没有关系. 若将表中“观测值”用字母表示,则得下表: (近似的判断方法:设n a b c d =+++,如果0H 成立,则在吸烟的人中患病的比例与 不吸烟的人中患病的比例应差不多,由此可得 a c a b c d ≈ ++,即()()0a c d c a b ad bc +≈+?-≈,因此,||ad bc -越小,患病与吸烟之间的关系越弱, 否则,关系越强.)

相关主题
文本预览
相关文档 最新文档