当前位置:文档之家› 1.2独立性检验

1.2独立性检验

1.2独立性检验
1.2独立性检验

1.2独立性检验

1.2独立性检验的基本思想及其初步应用

1.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:

认为作业多 认为作业不多 总数 喜欢玩电脑游戏 18 9 27 不喜欢玩电脑游戏 8 15 23 总数

26

24

50

根据表中数据得到25018158927232426

k ()??-?=≈

??? 5.059,因为p(K 2

5.024)=0.025,

则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为( )

(A)97.5% (B) 95% (C)90% (D)无充分根据

2.(2011?湛江一模)利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅表格来确定“X 和Y 有关系”的可信度.如果k >3.84,那么有把握认为“X 和Y 有关系”的百分比为( ) P

(0.5

0.40

0.25

0.15

0.10

0.05

0.025

0.010

0.005

0.001

K2>k)

k 0.4

55 0.7

08

1.3

23

2.0

72

2.7

06

3.8

4

5.0

24

6.6

35

7.8

79

10.

83

A.5%

B.75%

C.99.5%

D.95%

3.(2012?泰安一模)下列说法:

①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;

②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位;

③线性回归方程必过;

④在一个2×2列联表中,由计算得K2=13.079,则有99%的把握确认这两个变量间有关系;

其中错误的个数是()

A.0

B.1

C.2

D.3

4.(2010?泰安二模)某医疗研究所为了检验新开发的流感疫苗对甲型H1N1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设H

:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算出P(Χ2≥6.635)≈0.01,则下列说法正确的是()

C.有97.5%以上的把握认为“爱好该项运动与性别有关”

D.有97.5%以上的把握认为“爱好该项运动与性别无关”6.(2013?临沂一模)某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算K2=7.069,则所得到的统计学结论是:有()的把握认为“学生性别与支持该活动有关系”.P(k2≥k

) 0.100 0.050 0.025 0.010 0.001

2.706

3.841 5.024 6.635 10.828 k

A.0.1%

B.1%

C.99%

D.99.9%

7.(2012?武昌区模拟)通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下的列联表:

男女总计

走天桥40 20 60

走斑马线20 30 50

总计60 50 110

由,算得

参照独立性检验附表,得到的正确结论是()

A.有99%的把握认为“选择过马路的方式与性别有关”

B.有99%的把握认为“选择过马路的方式与性别无关”

C.在犯错误的概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”

(教案)1.2独立性检验的基本思想及其初步应用

第一课时 1.2独立性检验的基本思想及其初步应用(一) (共2课时) 教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据的列联表、柱形图和条形图展示在吸烟者中患肺癌的比例比不吸烟者中患肺癌的比例高,让学生亲身体验独立性检验的实施步骤与必要性. 教学重点:理解独立性检验的基本思想及实施步骤. 教学难点:了解独立性检验的基本思想、了解随机变量2 K的含义. 教学过程: 一、复习准备: 回归分析的方法、步骤,刻画模型拟合效果的方法(相关指数、残差分析)、步骤. 二、讲授新课: 1. 教学与列联表相关的概念: ①分类变量:变量的不同“值”表示个体所属的不同类别的变量称为分类变量. 分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级,等等. 分类变量的取值有时可用数字来表示,但这时的数字除了分类以外没有其他的含义. 如用“0”表示“男”,用“1”表示“女”. ②列联表:分类变量的汇总统计表(频数表). 一 般我们只研究每个分类变量只取两个值,这样的列 联表称为22 ?. 如吸烟与患肺癌的列联表: 2. 教学三维柱形图和二维条形图的概念: 由列联表可以粗略估计出吸烟者和不吸烟者患肺 癌的可能性存在差异.(教师在课堂上用EXCEL软件演示三维柱形图和二维条形图,引导学生观察这两类图形的特征,并分析由图形得出的结论) 3. 独立性检验的基本思想: ①独立性检验的必要性(为什么中能只凭列联表的数据和图形下结论?):列联表中的数据是样本数据,它只是总体的代表,具有随机性,故需要用列联表检验的方法确认所得结论在多大程度上适用于总体. 第一步:提出假设检验问题H 0:吸烟与患肺癌没有关系?H 1 :吸烟与患肺癌有关系 第二步:选择检验的指标 2 2 () K ()()()() n ad bc a b c d a c b d - = ++++ (它越小,原假设“H :吸 烟与患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1 :吸烟与患肺癌有关系”成立的可能性越大. 教学要求:通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题,并借助样本数据

独立性检验中的列表与用表

独立性检验中的列表与用表 224100 江苏省盐城市大丰区南阳中学 潘锦明 独立性检验基本思想中的2×2列联表是考查的重点,其中列表、填表与用表是独立性检验的基本步骤之一。本文就从以下三方面剖析。 一、列表: 关键理清两个分类变量关系,能合理列出分类变量列联表。 例1、网络对现代人的影响较大,尤其是青少年,为了了解网络对中学生学习成绩的影响,某地区教育主管部门从辖区初中生中随机抽取了515人调查,发现其中经常上网的有220人,这220人中有37人期末考试不及格,而另外295人中有21人不及格。问:能否有99%的把握认为经常上网会影响学习? 分析:通过阅读,本题包括两个变量,一类是娱乐方式,一类是成绩。 假设“上网与是否影响学习无关”,则2 K 应该很小,由公式得2 K 的观测值 863.11220 29558457)3727421183(5152≈????-??=k ,且01.0)635.6(2≈≥K P . 所以,我们有99%的把握认为“中学生经常上网影响学习”。 点评:在使用2 K 统计量作2×2列联表的独立性检验时,要求表中的4个数据都大于5. 二、填表与用表 这类题首先根据表格数值进行补充,再求解计算。 例2、富士康某生产车间在发年终奖金的时候,为了体现多劳多得的原则,需要对全车 (1)如果随机抽查这个车间的一名工人,那么抽到主动参加车间培训的工人的概率是多少?抽到不太主动参加车间培训的且工作积极性一般的工人的概率是多少? (2)试运用独立性检验的方法分析:工人的工作积极性与对待车间培训的态度是否有 解:(1)主动参加车间培训的工人有24人,总人数为50人,概率25 50== P .

1.1《独立性检验》习题

1-1《 统计案例》习题 1.1 独立性检验 双基达标 限时15分钟 1.下面是一个2×2的列联表 则表中a ,b 解析 由a +21=73,得a =52, 由a +5=b ,得b =57. 答案 52,57 2.为了检验两个事件A 与B 是否相关,经计算得χ2=3.850,我们有________ 的把握认为事件A 与B 相关. 答案 95% 3.为了考查高中生的性别与是否喜欢数学课程之间的关系,某市在该辖区内 的高中学生中随机地抽取300名学生进行调查,得到表中数据: 解析 由χ2 =300 47×123-35×95 2142×158×82×218≈4.512. 答案 4.512 4.下列关于独立性检验的4个叙述,说法正确的是________. ①χ2 的值越大,说明两事件相关程度越大; ②χ2 的值越小,说明两事件相关程度越小; ③χ2 ≤3.841时,有95%的把握说事件A 与B 无关; ④χ2 >6.635时,有99%的把握说事件A 与B 有关. 解析 在独立性检验中,随机变量χ2 的取值大小只能说明“两分类变量有关”,这一结论 的可靠程度,即可信度,而不表示两事件相关的程度,故①②不正确.χ2 >6.635说明有99%的把握认为二者有关系,χ2≤3.841时,若x 2 >2.706则有90%的把握认为事件A 与B 有关系.因

此可知③中说法是不正确的. 答案 ④ 5.想要检验是否喜欢参加体育活动是不是与性别有关,应该假 设________________. 解析 独立性检验假设有反证法的意味,应假设两类变量(而非变量的属性)无关,这时 的χ2应该很小,如果χ2很大,则可以否定假设;如果χ2 很小,则不能够肯定或者否定假设. 答案 H 0:喜欢参加体育活动与性别无关 6.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行 了3年的跟踪研究,调查他们是否发作过心脏病,调查结果如下表所示: 解 提出假设H 0:两种手术对病人又发作心脏病没有影响.由列联表,得 χ2=392× 39×167-157×29 2196×196×68×324 ≈1.780<2.706. 因为当H 0成立时,χ2 ≥1.780的概率大于10%,这个概率比较大,所以根据目前的调查数 据,不能否定假设H 0,故我们没有理由说这两种手术与“又发作过心脏病”有关,故可以认为病人是否发作心脏病跟他做过何种手术无关. 综合提高 限时30分钟 7. 2008年10月8日为我国第十一个高血压日,主题是“在家测量您的 血压”.某社区医疗服务部门为了考察该社区患高血压病是否与食盐摄入 量有关,对该社区的1 633人进行了跟踪调查,得出以下数据: 计算χ2有关系.

2独立性检验

1.2独立性检验的基本思想及其初步应用 根据表中数据得到 2 50181589 27232426 k () ??-? =≈ ??? 5.059,因为p(K2≥5.024)=0.025, 则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为() (A)97.5% (B) 95% (C)90% (D)无充分根据 2.(2011?湛江一模)利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅表格来确定“X和Y有关 A.5% B.75% C.99.5% D.95% 3.(2012?泰安一模)下列说法: ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位; ③线性回归方程必过; ④在一个2×2列联表中,由计算得K2=13.079,则有99%的把握确认这两个变量间有关系; 其中错误的个数是() A.0 B.1 C.2 D.3 4.(2010?泰安二模)某医疗研究所为了检验新开发的流感疫苗对甲型H1N1流感的预防作用,把1000名注射了疫苗的人与另外1000名未注射疫苗的人的半年的感冒记录作比较,提出假设H0:“这种疫苗不能起到预防甲型H1N1流感的作用”,并计算出P(Χ2≥6.635)≈0.01,则下列说法正确的是() A.这种疫苗能起到预防甲型H1N1流感的有效率为1% B.若某人未使用该疫苗,则他在半年中有99%的可能性得甲型H1N1 C.有1%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用” D.有99%的把握认为“这种疫苗能起到预防甲型H1N1流感的作用” 5.(2012?枣庄一模)通过随机询问100名性别不同的大学生是否爱好踢毪子运动,得到如下的列联表: 随机变量,经计算,统计量K2的观测值k≈4.762,参照附表,得到的正

高中数学统计案例--独立性检验 同步练习

统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?

8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?

独立性检验的基本思想及其初步应用习题及答案

数学·选修1-2(人教A版) 独立性检验的基本思想及其初步应用 ?达标训练 1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是( ) A.散点图B.等高条形图 C.2×2列联表 D.以上均不对 答案:B 2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大( ) 与 d c+d 与 a c+d 与 c c+d 与 c b+c 答案:C 3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是( ) A.k越大,“ X与Y有关系”可信程度越小 B.k越小,“ X与Y有关系”可信程度越小 C.k越接近于0,“X与Y无关”程度越小 D.k越大,“X与Y无关”程度越大 答案:B 4.下面是一个2×2列联表:

则表中a、b的值分别为( ) A.94、96 B.52、50 C.52、54 D.54、52 答案:C 5.性别与身高列联表如下: 那么,检验随机变量K2的值约等于 ( ) A. B. C.22 D. 答案:C 6.给出列联表如下: 根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是( ) A.B.0.5 C.D. 答案:B

?素能提高 1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是( ) A .男人、女人中患有色盲的频率分别为、 B .男人、女人患色盲的概率分别为19240、3 260 C .男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的 D .调查人数太少,不能说明色盲与性别有关 解析:男人患色盲的比例为38480,比女人中患色盲的比例6 520 大, 其差值为?? ???? 38480-6520≈ 6,差值较大. 答案:C 2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 由K 2=算得, K 2=≈. 附表: 参照附表,得到的正确结论是( ) A .有99%以上的把握认为“爱好该项运动与性别有关” B .有99%以上的把握认为“爱好该项运动与性别无关” C .在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关” D .在犯错误的概率不超过%的前提下,认为“爱好该项运动与性

独立性检验讲解

独立性检验基础训练题 姓名: 分数: 1.独立性检验中的统计假设就是假设两个事件A 、B ( ) A 互斥 B 不互斥 C 相互独立 D 不独立 2.在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就 ( ) A. 越大 B. 越小 C.无法判断 D. 以上都不对 3.2010年3月26日,韩国军舰“天安”号发生不明原因爆炸事故离奇沉没,5月20日韩国军民联合调查团公布的调查结果说天安舰是遭受朝鲜小型潜水艇发射的鱼雷攻击而沉没的。对此,许多网民表达了自己的意见,有的网友进行了调查,在参加调查的4258名男性公民中有2360名认为是朝鲜所为,3890名女性公民中有2386人认为朝鲜是遭陷害,在运用这些数据说明天安舰事件中朝鲜是否冤枉时用什么方法最有说服力?( ) A 平均数 B 回归分析 C 独立性检验 D 方差 4.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定断言“X 和Y 有关系”的可信度。如果k>5.024,那么就有把握认为“X 和Y 有关系”的百分比为 A.25% B.75% C.2.5% D.97.5% 5.假设有两个分类变量X 和Y ,它们的值域分别为},{21x x 和},{21y y ,其2×2列联表为: A .5=a ,4=b ,3=c ,2=d B .5=a ,3=b ,4=c ,2=d C .2=a ,3=b ,4=c ,5=d D .2=a ,3=b ,5=c ,4=d 6.考察玉米种子经过药物处理跟生病之间的关系得到如下表数据: A. 玉米种子经过药物处理跟是否生病有关; B. 玉米种子经过药物处理跟是否生病无关;

高考试题回归分析,独立性检验

回归分析与独立性检验 1.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生. 从这次考试成绩看, ①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ; ②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 . 2.根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ) A .逐年比较,2008年减少二氧化碳排放量的效果最显着 B .2007年我国治理二氧化碳排放显现成效 C .2006年以来我国二氧化碳年排放量呈减少趋势 D .2006年以来我国二氧化碳年排放量与年份正相关 3.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 根据上表可得回归直线方程???y bx a =+ ,其中???0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )] A .万元 B .万元 C .万元 D .万元 4.在画两个变量的散点图时,下面哪个叙述是正确的 ( ) A .预报变量在x 轴上,解释变量在y 轴上 B .解释变量在x 轴上,预报变量在 y 轴上 C .可以选择两个变量中任意一个变量在x 轴上 D .可以选择两个变量中任意一个变量在y 轴上 5 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

不得病 61 213 274 合计 93 314 407 ( ) A .种子经过处理跟是否生病有关 B .种子经过处理跟是否生病无关 C .种子是否经过处理决定是否生病 D .以上都是错误的 6.变量x 与y 具有线性相关关系,当x 取值16,14,12,8时,通过观测得到y 的值分别为11,9,8,5,若在实际问 题中,y 的预报最大取值是10,则x 的最大取值不能超过 ( ) A .16 B .17 C .15 D .12 7.在研究身高和体重的关系时,求得相关指数≈2 R ___________,可以叙述为“身高解释了64%的体重变化,而随 机误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。 8.下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图 (I )由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (II )建立y 关于t 的回归方程(系数精确到),预测2016年我国生活垃圾无害化处理量。 参考数据: 7 1 9.32i i y ==∑,7 1 40.17i i i t y ==∑, 7 2 1 ()0.55i i y y =-=∑,7≈. 参考公式:相关系数1 2 2 1 1 ()() ()(y y)n i i i n n i i i i t t y y r t t ===--= --∑∑∑, 回归方程 y a bt =+) )) 中斜率和截距的最小二乘估计公式分别为: 9.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论错误的是 A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 10.为了研究某班学生的脚长x (单位:厘米)和身高 y (单位:厘米)的关系,从该班随机抽取10名学生,根据 测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为???y bx a =+.已知10 1 225i i x ==∑,10 1 1600i i y ==∑,?4b =.该班某学生的脚长为24,据此估计其身高为 (A )160 (B )163 (C )166 (D )170 11.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下:

高中数学第一章统计案例1.2独立性检验是如何判断两个事件是否相互独立的素材北师大版

独立性检验是如何判断两个事件是否相互独立的 独立性检验的基本思想类似于反证法.要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量2χ应该很小.如果由观测数据计算得到的2χ的观测值很大,则在一定程度上说明假设不合理.根据随机变量 2χ的含义,可以通过概率式评价 该假设不合理的程度,由实际计算的2χ>6.635,说明假设不合理的程度约为99%,即“两个分类变量有关系”这一结论成立的可信程度约为99%. 当2χ≤3.841时,认为两个分类变量是无关的.对于两事件而言即相互独立. 1.两个事件独立的判定 例1: 为了研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进 根据193个病人的数据,能否作出药的效果与给药方式有关的结论?请说明理由. 解:提出假设H 0:药的效果与给药方式无关系. 根据列联表中的数据,得χ2 =2 193(58314064)122719895 -?-????≈1.3896<2.072. 当H 0成立时,χ2 >1.3896的概率大于15%, 这个概率比较大,所以根据目前的调查数据,不能否定假设H 0,即不能作出药的效果与给药方式有关的结论. 注意:这是一个由列联表来验证的独立性检验问题,其结论是没有关系的假设成立.并且应该注意上述结论是对所有口服药物与注射药物的实验人而言的,绝不要误以为对被跟踪的193个跟踪研究对象成立. 例2:调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表.试问能以多大把握认为婴儿的性别与出生时间有关系. 分析:利用表中的数据通过公式计算出2χ统计量,可以用它的取值大小来推断 独立性是否成立. 解:由公式 ()841.368892.357 3234553182624892 2 <≈????-??= χ 故婴儿的性别与出生时间是相互独立的(也可以说没有充分证据显示婴儿的性别与出生时间有关).

1独立性检验(应用检测题)

本套试题考查的内容比较全面,独立性检验的概念与方法、2×2列联表、随机变量2 K 的值、三维柱形图、二维条形图、等高条形图等知识点在试题中都得到了充分体现,很多试题与现实生活相联系,新颖别致,有大量的原创与改编试题。 独立性检验的基本思想及其初步应用同步测试题 A 组 一、选择题 1.独立性检验中的统计假设就是假设两个事件A 、B ( ) A 互斥 B 不互斥 C 相互独立 D 不独立 2.在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就 ( ) A. 越大 B. 越小 C.无法判断 D. 以上都不对 3.2010年3月26日,韩国军舰“天安”号发生不明原因爆炸事故离奇沉没,5月20日韩国军民联合调查团公布的调查结果说天安舰是遭受朝鲜小型潜水艇发射的鱼雷攻击而沉没的。对此,许多网民表达了自己的意见,有的网友进行了调查,在参加调查的4258名男性公民中有2360名认为是朝鲜所为,3890名女性公民中有2386人认为朝鲜是遭陷害,在运用这些数据说明天安舰事件中朝鲜是否冤枉时用什么方法最有说服力?( ) A 平均数 B 回归分析 C 独立性检验 D 方差 4.利用独立性检验来考虑两个分类变量X 和Y 是否有关系时,通过查阅下表来确定断言“X 和Y 有关系”的可信度。如果k>5.024,那么就有把握认为“X 和Y 有关系”的百分比为 A.25% B.75% C.2.5% D.97.5% 5.假设有两个分类变量X 和Y ,它们的值域分别为},{21x x 和},{21y y ,其2×2列联表为: 对以下数据,对同一样本能说明X与Y有关的可能性最大的一组为( ) A .5=a ,4=b ,3=c ,2=d B .5=a ,3=b ,4=c ,2=d C .2=a ,3=b ,4=c ,5=d D .2=a ,3=b ,5=c ,4=d 6.考察玉米种子经过药物处理跟生病之间的关系得到如下表数据:

卡方独立性检验

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

随机变量及其分布列与独立性检验练习题附答案

数学学科自习卷(二) 一、选择题 1.将三颗骰子各掷一次,记事件A =“三个点数都不同”,B =“至少出现一个6点”,则条件概率()P A B ,() P B A 分别是( ) A.6091,12 B.12,6091 C.518,6091 D.91216,12 2.设随机变量ξ服从正态分布()3,4N ,若()()232P a P a ξξ<-=>+,则a 的值为 A .73 B .53 C .5 D .3 3.已知随机变量ξ~)2,3(2N ,若23ξη=+,则D η= A . 0 B . 1 C . 2 D . 4 4.同时拋掷5枚均匀的硬币80次,设5枚硬币正好出现2枚正面向上,3枚反面向上的次数为ξ,则ξ的数学期望是( ) A .20 B .25 C. 30 D .40 5. 甲乙两人进行乒乓球比赛, 约定每局胜者得1分, 负者得0分, 比赛进行到有一人比对方多2分或打满6局时停止, 设甲在每局中获胜的概率为 23,乙在每局中获胜的概率为13 ,且各局胜负相互独立, 则比赛停止时已打局数ξ的期望()E ξ为( ) A .24181 B .26681 C .27481 D .670243 6.现在有10奖券,82元的,25元的,某人从中随机无放回地抽取3奖券,则此人得奖金额的数学期望为( ) A .6 B .395 C .415 D .9 7.一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c ,,,(0,1)a b c ∈,且无其它得分情况,已知他投篮一次得分的数学期望为1,则ab 的最大值为 ( ) A .148 B .124 C .112 D .16 8.位于数轴原点的一只电子兔沿着数轴按下列规则移动:电子兔每次移动一个单位,移动的方向向左或向右,并且向左移动的概率为 23,向右移动的概率为13,则电子兔移动五次后位于点(1,0)-的概率是 ( ) A .4243 B .8243 C .40243 D .80243

回归方程和独立性检验知识点

回归分析和独立性检验 一、回归分析 1、回归直线方程 a x b y ???+= (x 叫做解释变量,y 叫做预报变量) 其中∑∑==---=n i i n i i i x x y y x x b 1 2 1 )() )((?= ∑∑==--n i i n i i i x n x y x n y x 1 2 21 (由最小二乘法得出,考试时给出此公式中的一个) x b y a ??-= ( 此式说明:回归直线过样本的中心点)(y x , ,也就是平均值点。 ) 2、几条结论: (1)回归直线过样本的中心点)(y x ,。 (2)b>0时,y 与x 正相关,散点图呈上升趋势;b<0时,y 与x 负相关,散点图呈下降趋势。 (3)斜率b 的含义(举例): 如果回归方程为y=2.5x+2, 说明x 增加1个单位时,y 平均增加2.5个单位; 如果回归方程为y=-2.5x+2,说明x 增加1个单位时,y 平均减少2.5个单位。 (4)相关系数r 表示变量的相关程度。 范围:1≤r ,即 11≤≤-r r 越大.,相关性越强. 。0>r 时,y 与x 正相关;0

无差检验、独立性检验 SPSS

作业6: 1.无差检验 随机从某市抽取90名教师,其中高级职称有30名,中级职称有42名,初级职称有18名。若假设规定高、中、初级职称比为2:6:2,试问这一调查结果是否与规定相一致? 注:上表中“1”表示高级职称、“2”表示中级职称、“3”表示初级职称。 (2)研究假设 零假设:这一调查结果与规定一致。 备择假设:这一调查结果与规定不一致。 (3)操作说明 1.输入数据。保存为“数据1”。 2.对观测量进行加权。单击“数据”菜单下的“加权个案”,在弹出的“加权个案” 对话框中,选择“加权个案”单选项,并选择“人数”变量,单击“添加”按钮使 之添加到“频率变量”框中,定义该变量为权数,然后单击“确定”按钮,返回数 据编辑框。 3.卡方检验。单击“分析”菜单下的“非参数检验”,选项中得“卡方检验”命令。 在弹出的“卡方检验”对话框中,因为要对高级职称、中级职称、初级职称的人数 进行分析,所以在对话框左侧的列表中选择“职称”变量,单击“添加”按钮使之 添加到“检测变量列表”框中。在“期望值”框中得“数值”处输入理论上高级职 称、中级职称、初级职称的比例2:6:2,然后单击“确定”按钮,SPSS开始进行卡 方检验。 (4)生成图表及结果解释 从第一个表格中可以看出高、中、初级职称的实际观测值、理论值和两者之间的差异个数;从第二个表格中可以看出自由度df=2,X2=10.667>9.210= X20.01 (2), P<0.01,所以拒绝零假设,支持备择假设,即这一调查结果与规定不一致。

2.独立性检验 在研究初中厌学学生意志力时,某研究得到下表样本资料,试问厌学学生的意志力水平是否与年级有关? (1)原始数据 (2)研究假设 零假设:厌学学生的意志力水平与年级无关。 备择假设:厌学学生的意志力水平与年级有关。 (3)操作说明 1. 输入数据。保存为“数据2”。 2.对观测量进行加权。单击“数据”菜单下的“加权个案”,在弹出的“加权个案”对 话框中,选择“加权个案”单选项,并选择“人数”变量,单击“添加”按钮使之添加到“频率变量”框中,定义该变量为权数,然后单击“确定”按钮,返回数据编辑框。 3.独立性检验。单击“分析”菜单下的“描述统计”中得“交叉表”选项,在弹出的“交叉表”对话框中,将左边列表中得“年级”添加到“行”变量框中,将左边列表框中得“意志力水平”添加到“列”变量中。点击“统计量”按钮,在弹出的对话框中,选择“卡方检验”单选项。点击“继续”按钮,返回到“交叉表”对话框中,点击“确定”。SPSS开始进行独立性检验。 (4)生成图表及结果解释。

独立性检验

一、新知: 1.分类变量: 2.列联表(22 列联表) 二、探究任务:吸烟与患肺癌的关系 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果: 那么,吸烟是否对患肺癌有影响? 1.由列联表可粗略的看出: (1)不吸烟者有患肺癌; (2)不吸烟者有患肺癌. 因此,直观上的结论:. 2、通过数据和图形,得到的直观印象是患肺癌有关.那是否有一定的把握认为“吸烟与患肺癌有关”呢?我们可以通过统计分析来回答这个问题。 (独立性检验的必要性) 3、统计量2K 为了使不同样本容量的数据有统一的评判标准,使用2K 2 K= 吸烟与患肺癌列联表

判断方法: 1、先假设两变量没有关系 2、计算2K 注意: ①2K一般要大于6.635 ②2K越大,证明假设不成立(即两变量有关系),说明两变量之间关系越强;2K越小,证明假设成立(即两变量没有关系),说明两变量之间关系越弱。 三、独立性检验: 利用随机变量2K来判断“两个分类变量有关系”的方法称为独立性检验。 (独立性检验是检验两个分类变量是都有关系的一种常用统计方法) 四、※典型例题 例1 吸烟与患肺癌列联表 求2K. ※动手试试 练1. 性别与喜欢数学课程列联表:

求2K. 课后作业 某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表: 求2K.

第二节 一、复习 1. 分类变量:. 2. 22 列联表:. 3. 统计量2K:. 二、新课 例 1 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果: 那么,吸烟是否对患肺癌有影响? 第一步:提出假设检验问题 : H 第二步:根据公式求2K观测值 k= 2、思考:究竟吸烟与患肺癌有关系的概率是多少呢?(有百分 之多少把握认为两者有关系呢?)

《独立性检验》教案)

《独立性检验》教案 一、教学目标 1、知识与技能: 通过典型案例的探究,了解独立性检验的基本思想,会对两个分类变量进行独立性检验,明确独立性检验的基本步骤,并能利用独立性检验的基本思想来解决实际问题. 2、过程与方法: 通过探究“吸烟是否与患肺癌有关系”引出独立性检验的问题。通过列联表、等高条形图,使学生直观感觉到吸烟和患肺癌可能有关系.这一直觉来自于观测数据,即样本.问题是这种来自于样本的印象能够在多大程度上代表总体?这节课就是为了解决这个问题,让学生亲身体验直观感受的基础上,提高学生的数据分析能力. 3、情感态度价值观: 通过本节课的学习,加强数学与现实生活的联系。以科学的态度评价两个分类变量有关系的可能性。培养学生运用所学知识,解决实际问题的能力。对问题的自主探究,提高学生独立思考问题的能力;让学生对统计方法有更深刻的认识,体会统计方法应用的广泛性,进一步体会科学的严谨性。教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。 二、教学重点 理解独立性检验的基本思想及实施步骤. 三、教学难点 1.了解独立性检验的基本思想; 2.了解随机变量K2的含义,K2的观测值很大,就认为两个分类变量是有关系的。 四、教学方法 以“问题串”的形式,层层设疑,诱思探究。用“讲授法”,循序渐进,引导学生,步步为营,螺蜁上升探究本节课的知识内容. 五、教学过程设计

环 节 互动意图创 设情景、引入新课课下预习,搜集有关分类变量有无关系的一些实例。 情境引入、提出问题:1、吸烟与患肺癌有关系吗? 2、你有多大程度把握吸烟与患肺癌有关? 组织引 导学生 课下预 习问题 背景, 初步明 确定要 解决 “吸烟 与患肺 癌”之 间的关 系问 题. 好的课 堂情景 引入, 能激发 学生求 知欲, 是新问 题能够 顺利解 决的前 提条件 之一. 初步探索、展示内涵 变量有定量变量、分类变量,定量变量—回归分析;分类变 量—独立性检验,引出课题。 问题1、我们在研究“吸烟与患肺癌的关系”时,需要关注哪一些 量呢? 列联表:分类变量的汇总统计表(频数表). 一般我们只 研究每个分类变量只取两个值,这样的列联表称为2*2列联表 . 如吸烟与患肺癌的列联表: 不患肺癌患肺癌总计 不吸烟7775 42 7817 吸烟2099 49 2148 总计9874 91 9965 问题2:由以上列联表,我们估计吸烟是否对患肺癌有影响?①在 不吸烟者中患肺癌的比例为________;②在吸烟者中患肺癌的比 例为________. 1,教师 通过举 例,引 入分类 变量这 个新概 念.引 出课题 2,组织 学生填 表讨论 问题, 初步得 到问题 的结 论. 从实际 问题出 发引入 概念, 提出问 题有利 于学生 明白我 们要学 习这节 课的必 要性。。

《独立性检验》

《独立性检验的基本思想及其初步应用》教学设计 东北师范大学附属实验学校李宇 一、教学内容与内容解析 1.内容: 独立性检验的基本思想及实施步骤 2.内容解析: 本节课是人教A版(选修)2—3第三章第二单元第二课时的内容.在本课之前,学生已经学习过事件的相互独立性、正态分布及回归分析的基本思想及初步应用。本节课利用独立性检验进一步分析两个分类变量之间是否有关系,是高中数学知识中体现统计思想的重要课节。 在本节课的教学中,要把重点放在独立性检验的统计学原理上,理解独立性检验的基本思想,明确独立性检验的基本步骤。在独立性检验中,通过典型案例的研究,介绍了独立性检验的基本思想、方法和初步应用。独立性检验的基本思想和反证法类似,它们都是假设结论不成立,反证法是在假设结论不成立基础上推出矛盾从而证得结论成立,而独立性检验是在假设结论不成立基础上推出有利于结论成立的小概率事件发生,于是认为结论在很大程度上是成立的。因为小概率事件在一次试验中通常是不会发生的,所以有利于结论成立的小概率事件的发生为否定假设提供了有力的证据。 学习独立性检验的目的是“通过典型案例介绍独立性检验的基本思想、方法及其初步应用,使学生认识统计方法在决策中的作用”。这是因为,随着现代信息技术飞速发展,信息传播速度快,人们每天都会接触到影响我们生活的统计方面信息,所以具备一些统计知识已经成为现代人应具备的一种数学素养。 教学重点:理解独立性检验的基本思想及实施步骤. 二、教学目标与目标解析 1.目标: ①知识与技能目标 通过生活中新闻案例的探究,理解独立性检验的基本思想,明确独立性检验的基本步

骤,会对两个分类变量进行独立性检验,并能利用独立性检验的基本思想来解决实际问题。 ②过程与方法目标 通过探究“玩电脑游戏与注意力集中是否有关系”引出独立性检验的问题,借助样本数据的列联表分析独立性检验的实施步骤。利用上节课所学已经由数据直观判断出玩电脑游戏与注意力集中可能有关系。这一直觉来自于观测数据,即样本。问题是这种来自于样本的印象能够在多大程度上代表总体。这节课就是为了解决这个问题,在学生亲身体验感受的基础上,提高学生的数据分析能力。 ③情感态度价值观目标 通过本节课的学习,加强数学与现实生活的联系。以科学的态度评价两个分类变量有关系的可能性。培养学生运用所学知识,解决实际问题的能力。教学中适当地利用学生合作与交流,使学生在学习的同时,体会与他人合作的重要性。 2.目标解析: 独立性检验是考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度的一种重要的统计方法.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.因此,在学习中通过对统计案例的分析,理解和掌握独立性检验的方法,体会独立性检验的基本思想在解决实际问题的应用,以提高我们处理生活和工作中的某些问题的能力. 新课标指出:学生的数学学习内容应当是现实的、有趣的和富有挑战性的。从心理学的角度看,青少年有一种好奇的心态、探究的心理。因此,紧紧地抓住学生的这一特征,利用学生身边的问题“玩电脑游戏与注意力集中是否有关系”,设计教学情境,使学生在观察、讨论等活动中,逐步提高数据分析能力。 三、教学问题诊断分析 1.本节课的内容独立性检验对学生来说是全新的内容,为什么有这么一个方法?为什么要学习这个方法?通过课前的新闻引入可以让学生体会到本节课知识的应用性。 2.独立性检验相当于建立一个判别“两个分类变量之间有关系”这一结论是否成立的规则,并且给出该规则把“两个分类变量之间没有有关系”错判成“两个分类变量之间有关系”的概率。所以首先要教会学生的是了解并初步理解这个规则,而后才是会用这个

独立性检验练习含答案

§ 独立性检验 一、基础过关 1.当χ2>时,就有________的把握认为“x 与y 有关系”. 2.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶,则χ2≈__________.(结果保留3位小数) 3.分类变量X 和Y 的列表如下,则下列说法判断正确的是________.(填序号) y 1 y 2 总计 x 1 ( a b a +b x 2 c d c +d 总计 a +c b +d & a + b + c +d ①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强. 4.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表: 男 女 总计 】 爱好 40 20 60 不爱好 20 30 50 总计 60 % 50 110 由 χ2=n ad -bc 2 a + b c + d a +c b +d 算得, χ2=110×40×30-20×20260×50×60×50≈. 附表: P (χ2≥k ) k ) 参照附表,得到的正确结论是________. ①在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过%的前提下,认为“爱好该项运动与性别无关”;

③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”. 5.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸 . 年龄 合计 不超过40岁 超过40岁 吸烟量不多于20支/天 50 15 65 ) 吸烟量多于20支/天 10 25 35 合计 60 40 100 则有________的把握确定吸烟量与年龄有关. 二、能力提升 — 6.某高校“ 专业 性别 非统计专业 统计专业 合计 男 13 10 23 | 女 7 20 27 合计 20 30 50 为了判断主修统计专业是否与性别有关,根据表中的数据,得χ2=50×13×20-10×7 2 23×27×20×30 ≈. 因为χ2≈>,所以判断主修统计专业与性别有关系,那么这种判断出错的可能性为________. 7.在2×2列联表中,若每个数据变为原来的2倍,则卡方值变为原来的________倍. ~ 8.下列说法正确的是________.(填序号) ①对事件A 与B 的检验无关,即两个事件互不影响; ②事件A 与B 关系越密切,χ2就越大; ③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生. 9.为研究某新药的疗效,给50名患者服用此药,跟踪调查后得下表中的数据: 无效 有效 总计 ( 男性患者 15 35 50 女性患者 6 44 50

相关主题
文本预览
相关文档 最新文档