当前位置:文档之家› 用样本估计整体

用样本估计整体

用样本估计整体
用样本估计整体

这就是说。各个小长方形的面积等于相应各组的频率。显然。所有张方形面积之和等于1. 为了了解全部产品中优等品所占比例。可以统计出内径尺寸在区间25.325到25.475内的个体数载样本容量中所占的比例、也就是他的频率。从表中容易看出,这个频率值等于0.12+0.18+0.25+0.16+0.13=0.84,于是可以估计出所有生产的钢管中有84%的优等品、工厂可以根据质量规范。看看是否达到优等品率的要求,如果没有达到。就需要进一步分析原因。解决问题。

当然。用样本的频率分布估计总体的分布时。要使样本能够很好的反应总体的特征。必须随机抽取样本。由于抽样的随机性,可以想到(参考本届练习A第三题),如果随机抽取另外一个容量为100的样本,所形成的样本频率分布一般会与请按一个样本频率分布有所不同。但是。他们都可以近似的看做总体的分布。

从频率分布直方图可以清楚的看出数据分布的总体态势,但是从直方图本身得不出原式的数据内容。所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。

把频率分布直方图各个张方形上边的中点用线段连接起来,就得到频率分布折线图,为了方便看图。一般习惯于吧频率分布折线图化成与横轴相连。所以横轴上的左右两端点没有实际的意义。

图中各个小长方形的面积,表明了所抽取的100件产品中内径尺寸落在各个小组内的产品个数与100的比值大小。如果样本容量越大,所分组数越多。图中表示的频率分布就越接近于总体在各个小组内取值的个数与总数比值的大小。设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,他可以用仪表光滑取消Y=f (x)来描绘。这条光滑曲线就叫做总体密度曲线。总体密度曲线精确地反映了一个总体在各个区域内取值的规律。产品尺寸落在(a,b)内的百分率就是图中带斜线部分的面积,对本例来说,总体密度曲线呈中间高两边低的“钟”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内。

抽样后的样本数据汇总。号可以借助计算机来准确、快速的作出,图就是运用前面所讲到的画直方图的步骤,在工作表中对样本数据汇总得出的结果。

茎叶图:

某赛季甲乙两名篮球运动员每场比赛的得分情况如下:

甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50.

乙的得分:8,13,14,16,23,26,28,33,38,39,51.

上面的发数据可以用图来表示。他的中间部分像一棵植物的茎,两边部分像这个植物茎上生长出来的叶子。用中间的数字表示两位运动员得分的十位数,两边的数字分别表示两个人各场比赛得分个位数。例如。用3|389就表示了33,38,39这三个数据,通常把这样的图焦作茎叶图,根据上图可以对两名运动员的成绩进行比较。

从上面的茎叶图可以看出,甲运动员的得分情况是大致对称的。中位数是36,:乙运动员的得分情况除一个特殊得分外。也大致对称。中位数是26.

用茎叶图表示数据有两个突出的优点。一是从统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到。二是茎叶图可以在比赛时随时记录。方便记录与表示。

2.2.2用样本的数字特征估计总体的数字特征

在日常生活的很多情况下,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征。比如购买灯泡时,消费者希望知道的是这批灯泡的平均使用寿命,我们怎样来了解这批灯泡的平均使用寿命呢?当然不可能把所有的灯泡逐一测试,因为测试后灯泡就报废了。于是,需要通过随机抽样。把这批灯泡的寿命看做整体,从中随机抽取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征(如平均数等)来估计总体的数字特征。

1用样本的平均数估计总体平均数

我们在初中学过,平均数描述了数据的平均水平,定量的反应了数据的集中趋势所处的水平,那么,怎样用样本的平均数估计总体的平均数呢?

例1:从某大型企业全体员工某月的月工资中随机抽取50名员工的月工资资料如下(单位:元)

试计算这50员工的月工资平均数,并估计这个企业的员工平均工资。

解:月平均工资=

。由此可以估计这家企业的员工月平均工资为1320元。假如你去这家公司应聘职位,月平均工资水平是你考虑的重要因素。一般来讲,月平均工资的水平可以与同类公司待遇进行比较。

同样,再随机抽取50名公司职员的工资。计算说得的样本的平均数一般会与例1中的样本平均数不同,所以。用样本平均数估计总体平均数时。样本的平均数只是总体平均数的近似。

我们知道,N个样本x1,x2,…xn的平均数

12n

x x x

x

n

-+++

=

,则有12n

n x x x x

-

=+++

也就是把每个

(1,2,3)

i

x i n

=

都用x

-

代替后,数据总和保持不变,所以平均数x

-

对数据有

“取齐”的作用,代表了一组数据的数值平均水平。

在例1中,可能有人会猜测,应用50%的员工工资超过平均数,而50%低于平均数。

我们用前面学习的方法画出例1中月工资的频率分布直方图。并标出样本平均数,又数据可

以得出,只有30%的员工月平均工资超过平均数,其余70%的在平均数以下,想一想什么

原因导致了这个结果。

2.用样本标准差估计总体标准差

数据的离散程度可以用极差、方差或标准差来描述。我们知道,样本方差描述了一个数据围

绕平均数波动的大小,为了得到以样本数据的单位表示的波动幅度,通常要求求出样本方差

的算是平方根,一般的,设样本的元素x1,x2,…xn ,样本的平均数为x ,定义、

其中s 的平方表示样本方差。S 表示样本标准差。

计算样本数据x1,x2,…xn 的标准差的算法是:

S1 算出样本数据的平均数x -:

S2 算出每个样本数据与样本平均数的差(1,2,3,...)i x x i n --=

S3 算出S2中(1,2,3,...)i x x i n --=的平方

S4 算出S3中N 个平方数的平均数,即为样本方差。

S5 算出S4中平均数的算术平方根,即为样本标准差。

例2.计算数据5,7,7,8,10,11的标准差。

解:S1 57+7+8+10+11=86x -+=

S4 2911049s 46+++++=

=

2=

所以这组数据的标准差为2.

例4 从甲乙两名学生中选拔一人参加设计比赛,对他们的设计水平进行了测试,两人在相

同条件下各射击10次,命中的环数如下:

甲:7 8 6 8 6 5 9 10 7 4

乙:9 5 7 8 7 6 8 6 7 7

(1) 计算甲乙两人你射击命中环数的平均数和标准差:

(2) 比较两个人的成绩,然后决定选择哪一人参赛

解:(1)计算得77;=1.73s =1.10x x s --

==甲乙乙甲

(2)又(1)可知,甲乙两人的平均成绩相等,但S 乙

稳定一些,从成绩的稳定性考虑,可以选择乙参加比赛。

样本标准差和频率分布直方图有什么关系呢?从标准差的定义可知,如果样本各数据值都相

等,则标准差得0,表明数据没有波动幅度,数据没有离散性。若个体的值与平均数的差的

绝对值较大,则标准差也较大。表明数据的波动幅度也很大,数据离散程度很高,因此标准

差描述了数据对平均数的离散程度。

再来看钢管内径尺寸的例子,他的样本平均数为25.401,标本标准差为0.056,在这放图中

用虚线i 标出平均数所在的位置,并画出距平均数两侧各一倍的标准差和两倍标准差的区间,

可以看到大约有70%的钢管内径尺寸落在距离平均数两侧各一倍标准差的区间内,即区间

(x ,x s s --

-+),大约有95%的钢管内径尺寸落在距平均数两侧各两倍标准差的区间内,即

区间(x 2,x 2s s --

-+),由此我们估计总体中也有大致比率的产品尺寸落入到相应的区间内。

实际生产、生活中有大量的例子符合这样的统计规律,比如同一年龄段的人群的身高、体重、

同一生产线生产的带装洗衣粉的质量等。

2.3变量的相关性

2.3.1 变量的相关关系

变量与变量之间的关系常见的有两类:一类是确定性的函数关系,像长方形的边长a 和面积

S 的关系。另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,他们的关

系是带有随机性的,例如,人的身高并不能确定体重,但一般来说:“身高者,体也重”,我

们说身高与体重这两个变量具有相关关系。

怎样判断两个变量有没有相关关系,我们来看下面的例子。

例 设某地10户家庭的年收入和年饮食支出的统计资料如下表。

由表中数据可以看出,y 有随x 增加而增加的趋势,并且增加的趋势变缓。为了更清楚的看

出x 与y 是否有相关关系,我们以年收入x 的取值做横坐标,把年饮食支出y 的相应取值作

为纵坐标,在直接坐标系中描点(x1,y1)(i=1,2,3,…,10),如图所示,这样的图形叫做

散点图,从图中可以只直观的看出家庭年收入和年饮食支出之间具有相关关系,并且当年收

入的值由小变大时,年饮食支出的值也在由小变大,这种关系称为正相关,反之,如果一个

变量的值由小变大时,另一个变量的值由大变小,这种关系称为负相关。

2.3.2 两个变量的线性相关

看下面的例子

例1下表是某小卖部六天卖出的热茶的杯数与当天天气温度的对比表。

(1)将表中的数据画成散点图;

(2)你能从散点图中发现温度与饮料杯数近似成什么关系吗?

(3)如果近似成线性关系的话,请画出一条直线近似地表示这种线性关系

解:(1)画出的散点图如图

(2)从图中可以发现温度和杯数具有相关关系,当温度的值由小到大变化时,杯数的值由大变小,所以温度和杯数成负相关。图中的数据点大致分布在一条直线附近,因此温度和杯数近似成线性相关关系。

(3)根据不同的标准,可以画出不同的直线来近似表示这种线性相关关系,比如连接最左侧点和最右侧点得到一条直线,或者让画出的直线上方的点和下方的点数目相等。

同学们也可以自己尝试制定标准来画出近似直线,管家能在与这一标准是否合理,是否能够

得到最佳的近似直线。(最优拟合直线)。

由图2-11可见,所有数据点都分布在一条直线附近,显然这样的直线还可以画出许多条,

而我们希望找出其中一条,它能最好的反应x 和y 之间的关系,换言之,我们要找出一条直

线,使这条直线“最贴近”已知的数据点,几座直线方程为

^y a bx =

+

① 这里在y 的上方加几号“^”,是为了区分Y 的实际值y ,表示当x 取值xi (i=1,2,3, (6)

时,Y 相应的观察值为y1,而直线上对应与xi 的纵坐标是^i y a bx =+,①式叫做Y 对x 的

回归直线方程,b 叫做回归系数,要确定回归直线方程①,只要确定a 与回归系数b 。

下面我们来研究回归直线方程的求法,设x ,Y 的一组观察值为

(xi ,yi )i=1,2,…,n

且回归直线方程为^y a bx =+

当x 取值xi (i=1,2,…,n )时,Y 的观察值为yi ,差^

(1,2,...,)i y y i n -=刻画了实际观察

值yi 与回归直线上相应点纵坐标之间的偏高程度,我们希望这n 个离差构成的总离差越小

越好,才能使所找的直线很贴近已知点。

一个自然的想法是把各个离差加起来作为总离差,可是。由于离差有正有负,直接相加会相

互抵消,这样就无法反映这些数据点的贴近程度,即这个总离差不能用n 个离差之和

^1()n i i i y y =-∑来表示,通常是用离差的平方和,即^21()n i i

i Q y a bx ==--∑作为总离差,并使

之达到最小,这样,回归直线就是所有直线中Q 取最小值的那一条,由于平方又叫二乘方。

所以这种使“离差平方和为最小”的方法,焦作最小二乘法。

用最小二乘法求回归直线中的a ,b 有下面的公式:

^1

221n i i

i n i i x y n x y b n x x --=-=-=-∑∑ …… ② ^^a y b x --

=- 其中a ,b 的上方加“^”,表示是由观察值按最小二乘法得的估计值,^b 也叫回归系数,^

a ,^

b 求出后,回归直线方程就建立起来了。

例2 在某种产品表面进行腐蚀刻线试验,得到腐蚀深度Y与腐蚀时间x之间相应的一组观察值如下表。

(1)画出表中数据的散点图

(2)求Y对x的回归直线方程。(结果保留到小数点后3位数字)

(3)试预测腐蚀时间为100s时腐蚀深度是多少

解:(1)散点图如图

(3)根据公式②求腐蚀深度Y对腐蚀时间x的回归直线方程的步骤如下:

I 先把数据列成表

II 计算^a ,^b 的值

由上表分别计算x ,y 的平均数得5102141111,.x y --=

=。代入公式②得(注意:不必把,.x y --

化为小数,以减小误差)

III 写出回归直线方程 腐蚀深度Y 对腐蚀时间x 的回归直线方程为0.304 5.346y x -=+。

里的回归系数^0.304,x s um b =他的意义是:腐蚀时间每增加一个单位(),深度Y 平均增加0.304个单位()

(3)根据上面求的的回归直线方程,当腐蚀时间为100s 时

0.304*100 5.346=35.86um y =+^

()

3.1事件与概率

3.1.1 随机现象

在自然界和人类社会里,经常会遇到两类不同的现象:必然现象和随机现象。

我们能知道。把一块石头抛向空中,他会掉到地面上来,我们生活的地球。每天你都在绕太

阳转动,一个人随着岁月的消逝,一定会衰老。死亡……这类现象称为必然现象,必然现象

是在一定条件下必然发生某种结果的现象。

另一类现象称为随机现象,它们具有这样的特点。当在相同的条件下多次观察同一现象,每

次观察到的结果不一定相同,事先很难预料哪一种结果会出现。

下面举4个例子。

例1 我们通常把硬币上刻有国徽的一面称为正面,现在在任意掷一枚质均匀的硬币,那么

可能出现“正面朝上”,也可能出现“反面朝上”,究竟得到哪一种结果。不可能事先预料到,

所以这是一种随机现象。

例2 一名中学生在篮球场的罚球线练习投篮,对于每次投篮,他可能投进,也可能投不进,

即使他打篮球再好,我们最多只能说,他投进的可能性很大。并不能保证每次投篮都能进。

所以这也是一种随机现象。

例3 在城市中,当我们走到装有交通信号灯的十字路口时,可能遇到绿灯,这时可以快速

穿过马路,也可能遇到红灯或者黄灯,这时就应该停下,一般来说,行人在十字路口看到的

交通信号灯颜色,可以认为这是一种s 随机现象。

例4 在10个同类产品中,有8个正品,2个次品,从中任意抽取3个监测,那么,“抽到3个正品”“抽到2个次品”“抽到1个次品”三种结果都有可能出现,至于出现哪一种结果,由于是任意抽取,抽取前无法预料,当然这也是一种随机现象。

为了探索随机现象的规律性,需要对随机现象进行观察,women你把观察随机现象或为了某种目的而进行的实验统称为试验,把观察结果或实验结果称为试验的结果,为了讨论问题方便,在本章中我们赋予“试验”这一词比较广泛的含义,例1中掷硬币,例2的中学生投篮,例3的观察交通信号灯颜色,例4的产品抽样检测等都是试验,此外,像战士打靶。明天会不会下雨,本地的足球队明天会不会进球,甚至小孩在做掷骰子游戏……都可以看成试验。

3.1.2 事件与基本事件空间

当我们在同样的条件下重复进行试验时,有的结果始终不会发生,他成为不可能事件,有的结果在每一次试验中肯定会发生,我们称为必然事件,在试验中可能出现,也可能不出现的结果称为随机事件。

如果某个练习投篮的中学生决定投篮5次,那么他“投进6次”称为不可能事件,“他投进的次数小于6”是必然事件,“投进3次”是随机事件。

在上一节例4中,也可以列出一些不可能事件,必然事件,随机事件,例如:抽到3个次品是不可能事件,抽到至少一个正品是必然事件,没有抽到正品是随机事件……

通常用大写英文字母A,B,C…表示随机事件,随机事件可以简称为事件。为了叙述起来文字简洁些,我们又是讲到事件时,其中可能包含不可能事件的和必然事件的意思。一般都不另作说明了。

在一次试验中,我们常常要关心的是所有可能发生的基本结果,他们是试验中不能再分最简单的随机事件,其他事件可以用他们来描绘,这样的事件简称为基本事件,所有基本事件构成的集合称为基本事件空间。基本事件空间常用大写希腊字母Ω表示。

例如,掷一枚硬币,观察硬币落地后那一面向上,这个试验的基本事件空间就是集合{正面向上,反面向上},即

Ω={正面向上,反面向上},或简记为Ω={正,反}。

这个试验有两个基本事件,“正面朝上”和“反面朝上”。

掷一枚骰子,观察掷出的点数。这个试验的基本事件空间Ω={1,2,4,5,6,}。其中1,2,3,4,5,6,分辨代表骰子掷出的点数为1,2,3,4,5,6这六个基本事件。

一先一后掷两枚硬币,观察正反面出现的情况,基本事件空间有

Ω=(正,正)(正,反)(反,正)(反,反)

它有四个基本事件,(正,正)代表第一和第二枚硬币都出现正面。(正,反)代表第一枚硬币是正面,第二枚硬币是反面。(反,正)代表第一枚是反面,第二枚是正面,(反,反)代表第一枚和第二枚都是反面。

对于这些问题,除了要知道试验可能出现的每一个结果外,我们还要了解与这些可能出现的结果有关的一些事件,例如,在一先一后掷出两次硬币的试验中,我们要了解“至少又一次出现正面”这个事件,通过观察,我们不能发现“至少又一次出现正面”这个事件可以看成由基本事件(正,正)(正,反)(反,正)组成的集合,若设事件A=“至少有一次出现正面”,那么,假如掷出了(正,正),显然可以说,“至少有一次出现正面”发生了,或者说事件A发生了;假如掷出了(反,反),就说事件A没有发生。一般的说,如果再一次试验中,出现的结果是集合A中的某个基本事件,我们就说事件A发生了,否则就说事件A没

有发生。

我们可以把随机事件理解为基本事件空间的子集。例如,在上面投掷一颗骰子观察投掷出点数的试验中,基本事件空间

Ω={1,2,3,4,5,6}。

如果设A={2,4,6,},那么B Ω,A也是Ω的一个子集。事件B表示“投掷出点数大于4 ”

例1 一个盒子中装有10个完全相同的小球,分别标以号码1,2,…,10,从中任取一球。观察球的号码,写出这个试验的基本事件和基本事件空间。

解:这个试验的基本事件是取得的小球号码为i,i=1,2, (10)

基本事件空间Ω={1,2, (10)

例2 连续投掷三枚硬币,观察落地后这三枚硬币出现正面还是反面

(1)写出这个试验的基本事件空间。

.(2)求这个试验的基本事件的总数。

(3)“恰好有两枚正面向上”这一事件包含哪几个基本事件。

解:(1)用类似上面一先一后投掷两枚硬币时基本事件的记法,这个试验的基本事件空间Ω={(正,正,正)(正,正,反)(正,反,正)(正,反,反)(反,正,正)(反,正,反)(反,反,正)(反,反,反)};

(2)基本事件的总是是8;

(3)“恰好有两枚正面向上”包含以下三个基本事件。

(正,正,反)(正,反,正)(反,正,正)。

3.1.3 频率与概率

随机事件在试验中可能发生,自然产生发生的可能性有多大的可能,我们还是从最简单的试验----投掷硬币谈起。虽然我们不能预先判断出出现正面向上还是反面向上,但是假如硬币均匀,直观上可以认为出现正面与反面的机会是相等的。即在大量试验中出现正面的频率应接近于0.5.

例1我们一起来投掷硬币

把全班分成十几个小组,每个小组4~5人,各小组把一枚均匀硬币至少投掷100次,观察投

当全班做完这一试验后,把试验结果公布在黑板上,请大家谈谈事件“正面朝上”的发生有没有什么规律可循?

历史上有些学者还做了成千上万次投掷硬币的试验。

我们可以设想有1000个人投掷硬币,如果每个人投掷5次,计算每个人透出正面的频率。在这1000个频率中,一般的说。0,0.2,0.4,0.6,0.8,1都会有,而且会有不少是0 或1,;如果要求每个人投20次。这是频率为0,0.05,0.95,1的将会减小,多数频率在0.35~0.65之间,甚至比较集中在0.4~0.6之间;如果要求每个人投掷1000次,这时绝大多数的频率会集中在0.5的附近,和0.5有较大差距的频率值也会有,但这样的频率值会很少,而且随着投掷次数的变多,频率也会越来越明显的集中在0.5附近,当然,即使投掷的次数再多,也不可能排除有和0.5距离较远的频率值,只不过这种情形极少。

人们经过大量试验和实际经验的积累逐渐认识到,在多次重复实验中。同一事件发生的频率

在某一个数值附近摆动,而且随着试验次数的增多,一般摆动幅度会很小,而且观察到的大偏差也越少,频率呈现一定的稳定性,频率的稳定性揭示出随机事件发生的可能性有一定的大小,事件的频率稳定在某一数值附近,我们就用这一数值表示事件发生的可能性大小。 一般地,在n 次重复进行的试验中,事件A 发生的频率M/N ,当n 很大时,总是在某个常数附近摆动,随着n 的增加,摆动幅度越来越小,这时就把这个常数叫做事件A 的概率,记做P (A )。

从概率的定义中,我们可以看出随机事件A 的概率P (A )满足0P A 1≤≤()。这是因为在n 次试验中,事件A 发生的频数m 满足0m n ≤≤,所以m

n 01≤≤,当A 时必然事件时,

P (A )=1,当A 时不可能事件时,P (A )=0.

从定义中,我们还可以看出,概率是通过频率来测量的,或者说频率是概率的一个近似,在前述投掷硬币的例子中,经过前人的反复多次试验,出现真面的频率逐渐稳定到0.5,那么我们就得到出现正面的概率是0.5,这件事情其实质与测量长度一样平常,给定一根木棒。谁都不怀疑它有“客观”长度,长度是多少?我们可以用尺子或者仪器去测量,不论尺子或者仪器多么精确。测量的额数值总是稳定在木棒真实长度的附近。事实上,人们也是把测量说的的值当做真实值,这个类比有助于我们理解概率和频率之间的内在关系。

概率的这种定义叫做概率的统计定义,在实践中很多时候采用这种发法求事件的概率。 有了概率的统计定义,我们就可以比较不同事件发生的可能性大小了。

例2 为了确定某类种子的发芽率,从一大批种子中抽出若干批做发芽试验,其结果如下:

从以上的数据可以看出,这类种子的发芽率约为0.9.

比较例1和例2的结果,我们可以说,这类种子的发芽率比投资一枚硬币正面向上的概率要大得多。

从概率统计定义出发,我们先来考虑此题的简化情形:在投掷一枚均匀硬币的随机试验中,正面出现的概率是0.5,这是否意味着投掷两次硬币一定会出现正面呢?

根据经验,我们投掷两次硬币可能一次正面也不出现,即出现两次反面的情形,但是在大量重复投掷硬币的试验中,比如投掷10000次硬币,则出现正面的次数约为5000次。

买1000张彩票相等于做1000次试验。结果可能一次奖也没中。或者中一次奖,或者多次中奖,所以“彩票中奖的概率为1/1000”,并不意味着买1000张彩票就一定能中奖,只有当所买彩票的数量N 非常大时,我们可以看成大量重复买彩票这个试验,中奖的次数约为n/1000(比如说买10000000张彩票,则中奖的次数约为100000),并且n 越大,中奖次数越接近于n/1000。

3.1.4概率的加法公式

概率的加法公式是计算概率的一个最基本的公式,根据它可以计算出一些较为复杂事件的概率,我们先通过实例引入两个关于事件的概率:互斥事件与事件的并。

例1 投掷一枚骰子,观察投掷出的点数,设事件A “出现奇数点”,B 为“出现2点”,已知P (A )=1/2,P (B )=1/6,求“出现奇数点或2点”的概率。

这里的事件A 和事件B 不可能同时发生,这种不可能同时发生的两个事件称为互斥事件,(或称互不相容事件)。

设事件C 为“出现奇数点或2点”,它也是一个随机事件,事件C 与事件A,B 的关系是:若事件A 和事件B 中至少有一个发生,则C 发生;若C 发生,则A,B 中至少有一个发生,我

们称事件C 是事件A,B 的并。(或和)。

一般的,由事件A 和B 至少一个发生(即A 发生或B 发生,或A,B 都发生)所构成的事件C ,称为事件A 和B 的并,记做C A

B =。事件A B 是由事件A 或B 所包含的基本事件组成的集合。

如图,阴影部分所表示的就是A B 。

假定A,B 是互斥事件。在n 次试验中,事件A 出现的频数是n1,事件B 出现的频数是n2,则事件A B 出现的频数正好是n1+n2,所以事件A B 的频率为:1

212n n n n n n n +=+ 而1

n n 是事件A 出现的频率,2n

n 是事件B 出现的频率,因此,如果用n μ表示在n 次试验中

事件出现的概率,则总有()()n n n A B B ?=μμ(A )+μ.由概率的统计定义。可知()()p A B p p B ?=(A )+。

一般的,如果事件A1,A2,…An 两两互斥,那么事件“12...A A An ???”发生的概率,等于这n 个事件分别发生的概率和,即

(12...)(1)(2)...().P A A An P A P A P An '???=+++①

公式①或公式'①叫做互斥事件的概率加法公式。

例1中事件C :“出现奇数点或者2点”的概率是事件A :“出现奇数点”的概率与事件B :

“出现2点”的概率之和,即1

12263()()()P C P A P B =+=+=.

例2 在数学考试中,小明的成绩在90分以上的概率是0.18,。在80~89分的概率是0.51,在70~79分的概率是0.15,在60~69分的概率是0.09,计算小明在数学考试中取得80分以上的成绩的概率和小明考试及格的概率?

解:分别记小明的考试成绩在90分以上,在80~89分,在70~79分,在60~69分为事件B,C,D,E 这四个事件是彼此互斥的。根据公式①小明的成绩在80分以上的概率是

()()()0.180.510.69P B C P B P C ?=+++=;

小明考试及格的概率,即成绩在60分以上的概率,由公式'①

()()()()()0.18+0.51+0.15+0.09=0.93P B C D E P B P C P D P E ???=+++=。 在这个例题中,令A=“小明考试及格”,-

A =“小明考试不及格”

显然两个事件是互斥事件,且必有一个发生,即A A -

?=Ω。

像这样不能同时发生且必有一个发生的两个事件焦作互为对立事件,事件A 的对立事件记做A ,图中阴影部分表示事件A 的对立事件,由于A A -,是互斥事件,所以()()()

()P P A A P A p A --=?=+Ω,又由Ω是必然事件得到P (Ω)=1,所以,()()P A p A -

+=1,即1()()P A p A --=。②

这个公式为为我们求出P(A)提供了一种方法,当我们直接求P(A)有困难时,常可以转化为P (A -

)。

在例2中,如果求“小明考试不及格”的概率,则由公式②得

P (A -)=1-P(A)=1-0.93=0.07,

即小明考试不及格的概率为0.07.

3.2 古典概型

3.2.1 古典概型

前面我们用随机事件的频率来近似概率,对于一些特殊类型的随机试验,我们并不需要去做大量重复的试验就可以得到随机事件的概率。先看下面的例子。

1 投掷一枚均匀的硬币,观察硬币落地后哪一面朝上,这个试验的基本事件空间Ω={正,反}。 它只有两个基本事件,由于硬币的质地是均匀的,因而直观上可以认为出现正面朝上与反面朝上的机会是均等的,所以投掷正面朝上和反面朝上的可能性都是1/2.

2 投掷一骰子,观察出现的点数,这个试验的基本事件空间Ω={1,52,3,4,5,6}它有六个基本事件,由于骰子的构造是均匀的,因而出现这六个结果的机会是均等的,于是我们可以断言:投掷一颗骰子,每种结果出现的可能性都是1/6。

3 一先一后投掷两枚硬币没观察正反面出现的情况,这个试验的基本事件空间Ω={(正,正)(正,反)(反,正)(反,反)},它有四个基本事件,因为每一枚硬币出现正面于出现反面的机会是均等的,所以可以认为这四个基本事件出现的机会是均等的,因而我们说每一个基本事件的可能性都是1/4.

以上3个试验有两个共同的特征:

(1) 有限性 在一次试验中,可能出现的结果只有有限个,即只有有限个不同的基本事件。

(2) 等可能性 每个基本事件发生的可能性是均等的。

我们称这样的试验为古典概型。上述3个例子均为古典概型。

一个试验是否为古典概型,在于这个试验是否具有古典概型的两个特征---有限性和等可能性,并不是所有的试验都是古典概型。例如,在适应的条件下“种下一粒种子观察它是否发

芽”,这个试验的基本事件空间为{发芽,不发芽},而发芽或者不发芽这两种结果出现的机会一般式不均等的。又如,从规格直径为300-

+0.6mm 的一批合格产品中任意抽取一根,测量其直径d ,测量值可能是从299.4~300.6mm 之间的任何一个值,所有可能的结果有无限多个,这两个试验都不是古典概型。

一般的,对于古典概型,如果试验的n 个基本事件为A1,A2,…An ,由于基本事件是两两互斥的,则由互斥时间的概率加法公式得

P(A1)+P(A2)+…+P(An)=(12,...,)()=1P A A An P ??=Ω

又因为每个基本事件发生的可能性相等,即P(A1)=P(A2)=…=P(An),代入上式得(1)1,(1)=1/n n P A P A ?=即。

所以在基本事件总数为n 的古典概型中,每个基本事件发生的概率为1/n 。

如果随机事件A 包含的基本事件数为m ,同样地,由互斥事件的概率加法公式可得P(A)=m/n 。所以在古典概型中,P(A)= 事件A 包含的基本事件数/试验的基本事件总数。这一定义称为概率的古典定义。

例1 投掷一颗骰子,观察掷出的点数,求掷得奇数点的概率。

解:这个试验的基本事件空间为Ω={1,2,3,4,5,6}。

基本事件总数n=6.事件A=掷得奇数点={1,3,5},其中包含的基本事件数m=3,所以P(A)=3/6=1/2=0.5.

例3 从含有两件正品a1,a2和一件次品b1的3件产品中每次任取1件,每件取中后不放

回,连续取两次,求取出的两件产品中恰有一件次品的概率。

解:每次取一个,取后不放回地连续取两次,其一切可能的结果组成的基本事件空间为 Ω={(a1,a2)(a1,b1)(a2,b1)(a2,b1)(b1,a1)(b1,a2)}

其中小括号内左边的字母表示第一次取出的产品,右边的字母表示每两次取出的产品。Ω由六个基本事件组成,而且可以认为这些基本事件的出现是等可能的,用A 表示取出的两件中,恰好有一件次品这一事件,则A={(a1,b1)(a2,b1)(b1,a1)(b1,a2)} 事件A 由4个基本事件组成,因而P(A)=4/6=2/3。

本章小结

巩固与提高

1判断下列命题的真假:

(1) 必然事件的概率等于1; 真

(2) 某事件的概率等于1.1 假

(3) 互斥事件一定是对立事件。 假

(4) 对立事件一定是互斥事件 真

(5) 在适宜条件下种下一粒种子。观察它是否发芽,这个试验是古典概型 假 2 填空

(1) 掷一颗骰子,出现3点或5点的概率等于:1/3

(2) 掷两颗骰子,出现点数之和等于8的概率等于:1/6

(3)掷三枚硬币,至少出现一个正面的概率等于:7/8

(4)掷一颗骰子,A={点数是奇数},B={点数是偶数},则A ∪B=:{点数是1,2,3,4,5,6}A ∩B=:? B 的互斥事件;点数是奇数A 的互斥事件∩B :点数是偶数

(5)已知P(A)=2/5,则()p A -=3/5

(6)从至少含有5件次品的10件产品中,任取3件,事件“所取3件都是正品”的对立事件为:事件“所取3件至多有一件正品”的对立事件为

3 某台电话,打进的电话响一声时,被接的概率是0.2,响第二声时,被接的概率是0.3,响第三声时,被接的概率是0.3,响第四声时,被接的概率是0.1.那么电话在响前四声内被接的概率是多少:0.9

自测与评估

1 有五条线段,长度分别为1,3,5,7,9.从这五条线段中任取3条。求所取三条线段能够成一个三角形的概率。

325554102!

C C ?=== ?Ω={(1,3,5)

(1,3,7)(1,3,9)(1,5,9)(1,7,9)(1,5,7)(3,5,7)(3,5,9)(3,7,9)(5,7,9)} 基本事件A={(3,5,7)(3,7,9)(5,7,9}

P(A)=3/10

2 在面积为S 的三角形abc 的边AB 上任取一点P ,求三角形PBC 的面积大于S/3的概率。 因为在AB 上任取一点P ,并求△PBC 的面积,所以两个三角形是同底BC 的。即BP 得高大于AB 的1/3时,

即概率为2/3

3 把一颗骰子投掷2次,观察出现的点数,并记第一次出现的点数为a ,第二次出现的点数为b ,试就方程组322

ax by x y +=??+=?解答下列问题:

(1)求方程组只有一个解的概率

(2)求方程组只有正数解得概率。

【解】:(1),,31,2,21

a b a -??? ??-??? 622b x a b -=-232a y a b

-=- Ω={(1,1)(1,2)(1,3)(1,4)(1,5)(1,6)(2,1)(2,2)(2,3)(2,4)(2,5)(2,6)(3,1)(3,2)(3,3)(3,4)(3,5)(3,6)(4,1)(4,2)(4,3)(4,4)(4,5)(4,6)(5,1)(5,2)(5,3)(5,4)(5,5)(5,6)(6,1)(6,2)(6,3)(6,4)(6,5)(6,6)} 1:根据以上的方程组要求原题有1解只要让b-2a 不等于0就成了

那a 和b 不能出现的情况是(1,2)(2,4)(3,6),用排除法去掉这三种情况概率就是1-(3/36)答案是11/12

2:要让方程组只有正解,那y 的的取值范围就是(0,1),a 跟b 的关系就是一个不等式组:b-2a>3-2a>0,解得a=1,b=4或5或6,那a 和b 的组合就只有3种情况,答案就是1/12

用样本估计总体

用样本估计总体一、基础知识 1.频率分布直方图 (1)纵轴表示频率 组距 ,即小长方形的高= 频率 组距 ; (2)小长方形的面积=组距×频率 组距 =频率; (3)各个小方形的面积总和等于1 . 2.频率分布表的画法 第一步:求极差,决定组数和组距,组距=极差组数 ; 第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表. 3.茎叶图 茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数. 4.中位数、众数、平均数的定义 (1)中位数 将一组数据按大小依次排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (2)众数 一组数据中出现次数最多的数据叫做这组数据的众数. (3)平均数 一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,x n的 平均数x=1 n(x1+x2+…+x n).

5.样本的数字特征 如果有n个数据x1,x2,…,x n,那么这n个数的 (1)平均数x=1 n(x1+x2+…+x n). (2)标准差s=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. (3)方差s2=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. 二、常用结论 1.频率分布直方图中的常见结论 (1)众数的估计值为最高矩形的中点对应的横坐标. (2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. (3)中位数的估计值的左边和右边的小矩形的面积和是相等的. 2.平均数、方差的公式推广 (1)若数据x1,x2,…,x n的平均数为x,则mx1+a,mx2+a,mx3+a,…,mx n+a的平均数是m x+a. (2)若数据x1,x2,…,x n的方差为s2,则数据ax1+b,ax2+b,…,ax n+b 的方差为a2s2. 考点一茎叶图 [典例](优质试题·山东高考)如图所示的茎叶图记录了甲、 乙两组各5名工人某日的产量数据(单位:件).若这两组数据 的中位数相等,且平均值也相等,则x和y的值分别为() A.3,5B.5,5 C.3,7 D.5,7 [解析]由两组数据的中位数相等可得65=60+y,解得y=5,又它们的平

最新高中数学统计图表数据的数字特征:用样本估计总体质量检测

统计图表数据的数字特征:用样本估计总体 1.在样本的频率分布直方图中,一共有(≥3)个小矩形,第3个小 矩形的面积等于其余m -1个小矩形面积之和的14 ,且样本容量为100,则第3组的频数是 ( ) A .0.2 B .25 C .20 D .以上都不正确 解析:第3组的频率是15 ,样本容量为100, ∴第3组的频数为100×15 =20. 答案:C 2.(2009·湖北高考)样本容量为200的频率分布直方图如图所示.根

据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为________,数据落在[2,10)内的概率约为 ________. 答案:64 0.4 题组 茎叶图在估计总体中的应用 二 3.某生产车间将10个零件的尺寸(单位:cm)用右面的茎叶图的 方式记录下来,则它们的平均值和中位数分别是________, ________.

解析:10个零件的尺寸数据如下:14,19,21,22,25,37,39,40,41,42,则平均数为30,中位数为31. 答案:30 31 4.(2009·福建高考)某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x 应该是________. 解析:若茎叶图中的x对应的分数为最高分, 则有平均分=89+89+91+92+92+93+94 7 ≈91.4≠91.故最

高分应为94. 故去掉最高分94,去掉最低分88,其平均分为91, ∴89+89+92+93+90+x +92+917 =91,解得x =1. 答案:1 5.(2010·福州模拟)甲、乙两位学生参加数学竞赛培训,在培训期 间,他们参加的5次预赛成绩记录如下: 甲 82 82 79 95 87 乙 95 75 80 90 85 (1)用茎叶图表示这两组数据; (2)从甲、乙两人的成绩中各随机抽取一个,求甲的成绩比乙高 的概率; (3)现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认 为选派哪位学生参加合适?说明理由. 解:(1)作出茎叶图如下:

用样本估计总体教案

2.2.1用样本的频率分布估计总体分布 一、教学目标分析 1.知识与技能目标 (1)通过实例体会分布的意义和作用。 (2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图。 (3)通过实例体会频率分布直方图的特征,能准确地做出总体估计。 2、过程与方法目标: 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法。 3、情感态度与价值观目标: 通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系。 二、教学的重点和难点 重点:会列频率分布表,画频率分布直方图。 难点:能通过样本的频率分布估计总体的分布。 三、教法与学法分析 1、教法:遵循观察、探究、发现、总结式的教学模式。重点以引导学生为主,让他们能积极、主动的进行探索,获取知识。由于内容较繁琐,所以要借助多媒体辅助教学。 2、学法:根据本节知识的特点,由于学生已具备一定的基础知识,可采取研究性学习的学习方法。 四、教学过程 (一)情境引入 1.随机抽样有哪几种基本的抽样方法? 简单随机抽样、系统抽样、分层抽样. 2.随机抽样是收集数据的方法,如何通过样本数据所包含的信息,估计总体的基本特征,即 用样本估计总体,是我们需要进一步学习的内容. 3.高二某班有50名学生,在数学必修②结业考试后随机抽取10名,其考试成绩如下: 82,75,61,93,62,55,70,68,85,78. 如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习水平,就需要有相应的数学方法作为理论指导,本节课我们将学习用样本的频率分布估计总体分布. (二)新课讲解 知识探究(一):频率分布表 【问题】我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t): 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.1 3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2

高考必考题型复习 用样本估计总体

第38练用样本估计总体 [题型分析·高考展望]用样本估计总体在高考中也是热点部分,考查形式主要是选择题、填空题或是与概率结合的综合性解答题,重点是频率分布直方图以及数字特征,属于比较简单的题目. 体验高考 1.(2015·湖南)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示:1300345668889 1411122233445556678 15012233 3 若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是() A.3 B.4 C.5 D.6 答案 B 解析由题意知,将1~35号分成7组,每组5名运动员,成绩落在区间[139,151]的运动员共有4组,故由系统抽样法知,共抽取4名.选B. 2.(2015·课标全国Ⅱ)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是() A.逐年比较,2008年减少二氧化硫排放量的效果最显著 B.2007年我国治理二氧化硫排放显现成效 C.2006年以来我国二氧化硫年排放量呈减少趋势 D.2006年以来我国二氧化硫年排放量与年份正相关 答案 D 解析从2006年起,将每年的二氧化硫排放量与前一年作差比较,得到2008年二氧化硫排放量与2007年排放量的差最大,A选项正确; 2007年二氧化硫排放量较2006年降低了很多,B选项正确; 虽然2011年二氧化硫排放量较2010年多一些,但自2006年以来,整体呈递减趋势,即C 选项正确;

自2006年以来我国二氧化硫年排放量与年份负相关,D选项错误.故选D. 3.(2016·课标全国丙)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是() A.各月的平均最低气温都在0 ℃以上 B.七月的平均温差比一月的平均温差大 C.三月和十一月的平均最高气温基本相同 D.平均最高气温高于20 ℃的月份有5个 答案 D 解析由题意知,平均最高气温高于20 ℃的有六月,七月,八月,故选D. 4.(2016·山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图知,这200名学生中每周的自习时间不少于22.5小时的人数是() A.56 B.60 C.120 D.140 答案 D 解析由题图知,组距为2.5,故每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7, ∴这200名学生中每周的自习时间不少于22.5小时的人数是200×0.7=140,故选D. 5.(2015·湖北)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (1)直方图中的a=________; (2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.

用样本估计总体(含答案).doc

25.2用样本估计总体 一. 选择题 1. 要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是( ) A. 这一批灯泡 B. 抽取的60只灯泡 C. 这一批灯泡的使用寿命 D. 抽取的这60只灯泡的使用寿命 2. 如果一组数据x 1,x 2,x 3,x 4,x 5,的平均数是x ,那么另一组数据x 1+1,x 2+2,x 3+3,x 4+4,x 5+5的平均数是 ( ) A.x . B. 2x + C.3x +. D.15x + 3. 为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中,下面说法错误的是( ) A. 总体是被抽查的200名考生 B. 个体是每一个考生的数学成绩 C.样本是200名考生的数学成绩 D. 样本容量是200 4. 某学校生物兴趣小组11人到校外采集植物标本,其中2人每人采集到6件,4人每人采集到3件,5人每人采集到4件,则这个兴趣小组平均每人采集到的标本是( ) A. 3件 B. 4件 C. 5件 D. 6件 二. 填空题: 1. 样本1,0,2,1,3,5,的平均数是________. 2.某地举行了一次数学竞赛,为了估计平均成绩,在抽取的部分试卷中,有1人得10分,3人得9分,8人得8分,12人得7分,9人得6分,7人得5分,则样本容量是___,样本平均数是_________. 3.某班共有学生50人,平均身高为168cm,其中30名男生平均身高为170cm,则20名女生的平均身高为___________. 三. 解答题: 1.大连是一个严重缺水的城市,为鼓励市民珍惜每一滴水,某居民委员会表彰了100个节约用水模范户,5月份这100户节约用水情况如下表所示,求5月份这100户居民的平均节约用水量. 2.某甲鱼养殖专业户共养甲鱼200只,为了与客户签订购销合同,对自已所养甲鱼的总重量进行估计,随意捞了5只,称得重量分别为1.5, 1.4, 1.6, 2, 1.8,(单位:千克). (1)根据样本平均数估计甲鱼的总重量约是多少千克? (2)如果甲鱼的市场价为每千克150元,那么该专业户卖出全部甲鱼的收入约为多少元?

必修三2.2.用样本估计总体(教(学)案)

. . . .. .. 2.2 用样本估计总体 教案 A 第1课时 教学容 §2.2.1 用样本的频率分布估计总体分布 教学目标 一、知识与技能 1. 通过实例体会分布的意义和作用. 2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. 二、过程与方法 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法. 三、情感、态度与价值观 通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系. 教学重点、难点 重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 难点:能通过样本的频率分布估计总体的分布. 教学设想 一、创设情境 在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50 乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33 请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定? 如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要容——用样本的频率分布估计总体分布. 二、探究新知 探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确

人教版高中数学【必修三】[知识点整理及重点题型梳理]_用样本估计总体_提高

人教版高中数学必修三 知识点梳理 重点题型(常考知识点)巩固练习 用样本估计总体 【学习目标】 1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. 3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差. 4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释. 5.会用样本的基本数字特征估计总体的基本数字特征. 【要点梳理】 要点一、频率分布的概念 频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为: 1.计算一组数据中最大值与最小值的差,即求极差 2.决定组距与组数 3.将数据分组 4.列频率分布表 5.画频率分布直方图 要点诠释: 频率分布直方图的特征: 1.从频率分布直方图可以清楚的看出数据分布的总体趋势. 2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了. 要点二、频率分布折线图、总体密度曲线 1.频率分布折线图的定义: 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. 2.总体密度曲线的定义: 在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 要点诠释: 总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律. 要点三、茎叶图 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图. 要点诠释:

用样本估计总体测试题

《2.2用样本估计总体(2)》测试题 、选择题 1. (2012安徽理)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图,贝U (). A.甲的成绩的平均数小于乙的成绩的平均数 B.甲的成绩的中位数等于乙 的成绩的中位数 C.甲的成绩的方差小于乙的成绩的方差 D.甲的成绩的极差小于乙的成绩 的极差 考查目的:考查统计图的识读,以及对数字特征的分析与理解能力 答案:C. —J + 5 + 6 + 7^8 工—5x316+9 二+ y- —______________ —Q x —___________ — & j 解析:「匚' - ,甲成绩的方差为:, f >3 + 32xl.— -------------- = 乙成绩的方差为* . 2. (2012江西理)样本("V '二)的平均数为」,样本-'人)的平均数为,C~),若样本(b P =,心P '-)的平均数「」:",其中 Q -C 氓—

2,贝U n,m的大小关系为().

A.;!—; B. : - W C. !八; D.不能确定 考查目的:考查平均数意义的理解和灵活应用 答案:A. 解析:由题意知,样本(“ V 宀'■■-)的平均数为 M - ffl - 咖十M m 十闰P ,又?.? £ = m 丰(1 「即,?—「:,答案应选A. 3. (2012陕西理)从甲乙两个城市分别随机抽取16台自动售货机,对其销售 额进行统计,统计数据用茎叶图表示(如图),设甲乙两组数据的平均数分别为 r -,中位数分别为J ,冷匸,则(). 甲 乙 ?65 0 1 028 75 2 i 2 C2337 E0Q 1 3 12443 3 1 4 238 A.怎甲弋冥己,叨甲 > 叫 B.怎甲丈龙己,丹3甲c 烧乙 C.怎甩〉工邑,用甲〉临己 D.忙甲〉蛊巴,廉零c 烧乙 考查目的:考查茎叶图的结构特征和作用,以及从茎叶图中提取样本数字特征的能力 答案:B. 18+22 解析:根据平均数的概念易计算出",又???「」 上 27 4-31 = ??答案应选B. MJ+JJ27 jn+z! m m +xi

用样本估计整体

这就是说。各个小长方形的面积等于相应各组的频率。显然。所有张方形面积之和等于1. 为了了解全部产品中优等品所占比例。可以统计出内径尺寸在区间25.325到25.475内的个体数载样本容量中所占的比例、也就是他的频率。从表中容易看出,这个频率值等于0.12+0.18+0.25+0.16+0.13=0.84,于是可以估计出所有生产的钢管中有84%的优等品、工厂可以根据质量规范。看看是否达到优等品率的要求,如果没有达到。就需要进一步分析原因。解决问题。 当然。用样本的频率分布估计总体的分布时。要使样本能够很好的反应总体的特征。必须随机抽取样本。由于抽样的随机性,可以想到(参考本届练习A第三题),如果随机抽取另外一个容量为100的样本,所形成的样本频率分布一般会与请按一个样本频率分布有所不同。但是。他们都可以近似的看做总体的分布。 从频率分布直方图可以清楚的看出数据分布的总体态势,但是从直方图本身得不出原式的数据内容。所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。 把频率分布直方图各个张方形上边的中点用线段连接起来,就得到频率分布折线图,为了方便看图。一般习惯于吧频率分布折线图化成与横轴相连。所以横轴上的左右两端点没有实际的意义。 图中各个小长方形的面积,表明了所抽取的100件产品中内径尺寸落在各个小组内的产品个数与100的比值大小。如果样本容量越大,所分组数越多。图中表示的频率分布就越接近于总体在各个小组内取值的个数与总数比值的大小。设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上越来越接近于总体的分布,他可以用仪表光滑取消Y=f (x)来描绘。这条光滑曲线就叫做总体密度曲线。总体密度曲线精确地反映了一个总体在各个区域内取值的规律。产品尺寸落在(a,b)内的百分率就是图中带斜线部分的面积,对本例来说,总体密度曲线呈中间高两边低的“钟”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内。 抽样后的样本数据汇总。号可以借助计算机来准确、快速的作出,图就是运用前面所讲到的画直方图的步骤,在工作表中对样本数据汇总得出的结果。 茎叶图: 某赛季甲乙两名篮球运动员每场比赛的得分情况如下: 甲的得分:12,15,24,25,31,31,36,36,37,39,44,49,50. 乙的得分:8,13,14,16,23,26,28,33,38,39,51. 上面的发数据可以用图来表示。他的中间部分像一棵植物的茎,两边部分像这个植物茎上生长出来的叶子。用中间的数字表示两位运动员得分的十位数,两边的数字分别表示两个人各场比赛得分个位数。例如。用3|389就表示了33,38,39这三个数据,通常把这样的图焦作茎叶图,根据上图可以对两名运动员的成绩进行比较。

用样本估计总体练习题含答案

用样本估计总体 一. 选择题 1. 要了解一批灯泡的使用寿命,从中抽取60只灯泡进行试验,在这个问题中,样本是( ) A. 这一批灯泡 B. 抽取的60只灯泡 C. 这一批灯泡的使用寿命 D. 抽取的这60只灯泡的使用寿命 2. 如果一组数据x 1,x 2,x 3,x 4,x 5,的平均数是x ,那么另一组数据x 1+1,x 2+2,x 3+3,x 4+4,x 5+5的平均数是 ( ) A.x . B. 2x + C.3x +. D.15x + 3. 为了考查某地区初中毕业生的数学毕业会考情况,从中抽查了200名考生的数学成绩,在这个问题中,下面说法错误的是( ) A. 总体是被抽查的200名考生 B. 个体是每一个考生的数学成绩 C.样本是200名考生的数学成绩 D. 样本容量是200 4. 某学校生物兴趣小组11人到校外采集植物标本,其中2人每人采集到6件,4人每人采集到3件,5人每人采集到4件,则这个兴趣小组平均每人采集到的标本是( ) A. 3件 B. 4件 C. 5件 D. 6件 二. 填空题: 1. 样本1,0,2,1,3,5,的平均数是________. 2.某地举行了一次数学竞赛,为了估计平均成绩,在抽取的部分试卷中,有1人得10分,3人得9分,8人得8分,12人得7分,9人得6分,7人得5分,则样本容量是___,样本平均数是_________. 3.某班共有学生50人,平均身高为168cm,其中30名男生平均身高为170cm,则20名女生的平均身高为___________. 三. 解答题: 1.大连是一个严重缺水的城市,为鼓励市民珍惜每一滴水,某居民委员会表彰了100个节约用水模范户,5月份这100户节约用水情况如下表所示,求5月份这100户居民的平均节约用水量. 2.某甲鱼养殖专业户共养甲鱼200只,为了与客户签订购销合同,对自已所养甲鱼的总重量进行估计,随意捞了5只,称得重量分别为, , , 2, ,(单位:千克). (1)根据样本平均数估计甲鱼的总重量约是多少千克 (2)如果甲鱼的市场价为每千克150元,那么该专业户卖出全部甲鱼的收入约为多少元

用样本估计总体知识讲解

用样本估计总体 【学习目标】 1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. 3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差. 4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释. 5.会用样本的基本数字特征估计总体的基本数字特征. 【要点梳理】 要点一、频率分布的概念 频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为: 1.计算一组数据中最大值与最小值的差,即求极差 2.决定组距与组数 3.将数据分组 4.列频率分布表 5.画频率分布直方图 要点诠释: 频率分布直方图的特征: 1.从频率分布直方图可以清楚的看出数据分布的总体趋势. 2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了. 要点二、频率分布折线图、总体密度曲线 1.频率分布折线图的定义: 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. 2.总体密度曲线的定义: 在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. 要点诠释: 总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律. 要点三、茎叶图 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图. 要点诠释: 茎叶图的特征: (1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示. (2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰. 要点四、众数、中位数与平均数 1.众数 一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出

用样本估计总体

《§6.2用样本估计总体》学案 一、学习要求: 1、掌握数据整理及其相关图表的制作方法 2、会求样本的平均值和标准差 3、能通过样本的分布和特征值来估计总体的分布和特征值 4、通过具体的实际问题,感受用样本估计总体分布规律的思想 二、学习重点、难点: 重点:数据整理及其相关图表的制作;样本特征值的计算;对总体分布和特征值的估计。 难点:频数频率分布图表和累计频率分布折线图的作用和分析;如何用样本的分布和特征值来估计总体。 三、学时安排:共4学时 第一学时:学习频率分布表,感受如何用样本频率分布表去估计总体分布,亲自体验制作频数频率分布表的过程。 第二学时:学习频率分布直方图,强化制作频率分布直方图的可操作性。 第三学时:学习平均数、方差和标准差的计算,熟悉并会用计算公式。 第四学时:建立用样本的分布估计总体的特征性质的思想,并小结本节内容四、学习过程: 第一学时 (一)课前尝试 1、学法指导: (1)回顾初中已经学过的频数分布表 (2)自学课本上P.8~10介绍的频数频率分布表。 2、尝试练习: 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量 为100的身高样本,数据如下(单位:cm),试作出该样本频率分布表。 168 165 171 167 170 165 170 152 175 174 165 170 168 169 171 166 164 155 164 158 170 155 166 158 155 160 160 164 156 162

160 170 168 164 174 171 165 179 163 172 180 174 173 159 163 172 167 160 164 169 151 168 158 168 176 155 165 165 169 162 177 158 175 165 169 151 163 166 163 167 178 165 158 170 169 159 155 163 153 155 167 163 164 158 168 167 161 162 167 168 161 165 174 156 167 166 162 161 164 166 (二)课堂探究: 1、探究问题:频数频率分布表能较好地反映总体分布情况,在实际中应用很广,因此,如何来制作频数频率分布表呢? 2、知识链接:对总体分布的估计 (1)频数频率分布表 (2)频数频率分布表的制作 3、拓展练习:课本上P.9例1 一般地,编制频率分布表的步骤如下: (1)求全距,决定组数和组距,组距组数 全距 ; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; (3)登记频数,计算频率,列出频率分布表。 4、当堂训练: 下面是某职业学校学生随机抽样的40名学生在一个月内的零花钱数据(单

单元测试(五)--用样本推断总体讲课稿

单元测试(五)用样本推断总体 (时间:45分钟满分:100分) 一、选择题(本大题共8个小题,每小题 3分,共24分) 1?某纺织厂从10万件同类产品中随机抽取了100件进行质检,发现其中有5件不合格,那么估计该厂这10万件产品中合格品约为() A.9.5 万件 B.9 万件 C.9 500 件 D.5 000 件 2?某鞋店试销一款女鞋,试销期间对不同颜色鞋的销量情况统计如下表: 颜色黑色棕色白色红色 销售量(双)75 45 32 55 鞋店经理最关心的是哪种颜色的鞋最畅销,则对鞋店经理最有意义的统计量是() A.平均数B?众数 C.中位数 C ?以上都不是 3?某农科院对甲、乙两种甜玉米各用10块相同条件的试验田进行试验,得到两个品种每公顷产量的两组数据,其方差分别为s甲2=0.002、s乙2=0.03,则() A?甲比乙的产量稳定B?乙比甲的产量稳定 C?甲、乙的产量一样稳定D?无法确定哪一品种的产量更稳定 4.去年某校有1 500人参加中考,为了了解他们的数学成绩?从中抽取200名考生的数学成绩,其中有60名考生达到优秀,那么该校考生达到优秀的人数约有() A.400 名 B.450 名 C.475 名 D.500 名 5?某校对460名初三学生进行跳绳技能培训,以提高同学们的跳绳成绩?为了解培训的效果,随机抽取了40名同学 进行测试,测试结果分成“不合格”、“合格”、“良好”、“优秀”四个等级,并绘制了如图所示的统计图,从图中可以估计出该校460名初三学生中,能获得跳绳“优秀”的总人数大约是() A.10 B.16 C.115 D.150 的创建活动中,组织学生开展植树造林活动抽查了 ?为了解全校学生的植树情况,学校随机100名学生的植树情况,将调查数据整理如下表: 植树数量(单位:棵) 4 5 6 8 10 人数30 22 25 15 8 若该校共有1 000名学生,请根据以上调查结果估计该校学生的植树总棵数是() A.58 B.580 C.1 160 D.5 800 7?为了了解我市某学校“书香校园”的建设情况,检查组在该校随机抽取40名学生,调查了解他们一周阅读课外书 籍的时间,并将调查结果绘制成如图所示的频数分布直方图(每小组的时间包含最小值,不包含最大值),根据图中信息估计该校学生一周课外阅读时间不少于4小时的人数占全校人数的百分数约等于() A.50% B.55% C.60% D.65% (学生人数} m 11 4 0 2 £ 6 8吋间(小■时)

必修三用样本估计总体教案

必修三用样本估计总体 教案 TYYGROUP system office room 【TYYUA16H-TYY-TYYYUA8Q8-

用样本估计总体 教案A 第1课时 教学内容 §用样本的频率分布估计总体分布 教学目标 一、知识与技能 1.通过实例体会分布的意义和作用. 2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计. 二、过程与方法 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法. 三、情感、态度与价值观 通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系. 教学重点、难点 重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图. 难点:能通过样本的频率分布估计总体的分布. 教学设想 一、创设情境 在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50 乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33 请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定? 如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布. 二、探究新知 探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢你认为,为了较为合理地确定出这个标准,需要做哪些工作(让学生展开讨论)

数学:新人教A版必修三 2.2用样本估计总体(同步练习)

2. 2 用样本估计总体 一、选择题 1、为了解一批数据在各个范围内所占的比例大小,将这批数据分组,落在各个小组里的数据个数叫做() A、频数 B、样本容量 C、频率 D、频数累计 2、在频率分布直方图中,各个小长方形的面积表示() A、落在相应各组的数据的频数 B、相应各组的频率 C、该样本所分成的组数 D、该样本的容量 3、为考察某种皮鞋的各种尺码的销售情况,以某天销售40双皮鞋为一个样本,把它按尺码分成5组,第3组的频率为0、25,第1,2,4组的频率分别为6,7,9,若第5组表示的是40—42码的皮鞋,则售出的200双皮鞋中含40—42码的皮鞋为() A、50 B、40 C、20 D、30 4、从一群学生中收取一个一定容量的样本对他们的学习成绩进行分析,前三

组是不超过80分的人,其频数之和为20人,其频率之和(又称累积频率)为0、4,则所抽取的样本的容量是 ( ) A 、100 B 、80 C 、40 D 、50 5、一个容量为20的数据样本,分组后,组距与频数如下:(10,20]2个,(20,30]3个,(30,40]4个,(40,50]5个,(50,60]4个,(60,70 ]2个,则样本在区间(-∞,50]上的频率是 ( ) A 、5% B 、25% C 、50% D 、70% 6、在10人中,有4个学生,2个干部,3个工人,1个农民,数5 2 是学生占总体的( ) A 、频数 B 、概率 C 、频率 D 、累积频率 7、列样本频率分布表时,决定组数的正确方法是 ( ) A 、任意确定 B 、一般分为5—12组 C 、由组距和组数决定 D 、根据经验法则,灵活 掌握 8、下列叙述中正确的是 ( ) A 、从频率分布表可以看出样本数据对于平均数的波动大小

用样本估计总体 训练-答案

1.把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( ) A .0.05 B .0.25 C .0.5 D .0.7 解析:选D.由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为14 20 =0.7. 2.(2014·高考广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( ) A .200,20 B .100,20 C .200,10 D .100,10 解析:选A.该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20,故选A. 3. 某同学进入高三后,4次月考的数学成绩的茎叶图如图,则该同学数学成绩的方差是( ) A .125 B .5 5 C .45 D .3 5 解析:选C.由茎叶图知平均值为114+126+128+1324=125,∴s 2=1 4[(125-114)2+(125-126)2+(125-128)2+(125 -132)2]=45. 4.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a ,中位数为b ,众数为c ,则有( ) A .a >b >c B .b >c >a C .c >a >b D .c >b >a 解析:选D.把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a =110× (10+12+14+14+15+15+16+17+17+17)=14.7,中位数b =15+15 2 =15,众数c =17,则a

202x高考数学刷题首秧第八章概率与统计考点测试55用样本估计总体文含解析

考点测试55 用样本估计总体 高考概览 高考在本考点的常考题型为选择题、填空题,分值为5分,中、低等难度 考纲研读 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点 2.理解样本数据标准差的意义和作用,会计算数据的标准差 3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释 4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想 5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题 一、基础小题 1.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( ) A .45 B .50 C .55 D .60 答案 B 解析 根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,所以该班的学生人数是15 0.3 =50.故选B . 2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的1 4 ,且样本容量为80,则中间一组的频数为( ) A .0.25 B .0.5 C .20 D .16 答案 D 解析 设中间一组的频数为x ,依题意有x 80=141-x 80 ,解得x =16.

3.研究人员随机调查统计了某地1000名“上班族”每天在工作之余使用手机上网的时间,并将其绘制为如图所示的频率分布直方图,若同一组数据用该区间的中点值作代表,则可估计该地“上班族”每天在工作之余使用手机上网的平均时间是( ) A.1.78小时 B.2.24小时 C.3.56小时 D.4.32小时 答案 C 解析(1×0.12+3×0.2+5×0.1+7×0.08)×2=3.56. 4.对于一组数据x i(i=1,2,3,…,n),如果将它们改变为x i+C(i=1,2,3,…,n),其中C≠0,则下列结论正确的是( ) A.平均数与方差均不变 B.平均数变,方差保持不变 C.平均数不变,方差变 D.平均数与方差均发生变化 答案 B 解析由平均数的定义,可知每个个体增加C,则平均数也增加C,方差不变.故选B.5.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示: 甲乙丙丁 平均环数 8.38.88.88.7 x 方差s23.53.62.25.4

用样本估计总体

用样本估计总体 1.作频率分布直方图的步骤 (1)求极差(即一组数据中最大值与最小值的差). (2)决定组距与组数. (3)将数据分组. (4)列频率分布表. (5)画频率分布直方图. 2.频率分布折线图和总体密度曲线 (1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图. (2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.

3.茎叶图 统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. 4.标准差和方差 (1)标准差是样本数据到平均数的一种平均距离. (2)标准差: s=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2]. (3)方差:s2=1 n[(x1-x) 2+(x 2 -x)2+…+(x n-x)2](x n是样本数据,n是样本容 量,x是样本平均数). 知识拓展 1.频率分布直方图的特点 (1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率 组距 ,频率=组距 ×频率组距 . (2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比. (3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广 (1)若数据x1,x2,…,x n的平均数为x,那么mx1+a,mx2+a,mx3+a,…,mx n +a的平均数是m x+a. (2)数据x1,x2,…,x n的方差为s2. ①数据x1+a,x2+a,…,x n+a的方差也为s2; ②数据ax1,ax2,…,ax n的方差为a2s2.

相关主题
文本预览
相关文档 最新文档