第五章抽样分布
§典型案例【6】
§第一节抽样分布的基本概念§第二节几个常见的抽样分布
【典型案例6】如何决定是否购买一批苹果?
俗话说“一日一苹果,医生远离我。”
假如现在面对一批苹果,人们如何了解它
们口感的均值和差异值,以便作出是否购
买这批苹果的决策呢?
人们常用作法:从这批苹果中随机挑
出几个品尝后,得出这几个苹果口感的均
值和差异值,以此作为这批苹果口感的均
值和差异值,从而作出是否购买这批苹果
的决策。
【典型案例6】如何决定是否购买一批苹果?
从统计学角度来讲,挑出的几个苹果口感的均值和差异值就是样本平均数和样
本方差,这批苹果口感的均值和差异值是
总体平均数和总体方差。
这种用商品质量数据的样本平均数、样本方差作为总体平均数、总体方差的作
法,是人们购买商品时常用的有效估计方
法,其理论依据是本章将要学习的内容。
第一节抽样分布基本概念
?一、样本容量和样本个数
?二、参数和统计量
?三、抽样分布
?四、抽样分布的数字特征
总体是研究的所有个体构成的集合,其中的个体的数目常用表示。
从总体中随机抽取部分个体构成一个样本,构成样本的个体的数目,常用表示,称为样本容量,也称样本量。
例如,典型案例6中,一批苹果有400个,从中抽取8个进行品尝,那么,而。显然,从中可以得到很多个样本。一、样本容量和样本个数
N n 400N =8n =
一、样本容量和样本个数
从一个含有N个个体的总体中,随机抽取样本容量为n的样本,可得到很多个样本,此即样本的个数。
典型案例6中,将400个苹果编号,则随机抽取的样本可能是由编号为1—8的这8个苹果构成,也可能是由编号为101—108的8个苹果构成等等。
参数是用来描述总体数量特征的,如总
体均值、总体比例、总体方差等;
统计量是用来描述样本数量特征的,是由样本构造的函数,如样本均值、样
本比例、样本方差等。
由于总体是唯一的、固定不变的,故参数往往是一个未知的常数;而样本不唯一,且一旦抽取出来,就成为已知,故统计量是随机变量,其取值随着样本的变化而改变。
μπ2σX p 2S
抽样的目的就是要根据样本统计量去估计或推断总体参数。
比如,常用样本均值去推断总体均值、用样本比例去推断总体比例、用样本方差去推断总体方差。以上做法的理论依据就是——样本统计量的抽样分布。
X μp π2S 2
σ
三、抽样分布
统计量是随机变量。抽样分布就是统计量的概率分布。
如样本均值的概率分布、样本比例的概率分布、样本方差的概率分布等都称为抽样分布。
以下将以样本均值为例说明统计量的抽样分布。
【例5-1】设有一个总体,含有5个个体:10、20、30、40、50,即。采取重复抽样的方式从中抽取样本容量为2的样本,即。
试写出样本均值的抽样分布。
5N =2n =X 三、抽样分布
解:由于=5,
=2,从总体中采取重复抽样的方式抽取样本,则样本共有=52
=25个。计算出这25个样本的均值,其结果如表5-1所示。
N n n N X
样本序号
样本个体样本均值样本均值的概率1
10,10101∕25210,20
152∕25310,30
203∕25410,40
254∕25510,50305∕25620,1015720,2020820,3025920,40301020,50354∕251130,10201230,20251330,30301430,40351530,50403∕25
1640,10251740,20301840,303519
40,404020
40,50452∕2521
50,103022
50,203523
50,304024
50,40452550,50501∕25表5-1
n=2
时样
本均
值的
抽样
及其
取值
情况
表5-2 =2时样本均值的抽样分布n X 1015202530354045501
23454321252525252525252525
X
P 从而,样本均值的概率分布如表5-2所示。X
在例5-1中,若样本容量n =4,则样本共有个,并且例5-1中的总体是一个非常小的总体,现实世界中,我们面对的总体往往很大,进而样本数目将很可观,不可能将所有的样本都抽取出来。
因此抽样分布实质上是一种理论分布。它可能是精确的某已知分布,也可能是以某已知分布为极限的极限分布。
45625n N ==
抽样分布理论在推断统计中具有重要的作用,它是后续参数估计和假设检验的理论依据和基础。
设总体的平均数为,方差为,采
取重复抽样的方式,从中抽取独立同分布
的样本:
,…,。根据数学期望和方差的性质,可推出:
μ2σ1X n X ()X E X μμ==22X n
σσ=(一)样本均值的数字特征
(5.1)
由式(5.1)可知:的平均数为,
方差为。随着的增大,其方差越来越小,从而的取值越来越向着靠拢,这便是用去估计理论依据。
X μ2n σn X μX μ由此可见,典型案例6中,人们用挑选出的几个苹果口感的均值去估计这批苹果口感的均值的做法是站得住脚的。
以上结论均建立在重复抽样情形下,若是在不重复抽样情形下,方差需要用系数进行修正,从而样本均值的数字特征为:
(5.2)
()X E X μμ==22
1X N n n N σσ-=-四、抽样分布的数字特征
比例:总体(或样本)中具有某种属性的个体数与全部个体数之比,总体比例记为。
现有,采取重复抽样的
方式从中抽取独立同分布的样本:
,…,。样本中变量值1出现次数记为,那么变量值1出现次数所占的比例为/ ,即为样本比例。
π(1,)X B π 1X n X 1n 1n n 1p n n =(二)样本比例的数字特征
四、抽样分布的数字特征
根据数学期望和方差的性质,可推出
样本比例的数学期望、方差与总体的平
均数、方差之间的关系:
(5.3)
p ()p E p μπ==2
(1)p n ππσ-=由式(5.3)可知:的平均数为总体
比例,方差为。随着的增大,
方差越来越小,从而的取值越来越向靠拢,这便是用去估计的理论依据。
p π(1)n ππ-n p p π
π
以上结论均建立在重复抽样情形下,若是在不重复抽样情形下,当样本容量很大时,方差需要用系数进行修正,从而样本比例的数字特征为:
(5.4)
()p E p μπ==2
(1)1p N n n N ππσ--=-
第六章 样本及抽样分布 【内容提要】 一、简单随机样本与统计量 1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。 2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为 12,,...,n X X X 的观察值。 注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。 3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。 注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有: 4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值 按由小到大的顺序重新编号12,1r x x x r n ***<??<≤≤,并设12,,...,n x x x 中取到k x * 的频数为k m , 其中10k k k r m n m n ≤≤≤≤=∑且,则称1110,(),,111,k k i n k k i k x x r x x m m F x x x x k r n n x x ** ** +≤≤≤* ??==≤<≤≤-???≥? ∑∑若若其中若为
第四章抽样与抽样分布 例1:从某年级1000位学生中抽取4位学生,计算身高(μ=169, =6.4),来估计全年级平均身高,假设抽取了成千上万个样本,得到如下结果: 例2:几年前台湾一项调查显示,台湾民众月收入近似成正态分布,均值为13100台币,标准差为8750元,求: 1)随机抽取一人,收入超过18430元的概率? 2)抽取一个10人样本,平均收入超过18430元的概率? 例3:假定某班级男生平均身高169cm,标准差为10.2cm,如果抽取一个n=100的随机样本,那么样本均值在μ±2之内的可能性是多少? 例4:一架电梯极限负重1000公斤,一般可容纳13人。假定电梯的所有乘客平均体重70公斤,标准差12公斤。那么一个13个人的随机样本总重量超过极限负重的概率是多少? 例5:某市育龄妇女生育意愿普查,65%的赞成“只生一个孩子”,35%不赞成或不表态。设生育态度X:赞成为1,否则为0。求:1)总体均值、总体方差、总体中赞成的比例;2)随机抽取10位育龄妇女,得到样本值为1、0、0、1、1、
1、0、1、1、1,求样本均值、样本中赞成比例。 解:1)计算见下表 2)样本均值=7/10=0.7,样本中赞成比例=7/10=0.7 例6:学校选人大代表,结果有60%的选民投了我院院长而当选。假定选举之前有人做了预测,抽取了一个n=30的随机样本进行民意测验,如果样本中只有半数一下的比例支持院长,于是得出院长失败的结果,显然这一预测是一个倒霉的预测。那么,抽取到以上倒霉样本的概率是多少呢?即错误预测的可能性是多少?如果将样本量增到100,再计算错误概率。 例7:某中学学生男女人数相同,现随机从中抽取15名学生,问男生人数大于10的概率是多少? 四、样本方差的抽样分布 设随机变量x 1,x 2,x 3…..x i 相互独立且服从同一正态分布,则将这些随机变量标准化,再计算它们的平方和,得到卡方值2χ,其服从于自由度为n-1的卡方分布: 2χ=2222312( )( )( ).....( )i x x x x μ μ μ μ σ σ σ σ ----++++= 2 2 1 1 () k i i x μσ=-∑ 分子分母同乘n-1,进一步整理得2 χ=2 2 (1)n s σ-~2χ(n-1) 练习题: 1、某专业学生的年龄分布是右偏的,均值为22,标准差为4.45,如果采用重复抽样的方法从该专业学生中抽取容量为100的样本,则样本均值的抽样分布为? 2、从均值为50,标准差为5的正态总体中抽取容量为25的样本,则样本均值超过51的概率为? 3、某企业声明企业人均收入为5500元,标准差为550元。如果随机抽取16位员工,则平均收入落在5400-5600元的概率是? 4、样本量为10的样本均值方差为12,则总体的方差为? 5、总体均值为3.1,标准差为0.8,从该总体中随机抽取容量为36的样本,样本
第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1
一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2
第五章抽样与抽样估计复习题 一、填空题 1 、在实际工作中,人们通常把n≥ 30 的样本称为大样本,而把n<30 的样本称为小样本。 2 、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3 、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4 、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5 、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1 、在其它条件不变的情况下,要使抽样平均误差为原来的1/3 ,则样本单位数必须 ((2)) ( 1)增加到原来的 3 倍(2)增加到原来的9 倍 ( 3)增加到原来的 6 倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) ( 1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20 小时抽 1 小时的全部产进行检验,这种方式是((4)) ( 1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) ( 1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100 次通话中,通话持续平均时间为 3 分钟,均方差为分钟,则概 率为时,通话平均持续时间的抽样极限误差为((2)) ( 1)(2)(3)(4) 6、假定11 亿人口大国和100 万人口小国的居民年龄变异程度相同,现在各自用重复 抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))( 1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1 、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2 、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3 、抽样极限误差((1)(2)( 4))
习题六样本及抽样分布 一、填空题 1.设来自总体的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =; 2.在总体中随机地抽取一个容量为 36 的样本,则均值落在4与6之间的概率 = 0.9332 ; 3.设某厂生产的灯泡的使用寿命 (单位:小时,抽取一容量为9的样本,得到 ,则; 4.设为总体的一个样本,则 0.025 ; 5.设为总体的一个样本,且服从分布,这里, ,则1/3 ; 6.设随机变量相互独立,均服从分布且与分别是来自总体的简单随机样本,则统计量服从参数为 9 的 t 分布。 7.设是取自正态总体的简单随机样本且 ,则 0.05 , 0.01 时,统计量服从分布,其自由度为 2 ;
8.设总体 X 服从正态分布,而是来自总体的简单随机样 本,则随机变量 服从 F 分布,参数为 10,5 ; 9.设随机变量则 F(n,1 ; 10.设随机变量且,A为常数,则 0.7 二、选择题 1.设是来自总体的简单随机样本,是样本均值, 记 则服从自由度的分布的随机变量是( A ); A. B. C. D. 2.设是经验分布函数,基于来自总体的样本,而是总体的分布函数,则下列命题错误的为,对于每个给定的( B ) A.是分布函数 B.依概率收敛于 C.是一个统计量 D.其数学期望是
3.设总体服从0-1分布,是来自总体的样本,是样本均值,则下列各选项中的量不是统计量的是( B ) A. B. C. D. 4.设是正态总体的一个样本,其中已知而未知,则下列各选项中的量不是统计量的是( C )。 A. B. C. D. 5.设和分别来自两个正态总体和的样本,且相互独立,分别为两个样本的样本方差,则服从的统计量是( B ) A. B. C. D. 6.设是正态总体的一个样本,和分别为样本均值和样本方差,则下面结论不成立的有( D ) A.相互独立; B.与相互独立; C.与相互独立D.与相互独立。
统计学习题答案第4章抽样与抽样分布
第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =
解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、
第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1
一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2
第五章 抽样估计学习指导 一、判断题×√ 1.抽样估计是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免地会产生误差,这种误差的大小是不能进行控制的.( ) 2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本.( ) 3.在抽样估计中,作为推断的总体和作为观察对象的样本都是确定的.唯一的.( ) 4.优良估计的无偏性是指:所有可能的样本平均数的平均数等于总体平均数.( ) 5.抽样成数的特点是,样本成数越大,则成数方差越大.( ) 6.在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大.( ) n x σ μ= 7.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度.( )
8.抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的.( ) 9.在其他条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度.( ) 10.在简单随机抽样中,如果重复抽样的抽样极限误差增加40%,其他条件不变,则样本单位数只需要原来的一半左右.( ) 11.抽样平均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差.( ) 12.样本单位数的多少与总体各单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比.( ) 二.单项选择题 1.抽样调查的主要目的是( ). A.用样本指标来推算总体指标 B.对调查单位做深入研究 C.计算和控制抽样误差 D.广泛运用数学方法 2.抽样调查所必须遵循的基本原则是( ). A.准确性原则 B.随机性原则 C.可靠性原则 D.灵活性原则
第五章 抽样调查及参数估计 5.1 抽样与抽样分布 5.2 参数估计的基本方法 5.3 总体均值的区间估计 5.4 总体比例的区间估计 5.5 样本容量的确定 一、简答题 1.什么是抽样推断?用样本指标估计总体指标应该满足哪三个标准才能被认为是优良的估计? 2.什么是抽样误差,影响抽样误差的主要因素有哪些? 3.简述概率抽样的五种方式 二、填空题 1.抽样推断是在 随机抽样 的基础上,利用样本资料计算样本指标,并据以推算 总体数量 特征的一种统计分析方法 。 2.从全部总体单位中随机抽选样本单位的方法有两种,即 重复 抽样和 不重复 抽样。 3.常用的抽样组织形式有 简单随机抽样 、 类型抽样 、等距抽样、 整群抽样 等四种。 4.影响抽样误差大小的因素有总体各单位标志值的差异程度、 抽样单位数的多少 、 抽样方法 和抽样调查的组织形式 。 5.总体参数区间估计必须具备估计值、 概率保证程度或概率度 、 抽样极限误差 等三个要素。 6.从总体单位数为N 的总体中抽取容量为n 的样本,在重复抽样和不重复抽样条件下,可能的样本个数分别是______________和_____________。 7.简单随机_抽样是最基本的抽样组织方式,也是其他复杂抽样设计的基础。 8.影响样本容量的主要因素包括总体各单位标志变异程度_、__允许的极限误差Δ的大小、_抽样方法_、抽样方式、抽样推断的可靠程度F(t)的大小等。 三、选择题 1.抽样调查需要遵守的基本原则是( B )。 A .准确性原则 B .随机性原则 C .代表性原则 D .可靠性原则 2.抽样调查的主要目的是( A )。 A .用样本指标推断总体指标 B .用总体指标推断样本指标 C .弥补普查资料的不足 D .节约经费开支 3.抽样平均误差反映了样本指标与总体指标之间的( B )。 A .实际误差 B .实际误差的平均数 C .可能的误差范围 D .实际的误差范围 4.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D ) 。 A .简单随机抽样 B .类型抽样 C .等距抽样 D .整群抽样 5.在其他情况一定的情况下,样本单位数与抽样误差之间的关系是( B )。 A .样本单位数越多,抽样误差越大 B .样本单位数越多,抽样误差越小 C .样本单位数与抽样误差无关 D .抽样误差是样本单位数的10% 6.用简单随机重复抽样方法抽取样本单位,如果要使抽样平均误差降低50%,那么样本n n N B N =!()!n N N A N n =-
一、填空题 1、在实际工作中,人们通常把 n≥30 的样本称为大样本,而把 n<30 的样本称为小样本。 2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须 ((2)) (1)增加到原来的3倍(2)增加到原来的9倍 (3)增加到原来的6倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1 小时的全部产进行检验,这种方式是((4)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) (1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为分钟,则概率为时,通话平均持续时间的抽样极限误差为((2)) (1)(2)(3)(4)
6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3、抽样极限误差((1)(2)(4)) (1)是所有可能的样本指标与总体指标之间的误差范围 (2)也叫允许误差(3)与所做估计的概率保证程度成反比 (4)通常用来表示抽样结果的精确度 4、影响样本容量的因素有((1)(2)(3)(4)(5)) (1)总体方差 (2)所要求的概率保证程度 (3)抽样方法 (4)抽样的组织形式 (5)允许误差法范围的大小 5、不重复抽样的抽样平均误差((2)(4)) (1)总是大于重复抽样的抽样平均误差
第5章 样本及抽样分布 1,设总体X 服从均值为1/2的指数分布,4321,,,X X X X 是来自总体的容量为4的样本,求 (1)4321,,,X X X X 的联合概率密度;(2)}2.17.0,15.0{21<<<
第六章样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题
1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X
对应(等同)。 a.总体中不同的数量指标的全体, 即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布 情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时 1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100
50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体
三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2, ……X n) n维随机向量表 示。 X i表示第i个被抽到的个体,是随机变量。(i=1,2,…n)
第4章 抽样与抽样分布——练习题(全免) 1. 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。 ⑴ 给出x 的抽样分布(重复抽样)的均值和标准差 ⑵ 描述x 的抽样分布的形状。你的回答依赖于样本容量吗? ⑶ 计算标准正态z 统计量对应于5.15=x 的值。 ⑷ 计算标准正态z 统计量对应于23=x 的值。 解: 已知 n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x 的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x <16; ⑵x >23; ⑶x >25; ⑷.x 落在16和22之间; ⑸x <14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。试求下列概率的近似值: 解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、 金融、保险以及与汽车相关的各项服务。1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。 ⑴ 描述x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x 服从怎样
习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21 (4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分 别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量21 ~()(1),,X t n n Y X >=则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7 二、选择题 1.设12,,...,n X X X 是来自总体2(,)N μσ的简单随机样本,X 是样本均值, 记22222 21 23111 111(),(),(),11n n n i i i i i i S X X S X X S X n n n μ====-=-=---∑∑∑ 2 241 1(),n i i S X n μ==-∑则服从自由度1n -的t 分布的随机变量是T =( A ); A . B C D 2.设()n F x 是经验分布函数,基于来自总体X 的样本,而()F x 是X 总体的 分布函数,则下列命题错误的为,对于每个给定的,()n x F x ( B ) A .是分布函数 B .依概率收敛于()F x C .是一个统计量 D .其数学期望是()F x
第五章抽样推断习题 一、一、单项选择题: 1、抽样推断的主要目的是(③)。 ①对调查单位作深入研究②计算和控制抽样误差 ③用样本指标来推算总体指标④广泛运用数学方法 2、抽样调查与典型调查的主要区别是(④)。 ①所研究的总体不同②调查对象不同 ③调查对象的代表性不同④调查单位的选取方式不同 3、样本是指(④)。 ①任何一个总体②任何一个被抽中的调查单位 ③抽样单元④由被抽中的调查单位所形成的总体 4、抽样误差是指(③)。 ①在调查过程中由于观察、测量等差错所引起的误差 ②在调查中违反随机原则出现的系统误差 ③随机抽样而产生的代表性误差④人为原因所造成的误差 5、抽样极限误差是(②)。 ①随机误差②抽样估计所允许的误差的上下界限 ③最小抽样误差④最大抽样误差 6、抽样平均误差就是(④)。 ①样本的标准差②总体的标准差 ③随机误差④样本指标的标准差 7、抽样估计的可靠性和精确度(②)。 ①是一致的②是矛盾的 ③成正比④无关系 8、在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应(①)。 ①增加8倍②增加9倍 ③增加1.25倍④增加2.25倍 9、当有多个参数需要估计时,可以计算出多个样品容量n,为满足共同的要求,必要的样本容量一般应是(②)。 ①最小的n值②最大的n值 ③中间的n值④第一个计算出来的n值 10、抽样时需要遵循随机原则的原因是(③)。
①可以防止一些工作中的失误②能使样本与总体有相同的分布 ③能使样本与总体有相似或相同的分布④可使单位调查费用降低 二、多项选择题: 1、抽样推断的优点(①②③④)。 ①时效性强②更经济③能够控制抽样估计的误差 ④适用范围广⑤无调查误差 2、抽样推断适用于(①②③④⑤)。 ①具有破坏性的场合②用于时效性要求强的场合 ③对于大规模总体和无限总体的场合进行调查 ④用于对全面调查的结果进行核查和修正 ⑤不必要进行全面调查,但又需要知道总体的全面情况时 3、抽样推断中哪些误差是可以避免的(①②④)。 ①调查性误差②因抽样破坏随机原则而造成的系统性偏差 ③抽样误差④因抽样破坏随机原则而造成的方向性偏差 4、区间估计的要素是(①③④)。 ①点估计值②样本的分布③估计的可靠度 ④抽样极限误差⑤总体的分布形式 5、影响必要样本容量的因素主要有(①②③⑤)。 ①总体的标志变异程度②允许误差的大小③重复抽样和不重复抽样 ④样本的差异程度⑤估计的可靠度 三、填空题 1、抽样推断就是根据()的信息去研究总体的特征。 2、样本单位选取方法可分为()和()。 3、对于简单随机抽样,总体中的每个单位被抽中的概率为()。 4、区间估计时,既要考虑极限误差的大小,即估计的()问题,又要考虑估计的()问题。 四、简答题 1、什么是抽样推断?抽样推断有哪几方面的特点? 2、抽样推断与典型调查相比有何不同? 五、计算题 1、为检查某批电子元件的质量,随机抽取1%的产品,将测得结果整理成如下表的形式:
样本及抽样分布
第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。
§6.1 随机样本 一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量:
抽样与抽样分布习题及答案 单选题 1.抽样调查抽选样本时,遵循的原则是( )。 A.随机原则 B.同质性原则 C.系统原则 D.主观性原则 答案:a 2.抽样误差是指( )。 A.在调查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差 C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 答案:c 3.抽样极限误差是( )。 A.调查性误差 B.一定可靠程度下的抽样误差可能范围 C.最小抽样误差 D.等于抽样平均误差 答案:b 4.在其它条件相同的情况下,重复抽样的抽样平均误差和不重复抽样的相比( )。 A.前者一定大于后者 B.前者一定小于后者 C.两者相等 D.前者可能大于、也可能小于后者 答案:a 5.抽样推断的精确度和极限误差的关系是( )。 A.前者高说明后者小 B.前者高说明后者大 C.前者变化而后者不变 D.两者没有关系 答案:a 6.在简单随机重复抽样下,欲使抽样平均误差缩小为原来的三分之一,则样本容量应( )。 A.增加8倍 B.增加9倍 C.增加倍 D.增加2.25倍 答案:b 7.当总体单位数较大时,若抽样比为51%,则对于简单随机抽样,不重复抽样的平均误差约为重复抽样的( )。 A.51% B.49% C.70% D.30%
答案:c 8.在500个抽样产品中,有95%的一级品,则在简单随机重复抽样下一级品率的抽样平均误差为( )。 A.0.6827% B.0.9545% C.0.2128% D.0.9747% 答案:d 9.统计误差按产生的来源分类,有( )。 A.随机误差和抽样误差 B.调查误差和随机误差 C.登记误差和代表性误差 D.工作误差和抽样误差 答案:c 10.某冷库对贮藏一批禽蛋的变质率进行抽样调查,根据以前的资料,禽蛋贮藏期变质率为53%,49%,48%。现在允许误差不超过5%,推断的概率保证度为95%,问至少要抽取的禽蛋数( )。 A.400 B.384 C.383 D.385 答案:d 三.判断题 1.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定的、唯一的。( ) 答案:错 2.样本成数是指在样本中具有被研究标志表现的单位数占全部样本单位数的比重。( ) 答案:对 3.在简单随机抽样中,如果重复抽样的抽样极限误差增加40% ,其它条件不变,则样本单位数只需要原来的一半左右。( ) 答案:对 4.总体是指包括调查对象所有单位的全体,而样本是指从总体中按随机原则抽取出来的部分单位所组成的集合体。 答案:对 5.参数是总体的某种特征值,而统计量是一个不含未知参数的样本函数。 答案:对 6.在计算样本容量时,成数方差P(1-P)在完全缺乏资料的情况下,可用成数方差P(1-P)的极大值0.5 0.5来代替。 答案:对
习题六样本及抽样分布 解答 公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]
样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:,,,,,则样本均值 = ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则 (940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21 (4)i i P X =>=∑ ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与 129,,...,Y Y Y 分别是来自总体,X Y 的简单随机样本,则统计量 U = 服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = ,b = 时,统计量Y 服从2 χ分布,其自由度为 2 ;
8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单 随机样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++服从 F 分布,参数为 10,5 ; 9.设随机变量2 1 ~()(1),,X t n n Y X >= 则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1()P X A >= 11若n ξξ,,1 是取自正态总体),(2 σμN 的一个样本,则∑==n i i n 1 1ξξ服 从 。 12样本),,(1n X X 的函数),,(1n X X f 称为 ,其中 ),,(1n X X f 不含未知参数。 13设总体X 服从),(2σμN ,X 和2S 分别为来自总体X 的样本容量为n 的 样本均值和方差,则 2 1 2 )(σ ∑=-n i i X X ~ , 2 2 )1(σ S n -~ 。 14 设随机变量X 和Y 相互独立且都服从正态分布)3,0(2N ,而91,,X X 和 91,,Y Y 分别是来自总体X 和Y 简单随机样本,则统计量2 92191Y Y X X U ++++= 服从 分布。t (9) 15 设随机变量X 和Y 相互独立且都服从正态分布)3,0(2N ,而91,,X X 和 91,,Y Y 分别是来自总体X 和Y 的简单随机样本,则统计量 2 9 2 12 921Y Y X X V ++++= 服从 分布。F(9,9) 二、选择题