当前位置:文档之家› 统计学抽样方案

统计学抽样方案

统计学抽样方案
统计学抽样方案

2006年海宁市公众科学素养调查抽样方案

一、调查目的、范围及对象

海宁地处中国长江三角洲南翼、浙江省北部,东距上海100公里,西离杭州60公里,南濒钱塘江,内陆面积近700平方公里,地势平坦,河流众多,水源丰富,是典型的江南水乡。海宁现辖8个镇,4个街道,总人口64万。 海宁经济发达,市场繁荣,是我国首批沿海对外开放县(市)之一,连续三届跻身“全国综合实力百强县(市)”行列,县域社会经济发展综合评价全国第19位,是浙江省首批“小康县(市)”之一。 海宁的目标是实现由小康向现代化的历史性跨越,到2010年建成经济文化强市。

提高公众科学文化素质,是实施科教兴国战略和可持续发展战略,是建设经济文化强市的重要内容之一。为深入地了解海宁市公众科学素养的状况,为政府和相关机构以及科普研究提供详尽的数据,海宁市科协决定于2006年6月至11月开展海宁市公众科学素养抽样调查。

● 本次调查的范围是海宁市包括:斜桥镇、许村镇、长安镇、周王庙镇、盐官镇、丁桥

镇、袁花镇、黄湾镇、硖石街道、海洲街道、海昌街道、马桥街道。

● 本次调查对象是在海宁市境内居住半年以上,年龄在18~69岁的成年人(智力障碍者除

外)。

● 本次调查的内容主要是了解海宁市公众的科学素养水平、获得科技知识的渠道、对科

技发展的态度等方面的基本情况。

二、调查方案的设计

从数据上看,海宁市各地区的经济、文化等各方面差异不是很大。但非农业与农村的差异还是明显的。本次调查采用分层抽样三阶段的方法,各阶段的抽样单位如下: 第一阶段:海宁市所有镇及街道均入选为抽样单位; 第二阶段:以社区或村委会为二级抽样单位;

第三阶段:以家庭住户并在每户中确定1人为最终单位;

(一) 调查样本量的确定

● 样本量的定量分析:

纯净样本量是指去掉不合格或未回答的调查对象以后的剩余量,由于调查的结果主要是估计各种比例数据以及比例数据的之间的比较,所以在决定调查样本量时采用估计简单

随机抽样的总体比例时的样本量为基础,一般用公式2

2)

1(d

p p u N -=α来计算,其中N 为纯净样本量,αu 为一定置信度下所对应的临界值,p 为样本比例,2d 为误差率。类似调查中,大多数取95%的置信度(即仍有5%的不确定性或5%的误差),本调查也采用95%的置信度,此时α

u =1.96,由于p 值较难估计,可采用保守策略,取5.0=p ,上述公式转化为

2

2

25.05.096.1d

N ??=

。一般误差率(最大允许绝对误差) d 取值为3%或更小。 ● 样本量的确定:

在95%的置信度下按抽样绝对误差不超过3%的要求进行计算,由于我们可能要计算各种比较的大小,所以没办法精确地估计p 的大小,采用保守策略,取5.0=p 计,即所应抽取样本量为:

22022

(1) 1.960.50.510670.03

u p p n d α-??==≈ 根据经验,一般分层抽样的设计效应为1.8,故抽取总样本数为1920.6个(人),为了便于

计算和分组,设定本次的样本量为1920个(人)。

(二) 抽样方法

考虑本项目所调查的地点仅为海宁市,所调查区域相对集中,并且海宁市所属的镇和街道只有12个分别为斜桥镇、许村镇、长安镇、周王庙镇、盐官镇、丁桥镇、袁花镇、黄湾镇、硖石街道、海洲街道、海昌街道、马桥街道。抽样方法采取分层的三阶段与人口成比例的PPS 概率抽样,即分层、多阶段概率与规模成比例系统抽样法。首先将海宁市按非农村人口和农村人口分为两个层,分层标准主要为居民性质(按海宁市科协所提供资料)。分层后,分别采用三级子抽样,即小层→社区或村→家庭户→人。

(三)分层

全市的镇和街道为一级抽样单元,共有12个基本单位。对第一阶段的抽样,全市各地区农村居民与非农村居民的科学水平差异较大,并且考虑到海宁市的具体情况,所以,将海宁市按非农村和农村分为两个层进行抽样。 ● 农业与非农业人口的比例的确定

海宁市的非农业人口(即由海宁市科协提供的农村社区人口和城镇社区社区人口之和)与农业人口(即海宁市科协提供的农村人口)的比例为23.39:76.61。依据按比例抽样的原则,同时也兼顾可操作性,确定抽样时农业人口与非农业人口的样本数分别为:1464个(人)和456个(人)。现根据海宁市各镇或街道农业与非农业人口比例,确定非农业与农业的样本量比例如下:

(四)多阶抽样步骤:

1.初级抽样单位的抽选

全市的12个镇、街道均为初级抽样单位。

2.二级抽样单位的抽选

在各的街道、镇抽取若干个社区或村委会,由已经取得的社区和村的人口资料编号排序(随机进行,没有规定的先后次序)。然后用产生随机数的方法抽取社区或村。(可见表2,表3)。

4.三级抽样单位的抽选

将以上抽中的社区或村委会中所含居民户数编号排序。仍随机抽样法,从每个社区或村委会中抽取24或12户居民(具体样本的分配见下表3),将从社区中抽取的样本为非农业人口的代表,从村中抽到的样本为农业人口的代表。再用二维随机数表决定具体18-69岁(智力障碍者除外)的居民。

三、第二阶段抽样——街道和镇对社区和村的抽样

根据上述的抽样原则,确定抽取社区和村的个数如下:

利用海宁市科协提供的资料,按人口总数的PPS抽样,经发生随机数产生下面的样本社区和村。

3

注1

4

四、第三阶段抽样——社区或村对家庭户的抽样

社区或村对家庭户的抽样是利用计算器产生随机数后进行简单随机抽样。例如:在抽中某个社区有40户,具体资料如下表所示:

(2

取整后所得的数即为被抽中的家庭的相应的编号。如表4。

5

五、家庭户内被调查对象的确定

为了在调查中,使家庭中每个合格的调查对象均有同样的机会被抽选,本调查采用以下二维随机数表法。

二维随机数表的使用方法:

●事先在第一行中随机圈定一列(每个样本街道、乡镇内1~12中每个数字被圈定的问卷

数目完全相同)。

●将户内所有符合调查条件的成员(包括半年以上的暂住人口,如保姆、亲戚)按先男

后女、同性别按年龄从大到小的顺序排列。

men3。

附表一:入户接触表

附表二:二维随机数

附表三:问卷编号

6

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

统计学原理第六章习题及答案

第六章抽样调查 1.当研究目的一旦确定,全及总体也就相应确定,而从全及总体中抽取的抽样 总体则是不确定的。(V )2.从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样 本。( X )3.在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。 (X )4.我们可以任取某一次抽样所得的抽样误差,来作为衡量抽样指标对于全及指 标的代表性程度。(X ) 5.由于没有遵守随机原则而造成的误差,通常称为随机误差。(X ) 6.抽样平均误差是表明抽样估计的准确度,抽样极限误差则是表明抽样估计准 确程度的范围;两者既有区别,又有联系。( V ) 7.抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于 抽样平均误差,也可能小于抽样平均误差。( V ) 8.所有可能的样本平均数的平均数等于总体平均数。(V ) 9.按有关标志排队,随机起点的等距抽样可能产生系统性误差。( V ) 10.抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法, 因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(X )11.重复抽样时,其他条件不变,允许误差扩大一倍,则抽样数目为原来的2倍。 (X) 12.扩大或缩小抽样误差范围的倍数叫概率度,其代表符号是V。(V) 13.重复抽样时若其它条件一定,而抽样单位数目增加3倍,则抽样平均误差为 原来的2倍。(X) 14.由于抽样调查存在抽样误差,所以抽样调查资料的准确性要比全面调查资料 的准确性差。(X) 15.在保证概率度和总体方差一定的条件下允许误差大小与抽样数目多少成正 比。(X) 16.扩大或缩小了以后的抽样误差范围叫抽样极限误差。(X) 17.如果总体平均数落在区间(960,1040)内的概率为0.9545,则抽样平均误 差等于30。(X) 18.抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概 率保证程度。(V )19.扩大抽样误差的范围,会降低推断的把握程度,但会提高推断的准确度。(X)

统计学抽样与抽样分布练习题

第6章 抽样与抽样分布 练习题 6.1 从均值为200、标准差为50的总体中,抽取100=n 的简单随机样本,用样本均值x 估计总体均值。 (1) x 的数学期望是多少? (2) x 的标准差是多少? (3) x 的抽样分布是什么? (4) 样本方差2 s 的抽样分布是什么? 6.2 假定总体共有1000个单位,均值32=μ,标准差5=σ。从中抽取一个样本量为30的简单随机样本用于获得总体信息。 (1)x 的数学期望是多少? (2)x 的标准差是多少? 6.3 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。样本均值的抽样标准差x σ等于多少? 6.4 设总体均值17=μ,标准差10=σ。从该总体中抽取一个样本量为25的随机样本,其均值为25x ;同样,抽取一个样本量为100的随机样本,样本均值为100x 。 (1)描述25x 的抽样分布。 (2)描述100x 的抽样分布。 6.5 从10=σ的总体中抽取样本量为50的随机样本,求样本均值的抽样标准差: (1)重复抽样。 (2)不重复抽样,总体单位数分别为50000、5000、500。 6.6 从4.0=π的总体中,抽取一个样本量为100的简单随机样本。 (1)p 的数学期望是多少? (2)p 的标准差是多少? (3)p 的分布是什么? 6.7 假定总体比例为55.0=π,从该总体中分别抽取样本量为100、200、500和1000的样本。

(1) 分别计算样本比例的标准差p σ。 (2) 当样本量增大时,样本比例的标准差有何变化? 6.8 假定顾客在超市一次性购物的平均消费是85元,标准差是9元。从中随机抽取40个顾 客,每个顾客消费金额大于87元的概率是多少? 6.9 在校大学生每月的平均支出是448元,标准差是21元。随机抽取49名学生,样本均值 在441~446之间的概率是多少? 6.10 假设一个总体共有8个数值:54,55,59,63,64,68,69,70。从该总体中按重复 抽样方式抽取2=n 的随机样本。 (1) 计算出总体的均值和标准差。 (2) 一共有多少个可能的样本? (3) 抽出所有可能的样本,并计算出每个样本的均值。 (4) 画出样本均值的抽样分布的直方图,说明样本均值分布的特征。 (5) 计算所有样本均值的平均数和标准差,并与总体的均值和标准差进行比较,得 到的结论是什么? 6.11 从均值为5.4=μ,方差为25.82=σ的总体中,抽取50个由5=n 个观测值组成的 随机样本,结果见Book6.11。 (1) 计算每一个样本的均值。 (2) 构造50个样本均值的相对频数分布,以此代表样本均值x 的抽样分布。 (3) 计算50个样本均值的平均值和标准差x σ。 6.12 来自一个样本的50个观察值见Book6.12。 (1) 用组距为10构建频数分布表,并画出直方图。 (2) 这组数据大概是什么分布?

《统计学原理》作业(三)参考答案

《统计学原理》作业(三) (第五~第七章) 一、判断题 1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。(×) 2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(×) 3、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 4、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(×) 5、抽样极限误差总是大于抽样平均误差。(×) 6、相关系数是测定变量之间相关关系的唯一方法(×) 7、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√)。 8、利用一个回归方程,两个变量可以互相推算(×)。 9、估计标准误指的就是实际值y与估计值y c的平均误差程度(√)。 10、抽样误差即代表性误差和登记性误差,这两种误差都是不可避免的。(×) 11、总体参数区间估计必须具备的三个要素是估计值、抽样误差范围、概率保证程度。(√) 12、在一定条件下,施肥量与收获率是正相关关系。(√) 二、单项选择题 1、在一定的抽样平均误差条件下(A)。 A、扩大极限误差范围,可以提高推断的可靠程度 B、扩大极限误差范围,会降低推断的可靠程度 C、缩小极限误差范围,可以提高推断的可靠程度 D、缩小极限误差范围,不改变推断的可靠程度 2、反映样本指标与总体指标之间的平均误差程度的指标是(C)。 A、抽样误差系数 B、概率度 C、抽样平均误差 D、抽样极限误差 3、抽样平均误差是(C)。 A、全及总体的标准差 B、样本的标准差 C、抽样指标的标准差 D、抽样误差的平均差 4、当成数等于(C)时,成数的方差最大。 A、1 B、0 c、0.5 D、-1

统计学第九章抽样与抽样估计

第九章抽样与抽样估计 一、单项选择题 1、抽样极限误差是指抽样指标和总体指标之间(D)。 A.抽样误差的平均数B.抽样误差的标准差 C.抽样误差的可靠程度D.抽样误差的最大可能范围 2、样本平均数和总体平均数(B)。解析:样本平均数是以总体平均数为中心,在其范围内变动(P213) A.前者是一个确定值,B.前者是随机变量, 后者是随机变量后者是一个确定值 C.两者都是随机变量D.两者都是确定值 3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%, 95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。A.144B.105C.76D.109 4、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。 A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/3 5、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。 A.增加9倍B.增加8倍 C.为原来的2.25倍D.增加2.25倍 6、抽样误差是指(C)。解析:这题考的是抽样误差的定义(P213) A.在抽查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差 C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 7、在一定的抽样平均误差条件下(A)。

A.扩大极限误差范围,可以提高推断的可靠程度 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度 8、抽样平均误差是(B)。解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差 C.抽样指标的标准差D.抽样误差的平均差 9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式(D)。 A.简单随机抽样B.类型抽样 C.等距抽样D.整群抽样 10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 11、事先确定整体范围,并对整体的每隔单位都编号,然后根据《随机数码表》 或抽签的方式来抽取样本的抽样组织形式,被称为(B)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 12、在同样条件下,不重复抽样的抽样标准误差于重复抽样的抽样的标准误差相 比,(A)。 A.前着小于后者B.前者大于后者 C.两者相等D.无法判断 13、在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其 他条件不变),必要的样本容量将会(C)。

统计学 第五章 抽样推断课后答案

第五章 抽样推断 一、单项选择题 1 2 3 4 5 6 7 8 9 10 C B A D B D C B A C 11 12 13 14 15 16 17 18 19 20 A D C A D C A C B D 二、多项选择题 1 2 3 4 5 ABCE ABDE BCE ABCE ABDE 6 7 8 9 10 ACE ADE ACD ABE CDE 11 12 13 14 15 BDE CD BC ABCD ABCDE 16 17 18 19 20 AD AC BCE ABDE ACE 三、判断题 1 2 3 4 5 6 7 8 9 10 × × × √ √ × √ √ × × 四、填空题 1、变量 属性 2、正 反 3、重复抽样 不重复抽样 4、抽样总体 样本 5、大于 N n - 1 N n 6、标准差 7、样本 总体 抽样平均误差 抽样平均误差 △x = Z x σ 8、合适的样本估计量 一定的概率保证程度 允许的极限误差范围 9、随机抽样 统计分组 10、增大 增大 降低 11、大数定律 中心极限定理 12、样本容量不小(不小于30个单位) 13、大 0.5

14、缩小 3 3 (即0.5774) 扩大 1.1180 15、估计量(或统计量) 参数 五、简答题(略) 六、计算题 1、已知条件:P = 0.5 ,n = 100 且重复抽样 求:p ≤0.45的概率 解: Z = 1100 ) 5.01(5.05.045.0)1(=-?-= --n P P P p 则F (Z = 1) = 0.6827 所以p ≤0.45的概率为: 2 6827 .01-= 0.15865 2、解 E (x 1) = E (0.5X 1 + 0.3X 2 + 0.2X 3) = 0.5 E (X ) + 0.3 E (X ) + 0.2E (X ) = E (X ) = X E (x 2) = E (0.5X 1 + 0.25X 2 + 0.25X 3) = 0.5 E (X ) + 0.25 E (X ) + 0.25E (X ) = E (X ) = X E (x 3) = E (0.4X 1 + 0.3X 2 + 0.3X 3) = 0.4 E (X ) + 0.3 E (X ) + 0.3E (X ) = E (X ) = X 所以x 1、x 2、x 3都是X 的无偏估计量。 D (x 1) = D (0.5X 1 + 0.3X 2 + 0.2X 3) = 0.25 D (X ) + 0.09 D (X ) + 0.04D (X ) = 0.38 D (x 2) = D (0.5X 1 + 0.25X 2 + 0.25X 3)

统计学习题答案 第4章 抽样与抽样分布

统计学习题答案第4章抽样与抽样分布

第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、

《统计学》抽样调查习题和答案

六.计算题部分 1、对一批成品按重复抽样方法抽选100件,其中废品4件,当概率为95.45%(t=2)时,可否认为这批产品的废品率不超过6%? 答案:解:2%,4100 4,100====t p n 0196 .0100 ) 04.01(04.0) 1(=-= -= n p p p μ 039.00196.02=?==? p p t μ p p p P p ?+≤≤? - 039.004.0039.004.0+≤≤-P 0.1%------7.9% ∴废品率不超过6% 2、某乡有5000农户,按随机原则重复抽取100户调查,得平均每户年纯收入12000元,标准差2000元。 要求:(1)以95%的概率(t=1.96)估计全乡平均每户年纯收入的区间。(2)以同样概率估计全乡农户年纯收入总额的区间范围。 答案: 解: 200100 2000===n x σμ 39220096.1=?==?x x t μ x x x X x ?+≤≤?- 3921200039212000+≤≤-X 11608-----12392(元) 5000×11608------5000×12392(元) 3、某企业生产一种新的电子元件,用简单随机重复抽样方法抽取100只作耐用时间试验,测试结果,平均寿命6000小时,标准差300小时,试在95.45%(t=2)概率保证下,估计这种新电子元件平均寿命区间。 答案: 解:2,300,6000,100====t x n σ (小时)30100 300===n x σμ (小时)60302=?==?x x t μ x x x X x ?+≤≤?- 606000606000+≤≤-X 5940-----6060(小时) 4、 从某年级学生中按简单随机抽样方式抽取50名学生,对邓小平理论课的考试成绩进行检查,得知其平均分数为75.6分,样本标准差10分,试以95.45%(99.73%t=3、68.27%t=1)的概率保证程度推断全年级学生考试成绩的区间范围。如果其它条件不变,将允许误差缩小一半,应抽取多少名学生? 答案:解:2,10,6.75,50====t x n σ 4142 .150 10== = n x σ μ 8284 .24142.12=?==?x x t μ 2426 .44142.13=?==?x x t μ x x x X x ?+≤≤?- 8284 .26.758284 .26.75+≤≤-X 2426.46.752426.46.75+≤≤-X 72.77----78.43 71.3574---79.8426

统计学各章练习——抽样推断

第九章抽样推断 一、名词 1、抽样推断:即由样本指标来推断总体指标的统计方法。 2、抽样误差:是指抽样指标和全及指标之间的绝对离差。 3、抽样极限误差:是指样本指标与全及指标之间产生的抽样误差被允许的最大可能范围,也叫允许误差。 4、点估计:就是直接用样本指标代表总体指标的估计方法。 5、区间估计:就是把抽样指标与抽样平均误差结合起来,来推断总体指标所在的可能范围的方法。 6、假设检验:就是先对研究总体的参数做出某种假设,然后抽取样本,构造适当的统计量,利用样本提供的信息对假设的正确性进行判断的过程。 二、填空题 1.抽样推断是由(样本指标)来推断(相应的全及指标)的统计方法。 2.影响抽样误差大小的因素主要有:总体各单位标志值的差异程度、(样本的单位数目)、(抽样的具体方法)和抽样调查的组织形式。 3.抽样误差是由于抽样的(随机性)而产生的误差,这种误差不可避免,但可以控制在(所允许的范围)之内。 4.抽样平均误差是样本平均数的(标准差),是所有可能样本指标与总体指标之离差的(平均数)。 5.抽样极限误差,是指样本指标与全及指标之间产生的(抽样误差)被允许的(最大可能范围)。 6.用样本指标估计总体指标,要做到三个要求,即:(无偏性)、(一致性)、(有效性)。 7.抽样估计的方法有(点估计)和(区间估计)两种。 8.总体参数的区间估计必须同时具备(估计值)、(抽样误差范围)和(概率保证程度)三个要素。 9.总体中各单位标志值之间的变异程度越大,要求的样本单位数就(越多),即样本容量就(越大),总体各单位标志值变异程度与样本容量之间成(正比)。 10.允许误差越大,需要的样本单位数目就(越少);允许误差越小,需要的样本单位数目就(越多)。 11.对推断结果要求的可靠程度越高,必要样本单位数目就(越多);反之,可靠程度越低,必要样本单位数目就(越少)。 12.参数估计是用样本统计量估计(总体参数),而假设检验则是先对总体参数(提出假设),然后,运用样本资料验证假设(是否成立)。 三、判断 1.在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定、唯一的。(×) 2.样本容量指从一个总体中可能抽取的样本个数。(×) 3.抽样极限误差总是大于抽样平均误差。(×) 4.重复抽样误差大于不重复抽样误差。(√) 5.抽样准确度要求高,则可靠性低。(√) 6.抽样平均数的标准差或抽样成数的标准差是衡量抽样误差一般水平的尺度。(√) 7.点估计就是以样本的实际值直接作为相应总体参数的估计值。(√) 8.抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(√) 四、选择 (一)单项选择 1.抽样调查所遵循的基本原则是(B)。

统计学答案解析最新版本

统计学课本课后作业题(全) 题目: 第1章:P11 6,7 第2章:P52 练习题3、9、10、11 第3章:P116思考题12、14 练习题16、25 第4章:P114 思考题6,练习题2、4、6、13 第5章:P179 思考题4、练习题3、4、6、11 第6章:P209 思考题4、练习题1、3、6 第7章:P246思考题1、练习题1、7 第8章:P287 思考题4、10 练习题2、3 第一章 6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;最近的一个集装箱内的全部油漆; (2)描述研究变量;装满的油漆罐的质量; (3)描述样本;最近的一个集装箱内的50罐油漆; (4)描述推断。50罐油漆的质量应为4.536×50=226.8 kg。 7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第二章 3.某百货公司连续40天的商品销售额如下(单位:万元):

统计学习题第五章_抽样与抽样估计答案

一、填空题 1、在实际工作中,人们通常把 n≥30 的样本称为大样本,而把 n<30 的样本称为小样本。 2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须 ((2)) (1)增加到原来的3倍(2)增加到原来的9倍 (3)增加到原来的6倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1 小时的全部产进行检验,这种方式是((4)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) (1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为分钟,则概率为时,通话平均持续时间的抽样极限误差为((2)) (1)(2)(3)(4)

6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3、抽样极限误差((1)(2)(4)) (1)是所有可能的样本指标与总体指标之间的误差范围 (2)也叫允许误差(3)与所做估计的概率保证程度成反比 (4)通常用来表示抽样结果的精确度 4、影响样本容量的因素有((1)(2)(3)(4)(5)) (1)总体方差 (2)所要求的概率保证程度 (3)抽样方法 (4)抽样的组织形式 (5)允许误差法范围的大小 5、不重复抽样的抽样平均误差((2)(4)) (1)总是大于重复抽样的抽样平均误差

电大统计学原理期末测验考试题库

单选: 1、连续生产的电子管厂,产品质量检验是这样安排的,在一天中,每隔一小时抽取5分钟的产品进行检验,这是(D ) D.整群抽样 2、统计分组的关键是(A ) A.正确选择分组标志 3、直接反映总体规模大小的指标是( C ) C.总量指标 4、抽样调查的主要目的是( A ) A.用样本指标推算总体指标 5、相关系数的取值范围是( C ) C. -l≤r

统计学第五章课后题及答案解析

第五章 练习题 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查B.了解样本的基本情况 C.了解总体的基本情况D.推断总体指标2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数B.总体方差 C.抽样比例D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大B.二年级较大 C.误差相同D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差B.低估误差 C.恰好相等D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2 ,则样本容量() A.扩大到原来的2倍B.扩大到原来的4倍 C.缩小到原来的1/4D .缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样B.纯随机抽样 C.分层抽样D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差B.层内方差 C.总方差D.允许误差二、多项选择题 1.抽样推断的特点有() A .建立在随机抽样原则基础 上 B.深入研究复杂的专门问 题 C .用样本指标来推断总体指 标 D.抽样误差可以事先计算 E .抽样误差可以事先控制 2.影响抽样误差的因素有() A .样本容量的大小B.是有限总体还是无限总 体 C .总体单位的标志变动度D.抽样方法 E .抽样组织方式 3.抽样方法根据取样的方式不同分为() A .重复抽样 B .等距抽样 C .整群抽样 D .分层抽样 E .不重复抽样 4.抽样推断的优良标准是() A .无偏性 B .同质性 C .一致性 D .随机性 E .有效性 5.影响必要样本容量的主要因素有() A . 总体方差的大小B.抽样方法

统计学原理b试题a(

山东理工大学成人高等教育统计学原理试卷(A 卷) 共三个大题,满分100分。 一、单项选择题(每题2分,共20分) 1、某县男性人口占52%,这个指标属于( B )。 A .结构相对数 B .比例相对数 C .强对相对数 D .平均数 2、“统计”一词的基本含义是( B ) A.统计调查 、统计整理 、统计分析 B. 统计科学、 统计工作 、统计资料 C .统计方法、 统计分析 、统计计算 D. 统计设计、 统计分组 、统计计算 3、某企业计划产量比去年提高8%,而实际产量提高了12%,则计划完成程度为( C ) A. 150% % C. % D. % 4、相关系数接近于1,表明两变量间( D )。 A .没有相关关系 B .线性相关关系较弱 C .负线性相关关系较强 D .高度正相关 5、已知某地的工业总产值2012年比2005年增长%,2011年比2005年增长150%,则2012年比2011年增长( A )。 A .15% B .125% C .115% D .% 6、编制数量指标指数的一般原则是采用( C )作同度量因素。 A. 报告期数量指标 B. 基期数量指标 C. 基期质量指标 D. 报告期质量指标 7、在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比,是( C ) A .两者相等 B .两者不等 C .前者小于后者 D .前者大于后者 8、一个总体单位( ) A .可以有多个标志 B .可以有多个指标 C .只能有一个标志 D .只能有一个指标 9、某灯泡厂为了掌握产品质量,拟进行一次质量大检查,应选择( A ) A. 抽样调查 B. 全面调查 C. 重点调查 D. 统计报表 10、将对比基数为1而计算出来的相对数称为( c ) A .千分数 B .倍数 C .成数 D .百分数 二、简答题(每题8分,共40分) 1、 影响样本容量大小的因素有哪些 样本容量的大小不取决于总体的多少,而取决于:1、研究对象的变化程度;2、 所要求或误差的大小(即精确要求);3、要求推断的置信程度。 2、影响抽样误差的因素有哪些 ①抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;抽样单位数目越少,抽样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,则为全面调查,也就不存在抽样误差了。 ②总体被研究标志的变异程度。在其他条件不变的情况下,总体标志的变异程度越小,抽样误差越小。总体标志的变异程度越大,抽样误差越大。抽样误差和总体标志的变异程度成正比变化。这是因为总体的变异程度小,表示吝惜体各单位标志值之间的差异小。则样本指标与总体指标之间的差异也可能小;如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差。 ③抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采用不重复抽样比采用重复抽样的抽样误差小。 ④抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。通常,我们不常利用不同的抽样误差,做出判断各种抽样组织方式的比较标准。 3、简述统计指数的作用 1.反映复杂的社会经济现象总体的综合变动程序 2.分析各个因素对复杂社会经济现象总体综合变动 3.研究社会经济现象总体的结构变动对平均水平变动的影响 4.考察计划任务的完成程度 4、简述平均指标的应用原则。 1.计算和应用平均指标必须注意现象总体的同质性。 2.用组平均数补充说明平均数 3、计算和运用平均数时,要注意极端数值的影响。 4、在运用平均数分析时还应注意用分配数列补充说明平均数。 5、把平均数与典型事例相结合。 5、简述相关分析的主要内容。 适用专业 工商管理、国贸、人力 资源 层 次 本专科 考试时间 90分钟 题号 一 二 三 总分 分数 级 年 ) 站 授 函 ( 院 学 业 专 名 姓 号 学 共4页第1页 共4页第2页

统计学 第五章习题

第五章思考与练习 1. 要求: (1)计算样本平均数和样本标准差,并推算抽样平均误差; (2)以95.45%的概率保证,估计该厂工人的月平均工资和工资总额的区间。 2.从某餐厅连续三个星期抽查49名顾客,调查顾客的平均消费额,得样本平均消费额为 25.5元。要求: (1)假设总体标准差为10.5元,求抽样平均误差。 (2)以95%的概率保证,抽样极限误差是多少? (3)估计总体消费额的置信区间。 3.某加油站想了解司机在该加油站加油的习惯,一周内随机抽取了100名司机,得出如下 结果:平均加油量等于13.5升,样本标准差为3.2升,有19人购买无铅汽油,试问:(1)以0.05的显著性水平,是否有证据说明平均加油量为12升。 (2)以0.05的显著性水平,是否有证据说明购买无铅汽油的司机少于20。 4 设干燥时间总体服从正态分布,现在要求置信度为95%时估计这种漆的平均干燥时间。 (1)根据经验知总体标准差为0.6小时: (2)总体标准差未知。 5.采用简单随机重置抽样从2000件产品中抽查200件产品,其中合格产品190件,要求: (1)计算该产品的合格率及其抽样平均误差; (2)以95.45%的概率,对产品合格率和产品合格数量进行区间估计; (3)如果合格品率的极限误差为2.31%,其概率保证程度是多少?

6.某电子产品的使用寿命在3000小时以下为次品,现在从5000件产品中抽取100件测得 要求: (1)分别按重置抽样和不重置抽样计算该产品平均寿命的抽样平均误差; (2)分别按重置抽样和不重置抽样计算该产品次品率的抽样平均误差; (3)以90%的概率保证,对该产品的平均使用寿命进行区间估计; (4)以90%的概率保证,对该产品的次品率进行区间估计。 7.某医院欲估计一名医生花在每个病人身上的平均时间,根据以往经验看病时间的标准差 为6分钟。若要求置信度为95%,允许误差范围为2分钟。试问随机抽样中需要多大的样本? 8.某公司新推出一种营养型豆奶,为了解该豆奶的受欢迎程度,并使置信度为95%,估计 误差不超过5%,下列情况下,你建议样本容量为多少? (1)初步估计60%的顾客喜欢此豆奶 (2)没有任何顾客资料 9.为调查某地区人口综合素质,在该地区150 000户家庭中以不重置抽样方式随机抽取30 要求: (1)试以95.45%的概率保证程度,推断该地区的人口总数 (2)若要求人口总数的极限误差不超过3300人,应至少抽取多少户作为样本? 10.某电视台为了了解某电视节目的收视率,随机抽取500户居民作为样本。从调查结果来 看,有160户收看该节目。以95%的概率保证推断: (1)该电视节目的收视率 (2)如果收视率的极限误差缩小为原来的1/2,则样本容量应为原来的多少户? 11.从某县的100个村中,抽取10个村进行各村的全面调查,算得每户平均饲养家畜35头, 各村平均的方差为16,要求: (1)以90%的概率估计全县平均每户饲养家畜的头数 (2)若极限误差为2412头,则计算其概率保证程度。

统计学作业(抽样推断)

第六章抽样推断 一、单项选择题 1. 抽样调查的主要目的在于( A. 计算和控制误差 B. . 用样本来推断总体 D. 对调查单位作深入的研究 2. 抽样调查所必须遵循的基本原则是( A. 随意原则 B. 可比性原则. 准确性原则 D. 3. 下列属于抽样调查的事项有( A. B. 为了解某大学生食堂卫生状况,对该校的一个食堂进行了调查 C. 对某城市居民1% D. 4. 无偏性是指( A. 抽样指标等于总体指标 B. C. 样本平均数等于总体平均数 D. 5. 一致性是指当样本的单位数充分大时,抽样指标( A. 小于总体指标 B. 等于总体指标. 大于总体指标 D. 充分靠近总体指标 6. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有()。 A. 前者小于后者 B. 前者大于后者C. 两者相等 D. 7. 能够事先加以计算和控制的误差是( A. 抽样误差 B. 登记误差. 代表性误差 D. 8.对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍。抽样平均误差( A. 第一工厂大 B. 第二个工厂大. 两工厂一样大 D. 9. 抽样平均误差是指抽样平均数(或抽样成数)的( A. 平均数 B. 平均差C. 标准差 D. 10.在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比, 是( A. 两者相等 B. 两者不等. 前者小于后者 D. 11. 反映抽样指标与总体指标之间抽样的可能范围的指标是(

A. 抽样平均误差 B. . 概率度 D. 12.在下列情况下,计算不重复抽样的抽样平均误差可以采用重复抽样公式()。 A. 总体单位数很多 B. C. 抽样单位数对总体单位数的比重很小D. 抽样单位数对总体单位数的比重较大 13.在进行纯随机重复抽样时,为使抽样平均误差减少25%,则抽样单位数应()。 A. 增加25% B. 增加78%C. 增加1.78% D. 减少25% 14.在其它同等的条件下,若抽选5%的样本,则重复抽样的平均误差为不重复抽样平均误差的( A. 1.03倍 B. 1.05倍C. 0.97倍 D. 95% 15. 在总体方差一定的情况下,下列条件中抽样平均误差最小的是( A. 抽样单位数为20 B. 抽样单位数为40C. 抽样单位数为90 D. 抽样单位数为100 16. 通常所说的大样本是指样本容量( A. 小于10 B. 不大于10 C. 小于30 D. 不小于30 17. 抽样成数指标P值越接近1,则抽样成数平均误差值()。 A.越大 B.越小 C.越接近0.5 D.越接近1 18.当总体单位数很大时,若抽样比例为51%,则对于简单随机抽样,不重复抽样的抽样平均误差约为重复抽样的( A. 51% B. 49% C. 70% D. 30% 19.将总体单位按一事实上标志排队,并按固定距离抽选样本点的方法是( A. 类型抽样 B. 等距抽样C. 整群抽样 D. 20. 在进行抽样估计时,常用的概率度t的取值( A. t<1 B. 1≤t≤3 C. t=2 D. t>3 21. 抽样调查中( A. 既有登记性误差,也有代表性误差 B. 只有登记性误差,没有代表性误差 C. 没有登记性误差,只有代表性误差 D. 上述两种误差都没有 22. 等距抽样的误差与简单随机抽样相比较( A. 前者小 B. 前者大C. 两者相等 D. 23.某地订奶居民户均牛奶消费量为120公斤,抽样平均误差为2公斤。据此可算得户均牛奶消费量在114-126公斤之间的概率为(

统计学第九章抽样与抽样估计

统计学第九章抽样与抽样估计

第九章抽样与抽样估计 一、单项选择题 1、抽样极限误差是指抽样指标和总体指标之间(D)。 A.抽样误差的平均数B.抽样误差的标准差 C.抽样误差的可靠程度D.抽样误差的最大可能范围 2、样本平均数和总体平均数(B)。解析:样本平均数是以总体平均数为中心,在其范围内变动(P213) A.前者是一个确定值,B.前者是随机变量, 后者是随机变量后者是一个确定值 C.两者都是随机变量D.两者都是确定值 3、某场要对某批产品进行抽样调查,一直以往的产品合格率分别为90%,93%, 95%,要求误差范围小于5%,可靠性为95.45%,则必要样本容量应为(B)。A.144B.105C.76D.109 4、在总体方差不变的条件下,样本单位数增加3倍,则抽样误差(C)。 A.缩小1/2B.为原来的3/√3C.为原来的1/3D.为原来的2/3 5、在其他条件不变的前提下,若要求误差范围缩小1/3,则样本容量(B)。 A.增加9倍B.增加8倍 C.为原来的2.25倍D.增加2.25倍 6、抽样误差是指(C)。解析:这题考的是抽样误差的定义(P213) A.在抽查过程中由于观察、测量等差错所引起的误差 B.在调查中违反随机原则出现的系统误差 C.随机抽样而产生的代表性误差 D.人为原因所造成的误差 7、在一定的抽样平均误差条件下(A)。

A.扩大极限误差范围,可以提高推断的可靠程度 B.扩大极限误差范围,会降低推断的可靠程度 C.缩小极限误差范围,可以提高推断的可靠程度 D.缩小极限误差范围,不改变推断的可靠程度 8、抽样平均误差是(B)。解析:这题考的是抽样平均误差的定义(P214)A.总体的标准差B.样本的标准差 C.抽样指标的标准差D.抽样误差的平均差 9、对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进 行检验,这种抽查方式(D)。 A.简单随机抽样B.类型抽样 C.等距抽样D.整群抽样 10、先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本, 这种抽样形式被称为(C)解析:这题考的是抽样调查的几种不同的方式的定义(P211)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 11、事先确定整体范围,并对整体的每隔单位都编号,然后根据《随机数码表》 或抽签的方式来抽取样本的抽样组织形式,被称为(B)。 A.简单随机抽样B.机械抽样 C.分层抽样D.整群抽样 12、在同样条件下,不重复抽样的抽样标准误差于重复抽样的抽样的标准误差 相比,(A)。 A.前着小于后者B.前者大于后者 C.两者相等D.无法判断 13、在重复的简单随机抽样中,当概率保证程度从68.27%提高到95.45%时(其 他条件不变),必要的样本容量将会(C)。

相关主题
文本预览
相关文档 最新文档