当前位置:文档之家› 抽样技术简单随机抽样

抽样技术简单随机抽样

调查学生如何进行简单随机抽样

调查学生如何进行简单随机抽样 例、某校有学生1200人,为了调查某种情况打算抽取一个样本容量为50的样本,问此样本若采用简单随机抽样将如何获得? 分析:简单随机抽样分两种:抽签法和随机数表法.尽管此题的总体中的个体数不一定算“较少”,但依题意其操作过程却是保障等概率的. 解:法一:首先,把该校学生都编上:0001,0002,0003,…,1200.如用抽签法,则作1200个形状、大小相同的号签(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌.抽签时,每次从中抽出1个号签,连续抽取50次,就得到一个容量为50的样本. 法二:首先,把该校学生都编上:0001,0002,0003,…,1200如用随机数表法,则可在数表上随机选定一个起始位置(例如,随意投一针,针尖所指数字可作起始位置).假如起始位置是表中的第5行第9列的数字6,从6开始向右连续取数字,以4个数为一组,碰到右边线时向下错一行向左继续取,所得数字如下: 6438,5482,4622,3162,4309,9006,1844,3253,2383,0130,3046,1943,6248,3469,0253,7887,3239,7371,28的,3445,9493,4977,2261,8442,…… 所取录的4位数字如果小于或等于1200,则对应此号的学生就是被抽取的个体;如果所取录的4位数字大于1200而小于或等于2400,则减去1200剩余数即是被抽取的;如果大于2400而小于3600,则减去2 400;依些类推.如果遇到相同的,则只留第一次取录的数字,其余的舍去.经过这样处理,被抽取的学生所对应的分别是: 0438,0682,1022,0762,0709,0606,0644,0853,1183,013O,0646,0743,0248,1069,0253,0687,0839,0171,0445,1045,1093,0177,1061,0042,…一直取够50人为止. 说明:规X的,不带主观意向的随机抽样,才能保证公平性、客观性、准确性和可信性.故此,抽样的过程,也反映科学的工作态度和XX的工作作风. 判断抽牌方法是否为简单随机抽样 例人们打桥牌时,将洗好的扑克牌(52X)随机确定一X为起始牌,这时,开始按次序搬牌,对任何一家来说,都是从52X总体中抽取一个13X的样本.问这种抽样方法是否为简单随机抽样? 分析:简单随机抽样的实质是逐个地从总体中随机抽取.而这里只是随机确定了起始X,这时其他各X虽然是逐X起牌的,其实各X在谁手里已被确定,所以,不是简单随机抽样,据其等距起牌的特点,应将其定位在系统抽样. 解:是简单随机抽样,是系统抽样. 说明:逐X随机抽取与逐X起牌不是一回事,其实抓住其“等距”的特点不难发现,属于哪类抽样. 判断是不是系统抽样 例下列抽样中不是系统抽样的是() A.从标有1-15号的15个球中,任选3个作样本,按从小号到大号排序,随机选起点

抽样技术课后习题参考答案金勇进

第二章习题 2.1判断下列抽样方法是否是等概的: (1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。 (2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64. (3)总体20000~21000,从1~1000中产生随机数r 。然后用r+19999作为被抽选的数。 解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。第二,每个单元被抽中的概率是已知的,或者是可以计算的。第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。 因此(1)中只有1~64是可能被抽中的,故不是等概的。(2)不是等概的【原因】(3)是等概的。 2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同? 300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。如果希望相对误差限不超过10%,则样本量至少应为多少? 解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为 [])(y [2 y V z N α±=[475000±1.96*41308.19] 即为(394035.95,555964.05) 由相对误差公式 y ) (v u 2y α≤10% 可得%10*5.9206*n 50000 n 1*96.1≤- 即n ≥862

欲使相对误差限不超过10%,则样本量至少应为862 2.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。 解析:由已知得:10000=N 200=n 35.0=p 02.0==N n f 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n f p V 该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2 ∧ ∧ ±P V Z P E α 代入数据计算得:该区间为[0.2843,0.4157] 2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表: 编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 10 240 20 120 估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。 解析:由已知得:200=N 20=n 根据表中数据计算得:5.14420120 1 ==∑=i i y y ∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2 y V z α ±即是:[132.544 ,156.456] 故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。 2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到 y =1120(吨),225600S =,据此估计该地区今年的粮食总产量,并给出置信水平95%的 置信区间。 解析:由题意知:y =1120 1429.0350 50 n === N f 225600S =?160=s

简单随机抽样习题及解答

简单随机抽样习题及解答 一、名词解释 简单随机抽样抽样比设计效应 二、单选题 1、假设根据抽样方差公式确定的初始样本量为400,有效回答率为0.8,那么实际样本量应为:() A 320 B 800 C 400 D 480 答案:B 2、已知某方案的设计效应为0.8,若计算得简单随机抽样的必要样本量为300,则该方案所需样本量为() A 375 B 540 C 240 D 360 答案:C 3、假设根据抽样方差公式确定的初始样本量为400,如现在要将抽样相对误差降低20%,则样本量应为:() A 256 B 320 C 500 D 625 答案:D 三、多选题 1、简单随机抽样的抽样原则有() A 随机抽样原则 B 抽样单元入样概率已知 C 抽样单元入样概率相等 D 随意抽取原则 答案:ABC 2、影响样本容量的因素有: A 总体大小 B 抽样误差 C 总体方差 D 置信水平 答案:ABCD 3、简单随机抽样的实施方法有() A 随机数法 B 抽签法 C 计算机抽取 D 判断抽取 答案:ABC 四、简答题 1、简述样本容量的确定步骤 2、简述预估计总体方差的方法 五、计算 1、某工厂欲制定工作定额,估计所需平均操作时间,从全厂98名从事该项作业的工人中随

机抽选8人,其操作时间分别为4.2,5.1,7.9,3.8,5.3,4.6,5.1,4.1(单位:分),试以95%的置信度估计该项作业平均所需时间的置信区间(有限总体修正系数可忽略)。 2、某居民区共有10000户,现用抽样调查的方法估计该区居民的用水量。采用简单随机抽样抽选了100户,得y=12.5,s2=12.52。估计该居民区的总用水量95%的置信区间。若要求估计的相对误差不超过20%,试问应抽多少户做样本? (1)该区居民的平均用水量的置信区间: 该区居民的用水总量的95%置信区间:(1181,1319) (2) 35.96)5 .122.052.1296.1()(220=??==Y r S u n α 9643.95100≈=+=N n n n 3. 某县采用简单随机抽样估计粮食、棉花、大豆的播种面积,抽样单元为农户。根据以往资料其变量的变异系数为 名称 粮食 棉花 大豆 变异系数 0.38 0.39 0.44 若要求以上各个项目的置信度为95%,相对误差不超过4%,需要抽取多少户?若用这一样本估计粮食的播种面积,其精度是多少? (1) ) 04.6,98.3(4356 .036.20125.54356 .0)(1897.0)98 81(86527.1)1()(0125.51?21 ?±==-=-====∑=y s f n s y v y n y Y n i i ) 19.13,81.11(35 .096.15.1235 .0)(1239.0)01.01(100 52.12)1()(5.12?2?±==-=-===y s f n s y v y Y

1简单随机抽样、系统抽样、分层抽样含答案

简单随机抽样、系统抽样、分层抽样 1.简单随机抽样的定义 设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. 2.简单随机抽样的分类 简单随机抽样????? 抽签法随机数法 3.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的. 4.系统抽样的概念 先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本. 5.系统抽样的步骤 假设要从容量为N 的总体中抽取容量为n 的样本,步骤为: (1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等. (2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n ; (3)在第1段用简单随机抽样确定第一个个体编号l(l≤k); (4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本. 6.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. 7.分层抽样的适用条件 分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选

抽样技术简答题及答案

抽样技术各类简答题参考答案 习题一 1.请列举一些你所了解的以及被接受的抽样调查。 略 2. 抽样调查基础理论及其意义; 答:大数定律,中心极限定理,误差分布理论,概率理论。 大数定律是统计抽样调查的数理基础,也给统计学中的大量观察法提供了理论和数学方面的依据;中心极限定理说明,用样本平均值产生的概率来代替从总体中直接抽出来的样本计算的抽取样本的概率,为抽样推断奠定了科学的理论基础;认识抽样误差及其分布的目的是希望所设计的抽样方案所取得的绝大部分的估计量能较好的集中在总体指标的附近,通过计算抽样误差的极限是抽样误差处于被控制的状态;概率论作为数学的一个分支而引进统计学中,是统计学发展史上的重要事件。 3.抽样调查的特点。 答:1)随机抽样;2)以部分推断总体;3)存在抽样误差,但可计算,控制;4)速度快、周期短、精度高、费用低;5)抽样技术灵活多样;6)应用广泛。 4.样本可能数目及其意义; 答:样本可能数目是在容量为N的总体中抽取容量为n的样本时,所有可能被抽中的不同样本的个数,用A表示。 意义:正确理解样本可能数目的概念,对于准确理解和把握抽样调查误差的计算,样本统计量的抽样分布、抽样估计的优良标准等一系列理论和方法问题都有十分重要的帮助。 5. 影响抽样误差的因素; 答:抽样误差是用样本统计量推断总体参数时的误差,它属于一种代表性误差,在抽样调查中抽样误差是不可避免的,但可以计算,并且可以被控制在任意小的范围内;影响 抽样误差的因素:1)有样本量大小,抽样误差通常会随着样本量的大小而增减,在某 些情形下,抽样误差与样本量大小的平方根成反比关系;2)所研究现象总体变异程度 的大小,一般而言,总体变异程度越大则抽样误差可能越大;3)抽样的方式方法, 如放回抽样的误差大于不放回抽样,各种不同的抽样组织方式也常会有不同的抽样误 差。 在实际工作中,样本量和抽样方式方法的影响是可以控制的,总体变异程度虽不可以 控制,但却可通过设计一些复杂的抽样技术而将其影响加以控制。 习题二 三简答题 1 概率抽样与非概率抽样的区别 答:概率抽样是指在抽取样本单元时,每个总体单元有一个非零的入样概率,并且样本单元的抽取应遵循一定的随机化程序。 2 普查与抽样调查的区别 答:普查是对总体的所有单元进行调查;抽样调查仅对总体中的部分单元进行调查。 3何谓抽样效率,如何评价设计效果? 答:两个抽样方案的抽样方差之比为抽样效率。当某个估计量的方差比另一估计量的方差小时,则称方差小的估计量效率比较高,因方差的大小与样本容量有直接的关系,因此比

随机抽样知识讲解

随机抽样 【学习目标】 1、了解简单随机抽样的概念,掌握实施简单随机抽样的常用方法:抽签法和随机数表法; 2、了解系统抽样的意义,并会用系统抽样的方法从总体中抽取样本; 3、了解分层抽样的概念与特征,清楚简单随机抽样、系统抽样、分层抽样的区别和联系. 【要点梳理】 要点一、简单随机抽样 简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取. 1、简单随机抽样的概念: 一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 2、简单随机抽样的特点: (1)被抽取样本的总体个数N是有限的; (2)简单随机样本数n小于等于样本总体的个数N; (3)从总体中逐个进行抽取,使抽样便于在实践中操作; (4)它是不放回抽取,这使其具有广泛应用性; (5)每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性. 3、实施抽样的方法: (1)抽签法: 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力又不方便,若标号的纸片或小球搅拌得不均匀还可能导致抽样的不公平.

抽签法的一般步骤: ①将总体中的N个个体编号; ②把这N个号码写在形状、大小相同的号签上; ③将号签放在同一箱中,并搅拌均匀; ④从箱中每次抽取一个号签,连续抽取n次; ⑤将总体中与抽到的号签的编号一致的n个个体取出. (2)随机数表法: 要理解好随机数表,即表中每个位置上等可能出现0,1,2,…,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性. 随机数表法的步骤: ①将总体的个体编号(每个号码的位数一致); ②在随机数表中任选一个数字作为开始; ③从选定的数开始按一定的方向读下去,若得到的数码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止. 注意: ①选定开始数字,要保证所选数字的随机性; ②确定读数方向获取样本号码时,读数方向可向左、向右、向上、向下,样本号码不能重复,否则舍去. 要点诠释: 1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法. 2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不

应用抽样技术期末复习题

抽样调查 一、选择题 1.抽样调查的根本功能是( C ) A. 获取样本资料 B. 计算样本资料 C . 推断总体数量特征 D. 节约费用 2.概率抽样与非概率抽样的根本区别是( B ) A.是否能保证总体中每个单位都有完全相同的概率被抽中 B.是否能保证总体中每个单位都有事先已知或可以计算的非零概率被抽中 C.是否能减少调查误差 D.是否能计算和控制抽样误差 3. 与简单随机抽样进行比较,样本设计效果系数Deff >1表明( A ) A.所考虑的抽样设计比简单随机抽样效率低 B.所考虑的抽样设计比简单随机抽样效率高 C.所考虑的抽样设计与简单随机抽样效率相同 D.以上皆对 4.优良估计量的标准是( B ) A.无偏性、充分性和一致性 B.无偏性、一致性和有效性 C. 无误差性、一致性和有效性 D. 无误差性、无偏性和有效性 5.某乡欲估计今年的小麦总产量进行调查,已知去年的总产量为12820吨,全县共123个村,抽取13个村调查今年的产量,得到63.118=y 吨,这些村去年的产量平均为21.104=x 吨。试采用比率估计方法估计今年该地区小麦总产量( B ) A.12820.63 B.14593.96 C.12817.83 D.14591.49 6.抽样标准误差的大小与下列哪个因素无关( C ) A .样本容量 B .抽样方式、方法 C .概率保证程度 D .估计量 7.抽样标准误差与抽样极限误差之间的关系是( B ) A.θ θ )?(SE = ? B.)?(θtSE =? C.θθ)?(tSE =? D.t SE )?(θ=? 8.应用比率估计量能使估计精度有较大改进的前提条件是调查变量与辅助变量 之间大致成( A )关系 A.正比例 B.反比例 C.负相关 D.以上皆是 9.能使)2(1)(2 22YX X Y lr S S S n f y V ββ-+-=达到极小值的β值为( B ) A.YX X Y S S S ? B.2X YX S S C.2Y YX S S D.X YX S S 2 10.( B ) 是总体里最小的、不可再分的单元。 A.抽样单元 B.基本单元 C.初级单元 D.次级单元 11. 下面哪种抽样方法是最简单的概率抽样方法( A )。 A.简单随机抽样 B.分层随机抽样 C.系统抽样 D.整群抽样 12. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A.简单随机抽样的deff=1 B.分层随机抽样的deff ﹥1 C.整群随机抽样的deff ﹥1 D.机械随机抽样的deff ≈1

简单随机抽样(含答案)

简单随机抽样 一、单选题 1. 抽样比的计算公式为( B )。 A. f= (n-1)/ (N-1) B. f=n/N C. f= (n-1)/N D. f= (N-n)/N 2. 不放回的简单随机抽样指的是哪种情形的随机抽样?(D ) A. 放回有序 B. 放回无序 C. 不放回有序 D. 不放回无序 3. 放回的简答随机抽样指的是哪种情形的随机抽样?( A ) A. 放回有序 B. 放回无序 C. 不放回有序 D. 不放回无序 4. 通常所讨论的简单随机抽样指的是( D )。 A. 放回的简单随机抽样 B. 放回无序随机抽样 C. 不放回有序随机抽样 D. 不放回的简单随机抽样 5. 下面给出的四个式子中,错误的是(D )。 A. ()E y Y = B.()E Ny Y = C.()E p P = D. ?()E R R = 6. 关于简单随机抽样的核心定理,下面表达式正确的是( A )。 A. 21()f V y S n -= B. 2 1()1f V y s n -=- C. 21()V y s n = D. 2 1()f V y s n -= 7. 下面关于各种抽样方法的设计效应,表述错误的是( B )。 A. 简单随机抽样的deff=1 B. 分层随机抽样的deff>1 C. 整群随机抽样的deff>1 D. 机械随机抽样的deff ≈1 8. 假设考虑了有效回答率之外所有其他因素的初始样本量为400,而设计有效回答率 为80%,那么样本量应定为( B )。 A. 320 B. 500 C. 400 D. 480 9. 在要求的精度水平下,不考虑其他因素的影响,若简单随机抽样所需要的样本量为300,分层随机抽样的设计效应deff=0.8,那么若想达到相同的精度,分层随机抽样所需要的样本量为(C )。 A. 375 B. 540 C. 240 D. 360 二、多选题 1. 随机抽样可以分为( ABCD )。 A. 放回有序

《抽样技术》第四版习题答案

第2章 2.1 解:()1 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号 为1~64的这些单元中每一个单元被抽到的概率都是 1100 。 ()2这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中 的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是2 100 ,而尚未被抽中的编号为36~63的每个单元的入样概率都是 1100 。 ()3这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~ 21 000中的每个单元的入样概率都是 1 1000 ,所以这种抽样是等概率的。 2.3 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大 _ y E y y -= 近似服从标准正态分布, _ Y 的195%α-=的置信区 间为y z y z y y α α??-+=-+? ?。

而()2 1f V y S n -= 中总体的方差2S 是未知的,用样本方差2s 来代替,置信区间 为,y y ?? -+???? 。 由题意知道,_ 2 9.5,206y s ==,而且样本量为300,50000n N ==,代入可以求得 _ 21130050000 ()2060.6825300 f v y s n --= =?=。将它们代入上面的式子可得该市居民日用电量的95%置信区间为7.8808,11.1192????。 下一步计算样本量。绝对误差限d 和相对误差限r 的关系为_ d rY =。 根据置信区间的求解方法可知 _ ___ 11P y Y r Y P αα? ???-≤≥-?≤≥-???? 根据正态分布的分位数可以知道1P Z αα??? ≤≥-???? ,所以()2_2rY V y z α?? ?= ??? 。也就是2 _2 _2 22 /221111r Y r Y S n N z S n N z αα?? ?????? ????? ???-=?=+ ? ????? ?? ???? 。 把_ 2 9.5,206,10%,50000y s r N ====代入上式可得,861.75862n =≈。所以样本量至少为862。 2.4 解:总体中参加培训班的比例为P ,那么这次简单随机抽样得到的P 的估计值p 的方差()()111f N V p P P n N -= --, 在大样本的条件下近 似服从标准正态分布。在本题中,样本量足够大,从而可得P 的195%α- =的置信区间为 2p z p z αα?-+?。 而这里的()V p 是未知的,我们使用它的估计值

1简单随机抽样、系统抽样、分层抽样含答案

2.1.1 简单随机抽样、系统抽样、分层抽样 1.简单随机抽样的定义 设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. 2.简单随机抽样的分类 简单随机抽样????? 抽签法随机数法 3.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的. 4.系统抽样的概念 先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本. 5.系统抽样的步骤 假设要从容量为N 的总体中抽取容量为n 的样本,步骤为: (1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等. (2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n ; (3)在第1段用简单随机抽样确定第一个个体编号l(l ≤k); (4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本. 6.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. 7.分层抽样的适用条件 分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选 用分层抽样的方法. 一、选择题 1.抽签法中确保样本代表性的关键是( ) A .制签 B .搅拌均匀 C .逐一抽取 D .抽取不放回 答案 B 解析 由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B . 2.下列抽样实验中,用抽签法方便的有( ) A .从某厂生产的3 000件产品中抽取600件进行质量检验 B .从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验 C .从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验 D .从某厂生产的3 000件产品中抽取10件进行质量检验 答案 B

抽样技术题目

一、 简单随机抽样 1、在简单随机抽样中,试证明比估计R y 是总体均值Y 的渐近无偏估计,并求其方差。 证明:X R Y = X x y X R Y y R = ==∧ ∧ () ?? ??? ????????????????? ????? ? ? ?-+???? ? ?-+???? ?? --=? ????? ? ????? ?????? ? ?-+=???? ??=2 2 11X X x o X X x X X x X y E X X X x X y E X X x y E y E R 由于0?→?-P X x 即0→-X X x 所以() () Y y E X y E X y E R ==??? ? ??= 得证。 ()() 2 22 2 ??? ? ??-=???? ??-=-=R x y E X X R X x y E y E y E y Var R R R () () ?????????? ???????????? ????? ? ? ?-+???? ? ?-+???? ? ?---=?????? ? ?????? ? ???? ??-+-=2 2 2111X X x o X X x X X x X x R y X X x X x R y E X 由于0?→?-P X x 即 0→-X X x 所以() ()() 2 22 2 1Z R S n f x R y Var x R y E X x R y E X y Var -=-=-=??? ? ??-= 其中:RX Y Z -=故() ()()( )[]() 2 222 1 2111X XY Y N i i i R S R RS S n f X R Y RX Y N n f y Var +--=-----=∑= 2、对于简单随机抽样,总体均值Y 的回归估计量定义为:()lr y y X x β=+-,如β为常数(记为0β),证明 201 22200(y )11(y )[()()]11(2) lr N lr i i i x xy E Y f V Y Y X X n N f S S S n βββ==-=-----=+-∑

《抽样技术》第四版习题答案

第2章 解:这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为1~64的这些单元中每一个单元被抽到的概率都是。 这种抽样方法不是等概率的。利用这种方法,在每次抽取样本单元时,尚未被抽中的编号为1~35以及编号为64的这36个单元中每个单元的入样概率都是,而尚未被抽中的编号为36~63的每个单元的入样概率都是。 这种抽样方法是等概率的。在每次抽取样本单元时,尚未被抽中的编号为20 000~21 000中的每个单元的入样概率都是,所以这种抽样是等概率的。 解: 解:首先估计该市居民日用电量的95%的置信区间。根据中心极限定理可知,在大样本的条件下,近似服从标准正态分布,的的置信区间为。 而中总体的方差是未知的,用样本方差来代替,置信区间为。 由题意知道,,而且样本量为,代入可以求得 。将它们代入上面的式子可得该市居民日用电量的95%置信区间为。 下一步计算样本量。绝对误差限和相对误差限的关系为。 根据置信区间的求解方法可知 根据正态分布的分位数可以知道,所以。也就是。 把代入上式可得,。所以样本量至少为862。 解:总体中参加培训班的比例为,那么这次简单随机抽样得到的的估计值的方差,利用中心极限定理可得在大样本的条件下近似服从标准正态分布。在本题中,样本量足够大,从而可得的的置信区间为。

而这里的是未知的,我们使用它的估计值。所以总体比例的的置信区间可以写为,将代入可得置信区间为。 解:利用得到的样本,计算得到样本均值为,从而估计小区的平均文化支出为144.5元。总体均值的的置信区间为,用来估计样本均值的方差。 计算得到,则,,代入数值后计算可得总体均值的95%的置信区间为。 解:根据样本信息估计可得每个乡的平均产量为1 120吨,该地区今年的粮食总产量的估计值为(吨)。 总体总值估计值的方差为,总体总值的的置信区间为,把 代入,可得粮食总产量的的置信区间为。 解:首先计算简单随机抽样条件下所需要的样本量,把带入公式,最后可得。 如果考虑到有效回答率的问题,在有效回答率为70%时,样本量应该最终确定为。 解:去年的化肥总产量和今年的总产量之间存在较强的相关性,而且这种相关关系较为稳定,所以引入去年的化肥产量作为辅助变量。于是我们采用比率估计量的形式来估计今年的化肥总产量。去年化肥总产量为。利用去年的化肥总产量,今年的化肥总产量的估计值为吨。 解:本题中,简单估计量的方差的估计值为=37.17。 利用比率估计量进行估计时,我们引入了家庭的总支出作为辅助变量,记为。文化支出属于总支出的一部分,这个主要变量与辅助变量之间存在较强的相关关系,而且它们之间的关系是比较稳定的,且全部家庭的总支出是已知的量。 文化支出的比率估计量为,通过计算得到,而,则,文化支出的比率估计量的值为(元)。 现在考虑比率估计量的方差,在样本量较大的条件下,,通过计算可以得到两个变量的样本方差为,之间的相关系数的估计值为,代入上面的公式,可以得到比率估计量的方差的估计值为。这个数值比简单估计量的方差估计值要小很多。全部家庭的平均文化支出的的置信区间为,把具体的数值代入可得置信区间为。 接下来比较比估计和简单估计的效率,,这是比估计的设计效应值,从这里可以看出比估计量比简单估计量的效率更高。 解:利用简单估计量可得,样本方差为,,样本均值的方差估计值为。 利用回归估计的方法,在这里选取肉牛的原重量为辅助变量。选择原重量为辅助变量是合理的,因为肉牛的原重量在很大程度上影响着肉牛的现在的重量,二者之间存在较强的相关性,相关系数的估计值为,而且这种相关关系是稳定的,这里肉牛的原重量的数值已经得到,所以选择肉牛的原重量为辅助变量。 回归估计量的精度最高的回归系数的估计值为。现在可以得到肉牛现重量的回归估计量为,代入数值可以得到。 回归估计量的方差为,方差的估计值为,代入相应的数值,,显然有。在本题中,因为存在肉牛原重量这个较好的辅助变量,所以回归估计量的精度要好于简单估计量。 第3章 3.1 解:在分层随机抽样中,层标志的选择很重要。划分层的指标应该与抽样调查中最关心的调查变量存在较强的相关性,而且把总体划分为几个层之后,层应该满足:层内之间的差异尽可能小,层间差异尽可能大。这样才能使得最后获得的样本有很好的代表性。对

(完整word版)简单随机抽样练习

简单随机抽样练习 一、选择题 1. 为调查参加运动会的1000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( ) A .1000名运动员是总体 B .每个运动员是个体 C .抽取的100名运动员是样本 D .样本容量是100 2. 为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是( ) A .总体是240 B 、个体是每一个学生 C 、样本是40名学生 D 、样本容量是40 3. 在简单随机抽样中,某一个个体被抽到的可能性( ) A 、与第n 次有关,第一次可能性最大 B 、与第n 次有关,第一次可能性最小 C 、与第n 次无关,与抽取的第n 个样本有关 D 、与第n 次无关,每次可能性相等 5.用随机数表法从100名学生(男生25人)中抽选20人,某男学生被抽到的可能性是( ). A.1100 B.125 C.15 D.14 6.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是 ( ). A .1 000名运动员是总体 B .每个运动员是个体 C .抽取的100名运动员是样本 D .样本容量是100 7.一个总体中有10个个体,用简单随机抽样的方法从中抽取一个容量为3的样本,则某特定个体被抽到的可能性是________. 8. 总体由编号为 01,02,…,19,20 的 20 个个体组成.利用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为( ) A.08 B.07 C.02 D.01 二、填空题 9. 一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是 。 10.关于简单随机抽样,有下列说法: ①它要求被抽取样本的总体的个数有限;②它是从总体中逐个地进行抽取; ③它是一种不放回抽样; ④它是一种等可能抽样,每次从总体中抽取一个个体时,不仅各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性. 其中正确的有________(请把你认为正确的所有序号都写上). 解析 根据简单随机抽样的特点,可知都正确.

简单随机抽样系统抽样分层抽样含答案

简单随机抽样系统抽样分层抽样含答案 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】

2.1.1 简单随机抽样、系统抽样、分层抽样 1.简单随机抽样的定义 设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. 2.简单随机抽样的分类 简单随机抽样??? 抽签法随机数法 3.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的. 4.系统抽样的概念 先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本. 5.系统抽样的步骤 假设要从容量为N 的总体中抽取容量为n 的样本,步骤为: (1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等. (2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n ; (3)在第1段用简单随机抽样确定第一个个体编号l(l≤k);

(4)按照一定的规则抽取样本.通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本. 6.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. 7.分层抽样的适用条件 分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法. 一、选择题 1.抽签法中确保样本代表性的关键是( ) A.制签B.搅拌均匀C.逐一抽取D.抽取不放回 答案 B 解析由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B. 2.下列抽样实验中,用抽签法方便的有( ) A.从某厂生产的3 000件产品中抽取600件进行质量检验 B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验 C.从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验 D.从某厂生产的3 000件产品中抽取10件进行质量检验 答案B 解析A总体容量较大,样本容量也较大不适宜用抽签法;B总体容量较小,样本容量也较小可用抽签法;C中甲、乙两厂生产的两箱产品有

抽样技术练习题及答案

1.请列举一些你所了解的以及被接受的抽样调查。 2.抽样调查基础理论及其意义; 3.抽样调查的特点。 4.样本可能数目及其意义; 5.影响抽样误差的因素; 6.某个总体抽取一个n=50的独立同分布样本,样本数据如下: 567 601 665 732 366 937 462 619 279 287 690 520 502 312 452 562 557 574 350 875 834 203 593 980 172 287 753 259 276 876 692 371 887 641 399 442 927 442 918 11 178 416 405 210 58 797 746 153 644 476 1)计算样本均值y与样本方差s2; 2)若用y估计总体均值,按数理统计结果,y是否无偏,并写出它的方差表达式; 3)根据上述样本数据,如何估计v(y)? 4)假定y的分布是近似正态的,试分别给出总体均值μ的置信度为80%,90%,95%,99%的(近似)置信区间。

一判断题 1 普查是对总体的所有单元进行调查,而抽样调查仅对总体的部分单元进行调查。 2 概率抽样就是随机抽样,即要求按一定的概率以随机原则抽取样本,同时每个单元被抽中的概率是可以计算出来的。 3 抽样单元与总体单元是一致的。 4 偏倚是由于系统性因素产生的。 5 在没有偏倚的情况下,用样本统计量对目标量进行估计,要求估计量的方差越小越好。 6 偏倚与抽样误差一样都是由于抽样的随机性产生的。 7 偏倚与抽样误差一样都随样本量的增大而减小。 8 抽样单元是构成抽样框的基本要素,抽样单元只包含一个个体。 9 抽样单元可以分级,但在抽样调查中却没有与之相对应的不同级的抽样框。 10 总体目标量与样本统计量有不同的意义,但样本统计量它是样本的函数,是随机变量。 11 一个抽样设计方案比另一个抽样设计方案好,是因为它的估计量方差小。 12 抽样误差在概率抽样中可以对其进行计量并加以控制,随着样本量的增大抽样误差会越来越小,随着n越来越接近N,抽样误差几乎可以消除。 13 抽样误差越小,说明用样本统计量对总体参数进行估计时的精度越低。 14 样本量与调查费用呈现线性关系,但样本量与精度却呈非线性关系。 15 精度和费用也是评价抽样设计方案优劣的两条准则。 16 简单随机抽样时每个总体单元都有非零的入样概率,但每个总体单元的入样概率是不同的。 17 当总体N很大时,构造一个包含所有总体单元名单的抽样框是有局限性的,这也是简单随机抽样的局限性。 18 设N=872,n=10。利用随机数字表抽取一个简单随机样本如下:128 157 506 455 127 789 867 954 938 622 19 设N=678 n=5 利用随机数字表抽取一个简单随机样本如下:556 485 098 260 485 20 在实际工作中,如果抽样比接近于1时,人们会采用全面调查 二填空题 1 抽样比是指( ),用( )表示。 2 偏倚为零的估计量,满足( ),称为( )。 3 简单随机抽样的抽样误差等于( )。 4 简单随机抽样时重复抽样的抽样误差等于( ) 5 抽样时某一总体单元在第m次被选入样本的概率是( ) 6 简单随机抽样时总体单元被选入样本的概率是( ) 7 某一样本被选中概率是( )。 8 大数定理是指( )的规律性总是在大量( )的观察中才能显现出来,随着观察次数( )的增大,( )影响将互相抵消而使规律性有稳定的性质。 9 中心极限定理证明了当( )增大时,观察值的均值将趋向于服从( ),即不论( )服从什么分布,在观察值足够多时其均值就趋向( )分布。 10 抽样调查的核心是估计问题,选择估计量的标准是( ) ( ) ( )。 三简答题

抽样技术练习题

课件例题: 简单随机 1.随机数表: 例:N=1300, M=2000 2841——2841÷2000…841,抽中 3421——3421÷2000…1421,舍弃 6181——6181÷2000…181,抽中 6115——6115÷2000…115,抽中 9176——9176÷2000…1176,抽中 2.例:下面是从N=6的总体抽取的n=3的全部可能样本情况,总体指标值为{6、7、10、12、25、30}。 S2=100.8 总体均值为15 总体总量为90 3.例:一个房间有五个人,i = 1、2、3、4、5,N=5 , 每个人带的钱Yi=100元、80元、100元、120元、90元,Y=98元,(Yi-Y)2=880。则全部可能样本情况表如下:

4.例:为调查某城镇成年居民的服装消费水平,在全体N=5443个成年中,用简单随机抽样抽的一个n=36的样本,调查上一年中购买成衣件数xi与支出金额yi,样本资料如下,试估计该城镇居民成衣平均消费水平及消费总额

该城镇成人平均年成衣消费5.5件,95%置信度的近似置信区间为(5.5±1.96×0.66),即[4.21件,6.79件]; 而人均用于成衣消费支出的金额为649.722元,95%置信度的近似置信区间为(649.722±1.96×91.71),即[469.97元,829.47元]。 该城镇成人年成衣总消费量估计 5.5×5443=29937件,95%置信度的近似置信区间为(29937±1.96×0.66×5443),即[22893件,36981件]; 该城镇用于成衣的消费总金额估计为3536438.06元, 95%的近似置信区间为:(3536438.06±1.96×91.71×5443)即[2558048.54元,4514827.58元] 若要求:成衣人均消费件数的估计绝对误差限为0.2件,人均消费成衣支出金额的估计的相

相关主题
文本预览
相关文档 最新文档