当前位置:文档之家› 统计学第六章抽样与参数估计

统计学第六章抽样与参数估计

统计学第六章抽样与参数估计

《统计学》第六章抽样与参数估计

1、某市劳动和社会保障局想调查下岗职工中女性所占的比重,随机抽取300个下岗职工,发现其中195个为女性职工。试以95.45%的概率保证程度,估计该市下岗职工中女性比重的区间范围。解:已知n=300,概率保证程度95.45%,Z 0.0455/2 =2

P=300195=65% 区间范围P n )1(2

p p -Z ±α=0.65300

)

65.01(65.02-±=0.65±0.055 该市下岗职工中女性比重的区间范围为59.5%~70.5之间

2、某灯管厂生产10万只日光灯管,现采用简单随机重复抽样方式抽取1‰灯管进行质量检验,测试结果如下表所示:

耐用时间(小时)

灯管数(只)

800以下 10 800-900 15 900-1000 35 1000-1100 25 1100以上 15 合计

100

根据上述资料:

(1)试计算抽样总体灯管的平均耐用时间

(2)在99.73%的概率保证程度下,估计10万只灯管平均耐用时间的区间范围。 (3)按质量规定,凡耐用时间不及800小时的灯管为不合格品,试计算抽样总体灯管的合格率,并按95%的概率保证程度下,估计10万只灯管的合格率区间范围。

(4)若上述条件不变,只是抽样极限误差可放宽到40小时,在99.73%的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验?

解:

耐用时间(小时)灯管数(只)f

组中值x xf f x x 2)(-

800以下 10 750 7500 484000 800-900 15 850 12750 216000 900-1000 35 950 33250 14000 1000-1100 25 1050 26250 160000 1100以上

15

1150

17250

486000

合计 100 - 97000 1360000

(1)平均耐热时间x =

∑∑f xf =

100

97000

=970(小时)(2)S

2

=

∑∑-f

f

x x 2

)( =

100

1360000

=13600 x σ=n s 2=100

13600=11.66 x ?=3×11.66=34.98 x x ?±=970±34.98

在99.73%的概率保证程度下,该灯管平均耐用时间在935.02~1004.98小时之间

(3)p=100

15

253515+++=0.9

p σ=

03.0100

)

9.01(9.0)

1(≡-≡-n p p

p ?=1.96×0.03=0.0588 p ±p ?=0.9±0.0588

在95%的概率保证程度下,该灯管的合格率在84.12%~95.88%之间(4)n=

x

2

222

Z s α=2

240

13600

3?=76.5≈77(只)

统计学习题(抽样分布、参数估计)

统计学习题(抽样分布、参数估计)

练习题 第1章绪论(略) 第2章统计数据的描述 2.1某家商场为了解前来该商场购物的顾客的学历分布情况,随机抽取了100名顾客。其学历表示为:1.初中;2.高中/中专; 3.大专; 4.本科及以上学历。调查结果如下: 4222434414 2244432422 3121441424 2332134344 3312424324 2322212244 2123333334 2343313232 4313434214 2242334121(1)制作一张频数分布表。 (2)绘制一张条形图,反映学历分布。

2.2在一项研究中,某调查公司为了解某品牌变速箱是否存在缺陷,从一家该汽车的维修公司获得该汽车变速箱失效前行驶的实际里程数的资料数据如下: 850 92393 23 64 34 2 74 27 6 744 25 37 83 2 77 53 9 326 09 89 64 1 612 54 594 65942 19 67 99 8 40 00 1 118 444 73 34 1 77 43 7 116 803 59 81 7 702 09 928 57101 769 25 06 6 79 29 4 138 114 64 09 63 43 6 957 74 77 09 8 645 44 121 352699 22 86 81 3 85 58 6 599 02 85 86 1 69 86 8 693 46 35 66 2 116 269 534 02 324 64 65 60 5 53 50 852 88 32 52 4 66 68 1 672 01 89 34 1 887 98(1)对以上数据进行适当的分组并编制频 数分布表和累积频数分布表。 (2)用直方图来表现数据的分布特征。

统计学 第 6 章 抽样与参数估计

第6章抽样与参数估计 第6章抽样与参数估计 6.1抽样与抽样分布 6.2参数估计的基本方法 6.3总体均值的区间估计 6.4总体比例的区间估计 6.5样本容量的确定 学习目标 理解抽样方法与抽样分布 估计量与估计值的概念 点估计与区间估计的区别 评价估计量优良性的标准 总体均值的区间估计方法 总体比例的区间估计方法 样本容量的确定方法 参数估计在统计方法中的地位 统计推断的过程 6.1抽样与抽样分布 什么是抽样推断 概率捕样方法 抽样分布 抽样方法 抽样方法 概率抽样 (probabilitysampling) 也称随机抽样 特点 按一定的概率以随机原则抽取样本 抽取样本时使每个单位都有一定的机会被抽中 每个单位被抽中的概率是已知的,或是可以计算出来的 当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率 简单随机抽样 (simplerandomsampling) 从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础 特点 简单、直观,在抽样框完整时,可直接从中抽取样本 用样本统计量对目标量进行估计比较方便 局限性 当N很大时,不易构造抽样框 抽出的单位很分散,给实施调查增加了困难

没有利用其它辅助信息以提高估计的效率 分层抽样 (stratifiedsampling) 将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点 保证样本的结构与总体的结构比较相近,从而提高估计的精度 组织实施调查方便 既可以对总体参数进行估计,也可以对各层的目标量进行估计 系统抽样 (systematicsainplmg) 将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位 先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度 缺点:对估计量方差的估计比较困难 整群抽样 (clustersampling) 将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查 特点 抽样时只需群的抽样框,可简化工作量 调查的地点相对集中,节省调查费用,方便调查的实施 缺点是估计的精度较差 抽样分布 总体中各元素的观察值所形成的分布 分布通常是未知的 可以假定它服从某种分布 总体分布 (populationdistribution) 一个样本中各观察值的分布 也称经验分布 当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布 样本分布 (sampledistribution) 抽样分布的概念 (samplingdistribution) 抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布. 统计量:样本均值, 样本比例, 样本方差等 样本统计量的概率分布

统计学第六章抽样与参数估计

统计学第六章抽样与参数估计 《统计学》第六章抽样与参数估计 1、某市劳动和社会保障局想调查下岗职工中女性所占的比重,随机抽取300个下岗职工,发现其中195个为女性职工。试以95.45%的概率保证程度,估计该市下岗职工中女性比重的区间范围。解:已知n=300,概率保证程度95.45%,Z 0.0455/2 =2 P=300195=65% 区间范围P n )1(2 p p -Z ±α=0.65300 ) 65.01(65.02-±=0.65±0.055 该市下岗职工中女性比重的区间范围为59.5%~70.5之间 2、某灯管厂生产10万只日光灯管,现采用简单随机重复抽样方式抽取1‰灯管进行质量检验,测试结果如下表所示: 耐用时间(小时) 灯管数(只) 800以下 10 800-900 15 900-1000 35 1000-1100 25 1100以上 15 合计 100 根据上述资料: (1)试计算抽样总体灯管的平均耐用时间 (2)在99.73%的概率保证程度下,估计10万只灯管平均耐用时间的区间范围。 (3)按质量规定,凡耐用时间不及800小时的灯管为不合格品,试计算抽样总体灯管的合格率,并按95%的概率保证程度下,估计10万只灯管的合格率区间范围。 (4)若上述条件不变,只是抽样极限误差可放宽到40小时,在99.73%的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验? 解: 耐用时间(小时)灯管数(只)f 组中值x xf f x x 2)(-

800以下 10 750 7500 484000 800-900 15 850 12750 216000 900-1000 35 950 33250 14000 1000-1100 25 1050 26250 160000 1100以上 15 1150 17250 486000 合计 100 - 97000 1360000 (1)平均耐热时间x = ∑∑f xf = 100 97000 =970(小时)(2)S 2 = ∑∑-f f x x 2 )( = 100 1360000 =13600 x σ=n s 2=100 13600=11.66 x ?=3×11.66=34.98 x x ?±=970±34.98 在99.73%的概率保证程度下,该灯管平均耐用时间在935.02~1004.98小时之间 (3)p=100 15 253515+++=0.9 p σ= 03.0100

统计学中的参数估计与置信区间

统计学中的参数估计与置信区间统计学是一门研究通过搜集、整理、分析数据以得出结论的学科。 在统计学中,参数估计和置信区间是两个重要的概念。本文将介绍参 数估计的概念、方法和步骤,并解释置信区间的作用和计算方法。 一、参数估计的概念及方法 参数估计是通过从样本数据中推断总体参数值的过程。总体参数是 描述整个总体分布的特征,例如平均值、方差或比例。由于总体参数 无法得知,所以需要通过样本数据进行估计。 常用的参数估计方法包括点估计和区间估计。点估计是通过一个单 一的数值来估计参数值,通常使用样本均值或样本比例作为总体均值 或总体比例的估计值。例如,通过从一个人群中随机选取样本并计算 其平均年龄,就可以估计该人群的平均年龄。 区间估计是通过在一个范围内给出参数的估计值,这个范围被称为 置信区间。置信区间提供了一个参数估计值的上下界,表示了参数估 计的不确定性程度。例如,我们可以计算出一个置信区间为(57岁, 63岁),意味着我们有95%的把握相信真实的年龄在这个区间范围内。 二、置信区间的计算方法 置信区间的计算通常涉及到总体分布的特征、样本容量和置信水平。置信水平指的是我们对参数估计的置信程度,通常表示为95%或99%。

对于总体均值的区间估计,常用的方法是使用t分布或正态分布。 当总体标准差未知时,样本容量较小(通常小于30)或样本分布不服 从正态分布时,使用t分布。而当总体标准差已知,且样本容量较大时,使用正态分布。 置信区间的计算步骤如下: 1. 根据样本数据计算样本平均值(x)或样本比例(p)。 2. 根据总体分布特征和样本容量,选择合适的分布(t分布或正态 分布)。 3. 根据置信水平选择相应的分布的临界值(例如,使用z值或t 值)。 4. 根据公式计算置信区间的上下界,公式为估计值(点估计) ±临 界值 ×标准误差。 标准误差表示了样本估计值和总体参数真值之间的差异。它是由样 本容量和总体分布的特征决定的。 三、参数估计与置信区间的应用 参数估计和置信区间在实际应用中具有广泛的应用。在医学研究中,我们可以使用参数估计和置信区间来估计某种药物的治疗效果。在市 场调研中,我们可以使用参数估计和置信区间来估计产品的受欢迎程度。在政府决策中,我们可以使用参数估计和置信区间来估计某项政 策的效果。

统计学第三版笔记

统计学第三版笔记 统计学复习重点 第一章导论 统计是静止的历史,历史是流动的统计。 1、掌握统计的含义:统计工作、统计数据、统计学。 政治算数阶段的代表人物是威廉·佩蒂和约翰·格朗特 2、了解统计学的研究对象:客观事物的总体数量特征和数量关系。 3、掌握统计研究的基本方法:大量观察法、统计分组法、综合分析法、统计模型法、归纳推断法 4、了解统计研究的基本程序:统计目的→统计设计→统计调查→统计整理→统计分析→统计服务 5、了解统计具有的职能:信息职能、监督职能、咨询职能、辅助决策职能 6、重点掌握统计学的基本范畴: ①统计总体和总体单位②标志和标志表现③统计指标和指标体系(*统计指标六要素;指标名称、计量单位、计算方法、时间限制、空间限制、指标数值)④变异、变量与变量值。统计学上把总体各单位由于随机因素引起的某一标志表现的差异称为变异。变量按其值是否连续可以分为连续变量和离散变量 7、问答:说明指标和标志的区别与联系。 答:区别:指标是说明总体特征的,标志是说明总体单位特征的。指标具有可量性,无论是质量指标还是数量指标,都能用数字表示。而标志则不一定,数量标志具有可量性,而品质标志不具有可量性。 联系:①指标值往往由数量标志值汇总而来,没有总体单位的标志值就不会总体的指标值。②在一定条件下,数量标志和指标存在着互换关系。 8.、质量指标分为相对指标和平均指标,通常是由两个总量指标对比派生出来的。统计指标分为相对指标,平均指标和总量指标(数量指标)。

9. 第二章统计设计 1、掌握正交试验设计的方法。 2、 第三章统计数据的搜集 1、掌握数据的计量与分类。计量尺度由低级向高级、由粗略到经济分为定类尺度、定序尺度、定距尺度、定比尺度;分类:定性数据和定量数据,原始资料和次级资料。 2、了解统计调查的意义与形式。种类①调查单位是否完全:全面调查和非全面调查②登记时间是否连续:经常性调查和一次性调查(间隔时间相当长)③组织方式不同:统计报表和专门调查。 3、重点掌握数据搜集的方法。询问调查法(面谈调查法、邮寄调查法、电话调查法、留置问卷调查法);直接观察法;报告法;实验调查法;卫星遥感法。 4、掌握调查方案设计。明确调查对象,调查单位;填报单位与调查单位之间的区别。 5、了解统计调查的组织方式。统计报表和专门调查(普查、重点调查、典型调查、抽样调 查)。 6、掌握统计数据的质量要求。准确、及时、全面和经济。统计数据误差分为登记性误差和代表性误差。 7、问答:为什么普查与全面调查不能互相替代? 8、问答:怎样理解各种调查方式的综合运用? 答:搜集、整理统计资料,应当以周期性普查为基础,以经常性抽样调查为主体,综合运用全面调查,重点调查等方法,并充分利用行政记录等资料。 第四章统计数据的整理与显示 1、掌握数据整理的程序。设计和编制统计数据的整理方案对调查获得数据进行审核,准确性审核包括逻辑检查和计算检查按照一定的组织方式和方法对调查所获得的数据进行分组、编码、汇总和计算④

统计学中的参数估计与置信区间

统计学中的参数估计与置信区间统计学是关于收集、分析和解释数据的学科,其中包括了参数估计和置信区间的概念。参数估计用于通过从样本中进行推断来估计总体参数的值,而置信区间则是对这个估计结果进行测量误差范围的一种方法。 一、参数估计 参数估计是统计学中重要的概念,其目的是通过样本数据来估计总体参数的值。总体参数是指总体分布的特征,例如均值、方差、比例等。在实际研究中,很难直接获得总体数据,因此我们通常采用抽样方法,从总体中选取样本进行分析。 参数估计有两种方法:点估计和区间估计。点估计是通过样本数据计算出一个单独的数值来估计总体参数的值,例如计算样本均值作为总体均值的估计值。点估计简单直观,但无法确定其准确性。因此,统计学家提出了置信区间的概念。 二、置信区间 置信区间是一种用于衡量参数估计的不确定性的方法。它提供了一个范围,其中包含了对总体参数值的估计。置信区间由一个下限和一个上限组成,表示参数估计的可信程度。通常,置信区间的置信水平设定为95%或90%。

置信区间的计算通常基于样本数据的分布特性和统计推断方法。对于大样本,根据中心极限定理,可以使用正态分布来计算置信区间;对于小样本,根据t分布进行计算。 三、计算步骤 下面以计算样本均值的置信区间为例来介绍计算步骤。 1. 收集样本数据,并计算样本均值。 2. 确定置信水平,例如95%。 3. 根据样本数据的特点,选择相应的分布进行计算。若样本数据服从正态分布,可以使用正态分布进行计算;若样本数据不服从正态分布,可以使用t分布进行计算。 4. 根据所选分布的特点和样本大小,计算置信区间的下限和上限。 5. 解释置信区间的含义,例如可以说“置信区间为(下限,上限)表示我们有95%的信心相信总体均值在这个范围内”。 四、置信区间的应用 置信区间的应用非常广泛,对于研究者和决策者来说都非常重要。 首先,置信区间可以用于总体参数估计。通过置信区间,我们可以得到一个关于总体参数值的范围,而不只是一个点估计。这样可以提供更多的信息,使决策更加准确。

6抽样分布与统计推断原理

6抽样分布与统计推断原理 抽样分布是统计学中非常重要的概念,它在统计推断中起着核心的作用。在统计推断中,我们通常无法对整个总体进行研究,而是通过抽取样 本的方法,来推断总体的一些特征。抽样分布就是用来描述样本统计量的 分布情况,这些统计量包括样本均值、样本方差等。 在统计推断中,我们常常使用抽样分布来估计总体参数,并进行假设 检验。那么什么是抽样分布呢?抽样分布是指当我们重复抽取多次样本, 并计算每个样本的统计量时,这些统计量所组成的分布。例如,当我们抽 取多次样本,并计算每个样本的均值时,这些样本均值所组成的分布就是 抽样分布。 下面我们来介绍几个常见的抽样分布: 1.正态分布:当我们从一个正态分布总体中抽取多次样本,并计算每 个样本的均值时,这些样本均值的分布将近似服从正态分布。这就是著名 的中心极限定理。中心极限定理告诉我们,无论总体的分布形态如何,只 要样本数量足够大,样本均值的分布将接近正态分布。 2.t分布:当我们从一个正态分布总体中抽取多次样本,并计算每个 样本的均值时,当总体标准差未知时,这些样本均值的分布将服从t分布。t分布相比于正态分布,其概率密度曲线更加扁平,这意味着t分布比正 态分布更容易出现较大或较小的极端值。 3.卡方分布:当我们从一个正态分布总体中抽取多次样本,并计算每 个样本的方差时,这些样本方差的分布将服从卡方分布。卡方分布是一个 非对称的分布,其概率密度曲线右侧较长且上膨胀,左侧较短且下凹。

通过抽样分布,我们可以进行统计推断,即利用样本的统计量来推断 总体参数的取值。常见的统计推断方法包括点估计和区间估计。 点估计是利用样本统计量来估计总体参数的值。例如,我们可以利用 样本均值来估计总体均值。可以使用不同的点估计方法,如最大似然估计、矩估计等。 区间估计是用一个区间来估计总体参数的值。例如,我们可以利用样 本均值来构建总体均值的置信区间。置信区间是一个包含真实参数值的区间,它给出了我们对总体参数的估计范围,并附带一个置信水平。 在进行统计推断时,我们还需要利用原理进行假设检验。假设检验是 判断总体参数是否符合一些特定假设的方法。通常我们会提出一个原假设 和一个备择假设,并基于样本数据来做出判断。在假设检验中,我们使用 抽样分布的性质来计算假设检验的p值,用来衡量观察到的差异在假设成 立时出现的概率。 总之,抽样分布与统计推断原理是统计学中非常重要的内容。通过抽 样分布,我们可以对总体参数进行估计,并进行假设检验,从而对总体特 征进行推断。这为我们在实际问题中进行数据分析提供了基础和指导。

抽样与参数估计统计学实验报告

抽样与参数估计统计学实验报告 抽样与参数估计统计学实验报告 概述 本实验以抽样与参数估计统计学为主题,研究了参数估计、抽样方法、统计识别等内容。 实验目的 1. 熟悉参数估计和统计分析的基本原理和方法; 2. 掌握抽样的基本原理,熟悉抽样方法的运用; 3. 掌握统计模型识别的方法,进行统计分析和决策; 实验介绍 1. 参数估计:参数估计是统计分析过程中重要的一步,它是识别某个 实际系统的一个重要参数,以此据估计出实际系统的精确参数,估计 准确的参数是统计模型的建立的前提。 2. 抽样方法:抽样方法就是从一个总体中取样,所取样的水平表现出 一定的代表性,从而能推算出总体的概况,抽样方法有分层抽样、系 统抽样、整群抽样等多种。 3. 统计模型识别:是用统计技术进行模型识别,它是利用概率模型来 分析数据,建立有效的模型,从而进行有效的分析。 数据分析

1. 针对参数估计,我们使用假设检验,通过比较估计值和真实值,进 行检验,从而得出参数的准确度。 2. 针对抽样方法,我们使用分层抽样,将总体划分成不同的层,可以 更好地表征总体,进行有效抽样。 3. 针对统计模型识别,我们使用多种模型进行比较,根据其检验概率 和显著性水平,选择出最有效的模型进行识别。 结论 1. 通过假设检验,得出了参数估计的准确度; 2. 通过分层抽样得出了较好的抽样结果; 3. 通过多种模型进行比较,选择出最有效的模型进行识别。 建议 在下次实验中,为了提高参数估计的精度,应该进行更加精细的假设 检验;为了增加抽样的可靠性,应该采用更为严谨的抽样方法;此外,要多尝试不同的统计模型,以期得到更好的结果。

统计学习题答案参数估计

第5章 参数估计 ●1。 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0。7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 。96×0。7906=1。5496。 ●2。某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000. (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1。96, 这时总体均值的置信区间为 α/2 σ x Z 0±4。2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124。2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6。 2 5.8 2. 3 4。1 5. 4 4。5 3。2 4.4 2.0 5.4 2.6 6。 4 1。8 3。 5 5。7 2.3 2。1 1。9 1。2 5.1 4.3 4。2 3.6 0。8 1.5 4.7 1。 4 1.2 2。9 3。 5 2。4 0.5 3.6 2。5

初级统计学第六章 估计与样本容量

第6章估计与样本容量 6.1 概述 这一章我们介绍估计下列总体参数数值的方法:总体均值、比例和方差。我们还讲述确定这些参数估计所需要的样本容量方法。6.2 估计总体均值:大样本 这一节的主要目标:已知一个集合中样本数据多于30个,讨论总体均值μ的估计值。 假设 1.n>30(样本中的数据超过30个)。 2.样本是一个简单随机样本(相同容量的所有样本被选出的可能性相同)。 不仔细收集的数据绝对是毫无价值的,即使样本很大。 这一节中的方法假设,那些样本之间的差异是由于可能的随机波动造成的,而不是因为一些不合理的抽样方法。 定义 估计量(estimator)是指使用样本数据来估计总体参数的公式或过程。 估计值(estimate)是指用来近似总体参数的特定数值或数值的范围。 点估计值(point estimate)是用来近似总体参数的一个数值(或点)。 样本均值x是总体均值μ的最优点估计值。

虽然我们可以使用其他统计量,例如样本中位数、中列数或众数作为总体均值μ的估计值,但研究显示,样本均值x通常会特供最优的估计值,原因有两点。 第一,对于很多总体来说,样本均值x的分布比其他样本统计量的分布有更好的一致性。第二,对于所有的总体,样本均值x是总体均值μ的一个无偏估计量,这意味着样本均值分布的中心趋近于总体均值μ的中心。 我们为什么需要置信区间? 置信区间或区间估计是由一个数值范围(或一个区间)构成的,而不是仅由一个点构成的。 定义 置信区间(或区间估计)是指用来估计总体参数真实值的一个数据范围(或一个区间)。 一个置信区间和一个置信度相联系,例如0.95(或95%)。置信度会告诉我们,有百分之多少的时间,置信区间真的包含了总体参数,这里假设这个估计过程可以重复很多次。在置信度的定义中,用α(希腊字母阿尔法的小写)表示一个概率或面积。α的值是置信度的补。当置信度为0.95(95%)时,α=0.05。当置信度为0.99(99%)时,α=0.01。 定义 置信度是指概率1-α(通常表示为等价的百分数),它是置信区间实际包含总体参数的时间的相对频数,这里假设估计过程可以重复很多次。(置信度还称作置信水平,或置信系数。)

社会统计学课后题答案(卢淑华)

《社会统计学》课程练习题〔1〕答案 一、略 二、〔1〕对立事件 〔2〕互不相容事件 〔3〕互不相容事件 〔1〕对立事件 三、 ) (28.516200182525 400)(52520040 25 504000元元=⨯++==⨯-+ =M M d )(91.29040091.690)(91.69020022 65 75600)(00.4002001510 252001331元元元=-=-==⨯-+==⨯-+ =Q Q Q Q Q ) (66.2255092450924100 50924001001005260032760000)(2 2 22 元====- = - = ∑∑σσN N b n b n i i i i 四、〔1〕极差R=1529-65=1464〔百元〕 〔2〕将数据从小到大排序:65 92 106 118 122 135 148 174 185 1529 ) 74.25(102.5-176.75Q )(75.17625.0)174185(174Q )(5.10275.0)92106(92Q 25 .84 ) 110(375.24 1 103131百元四分互差百元百元的位置的位置===⨯-+==⨯-+==+⨯==+= Q Q 〔3〕 )(92.42164.17801710 1026742495204)(2 2 2百元==- = - = ∑∑N N x x i i σ

32.010032 )(15 .08012 )/(4 .08032 )/(4 .010040 )(12 .010012 )(6 .02012 )/(15 .08012 )/(2 .010020 )(8.010080 )(================== AC P B A P A C P C P AB P B A P A B P B P A P 六、 633.010 1157154)()()()(375 .0415 101)()()/(214 .0715 101)()()/(10 1 )(157 )(154)(=-+=-+=+=⨯===⨯=== = = AB P B P A P B A P A P AB P A B P B P AB P B A P AB P B P A P 七、 〔1〕10口井皆产油的概率为:0000059.07.03.0)10(01010 10 ===C P ξ (2) 10口井皆不产油的概率为:02825.07.03.0)0(1000 10 ===C P ξ 〔3〕该公司赢利的时机为:85069.07.03.07.03.01)2(91110100010 =--=≥C C P ξ

抽样分布参数估计和假设检验

抽样分布参数估计和假设检验 一、抽样分布的理论及定理(一)抽样分布 抽样分布是统计推断的基础,它是指从总体中随机抽取容量为n的若干个样本,对每一样本可计算其k统计量,而k个统计量构成的分布即为抽样分布,也称统计量分布或随机变量函数分布。(二)中心极限定理中心极限定理是用极限的方法所求的随机变量分布的一系列定理,其内容主要反映在三个方面。 1.如果总体呈正态分布,则从总体中抽取容量为n的一切可能样本时,其样本均数的分布也呈正态分布;无论总体是否服从正态分布,只要样本容量足够大,样本均数的分布也接近正态分布。均数()即2.从总体中抽取容量为n的一切可能样本时,所有样本均数的均数(某)等于总体 某 3.从总体中抽取容量为n的一切可能样本时,所有样本均数的标准差(某)等于总体标准差除以样本容量的算数平方根,即 某n 中心极限定理在统计学中是相当重要的。因为许多问题都使用正态曲线的方法。这个定理适于无限总体的抽样,同样也适于有限总体的抽样。中心极限定理不仅给出了样本均数抽样分布的正态性依据,使得大多数数据分布都能运用正态分布的理论进行分析,而且还给出了推断统计中两个重要参数(即样本均数某与样本标准差某)的计算方法。 (三)抽样分布中的几个重要概念

1.随机样本。统计学是以概率论为其理论和方法的科学,概率又是 研究随机现象的,因此进行统计推断所使用的样本必须为随机样本(randomample)。所谓随机样本是指按照概率的规律抽取的样本,2.抽样误差。从总体中抽取容量为n的k个样本时,样本统计量与 总体参数之间总会存在一定的差距,而这种差距是由于抽样的随机性所引 起的样本统计量与总体参数之间的不同,称为抽样误差。 3.标准误。样本统计量分布的标准差或某统计量在抽样分布上的标 准差,符号SE或某表示。根据中心极限定理其标准差为 某n ★(問答爲什麽說標準誤是進行統計推斷可靠性高低的標準) 正如标准差越小,数据分布越集中,平均数的代表性越好。同理,在 推断统计中,标准误越小,说明样本统计量与总体参数的之间越接近,即 样本对总体的代表性越好,这时用样本统计量去推断总体就越可靠、越准确;相反,标准误越大,说明样本统计量与总体参数之间的差距越大,即 样本对总体的代表性越差,这时用样本统计量去推断总体就越不可靠、越 不准确。所以说标准误是进行统计推断可靠性高低的指标。 4.自由度。一群数据或观测值可以独立自由变动的数目称为自由度,用符号df或n表示。 在 某某N中,dfN。在计算方差或标准差时,因受某某0的限制, dfN1,即有方差 二、常用抽样分布

第六章 参数值的估计

第六章 参数值的估计 第一节 参数估计的一般问题 一、估计量与估计值 参数估计就是用样本统计量去估计总体参数,如用X 估计μ,用S2估计2 σ,用p 估计π等。总体参数可以笼统地用一个符号θ表示。参数估计中,用来估计 总体参数的统计量的名称,称为估计量,用θ 表示,如样本均值、样本比例等就是估计量。用来估计总体参数时计算出来的估计量的具体数值,叫做估计值。 二、点估计与区间估计——参数估计的两种方法 1、点估计 用样本估计量θ 的值直接作为总体参数θ的估计量值。 2、区间估计 它是在点估计基础上,给出总体参数估计的一个区间,由此可以衡量点估计值可靠性的度量。这个区间通常是由样本统计量加减抽样误差而得到。以样本均值的区间估计来说明区间估计原理: 根据样本均值的抽样分布可知,重复抽样或无限总体抽样情况下,样本均值 ,由此可知,样本均值落在总体均值两侧各为一个标准误差范围内的概率为0.6827,两个标准误差范围0.9545,三个标准误差范围0.9973,并可计算出样本均值落在μ的两侧任何一个标准误差范围内的概率(根据已知的μ,σ计算)。但实际估计时,μ是未知的,因而不再是估计样本均值落在某一范围内的概率,而只能根据已设定的概率计算这个范围的大小。例如:约有95%的样本均值会落在距μ的两个标准误差范围内,即约有95%的样本均值所构造的两个标准误差的区间会包括μ。 在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间,区间的最小值为置信下限,最大值为置信上限。例如,抽取了1000个样本,根据每个样本构造一个置信区间,其中有95%的区间包含了真实的总体参数,而5%的没有包括,则称95%为置信水平/置信系数。构造置信区间时,可以用所希望的值作为置信水平,常用的置信水平是90%,95%,99%,见下表:

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95% (t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下:

试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差 (2)以95.45%的概率保证程度对该批产品合格品率和合格品数量进行区间估计。 (3)如果极限误差为2.31%,则其概率保证程度是多少? 7、某单位按重复抽样方式随机抽取40名职工,对其业务考试成绩进行检查,资料如下: 68 89 88 84 86 87 75 73 72 68

生物统计学答案 第六章 参数估计

第六章参数估计 6.1以每天每千克体重52 μmol 5-羟色胺处理家兔14天后,对血液中血清素含量的影响如下表[9]: y/(μg · L-1)s/(μg · L-1)n 对照组 4.20 0.35 12 5-羟色胺处理组8.49 0.37 9 建立对照组和5-羟色胺处理组平均数差的0.95置信限。 答:程序如下: options nodate; data common; alpha=0.05; input n1 m1 s1 n2 m2 s2; dfa=n1-1; dfb=n2-1; vara=s1**2; varb=s2**2; if vara>varb then F=vara/varb; else F=varb/vara; if vara>varb then Futailp=1-probf(F,dfa,dfb); else Futailp=1-probf(F,dfb,dfa); df=n1+n2-2; t=tinv(1-alpha/2,df); d=abs(m1-m2); lcldmseq=d-t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2)); ucldmseq=d+t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2)); k=vara/n1/(vara/n1+varb/n2); df0=1/(k**2/dfa+(1-K)**2/dfb); t0=tinv(1-alpha/2,df0); lcldmsun=d-t0*sqrt(vara/n1+varb/n2); ucldmsun=d+t0*sqrt(vara/n1+varb/n2); cards; 12 4.20 0.35 9 8.49 0.37 ; proc print; id f; var Futailp alpha lcldmseq ucldmseq lcldmsun ucldmsun; title1 'Confidence Limits on the Difference of Means'; title2 'for Non-Primal Data'; run; 结果见下表: Confidence Limits on the Difference of Means for Non-Primal Data F FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN 1.11755 0.42066 0.05 3.95907 4.62093 3.95336 4.62664 首先,方差是具齐性的。在方差具齐性的情况下,平均数差的0.95置信下限为3.959 07,置信上限为4.620 93。0.95置信区间为3.959 07 ~ 4.620 93。 6.2不同年龄的雄岩羊角角基端距如下表[27]: 年龄/a y/cm s/cm n

统计学第六章参数估计和假设检验习题

统计学第六章参数估计和假设检验习题 第六章参数估计和假设检验 一、填空题 1、总体参数估计是指 2、 称为置信水平,表示为 3、落在总体均值两个抽样标准差范围内的概率为 4、影响样本的单位数目的因素有 5、是研究者想收集证据予以反对的假设。 答案:1、就是以样本统计量来估计总体参数,总体参数是常数,而统计量是随机变量。 2、将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,(1 - 3、0.9545 4、总体变量的变异程度σ、允许的误差范围△、抽样的可靠程度1-α 5、纯随机抽样、等距抽样(机械抽样)、类型抽样(分层抽样)和整群抽样 二、单项选择题 1、估计量的含义是指(A) A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2、一个95%的置信区间是指( C ) A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D.在用同样方法构造的总体参数的多个区间中,有

95%的区间不包含该总体参数 3、抽取一个容量为100的随机样本,其均值为x =81,标准着s=12。总体均值μ的99%的置信区间为( C ) 81±1.97 81±2.35 81±3.10 81±3.52 4.成数与成数方差的关系是(C ) A.成数的数值越接近0,成数的方差越大 B.成数的数值越接近0.3,成数的方差越大 C.成数的数值越接近0.5,成数的方差越大 D.成数的数值越接近l ,成数的方差越大 5.纯随机重复抽样的条件下,若其他条件不变,要使抽样平均误差缩小为原来的1/3,则样本单位数必须( B ) A.增大到原来的3倍B.增大到原来的9倍 C.增大到原来的6倍D.也是原来的1/3 6、对于非正态总体,使用统计量 x z =估计总体均值的条件是(D ) A .小样本 B .总体方差已知 C .总体方差未知 D .大样本 7、在假设检验中,原假设和备选假设( C ) A. 都有可能成立 B. 都有可能不成立 C. 只有一个成立而且必有一个成立 D. 原假设一定成立,备选假设不一定成立 8.一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( A ) A .0:5H μ=,1:5H μ≠

统计学 抽样估计习题

第六章抽样估计题 一、单项选择题 1、抽样推断的基本内容是: A.参数估计 B.假设检验 C.参数估计和假设检验两方面 D.数据的收集 2、抽样平均误差的实质是 A. 总体标准差 B. 抽样总体的标准差 C. 抽样总体方差 D. 样本平均数(成数〉的标准差 3、不重复抽样平均误差: A. 总是大于重复抽样平均误差 B. 总是小于重复抽样平均误差 C. 总是等于重复抽样平均误差 D. 上情况都可能发生 4、在其它条件不变的情况下,抽样单位数增加一半,抽样平差 A. 缩小为原来的81.6% B. 缩小为原来的50% C. 缩小为原来的25% D.扩大为原来的四倍 5、样本的形成是: A.随机的 B.随意的 C. 非随机的 D.确定的 6、抽样误差之所以产生是由于: A. 破坏了随机抽样的原则。 B. 抽样总体的结构不足以代表总体的结构。 C. 破坏了抽样的系统。 D.调查人员的素质。 7、抽样误差指的是: A. 代表性随机误差 B. 非抽样误差 C. 代表性误差 D. 随机性误差 8、抽样误差大小 A. 可以事先计算,但不能控制 B. 不可事先计算,但能控制 C. 能够控制和消灭 D.能够控制,但不能消灭 9、随机抽出100个工人,占全体工人1%,工龄不到一年的比重为10%。在概率为0.9545时,计算工龄不到一年的工人比重的极限抽样误差。 A.0.6% B. 6% C. 0.9% D. 3% 10、根据抽样调查25个工厂(抽取2%)资料,采购阶段流动资金平均周转时间为52天,方差100,在概率为0.954时,计算流动资金平均周转时间的极限抽样误差。 A.0.8 B.3.96 C.4 D.226 11、根据某城市抽样调查225户,计算出户均储蓄额30000元,抽样平均误差800元,试问概率为90%,户均储蓄余额极限误差是多少? A.53.3 B.1.65 C.720 D.1320 12、根据某市公共电话网100次通话情形抽样调查,知道每次通话平均持续时间为4分钟,均方差为2分钟。在概率为0.9545时,计算每次通话平均持续时间的极限抽样误差。 A.0.2 B.0.4 C.0.28 D.0.1428 13、为研究劳动生产率,某工厂对19%工人进行调查,抽样324人。这些工人加工某零件平均时间消耗35分钟,均方差为7.2分钟,试以0.9545置信度估计平均时间消耗的极限抽样误差。 A.0.8 B.0.36 C.0.076 D.0.72 14、为研究工人生产定额完成情况,对某工厂抽样调查36%的计件工人。抽样的144人中,有80%的工人超额完成生产定额。试计算概率为0.9973时超额完成生产定额工人比重的极限抽样误差。 A.10% B.8% C.12% D.3.2% 15、为估计某地区10000名适龄儿童的入学率,用不重复抽样从该:地区抽取400名儿童,有320

统计学课后习题答案第六章抽样调查

第六章抽样调查 一、单项选择题 1.抽样调查所必须遵循的原则是 A.灵活性原则 B.可靠性原则 C.随机性原则 D.准确性原则 2.抽样调查的目的的在于 A.对调查单位作深入研究 B.用样本指标推断总体指标 C.计算和控制抽样误差 D.了解抽样总体全面情况 3.抽样调查与其他非全面调查的主要区别在于 A.选取调查单位的方式不同 B.调查的目的不同 C.调查的对象不同 D.调查的误差不同 4.抽样调查中 A.只有登记性误差,没有代表性误差 B.只有代表性误差,没有登记性误差 C.既有登记性误差,也有代表性误差 D.既无登记性误差,也无代表性误差 5.抽样调查是建立在下列哪一理论的基础上? A.数学理论 B.统计理论 C.概率论大数定律 D.经济理论 6.抽样误差是指 A.计算过程中所产生的误差 B.随机性的代表性误差 C.调查中产生的登记性误差 D.调查中所产生的系统性误差 7.重复抽样误差与不重复抽样误差相比 A.前者大于后者 B.后者大于前者 C.两者相等 D.两者无关 8.抽样平均误差反映了样本指标与总体指标之间的 A.实际误差 B.实际误差的绝对值 C.平均误差程度 D.可能误差范围 9.抽样平均误差是指抽样平均数(成数)的 A.平均数 B.平均差 C.标准差 D.标准差系数 1.反映样本指标与总体指标之间的抽样误差的可能范围的 指标是 A.抽样误差 B.抽样平均误差 C.概率保证程度 D.抽样极限误差 11.抽样极限误差和抽样估计的可靠程度(概率保证程度)之间的关系是 A.抽样极限误差越大,概率保证程度越大 B.抽样极限误差越小,概率保证程度越大 C.抽样极限误差越大,概率保证程度越小 D.抽样极限误差不变,概率保证程度越小 12.当抽样误差范围扩大时,抽样估计的可靠性将 A.保持不变 B.随之缩小 C.随之扩大 D.无法确定

相关主题
文本预览
相关文档 最新文档