当前位置:文档之家› 第六章 从本统计量估计整体参数

第六章 从本统计量估计整体参数

第六章 从本统计量估计整体参数
第六章 从本统计量估计整体参数

第六章从样本统计量估计整体参数

学习要点

第一节点估计

第二节区间估计

第三节总体均数的估计

第四节其他总体参数的估计

本章小结

学习要点

掌握推断统计的内容和前提条件

理解统计估计的原理,掌握统计估计的方法

能够运用总体均数估计的方法解决实际问题

第一节点估计

当总休平均数或比例未知时,我们可以直接把样本平均数或比例用作它的估计值。由于样本统计量为数轴上的一个点,所以称为“点估计值” 。

科学研究不仅需要对事物特征作出一般性的描述,而且更要根据样本提供的信息去推测相应总体的情况,统计内容中的推断统计则是专门研究如何用样本去推断总体的方法。

一、什么是推断统计

一般情况下,样本统计量是不会和相应的总体参数完全相同的,两者多少都会有一定的差距,但是如果用无限多个样本的统计量来估计总体参数,平均估计误差将会等于0。

具有这一特征的统计量就无偏估计值。

例如,用样本平均数估计总体平均数时,总会有些误差,在有些样本中,它可能会大于总体平均数,而在另一些样本中它又可能会小于总体平均数,而且对于不同的样本估计误差的大小也是不同的,但是无限多个样本平均数的平均估计误差为0。换句话说,样本平均数的平均数将会等于总体平均数。

推断统计就是指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体,

由已知推未知的过程。

推断统计根据推测的性质不同而分为参数估计和假设检验两方面。参数估计(parameter estimation)就是用样本去估计相应总体的状况,其具体方法有点估计和区间估计。假设检验(hypothesis test)的主要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验,又称统计检验(statistical test)。在检验中又根据是否需要依赖于对总体分布形态和总体参数检验的假设而分为参数检验和非参数检验。参数检验法在检验时对总体分布和总体参数

(μ,2

σ)有所要求,而非参数检验法在检验时则不依赖于总体的分布形态和总体参数的

情况。参数检验法主要有Z检验、t检验、F检验和q检验等,非参数检验(non-parameter test)主要有χ2检验、符号检验法、符号等级检验法、秩和检验、中位数检验等。

二、统计推断的基本问题

没有系统学过统计学的人往往有一种误解,以为只要搜集了数据资料,就可以用统计方法来处理数据。殊不知统计学是建立在概率论基础上的,而概率论是专门研究随机事件的。因此,在做统计推断之前必须考虑你所获得的资料是否能够用统计的方法来分析。通常,进行统计推断时应首先考虑以下三个方面的问题。

一是关于统计推断的基本前提。统计推断的前提是随机抽样。因此当我们利用样本统计量进行总体推断时,首先要了解抽样的方式,即了解样本是如何得来的,是随机抽取的,还是人为抽取的。随机抽样的均等性和独立性,避免了入样个体只来自总体的某一部分,从而也就避免了样本的偏倚性。可以说,样本的抽取直接关系着统计研究结果的科学性。

二是样本的规模与样本的代表性。抽样研究需要有一定的样本规模,而样本要具有代表性也需要有一定的样本规模来保证,以减少抽样误差。一般来说,在其它条件相同的情况下,样本越小,抽样的误差越大;样本越大,抽样的误差就越小。当样本增至包括总体的全部个体(即N

n=)时,抽样的误差为0。因此,只要条件允许,尽可能地采用大样本,以增强样本对总体的代表性和可靠性。值得注意的样本规模和样本代表性是建立在随机抽样基础之上的,否则即使样本再大也是无意义的。

三是统计推断的错误要有一定限度。统计推断是在特定的时间、空间和条件下得出的结论,加上抽样误差的影响,在用样本推测总体时总会犯一定的错误。这种错误在统计推断中是不可避免的,也是允许的。不过这种错误要有一定的限度,超过一定限度的错误是不允许的。统计推断中允许犯错误的限度是用小概率事件来表示。

第二节区间估计

一、参数估计的定义

所谓参数估计就是根据样本统计量去估计相应总体的参数。譬如我们可以根据样本均数(X)去估计总体的均数(μ),根据样本方差(2S)去估计总体方差(2

σ),根据样本的相关系数(r)去估计总体相关系数(ρ)等等。

二、参数估计的方法

参数估计有点估计和区间估计两种。譬如,某学区期末时抽取所管辖的小学四年级的数学测验成绩,求得平均分70分,标准差10分,于是一个管理者认为全区四年级的数学平均分可能是70分,而另一个管理者则认为全区四年级数学平均分可能性在65~75之间。因前者是用数轴上的一点做估计,称为点估计。后者是用数轴上的一段距离做估计,称区间估计。

(一)点估计

点估计(point estimation )是在参数估计中直接以样本的统计量(数轴上的一个点)作为总体参数的估计值。譬如用样本统计量:X ,S 、r 等作为总体参数μ、σ、ρ等的估计值。但是作为良好点估计的统计量必须具备一定的前提条件。

1.无偏性

用统计量估计总体参数必然会存在一定的误差,而恰好相等的情形是极少见的。当然,无偏性并不是说没有一点误差,而是要求用各个样本的统计量作为估计值时,其偏差为0,即

()0=-∑μX

这时的统计量被称为无偏估计量(unbiased estimator )。譬如,根据中心极限定理二有

μμ=X ,即样本均数的均数是总体均数的无偏估计量,亦即我们可以用样本均数的均数作

为总体均数的点估计值。假设我们从某市四个区的六岁男童中随机抽取四个样本,对每个样本测量其身高的平均数,再求得四个样本均数的均数为110.70公分,并此值作为该市所有六岁男孩的平均身高就是一个点估计。如果,

()∑-μX 大于0或小于0,那么这时的统计

量就为有偏估计量。作为总体参数的良好估计值是应当具备无偏性的。

当样本容量足够大的时候,用样本均数或样本标准差作为总体相应参数的估计量都可视为无偏估计量。正因为如此,在大样本统计分析中,常用样本标准差(

1-n S )去代替总体标

准差(σ)。当总体分布呈正态时,中数也是总体均数μ的无偏估计量。然而由于抽样误差的普遍存在,我们不能期待一次抽样就能对总体参数作出精确的估计。加之点估计不能给出估计误差及其可靠性有关信息,因此采用点估计时应特别注意样本统计量所具有的特性。

2.一致性

总体参数的估计量随样本容量的无限增大,应当能越来越接近它所估计的总体参数。例如正态总体的总体均数为μ,标准差为σ,如果X 是从总体中随机抽取样本获得的平均数,其容量为n ,则当N →∞时,X →μ;

1-n S →σ。

这时样本统计量的均数X 就是总体参数μ

的一个估计值,或者说X 与μ是一致的。

3.有效性

当总体参数的无偏估计量不止一个统计量时,则要分析无偏估计量的变异大小的情况。无偏估计量变异性小的,有效性较高;无偏估计量变异性大的,则有效性较低。例如作为总体均数μ的估计值来说,样本均数X 、中数Mdn 和众数Mo 等都是无偏估计量。这时选谁

作为估计值最恰当则要看谁的变异性最小。在X ,Mdn 和Mo 中只有X 的变异性最小,即X 的方差最小。所以用统计量——样本均数作为总体参数μ的估计值是最佳选择。这也同时说明为什么在统计推断中不常使用中数和众数。

4.充分性

充分性是指一个容量为n 的样本统计量是否充分地反映了全部n 个数所反映的总体信息。从X ,Mdn 和Mo 的比较中我们已知,只有在求均数X 时n 个数据全部参与计算,它充分地反映所有数据所要反映的总体信息,而在计算Mdn 和Mo 时只有部分数据参与计算,是用部分数据反映的总体信息。因此平均数的充分性最高,中数和众数的充分性较低。同理,在差异量数中方差2

S 和标准差S 要比平均差AD 、四分位差Q 更具有充分性。

一个好的点估计应当具备以上四个条件。但是无论如何,抽样误差总是存在,加上点估计不能提供正确估计的概率,所以应用时受到局限。例如,我们只能大体上知道样本容量比较大时,多数的X 靠近μ,但是样本容量究竟大到什么程度,“多数”、“靠近”到什么程度,“多数”到底是多少等等都是很模糊的。点估计的这些不足以及缺陷可以用区间估计的方法来弥补。

第三节 总体均数的估计

一、均数估计的标准误

均数估计就是用样本均数去估计总体均数。在用样本均数(X )对总体均数(μ)进行区间估计时,样本均数的标准误(X SE )是衡量抽样误差大小的重要指标,而样本均数的抽样分布则是进行这种估计的理论依据。

(一)标准误的定义式——2

σ已知 当总体σ2已知时,根据中心极限定理三有

()n

SE X X σ

σ=

()

n

n X ∑-=2

μ

因为标准误与总体标准差成正比,与样本容量的平方根成反比,所以总体标准差越小,标准误越小;样本容量越大,标准误也越小。

对于一个指定的总体来说,其总体标准差σ是一个确定的数。因此,在实际工作中,增大样本容量可以减小均数的标准误,这是提高估计精度的重要手段。对于总体均数μ进行估计时,如果σ已知,那么只需从总体中抽取一个容量为n 的随机样本,就可以求出X

SE 而对其区间作出估计,其区间估计公式为

X X σμ96.1±=

X X σμ58.2±=

(二)标准误的近似式——2

σ未知

在实际工作中,总体方差及总体标准差往往是未知的。这时我们只能根据样本的标准差

去估计总体的标准差。用样本标准差去估计总体标准差时必须考虑其无偏估计量的问题。 数理统计学已证明样本标准差n S 不是总体标准差σ的无偏估计量。因此,以n S 作为σ的点估计是不恰当的。但是样本的无偏标准差1-n S 却是总体标准差σ的无偏估计量,即统计量1-n S 抽样分布的平均数恰好等于σ。因此,这里的样本无偏标准差定义为

()

n

X X S n ∑-=

-2

1

()n

n X X

∑∑-=

2

2

由于1-n S 是σ的无偏估计量,且当n 一定时,1-n S 抽样分布的标准误小于X SE ,所以当n 足够大且一定时,σ≈-1n S 的近似程度高于μ≈X 。于是,有了样本平均数标准误的近似公式

n S SE n X 1-=

()

()

1

12

2

--=

--=

∑∑n n X X n

n X X

1-=

n S SE X

当总体σ未知时,即可采用这一公式计算均数的标准误。

二、总体均数的估计方法

总体均数的估计方法大致有三种,一种以正态分布理论为依据的估计法,称正态估计法。一种是以t 分布理论为依据的估计方法,称t 分布估计法。三是以渐近正态分布为依据的估计方法,称近似正态估计法。三种方法适用于不同的资料形式。

(一)正态估计法

正态估计法适用于总体方差σ2已知的数据资料。其具体应用情形有二,一是总体呈正态时,不论样本容量的大小,样本均数的分布都呈正态分布。因为,中心极限定理一指出,总体正态时,从总体抽取的容量为n 一切可能样本的均数呈正态分布。二是总体呈非正态时,只要样本容量大于30,样本均数的分布呈近似正态分布。因为,中心极限定理一指出,当n 足够大时,无论总体分布形态如何,样本均数的分布服从或接近正态分布。

第四节 其他总体参数的估计

参数估计除总体均数的估计外,还有总体方差和标准差的估计、总体相关系数的估计和总体比例的估计等等。这种参数估计过程大致相同,主要区别在于标准误的计算不同。

一、总体方差和总体标准差的估计 (一)总体方差的估计

由于样本方差与总体方差比值的分布呈2χ分布,所以有

()()2

2

121

χ-

'--n n S n ≤2

σ≤

()()

2

2

21

χn n S n '--,或

()()2

2

121

χ-

'--n n S n ≤2

σ≤

()()2

2

21

χn n S n '--

例8-5:从某校初三学生中随机抽取10份物理成绩,计算得平均分为71.2,标准差(

1-n S )

为14.46。试估计物理成绩的方差在什么范围之内。 1)选择显著性水平α。假设本例选05.0=α 2)计算自由度。本例,91101=-=-=n df

3)查2

χ显著性临界值表,确定

()2

2

χ-

'n 和

()2

2

α

χn ',本例有

()()7

.22975.092

2

19==-

χχα

()

()0

.192025.092

2

=='χχα

n

4)代入公式,作出估计

7.246.1492?≤2

σ≤0.1946.1492

?

97.696≤2σ≤04.99,或40.26≤2σ≤95.9

5)结果解释

该校初三学生物理成绩的方差有98%的可能会落在86.86~901.20之间或标准差会落在9.32~30.02之间,超出这一范围的可能只有2%。从这一结果看,物理成绩标准差的区间较大,若增加样本容量可缩小区间差距。 (二)总体标准差的估计

标准差的估计既可以采用上述总体方差估计区间的平方根,也可以直接利用样本标准差进行估计。样本标准差抽样分布的标准差称标准差的标准误,其公式为

S SE (或S σ)

n S n 21-=

因其近似正态分布,所以总体标准差的置信区间为

S n SE S 96.11±=-σ S n SE S 58.21±=-σ

用此法对例8-5进行总体标准的估计,则有

23.347.446

.1410

246

.14==

?=

S SE

79.20~13.823.396.146.14=?±=σ

二、总体相关系数的估计

由样本相关系数r 形成的分布形式较多,因此计算样本相关系数标准误的及置信限的方法也较为复杂。这里只介绍常用方法——Fisher 的Z 函数分布法。Fisher 的Z 函数分布法是通过将样本相关系数转换为r Z 值(因r Z 的样本分布近似正态分布),并以r Z 值进行估计,然后再将r Z 值还原为r 值的做法。这种既无需考虑样本容量大小,也无需顾忌总体相关系数ρ。

例8-6:某教师经研究发现,其所教班级学生(55人)的数学成绩与物理成绩的相关系数为0.66。试以95%的置信度估计全年级数学和物理的相关系数。

1)将r 转换为r Z 函数。查Fisher 函数转换表,当66.0=r 时,793.0=r Z 2)求r Z 的标准误

31-=

n SE r Z

本例,14.021.71

3

551==

-=

r Z SE

3)求

ρ

Z 的置信区间,即

r r Z r Z r SE Z Z SE Z Z 58.296.1±=±=ρρ

本例,

067

.1~519.014.096.1793.0=?±=ρZ

4)将r Z 转换为r 。仍查Fisher 函数转换表,由有 79.0~48.0=ρ

本章小结

参数估计是根据样本统计量去估计相应总体的参数的统计方法,其中最常用的是总体平均数的估计,有点估计和区间估计之分。点估计是指用数轴上的一点做估计,良好点估计的条件是无偏性、一致性、有效性和充分性。区间估计是以数轴上的一段距离做估计,其方法有正态法、t 分布法和近似正态法。

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 α/2 x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3.某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

统计学答案第七章

1 估计量的含义是指()。 A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为()。 A.无偏性 B.有效性 C.一致性 D.充分性 3 根据一个具体的样本求出的总体均值的95%的置信区间()。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 4 无偏估计是指()。 A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 5 总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。 A.样本均值的抽样标准差 B.样本标准差 C.样本方差 D.总体标准差 6 当样本量一定时,置信区间的宽度()。 A.随着置信系数的增大而减小 B.随着置信系数的增大而增大 C.与置信系数的大小无关 D.与置信系数的平方成反比 7 当置信水平一定时,置信区间的宽度()。 A.随着样本量的增大而减小 B.随着样本量的增大而增大 C.与样本量的大小无关 D.与样本量的平方根成正比 8 一个95%的置信区间是指()。 A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数

统计学 第四版 第七章答案

第四章 抽样分布与参数估计 7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客 组成了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = =2.143 (2)在95%的置信水平下,求边际误差。 x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ?=?2x z ασ=?0.025x z σ=?=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: (),x x x x -?+?=()120 4.2,120 4.2-+=(115.8,124.2) 7.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ?? ??? 或2 ,s x N n μ?? ??? 置信区间为: x z x z αα ?-? +? ? (1)构建μ的90%的置信区间。 2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(79.03,82.97) (2)构建μ的95%的置信区间。 2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(78.65,83.35) (3)构建μ的99%的置信区间。 2z α=0.005z =2.576,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(77.91,84.09) 7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取 36 解:

统计学原理课后习题答案 第五章 抽样及参数估计

统计学原理课后习题答案 第五章 抽样及参数估计 1.①由题意可知本题属于:纯随机重复抽样下的总体比例区间估计。 已知:n=1000,828 82.8%1000 p = =,(Z)195.45%F α=-= ,查表得/2=2Z α 由于不知总体标准差,用样本的标准差代替: p 82.8%282.8% 2.4%Z α±=±? =± 即:80.4%P 85.2%≤≤ 所以该城市拥有彩电家庭比例的置信区间为80.4%—85.2%。 ②由题意可知本题属于:重复抽样时比例的必要抽样数目。 已知: 82.8%p =,5%p ?= ,(Z)199.73%F α=-= ,查表得/2=3Z α 由于不知总体标准差,用样本的标准差代替: 222 2 (1P) 382.8%(1-82.8%)5130.05 p z P n -??= =≈? 2.由题意可知本题属于:纯随机重复抽样下的总体平均数的抽样极限误差 已知:n=100,=3x ,=0.8σ ,(Z)195%F α=-= ,查表得/2=1.96Z α /2 = 1.960.16Z α?=?= 分钟 3.(1) 已知:n=150,123 82%150 p = =,(Z)199.73%F α=-= ,查表得/2=3Z α 由于不知总体标准差,用样本的标准差代替: p 82%382%9.41%Z α±=±? =± 即:72.59%P 91.41%≤≤ (2)已知:n=150,=2x ,=0.75σ ,(Z)199.73%F α=-= ,查表得/2=3Z α

/2 0.75 2320.2x Z αμ=±=±?=± 分钟 即:1.8 2.2μ≤≤ 4. 已知: 200σ=,30z ?= ,(Z)195%F α=-= ,查表得/2=1.96Z α 则:22 222 2 1.9620017130 z z n σ?==≈? 户 (1)如上图 (2)40名职工的平均考核成绩为3070 40 76.75xf x f = = =∑ 样本的方差为2 2 ()4777.5 s 122.54x x f f -= = =∑∑ (Z)195%F α=-= ,查表得到/2 1.96Z α= /2 76.75 1.911.07 676.75 3.43s x Z α±=±?=± 即在95%的概率保证度下,该企业工人的平均考核成绩在73.32到80.18直接。 (3)已知:n=40,36 90%40 p = =,(Z)195%F α=-= ,查表得/2=1.96Z α 由于不知总体标准差,用样本的标准差代替:

统计学第七章、第八章课后题答案.doc

统计学复习笔记 第七章 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

统计学答案解析最新版本

统计学课本课后作业题(全) 题目: 第1章:P11 6,7 第2章:P52 练习题3、9、10、11 第3章:P116思考题12、14 练习题16、25 第4章:P114 思考题6,练习题2、4、6、13 第5章:P179 思考题4、练习题3、4、6、11 第6章:P209 思考题4、练习题1、3、6 第7章:P246思考题1、练习题1、7 第8章:P287 思考题4、10 练习题2、3 第一章 6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;最近的一个集装箱内的全部油漆; (2)描述研究变量;装满的油漆罐的质量; (3)描述样本;最近的一个集装箱内的50罐油漆; (4)描述推断。50罐油漆的质量应为4.536×50=226.8 kg。 7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第二章 3.某百货公司连续40天的商品销售额如下(单位:万元):

统计学第七章、第八章课后题答案

统计学复习笔记 第七章 参数估计 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差 、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

统计学第四版第七章答案

第四章 抽样分布与参数估计 某快餐店想要估计每位顾客午餐的平均花费金额。在为期3周的时间里选取49名顾客组成 了一个简单随机样本。 (1)假定总体标准差为15元,求样本均值的抽样标准误差。 x σ= = = (2)在95%的置信水平下,求边际误差。 x x t σ?=?,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ?=?x z ασ=?0.025x z σ=?=×= (3)如果样本均值为120元,求总体均值 的95%的置信区间。 置信区间为: (),x x x x -?+?=()120 4.2,120 4.2-+=(,) 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。 要求: 大样本,样本均值服从正态分布:2,x N n σμ?? ???:或2,s x N n μ?? ??? : 置信区间为: 22x z x z αα?-+ ? (1)构建μ的90%的置信区间。 2z α=0.05z =,置信区间为:()81 1.645 1.2,81 1.645 1.2-?+?=(,) (2)构建μ的95%的置信区间。 2z α=0.025z =,置信区间为:()81 1.96 1.2,81 1.96 1.2-?+?=(,) (3)构建μ的99%的置信区间。 2z α=0.005z =,置信区间为:()81 2.576 1.2,81 2.576 1.2-?+?=(,) 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取 36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 解:

统计学(第四版)贾俊平 第五章 参数估计 练习题答案

统计学(第四版)贾俊平第五章参数估计练习题答案 5.1(答案精确到小数点后两位) (1)已知:n=49,15σ=, 样本均值的标准误差X σ==(2)已知:置信水平:2 195%, 1.96 Z α α-==, 估计误差E=2 15 1.96 4.207 Z α== (3)已知120,X =置信水平:2 195%, 1.96Z αα-==,E=4.20 置信区间为()2 120 4.20115.80,124.20X Z α±=±= 5.2(答案精确到小数点后两位) (1)置信区间为2 8900 1.96(8646.97,9153.03)X Z α±=±= (2)置信区间为2 8900 1.96(8815.48,8984.52)X Z α±=±= (3)置信区间为2 8900 1.65(8760.55,9039.45)X Z α±=±= (4)置信区间为2 8900 2.58(8681.95,9118.05)X Z α±=±= 5.3 (1) 表5.3—1置信水平90%上网时间置信区间报告 上网时间

(2) (3)

5.4(答案精确到小数点后两位) (1)已知N=500,n=50,132n = A. 传统方法:32 0.6450 p == 比例置信区间为0.64(0.51,0.77)p Z ±=±= B. 现代方法:322 0.63504 p +==+ 比例置信区间为0.63(0.50,0.76)p Z ±=±= (2)已知0.8p =0.1≤ 得到:16n ≥ 5.5 (1)

5.6已知22 12121214,7,53.2,43.4,96.8,102.0n n X X s s ======, (1)置信水平195%α-=, 12μμ-置信区间为()(()122 1.86,17.74X X t v α -±= (2)置信水平199%α-=, 12μμ-置信区间为()(()122 0.19,19.41X X t v α -±= 5.7

统计学课件 第七章 参数估计

统计学
STATISTICS (第三版 第三版)
第 7 章 参数估计
统计学
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

统计学
STATISTICS (第三版 第三版)
第 7 章 参数估计
§7.1 参数估计的一般问题 §7.2 一个总体参数的区间估计 §7.3 样本量的确定
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

统计学
STATISTICS (第三版 第三版)
学习目标
1. 估计量与估计值的概念 2. 点估计与区间估计的区别 3. 评价估计量优良性的标准 4. 一个总体参数的区间估计方法 5. 样本量的确定方法
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

统计学
STATISTICS (第三版 第三版)
§7.1 参数估计的一般 问题
7.1.1 估计量与估计值 7.1.2 点估计与区间估计 7.1.3 评价估计量的标准
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

统计学
STATISTICS (第三版 第三版)
估计量与估计值
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

统计学
STATISTICS (第三版 第三版)
估计量与估计值
(estimator & estimated value)
1. 估计量:用于估计总体参数的随机变量 – 如样本均值,样本比例, 样本方差等 – 例如: 样本均值就是总体均值μ 的一个估计量
? 表示 2. 参数用θ 表示,估计量用 θ
3. 估计值:估计参数时 计算出来的统计量的
具体值
– 如果样本均值 ?x =80,则80就是μ的估计值
作者:张占贞 作者:张占贞 青岛科技大学经济与管理学院 青岛科技大学经济与管理学院

《统计学》名词解释及公式

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 概念:统计学,描述统计,推断统计。 统计在工商管理中的应用。 统计的其他应用领域。 概念:分类数据,顺序数据,数值型数据。 不同数据的特点。 概念:观测数据,实验数据。 概念:截面数据,时间序列数据。 统计数据的间接来源。 二手数据的特点。 概念:抽样调查,普查。 数据的间接来源。 数据的收集方法。 调查方案的内容。 概念。抽样误差,非抽样误差。 统计数据的质量。 概念:总体,样本。 概念:参数,统计量。

概念:变量,分类变量,顺序变量,数值 型变量,连续型变量,离散型变量。 二、主要术语 1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2.描述统计:研究数据收集、处理和描述的统计学分支。 3.推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4.分类数据:只能归于某一类别的非数字型数据。 5.顺序数据:只能归于某一有序类别的非数字型数据。 6.数值型数据:按数字尺度测量的观察值。 7.观测数据:通过调查或观测而收集到的数据。 8.实验数据:在实验中控制实验对象而收集到的数据。 9.截面数据:在相同或近似相同的时间点上收集的数据。 10.时间序列数据:在不同时间上收集到的数据。 11.抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12.普查:为特定目的而专门组织的全面调查。 13.总体:包含所研究的全部个体(数据)的集合。 14.样本:从总体中抽取的一部分元素的集合。 15.样本容量:也称样本量,是构成样本的元素数目。 16.参数:用来描述总体特征的概括性数字度量。 17.统计量:用来描述样本特征的概括性数字度量。 18.变量:说明现象某种特征的概念。 19.分类变量:说明事物类别的一个名称。 20.顺序变量:说明事物有序类别的一个名称。 21.数值型变量:说明事物数字特征的一个名称。

《统计学》课后练习题答案

第一章统计学及基本概念 1 第二章数据的收集与整理 4 第三章统计表与统计图7 第四章数据的描述性分析 9 第五章参数估计 12 第六章假设检验 17 第七章方差分析 21 第八章非参数检验24 第九章相关与回归分析27 第十章多元统计分析 31 第十一章时间序列分析35 第十二章指数38 第十二章指数38 第十三章统计决策42 第十四章统计质量管理45 第一章统计学及基本概念 1.1 统计的涵义(统计工作、统计资料和统计学) 1.2 统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学) 1.3 统计学的发展史(学派与主要代表人物) 1.4 数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数) 1.5 变量:连续与离散;确定与随机 1.6 总体、样本与个体 1.7 标志、指标及指标体系 1.8 统计计算工具 习题 一、单项选择题 1. 推断统计学研究()。(知识点:1.2 答案:D) A.统计数据收集的方法B.数据加工处理的方法 C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法 2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。(知识点:1.3 答案:D) A.数理统计学派B.政治算术学派C.社会统计学派D.国势学派 3. 下列数据中哪个是定比尺度衡量的数据()。(知识点:1.4 答案:B) A.性别B.年龄C.籍贯D.民族 4. 统计对现象总体数量特征的认识是()。(知识点:1.6 答案:C) A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体 5. 调查10个企业职工的工资水平情况,则统计总体是()。(知识点:1.6 答案:C) A.10个企业 B.10个企业职工的全部工资 C.10个企业的全部职工 D.10个企业每个职工的工资

3-第7章统计学参数估计练习题(20200627170347)

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1 ?参数估计就是用_________ 去估计____________ 。 2?点估计就是用_____________ 的某个取值直接作为总体参数的 _____________ 。 3. ______________________ 区间估计是在的基础上,给出总体参数估计的一个区间范围,该区间 通常由样本统计量加减___________ 得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的 比例称为___________ ,也成为_____________ 。 5. __________________________________________________________ 当样本量给定时,置信区间的宽度随着置信系数的增大而__________________________ ;当置信水 平固定时,置信区间的宽度随着样本量的增大而_____________ 。 6. 评价估计量的标准包含无偏性、 ___________ 和____________ 。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计 的可靠程度,就会___________ 置信区间的宽度;如要缩小置信区间的宽度,又不降 低置信程度,就要____________ 样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、 ___________ 和___________ 的影响。 9?估计方差未知的正态总体均值置信区间用公式_____________ ;当样本容量大于等于30时,可以用近似公式__________ 。 10?估计正态总体方差的置信区间时,用___________ 分布,公式为___________ 。 二、选择题(共10题,每题1分,共计10分) 1 ?根据一个具体的样本求出的总体均值的95%勺置信区间()。 A. 以95%勺概率包含总体均值 B. 有5%勺可能性包含总体均值 C?一定包含总体均值

统计学参数估计练习题

统计学参数估计练习题 SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1.参数估计就是用_______ __去估计_______ __。 2. 点估计就是用_______ __的某个取值直接作为总体参数的_______ __。3.区间估计是在_______ __的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减_______ __得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为_______ __,也成为_______ __。 5.当样本量给定时,置信区间的宽度随着置信系数的增大而_______ __;当置信水平固定时,置信区间的宽度随着样本量的增大而_______ __。 6. 评价估计量的标准包含无偏性、_______ __和_______ __。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可靠程度,就会_______ __置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程度,就要_______ __样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、_______ __和_______ __的影响。 9. 估计方差未知的正态总体均值置信区间用公式_______ __;当样本容量大于等于30时,可以用近似公式_______ __。 10. 估计正态总体方差的置信区间时,用_____ __分布,公式为______ __。 二、选择题(共10题,每题1分,共计10分) 1.根据一个具体的样本求出的总体均值的95%的置信区间 ( )。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2.估计量的含义是指( )。 A. 用来估计总体参数的统计量的名称

第章统计学参数估计练习题

第7 章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1 ?参数估计就是用______ _去估计________ _ 。 2?点估计就是用______________ 的某个取值直接作为总体参数的 ____________ 。 3?区间估计是在____________ 的基础上,给出总体参数估计的一个区间范围,该区间通常 由样本统计量加减 __________ 得到。 4. ____________ 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例称为,也成为 ____________ 。 5 ?当样本量给定时,置信区间的宽度随着置信系数的增大而_____________ ;当置信水平固定时,置信区间的宽度随着样本量的增大而 ____________ 。 6. 评价估计量的标准包含无偏性、________ __ 和 _______ __ 。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计的可 靠程度,就会 ____________ 置信区间的宽度;如要缩小置信区间的宽度,又不降低置信程 度,就要 ___________ 样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、____________ 和___________ 的影响。 9. ___________________________________________________ 估计方差未知的正态总体均值置信区间用公式__________________________________________ ;当样本容量大于等于30时,可以用近似公式 ____________ 。 10. 估计正态总体方差的置信区间时,用___________ 分布,公式为 __________ 。 二、选择题(共10题,每题1分,共计10分) 1 ?根据一个具体的样本求出的总体均值的95%勺置信区间()。 A. 以95%勺概率包含总体均值 B. 有5%勺可能性包含总体均值 C. 一定包含总体均值 D. 要么包含总体均值,要么不包含总体均值 2. 估计量的含义是指()。 A. 用来估计总体参数的统计量的名称

大学统计学第七章练习题与答案

第7章 参数估计 练习题 7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少? 解:⑴已知25,40,5===x n σ 样本均值的抽样标准差79.04 10 40 5≈= = = n x σ σ ⑵已知5=σ,40=n ,25=x ,4 10= x σ,%951=-α 96.1025.02 ==∴Z Z α 边际误差55.14 10 * 96.1≈==n Z E σ α 7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。 (1) 假定总体标准差为15元,求样本均值的抽样标准 误差; (2) 在95%的置信水平下,求边际误差; (3) 如果样本均值为120元,求总体均值μ的95%的置 信区间。 解.已知.根据查表得2/αz =1.96

(1)标准误差: 14.249 15== = n X σ σ (2).已知2/αz =1.96 所以边际误差=2/αz * =n s 1.96* 49 15=4.2 (3)置信区间:)(2.124,8.11596.149 151202 =*± =±n s Z x α 7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差85414=σ,构建总体均值μ的95%的置信区间。 96.12 =?Z 144.16741100 85414* 96.12 ==? ?n Z σ 856.87818144.16741104560.2 =-=-?n Z x σ 144 .121301144.16741104560. 2 =+=+?n Z x σ 置信区间:(87818.856,121301.144) 7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。 (1) 构建μ的90%的置信区间。 (2) 构建μ的95%的置信区间。 (3) 构建μ的99%的置信区间。 解;由题意知100=n , 81=x ,12=s . (1)置信水平为%901=-α,则645.12 =αZ . 由公式n s z x ? ±2 α974.181100 12645.181±=? ±= 即(),974.82,026.79974.181=±

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

(完整版)统计学习题答案第5章参数估计

第5章 参数估计 ? 1.从一个标准差为 5的总体中抽出一个容量为 40的样本,样本均值为 25。 (1) 样本均值的抽样标准差(T x 等于多少? (2) 在95%的置信水平下,允许误差是多少? 解:已知总体标准差b =5,样本容量n =40,为大样本,样本均值 x =25, (2)已知置信水平1 - a =95%,得Z a /2 =1.96 , ? 2?某快餐店想要估计每位顾客午餐的平均花费金额,在为期 3周的时间里选取 49名顾客 组成了一个简单随机样本。 (3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差; (5) 如果样本均值为120元,求总体均值 95%的置信区间。 解:(1)已假定总体标准差为 b =15元, (2)已知置信水平1 - a =95%,得Z a /2 =1.96 , (3)已知样本均值为 x =120元,置信水平1- a =95%,得 乙/2 =1.96 , 可知,如果样本均值为 120元,总体均值95%的置信区间为(115.8 , 124.2 )元。 ? 3.某大学为了解学生每天上网的时间,在全校 7500名学生中采取不重复抽样方法随机抽 取36人,调查他们每天上网的时间,得到下面的数据(单位:小时): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 29 35 2.4 05 36 2.5 (1 )样本均值的抽样标准差 =0.7906 于是,允许误差是 E = Z a /2 b ,n =1.96X 0.7906= 1.5496。 则样本均值的抽样标准误差为 (T 15 CT - = ----- = ------- =2.1429 x ..n 49 于是,允许误差是 E = Z a /2 =1.96X 2.1429=4.2000。 这时总体均值的置信区间为 Z a /2 =120± 4.2= 124.2 115.8

统计学名词解释

名词解释: 医学统计学:用统计学的原理和方法研究生物医学问题的一门学科。 变量(variable):观察单位的某项特征 变量值(value of variable):变量的观察结果(测量值) 总体(population):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。 样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。 随机抽样(random sample):按随机化原则从总体中抽取部分观察单位的过程。 同质(homogeneity):是针对被研究指标来讲,其影响因素相同。简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。 变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。 等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡。有序变量(定性变量的一种)。 概率(probability):是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大,0

随机误差(random error):排除了系统误差后的尚存的误差,受多种因素影响,使观察值不按照方向性和系统性而随机的变化,误差变量一般服从正态分布,可以通过统计处理来估计。 系统误差(system error):由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免。 随机变量(random variable):是指取值不能事先确定的观察结果,不能用一个正常数来表示,每个变量的取值服从特定的概率分布。 参数(parameter):根据总体分布特征而计算的总体统计指标。 统计量(statistic):由总体中随机抽取样本而计算的相应样本指标。 频数表(frequency table):将各变量值及其相应的频数列出表格形式,用来表示一批数据各观察值出现的频繁程度。 算术均数(arithmetic mean):描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X表示。 几何均数(geometric mean):描述对数正态分布或数据呈倍数变化资料的水平,记为G. 中位数(median),将一组观察值由小到大排列,n为奇数时取位次居中的变量值,为偶数时,取位次居中的两个变量的平均值。 极差(range):又称全距,为最大值与最小值之差,用于资料的粗略分析,计算简便但稳定性较差。符号R. 百分位数(percentile):将n个观察值从小到大依次排列,再把它们的位次转化为百分位。

相关主题
文本预览
相关文档 最新文档