当前位置:文档之家› 数理统计 单正态总体均值的置信区间

数理统计 单正态总体均值的置信区间

数理统计 单正态总体均值的置信区间
数理统计 单正态总体均值的置信区间

2.2.1单正态总体均值的置信区间

(1)方差已知情形

查表求满足:对于,。

对于总体中的样本,的置信区间为:

(2-4)

其中可以用norminv(1-a /2)计算。

例2.3设

1.1,

2.2, 3,3, 4.4, 5.5

为来自正态总体的简单随机样本,求的置信水平为95%的置信区

间。

解以下用Matlab命令计算:

x=[1.1,2.2,3.3,4.4,5.5];

n=length(x);

m=mean(x);

s=input(‘输入标准差s:’)

c=s/sqrt(n);

d=c*norminv(0.975);

a=m-d; b=m+d;

[a,b]

计算结果为 1.2840 5.3160

(2)方差未知情形

对于总体中的样本,的置信区间为:

(2-4)

其中为自由度的分布临界值。

数据同上,继续利用Matlab计算

S=std(x); dd=S*tinv(0.975,4)/sqrt(n);

aa=m-dd; bb=m+dd; [aa,bb]

结果为 1.1404 5.4596 程序在下面

>> x=[1.1,2.2,3.3,4.4,5.5]; n=length(x);

m=mean(x);

s=input('输入标准差s:') if (s==0)

s=std(x);

dd=s*tinv(0.975,4)/sqrt(n); aa=[m-dd,m+dd]

else

c=s/sqrt(n);

dd=c*norminv(0.975);

aa=[m-dd,m+dd]

end

第四节正态总体的置信区间

第四节 正态总体的置信区间 与其他总体相比, 正态总体参数的置信区间是最完善的,应用也最广泛。在构造正态总体参数的置信区间的过程中,t 分布、2χ分布、F 分布以及标准正态分布)1,0(N 扮演了重要角色. 本节介绍正态总体的置信区间,讨论下列情形: 1. 单正态总体均值(方差已知)的置信区间; 2. 单正态总体均值(方差未知)的置信区间; 3. 单正态总体方差的置信区间; 4. 双正态总体均值差(方差已知)的置信区间; 5. 双正态总体均值差(方差未知但相等)的置信区间; 6. 双正态总体方差比的置信区间. 注: 由于正态分布具有对称性, 利用双侧分位数来计算未知参数的置信度为α-1的置信区间, 其区间长度在所有这类区间中是最短的. 分布图示 ★ 引言 ★ 单正态总体均值(方差已知)的置信区间 ★ 例1 ★ 例2 ★ 单正态总体均值(方差未知)的置信区间 ★ 例3 ★ 例4 ★ 单正态总体方差的置信区间 ★ 例5 ★ 双正态总体均值差(方差已知)的置信区间 ★ 例6 ★ 双正态总体均值差(方差未知)的置信区间 ★ 例7 ★ 例8 ★ 双正态总体方差比的置信区间 ★ 例9 ★ 内容小结 ★ 课堂练习 ★ 习题6-4 内容要点 一、单正态总体均值的置信区间(1) 设总体),,(~2σμN X 其中2σ已知, 而μ为未知参数, n X X X ,,,21 是取自总体X 的一个样本. 对给定的置信水平α-1, 由上节例1已经得到μ的置信区间 ,,2/2/???? ? ??+?-n u X n u X σσαα 二、单正态总体均值的置信区间(2) 设总体),,(~2σμN X 其中μ,2σ未知, n X X X ,,,21 是取自总体X 的一个样本. 此时可用2σ的无偏估计2S 代替2σ, 构造统计量 n S X T /μ-=, 从第五章第三节的定理知).1(~/--= n t n S X T μ 对给定的置信水平α-1, 由 αμαα-=? ?????-<-<--1)1(/)1(2/2/n t n S X n t P ,

正态分布可信区间

3. 某地200例正常成人血铅含量的频数分布如下表。 (1)简述该资料的分布特征。 (2)若资料近似呈对数正态分布,试分别用百分位数法和正态分布法估计该地正常成人血铅值的95%参考值范围。 表某地200例正常成人血铅含量(μmol/L)的频数分布 血铅含量频数累积频数 0.00~7 7 0.24~49 56 0.48~45 101 0.72~32 133 0.96~28 161 1.20~13 174 1.44~14 188 1.68~ 4 192 1.92~ 4 196 2.16~ 1 197 2.40~ 2 199 2.64~ 1 200 [参考答案] (1)从表可以看出,血铅含量较低组段的频数明显高于较高组段,分布不对称。同正态分布相比,其分布高峰向血铅含量较低方向偏移,长尾向血铅含量较高组段延伸,数据为正偏态分布。 某地200例正常成人血铅含量(μmol/L)的频数分布 血铅含量组中值频数累积频数累积频率 0.00~0.12 7 7 3.5 0.24~0.36 49 56 28.0 0.48~0.60 45 101 50.5 0.72~0.84 32 133 66.5 0.96~ 1.08 28 161 80.5

1.20~ 1.32 13 174 87.0 1.44~ 1.56 14 188 94.0 1.68~ 1.80 4 192 96.0 1.92~ 2.04 4 196 98.0 2.16~ 2.28 1 197 98.5 2.40~ 2.52 2 199 99.5 2.64~ 2.76 1 200 100 (2)因为正常人血铅含量越低越好,所以应计算单侧95%参考值范围。 百分位数法:第95%百分位数位于1.68~组段,组距为0.24,频数为4,该组段以前的累积频数为188,故 95 (2000.95188) 1.680.24 1.80(μmol/L) 4 P ?- =+?= 即该地正常成人血铅值的95%参考值范围为小于1.80μmol/L。 正态分布法:将组中值进行log变换,根据题中表格,得到均值和标准差计算表。 某地200例正常成人血铅含量(μmol/L)均值和标准差计算表 血铅含量组中值lg组中值(x) 频数(f) fx2fx 0.00~0.12 -0.92 7 -6.44 5.9248 0.24~0.36 -0.44 49 -21.56 9.4864 0.48~0.60 -0.22 45 -9.9 2.178 0.72~0.84 -0.08 32 -2.56 0.2048 0.96~ 1.08 0.03 28 0.84 0.0252 1.20~ 1.32 0.12 13 1.56 0.1872 1.44~ 1.56 0.19 14 2.66 0.5054 1.68~ 1.80 0.26 4 1.04 0.2704 1.92~ 2.04 0.31 4 1.24 0.3844 2.16~ 2.28 0.36 1 0.36 0.1296 2.40~ 2.52 0.40 2 0.80 0.3200 2.64~ 2.76 0.44 1 0.44 0.1936 合计——200 -31.52 19.8098

Excel求置信区间的方法

应用Excel求置信区间 一、总体均值的区间估计 (一)总体方差未知 例:为研究某种汽车轮胎的磨损情况,随机选取16只轮胎,每只轮胎行驶到磨坏为止。记录所行驶的里程(以公里计)如下: 假设汽车轮胎的行驶里程服从正态分布,均值、方差未知。试求总体均值μ的置信度为的置信区间。 步骤:

1.在单元格A1中输入“样本数据”,在单元格B4中输入“指标名称”,在单元格C4中输入“指标数值”,并在单元格A2:A17中输入样本数据。 2.在单元格B5中输入“样本容量”,在单元格C5中输入“16”。 3.计算样本平均行驶里程。在单元格B6中输入“样本均值”,在单元格C6中输入公式:“=AVERAGE(A2,A17)”,回车后得到的结果为。

4.计算样本标准差。在单元格B7中输入“样本标准差”,在单元格C7中输入公式:“=STDEV(A2,A17)”,回车后得到的结果为。 5.计算抽样平均误差。在单元格B8中输入“抽样平均误差”,在单元格C8中输入公式:“=C7/SQRT(C5)” ,回车后得到的结果为。 6.在单元格B9中输入“置信度”,在单元格C9中输入“”。 7.在单元格B10中输入“自由度”,在单元格C10中输入“15”。 8.在单元格B11中输入“t分布的双侧分位数”,在单元格C11中输入公式:“ =TINV(1-C9,C10)”,回车后得到α=的t分布的双侧分位数t=。 9.计算允许误差。在单元格B12中输入“允许误差”,在单元格C12中输入公式:“=C11*C8”,回车后得到的结果为。

10.计算置信区间下限。在单元格B13中输入“置信下限”,在单元格C13中输入置信区间下限公式:“=C6-C12”,回车后得到的结果为。 11.计算置信区间上限。在单元格B14中输入“置信上限”,在单元格C14中输入置信区间上限公式:“=C6+C12”,回车后得到的结果为。 (二)总体方差已知 仍以上例为例,假设汽车轮胎的行驶里程服从正态总体,方差为10002,试求总体均值μ的置信度为的置信区间。

2017年公卫助理:总体率的置信区间试题

2017年公卫助理:总体率的置信区间试题本卷共分为1大题50小题,作答时间为180分钟,总分100分,60分及格。 一、单项选择题(共50题,每题2分。每题的备选项中,只有一个最符合题意) 1.HOCI和OCI-的杀菌效果为( c )。 A. HOCI的杀菌效果与OCI-相同 B. HOCI的杀菌效果与OCI-低80倍 C. HOCI的杀菌效果与OCI-高80倍 D. HOCI的杀菌效果与OCI-低20倍 E. HOCI的杀菌效果与OCI-高20倍 2.高温车间是指 A.夏季车间内气温超过30℃ B.车间内气温比室外夏季设计通风计算温度高2℃及以上 C.夏季车间内气温超过35℃ D.车间内热源散热量每小时每m3大于50kcal E.未明确规定 [正确答案]:B 3.甲氧苄啶的抗菌机制是抑制细菌的 A.二氢叶酸合成酶 B.四氢叶酸合成酶

C.二氢叶酸还原酶 D.DNA回旋酶 E.RNA聚合酶 正确答案:C 4.硝酸甘油的不良反应主要是由哪种作用所致 A.心排出量减少 B.血压降低 C.耗氧量减少 D.血管扩张 E.心肌血液的重新分布 正确答案:D 5. 社会医学研究工具(问卷或量表)的效度评价不包括( B ) A 表面效度B质量效度C 结构效度D 内容效度 6. 下列何药可诱发支气管哮喘 A.甲基多巴 B.利舍平 C.呱乙啶 D.普萘洛尔 E.硝苯地平

正确答案:D 7. 环磷酰胺的不良反应不包括 A.血压升高 B.恶心、呕吐 C.脱发 D.骨髓抑制 E.出血性膀胱炎 正确答案:A 8. 粉尘对人体可有以下作用 A.致纤维化 B.刺激 C.中毒 D.致敏 E.以上全部 9. 下列哪项不是文化的基本特征( C ) A 历史性 B 现实性 C 创造性 D 渗透性 10. 问卷的一般结构包括(A ) A、封面信——指导语——问题及答案——编码

第6章 总率的区间估计和假设检验

第6章总体率的区间估计和假设检验 ?掌握率的抽样误差的概念和意义 ?掌握总体率区间估计的概念意义和计算方法 ?掌握率的U检验的概念和条件,计算方法 ?第一节率的抽样误差与总体率的区间估计 一、率的抽样误差:在同一总体中按一定的样本含量n抽样,样本率和总体率或样本率之间也存在着差异,这种差异称为率的抽样误差。 例6.1 检查居民800人粪便中蛔虫阳性200人,阳性率为25%,试求阳性率的标准误。 本例:n=800,p=0.25,1-p=0.75, % 53 .1 0153 .0 800 75 .0 25 .0 = = ? = p S 二、总体率的区间估计 ㈠正态分布法 样本含量n足够大,np与n(1-p)均≥5时, 例6.2 求例6.1当地居民粪便蛔虫阳性率的95%可信区间和99%的可信区间。 95%的可信区间为:25%±1.96×1.53% 即(22.00%,28.00%) 99%的可信区间为:25%±2.58×1.53% 即(21.05%,28.95%)㈡查表法 当样本含量较小(如n≤50),np或n(1-p)<5时,样本率的分布呈二项分布,总体率的可信区间可据二项分布的理论求得。 第二节率的u检验 应用条件:样本含量n足够大,np与n(1-p)均≥5 。 此时,样本率p也是以总体率为中心呈正态分布或近似正态分布的。 一、样本率与总体率比较的u ?u值的计算公式为: 例6.5 根据以往经验,一般胃溃疡病患者有20%(总体率)发生胃出血症状。现某医生观察65岁以上胃溃疡病人152例,其中48例发生胃出血,占31.6%(样本率)。问老年胃n p ) 1(π π σ - = n p p S p ) 1(- = p S u p α ± n p p u p ) 1 ( | | | | π π π σ π - - = - =

OR的置信区间及如何由置信区间求解标准差

OR的置信区间及如何由置信区间求解标准差 董圣杰(Dongsj) 02-08-2014

关于OR 、lnOR 及置信区间的计算 暴露非暴露合计处理组 59(a )28(b )87(n1)对照组 8(c ) 33(d ) 41(n2) 合计67(m1)61(m2)128(N ) 1、处理组的暴露比值=a/b ,对照组的暴露比值=c/d ,两组的优势比OR= a b c d = ad bc 2、OR 置信区间的计算:主要有计算方法,即Miettinen 法和Woolf 法,其中Woolf 法 是Meta 分析中采用的方法;先简单介绍两种方法。 (1) Miettinen 法:计算中要利用四个表的卡方值,计算如下: (2) Woolf 法:该法采用了对数转换,利用了正态分布的进行计算,总体OR 的α的置信区间: 59338.69 828 OR ?==?()()()()() 2 226.07 ad bc n a b c d a c b d χ-?==++++() /2 2 1.961126.07 8.69 3.39,19.93Z OR αχ ±± ==标准正态分布的分位数 [] /2lnOR exp lnOR Z SE α±?ln 111111110.456 5928833 OR SE a b c d =+++=+++=()() exp ln 8.69 1.960.456 3.56,21.24±?=

如何采用Stata计算OR及其置信区间命令很简单: Woolf法计算的结果

知道置信区间如何求解标准差(误) ?经典统计学置信区间的计算,是通过构建枢轴量,根据枢轴量的分布获得的。

正态总体参数的区间估计

第19讲 正态总体参数的区间估计 教学目的:理解区间估计的概念,掌握各种条件下对一个正态总体的均值和方差进行 区间估计的方法。 教学重点:置信区间的确定。 教学难点:对置信区间的理解。 教学时数: 2学时。 教学过程: 第六章 参数估计 §6.3正态总体参数的区间估计 1. 区间估计的概念 我们已经讨论了参数的点估计,但是对于一个估计量,人们在测量或计算时,常不以得到近似值为满足,还需估计误差,即要求知道近似值的精确程度。因此,对于未知参数θ,除了求出它的点估计?θ外,我们还希望估计出一个范围,并希望知道这个范围包含参数θ真值的可信程度。 设?θ为未知参数θ的估计量,其误差小于某个正数ε的概率为1(01)αα-<<,即 ?{||}1P θθεα -<=- 或 αεθθεθ-=+<<-1)??(P 这表明,随机区间)?,?(εθεθ+-包含参数θ真值的概率(可信程度)为1α-,则这个区间)?,?(εθεθ+-就称为置信区间,1α-称为置信水平。 定义 设总体X 的分布中含有一个未知参数θ。若对于给定的概率1(01)αα-<<,存在两个统计量1112(,,,)n X X X θθ= 与2212(,,,)n X X X θθ= ,使得 12{}1P θθθα <<=-

则随机区间12(,)θθ称为参数θ的置信水平为1α-的置信区间,1θ称为置信下限,2θ称为置信上限,1α-称为置信水平。 注(1)置信区间的含义:若反复抽样多次(各次的样本容量相等,均为n ),每一组样本值确定一个区间12(,)θθ,每个这样的区间要么包含θ的真值,要么不包含θ的真值。按伯努利大数定理,在这么多的区间中,包含θ真值的约占100(1)%α-,不包含θ真值的约仅占100%α。例如:若0.01α=,反复抽样1000次,则得到的1000个区间中,不包含θ真值的约为10个。 (2)置信区间的长度表示估计结果的精确性,而置信水平表示估计结果的可靠性。对于置信水平为1α-的置信区间12(,)θθ,一方面置信水平1α-越大,估计的可靠性越高;另一方面区间12(,)θθ的长度(2)ε越小,估计的精确性越好。但这两方面通常是矛盾的,提高可靠性通常会使精确性下降(区间长度变大),而提高精确性通常会使可靠性下降(1α-变小),所以要找两方面的平衡点。 在学习区间估计方法之前,我们先介绍标准正态分布的α分位点概念。 设 () ~0,1X N ,若 z α 满足条件 { },01 P X z α αα>=<<,则称点z α为标准正态分布的α分位点。例如求0.01z 。按照α分位点定义,我们有 {}0.010.01P X z >=,则{}0.010.99P X z ≤=,即0.01()0.99z φ=。查表可得0.01 2.327z =. 又 由()x ?图形的对称性知1z z αα-=-。下面列出了几个常用的z α值: 2. 正态总体均值μ的区间估计 设已给定置信水平为1α-,总体()2~,X N μσ,12,,,n X X X 为一个样本,2 ,X S 分别是样本均值和样本方差。

相关主题
文本预览
相关文档 最新文档