当前位置：文档之家› 应用统计学：参数估计习题及答案

应用统计学：参数估计习题及答案

简答题

1、矩估计的推断思路如何？有何优劣？

2、极大似然估计的推断思路如何？有何优劣？

3、什么是抽样误差？抽样误差的大小受哪些因素影响？

4、简述点估计和区间估计的区别和特点。

5、确定重复抽样必要样本单位数应考虑哪些因素？

计算题

1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计，并考量估计结果符合什么标准

2、某学校用不重复随机抽样方法选取100名高中学生，占学生总数的10%，学生平均体重为50公斤，标准差为48.36公斤。要求在可靠程度为95%（t=1.96）的条件下，推断该校全部高中学生平均体重的范围是多少？

3、某县拟对该县20000小麦进行简单随机抽样调查，推断平均亩产量。根据过去抽样调查经验，平均亩产量的标准差为100公斤，抽样平均误差为40公斤。现在要求可靠程度为95.45%（t=2）的条件下，这次抽样的亩数应至少为多少？

4、某地区对小麦的单位面积产量进行抽样调查，随机抽选25公

顷，计算得平均每公顷产量9000公斤，每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少？（P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973）

5、某厂有甲、乙两车间都生产同种电器产品，为调查该厂电器产品的电流强度情况，按产量等比例类型抽样方法抽取样本，资料如下：

试推断：

（1）在95.45%（t=2）的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围

（2）以同样条件推断其合格率的可能范围

（3）比较两车间产品质量

6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件，其中合格品190件，要求：

（1）计算样本合格品率及其抽样平均误差

（2）以95.45%的概率保证程度对该批产品合格品率和合格品数量进行区间估计。

（3）如果极限误差为2.31%，则其概率保证程度是多少？

7、某单位按重复抽样方式随机抽取40名职工，对其业务考试成绩进行检查，资料如下：

6889 88 84 86 87 75 73 72 68

7582 99 58 81 54 79 76 95 76

7160 91 65 76 72 76 85 89 92

6457 83 81 78 77 72 61 70 87

（1）根据上述资料按成绩分成以下几组：60分以下、60-70分、70-80分、80-90分、90-100分。整理成变量分配数列。

（2）根据整理后的变量数列，以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围。

（3）其他条件不变，将允许误差缩小一半，应抽取多少名职工？

参考答案

简答：

1、矩估计属于常用点估计法的一种，它的推断思路是认为样本矩等于总体矩。这种推断方法的优势在于计算简便，适用范围广；其缺陷在于手段相对粗糙，估计结果不唯一，且在据镇估计体系内，无法判断不同估计量的优劣。

2、极大似然估计认为在一次单一的抽样实验中，该样本表现在所有可能的样本中，是出现概率相对最大的一个，通过对其概率的极值计算推断总体参数。这种推断方法的缺陷在于，适用面较窄，对于某些分布形式或参数无效；其优势则在于计算相对精密，估计效果唯一。

3、抽样误差实际包含两个概念：一是指抽样平均误差，在数理上表现为样本平均数的标准差别，计算上表现为n

σ，仅具有理论意义；另一个是指抽样极限误差，在区间估计中表现为估计量的浮动额度，计算上表现为n

，其值由允许的置信度、描

Zσ

述总体离散程度的标准差，和样本容量三个因素共同决定。

4、所谓点估计，是指估计结果表现为点值的估计方法，常用的有矩法和极大似然法；区间估计的结果则表现为域值。除了结果表现形式上的区别外，两者对结果的评价方式也不同。点估计只能够一些标准评价估计量的构造方式的优劣，不能对具体的一次估计结果进行评价；区间估计则可以对该次估计具体结果的可靠程度进行度量，且结果的可信度与于估计的精确度之间存在某种

非数量性的互补。两者之间也存在一定的联系：区间估计是以点估计量和中心，向数轴两边等距离扩展，形成域值。

5、重复抽样条件下，能够满足指定精度和信度要求的样本最低容量计算公式为22)(?=σ

αZ n ，式中可见，影响因素有三：分别为由要求信度决定的正态临界值2αZ 、描述总体离散度的标准差σ，

和要求的估计精度?。

计算：

1、两种点估计技术：

泊松分布：矩估计：x e k x

x E k ===∑-λλλ!)(

极大似然估计：

极大似然函数为λλn k k L i i --=∑∑!ln ln ln

令其导数为0有0=-∑n k i λ，解得k =λ

正态分布：矩估计：x x xf x E ===?μ)()(；2222)(1)(x x n

Ex x E -==-=σσ 极大似然估计：

极大似然函数为222)(ln 2ln 2ln σ

μσπ∑

----=x n n L

令其导数为0有02=-∑σμx 和0)(32=-+-∑σμσx n

两方程联立解得x =μ；n x x ∑-=22)(σ

2、不重复抽样下总体平均数的区间估计：

)11000100100010036.4896.150()1(222

--??±=--±∈N n N n s Z x αμ 3、样本容量的确定：

25)401002()(222=?=?=σ

αZ n

4、总体平均数的区间的概率计算：

9545.0)22()25

12009000948025120090008520(=≤≤-=-≤-≤-Z P n s x P μ 5、总体平均数和比例的区间估计、双总体平均数比例差的估计：

（1）两个车间数据拟合（加权算术平均）有

567.1)()(212211=++=n n x n x n x ；453.0)()(2122

22112=++=n n s n s n s )60453.02567.1()(1,2?±=±∈-n

s t x n αμ

（2）93.0)()(212211=++=n n p n p n p

)60

)93.01(93.096.193.0())1((2-??±=-±∈n p p Z p P α （3）))1()1()((2

221111,2121n p p n p p t p p P P n -+-±-∈--α 6、总体比例的参数、区间估计和概率计算：

（1）此处的样本合格品率明显是指此次试验得到的实证数据，因此有95.0200190==p ；抽样平均误差则是一个理论概念，描述的是样本比例作为一个随机变量的标准差，在重复抽样条件下其

计算：200)95.01(95.0)1(2-?=-=n p p p σ；不重复抽样条件下需要有修正因子：1

20002002000200)95.01(95.01)1(2--?-?=--?-=N n N n p p p σ。（2）重复)20005.095.0295.0())1((2??±=-±∈n p p Z p P α 不重复)1

2000200200020005.095.0295.0()1)1((2--???±=--?-±∈N n N n p p Z p P α 无论重复或不重复，合格品数量均为NP 。

（3）按题意0231.0)1(=-n p p Z α 则05.095.02000231.0)1(0231.02??=-=p p n Z α，查表可得α-1

7、数据整理、平均数区间估计和样本容量确定

（2）根据整理后的变量数列，以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围。

（3）其他条件不变，将允许误差缩小一半，应抽取多少名职工？

根据分组数据计算，有77=x ，1112=s

)40111277()(2?±=±∈n s

Z x αμ 22)2(?=s

Z n α，由式中可见，若要求允许误差减半，则要求样本容量

应比原来扩大4倍。

应用统计学试题及答案解析

6．对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= －1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7．某乡播种早稻5000亩，其中20％使用改良品种，亩产为600 公斤，其余亩产为500 公斤，则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件乙车间: x =90件, σ=6.3件哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

应用统计学：参数估计习题及答案

简答题 1、矩估计的推断思路如何？有何优劣？ 2、极大似然估计的推断思路如何？有何优劣？ 3、什么是抽样误差？抽样误差的大小受哪些因素影响？ 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素？计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计，并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生，占学生总数的10%，学生平均体重为50公斤，标准差为48.36公斤。要求在可靠程度为95%（t=1.96）的条件下，推断该校全部高中学生平均体重的范围是多少？ 3、某县拟对该县20000小麦进行简单随机抽样调查，推断平均亩产量。根据过去抽样调查经验，平均亩产量的标准差为100公斤，抽样平均误差为40公斤。现在要求可靠程度为95.45%（t=2）的条件下，这次抽样的亩数应至少为多少？ 4、某地区对小麦的单位面积产量进行抽样调查，随机抽选25公

顷，计算得平均每公顷产量9000公斤，每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少？（P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973） 5、某厂有甲、乙两车间都生产同种电器产品，为调查该厂电器产品的电流强度情况，按产量等比例类型抽样方法抽取样本，资料如下：试推断：（1）在95.45%（t=2）的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围（2）以同样条件推断其合格率的可能范围（3）比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件，其中合格品190件，要求：（1）计算样本合格品率及其抽样平均误差

参数估计练习题

第七章参数估计练习题一．选择题 1.估计量的含义是指（） A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C．总体参数的名称 D．总体参数的具体取值 2．一个95%的置信区间是指（） A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C. 在用同样方法构造的总体参数的多个区间中，有95%的区间包含该总体参数。 D.在用同样方法构造的总体参数的多个区间中，有95%的区间不包含该总体参数。 %的置信水平是指（） A.总体参数落在一个特定的样本所构造的区间内的概率是95% B．在用同样方法构造的总体参数的多个区间中，包含总体参数的区间比例为95% C．总体参数落在一个特定的样本所构造的区间内的概率是5% D．在用同样方法构造的总体参数的多个区间中，包含总体参数的区间比例为5% 4.根据一个具体的样本求出的总体均值的95%的置信区间（） A．以95%的概率包含总体均值 B．有5%的可能性包含总体均值 C.一定包含总体均值 D．要么包含总体均值，要么不包含总体均值 5. 当样本量一定时，置信区间的宽度（） A.随着置信水平的增大而减小 B. .随着置信水平的增大而增大 C．与置信水平的大小无关 D。与置信水平的平方成反比 6.当置信水平一定时，置信区间的宽度（） A.随着样本量的增大而减小 B. .随着样本量的增大而增大 C．与样本量的大小无关 D。与样本量的平方根成正比 7.在参数估计中，要求通过样本的统计量来估计总体参数，评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为（） A．无偏性 B.有效性 C. 一致性 D. 充分性 8. 置信水平（1-α）表达了置信区间的（） A．准确性 B. 精确性 C. 显著性D. 可靠性 9. 在总体均值和总体比例的区间估计中，边际误差由（） A．置信水平决定 B. 统计量的抽样标准差确定 C. 置信水平和统计量的抽样标准差 D. 统计量的抽样方差确定 10. 当正态总体的方差未知，且为小样本条件下，估计总体均值使用的分布是（） A.正态分布 B. t分布 C.χ2分布 D. F分布 11. 当正态总体的方差未知，且为大样本条件下，估计总体均值使用的分布是（）

应用统计学试题及答案

应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

二、单项选择题（每题1分，共10分） 1．重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2．根据分组数据计算均值时，利用各组数据的组中值做为代表值，使用这一代表值的假定条件是（）。 A．各组的权数必须相等 B．各组的组中值必须相等 C．各组数据在各组中均匀分布 D．各组的组中值都能取整数值 3．已知甲、乙两班学生统计学考试成绩：甲班平均分为70分，标准差为分；乙班平均分为75分，标准差为分。由此可知两个班考试成绩的离散程度（） A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4．某乡播种早稻5000亩，其中20%使用改良品种，亩产为600公斤，其余亩产为500公斤，则该乡全部早稻平均亩产为（）公斤公斤公斤公斤 5．时间序列若无季节变动，则其各月（季）季节指数应为（） A.100% % % % 6．用最小平方法给时间数列配合直线趋势方程y=a+bt，当b＜0时，说明现象的发展趋势是（） A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7．某地区今年和去年相比商品零售价格提高12%，则用同样多的货币今年比去年少购买（）的商品。 8．置信概率表达了区间估计的（） A.精确性 B.可靠性 C.显着性 D.规范性 9．H 0:μ=μ ，选用Z统计量进行检验，接受原假设H 的标准是（） A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下，你认为哪个回归方程可能是正确的（） A.y=125-10x =-50+8x =150-20x =-15-6x 三、多项选择题（每题2分，共10分） 1．抽样调查的特点有（）。 A．抽选调查单位时必须遵循随机原则 B．抽选出的单位有典型意义 C．抽选出的是重点单位 D．使用部分单位的指标数值去推断和估计总体的指标数值 E．通常会产生偶然的代表性误差，但这类误差事先可以控制或计算 2.某种产品单位成本计划比上年降低5%，实际降低了4%，则下列说法正确的是（） A.单位成本计划完成程度为80% B. 单位成本计划完成程度为% C.没完成单位成本计划 D.完成了单位成本计划 E.单位成本实际比计划少降低了1个百分点 3．数据离散程度的测度值中，不受极端数值影响的是（） A.极差 B.异众比率 C.四分位差 D.标准差 E.离散系数

参数估计习题参考答案2014

参数估计习题参考答案班级：姓名：学号：得分一、单项选择题： 1. 区间估计表明的是一个 ( B ) （A ）绝对可靠的范围（B ）可能的范围（C ）绝对不可靠的范围（D ）不可能的范围 2. 甲乙是两个无偏估计量，如果甲估计量的方差小于乙估计量的方差，则称（ D ）（A ）甲是充分估计量（B ）甲乙一样有效（C ）乙比甲有效（D ）甲比乙有效 3. 设总体服从正态分布，方差未知，在样本容量和置信度保持不变的情形下，根据不同的样本值得到总体均值的置信区间长度将（ D ）（A ）增加（B ）不变（C ）减少（D ）以上都对 4.设容量为16人的简单随机样本，平均完成工作时间13分钟，总体服从正态分布且标准差为3分钟。若想对完成工作所需时间构造一个90%置信区间，则（ A ） A.应用标准正态概率表查出z 值 B.应用t-分布表查出t 值 C.应用二项分布表查出p 值 D.应用泊松分布表查出λ值 5． 100(1-α)%是（ C ） A.置信限 B.置信区间 C.置信度 D.可靠因素 6．参数估计的类型有（ D ）（A ）点估计和无偏估计（B ）无偏估计和区间估计（C ）点估计和有效估计（D ）点估计和区间估计 7．在其他条件不变的情况下，提高抽样估计的可靠程度，其精度将（C ）（A ）增加（B ）不变（C ）减少（D ）以上都对二、计算分析题 1、12,, ,n X X X 是总体为2 (, ) N μσ的简单随机样本.记1 1n i i X X n ==∑，2 21 1()1n i i S X X n ==--∑，221T X S n =-.请证明 T 是2 μ的无偏估计量. 解 (I) 因为2 (,)X N μσ，所以2 (, )X N n σμ，从而2 ,E X DX n σμ= = ．因为 221()()E T E X S n =-221 ()E X E S n =- 221()()DX E X E S n =+-222211 n n σμσμ=+-= 所以，T 是2μ的无偏估计设总体X ~N （μ，σ 2 ），X 1，X 1，…，X n 是来自X 的一个样本。试确定常数c 使2 1 1 21 )(σX X c n i i i 为∑-=+-的无偏估计。解：由于

应用统计学试题和答案分析

六、计算题：（要求写出计算公式、过程，结果保留两位小数，共4题，每题10分） 1、某快餐店对顾客的平均花费进行抽样调查，随机抽取了49名顾客构成一个简单随机样本，调查结果为：样本平均花费为元，标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间；（φ（2）=）49=n 是大样本，由中心极限定理知，样本均值的极限分布为正态分布，故可用正态分布对总体均值进行区间估计。已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据，得该快餐店顾客的总体平均花费数额%的置信区间为（，） 3 要求：①、利用最小二乘法求出估计的回归方程；②、计算判定系数R 。附：10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题解 ① 计算估计的回归方程： ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为：y ) =+x ② 计算判定系数： 4 计算下列指数：①拉氏加权产量指数；②帕氏单位成本总指数。 4题解： ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题（每小题1分，共10题） 1、我国人口普查的调查对象是，调查单位是。 2、___ 频数密度 =频数÷组距，它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用饼图条图图来显示。 4、某百货公司连续几天的销售额如下：257、276、297、252、238、310、240、236、265，则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元，2005年3季度完成的GDP=36亿元，则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%，职工人数增加了2%，则该企业工资总额增长了 % 。 7、对回归系数的显着性检验，通常采用的是 t 检验。 8、设置信水平=1-α，检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲＞σ乙，x 甲＞x 乙，由此可推断 ( )