简答题
1、矩估计的推断思路如何?有何优劣?
2、极大似然估计的推断思路如何?有何优劣?
3、什么是抽样误差?抽样误差的大小受哪些因素影响?
4、简述点估计和区间估计的区别和特点。
5、确定重复抽样必要样本单位数应考虑哪些因素?
计算题
1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准
2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少?
3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少?
4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公
顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973)
5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下:
试推断:
(1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围
(2)以同样条件推断其合格率的可能范围
(3)比较两车间产品质量
6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求:
(1)计算样本合格品率及其抽样平均误差
(2)以95.45%的概率保证程度对该批产品合格品率和合格品数量进行区间估计。
(3)如果极限误差为2.31%,则其概率保证程度是多少?
7、某单位按重复抽样方式随机抽取40名职工,对其业务考试成绩进行检查,资料如下:
6889 88 84 86 87 75 73 72 68
7582 99 58 81 54 79 76 95 76
7160 91 65 76 72 76 85 89 92
6457 83 81 78 77 72 61 70 87
(1)根据上述资料按成绩分成以下几组:60分以下、60-70分、70-80分、80-90分、90-100分。整理成变量分配数列。
(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围。
(3)其他条件不变,将允许误差缩小一半,应抽取多少名职工?
参考答案
简答:
1、矩估计属于常用点估计法的一种,它的推断思路是认为样本矩等于总体矩。这种推断方法的优势在于计算简便,适用范围广;其缺陷在于手段相对粗糙,估计结果不唯一,且在据镇估计体系内,无法判断不同估计量的优劣。
2、极大似然估计认为在一次单一的抽样实验中,该样本表现在所有可能的样本中,是出现概率相对最大的一个,通过对其概率的极值计算推断总体参数。这种推断方法的缺陷在于,适用面较窄,对于某些分布形式或参数无效;其优势则在于计算相对精密,估计效果唯一。
3、抽样误差实际包含两个概念:一是指抽样平均误差,在数理上表现为样本平均数的标准差别,计算上表现为n
σ,仅具有理论意义;另一个是指抽样极限误差,在区间估计中表现为估计量的浮动额度,计算上表现为n
,其值由允许的置信度、描
Zσ
α
述总体离散程度的标准差,和样本容量三个因素共同决定。
4、所谓点估计,是指估计结果表现为点值的估计方法,常用的有矩法和极大似然法;区间估计的结果则表现为域值。除了结果表现形式上的区别外,两者对结果的评价方式也不同。点估计只能够一些标准评价估计量的构造方式的优劣,不能对具体的一次估计结果进行评价;区间估计则可以对该次估计具体结果的可靠程度进行度量,且结果的可信度与于估计的精确度之间存在某种
非数量性的互补。两者之间也存在一定的联系:区间估计是以点估计量和中心,向数轴两边等距离扩展,形成域值。
5、重复抽样条件下,能够满足指定精度和信度要求的样本最低容量计算公式为22)(?=σ
αZ n ,式中可见,影响因素有三:分别为由要求信度决定的正态临界值2αZ 、描述总体离散度的标准差σ,
和要求的估计精度?。
计算:
1、两种点估计技术:
泊松分布: 矩估计:x e k x
x E k ===∑-λλλ!)(
极大似然估计:
极大似然函数为λλn k k L i i --=∑∑!ln ln ln
令其导数为0有0=-∑n k i λ,解得k =λ
正态分布: 矩估计:x x xf x E ===?μ)()(;2222)(1)(x x n
Ex x E -==-=σσ 极大似然估计:
极大似然函数为222)(ln 2ln 2ln σ
μσπ∑
----=x n n L
令其导数为0有02=-∑σμx 和0)(32=-+-∑σμσx n
两方程联立解得x =μ;n x x ∑-=22)(σ
2、不重复抽样下总体平均数的区间估计:
)11000100100010036.4896.150()1(222
--??±=--±∈N n N n s Z x αμ 3、样本容量的确定:
25)401002()(222=?=?=σ
αZ n
4、总体平均数的区间的概率计算:
9545.0)22()25
12009000948025120090008520(=≤≤-=-≤-≤-Z P n s x P μ 5、总体平均数和比例的区间估计、双总体平均数比例差的估计:
(1)两个车间数据拟合(加权算术平均)有
567.1)()(212211=++=n n x n x n x ;453.0)()(2122
22112=++=n n s n s n s )60453.02567.1()(1,2?±=±∈-n
s t x n αμ
(2)93.0)()(212211=++=n n p n p n p
)60
)93.01(93.096.193.0())1((2-??±=-±∈n p p Z p P α (3)))1()1()((2
221111,2121n p p n p p t p p P P n -+-±-∈--α 6、总体比例的参数、区间估计和概率计算:
(1)此处的样本合格品率明显是指此次试验得到的实证数据,因此有95.0200190==p ;抽样平均误差则是一个理论概念,描述的是样本比例作为一个随机变量的标准差,在重复抽样条件下其
计算:200)95.01(95.0)1(2-?=-=n p p p σ;不重复抽样条件下需要有修正因子:1
20002002000200)95.01(95.01)1(2--?-?=--?-=N n N n p p p σ。 (2)重复)20005.095.0295.0())1((2??±=-±∈n p p Z p P α 不重复)1
2000200200020005.095.0295.0()1)1((2--???±=--?-±∈N n N n p p Z p P α 无论重复或不重复,合格品数量均为NP 。
(3)按题意0231.0)1(=-n p p Z α 则05.095.02000231.0)1(0231.02??=-=p p n Z α,查表可得α-1
7、数据整理、平均数区间估计和样本容量确定
(2)根据整理后的变量数列,以95.45%的概率保证程度推断全体职工业务考试成绩的区间范围。
(3)其他条件不变,将允许误差缩小一半,应抽取多少名职工?
根据分组数据计算,有77=x ,1112=s
)40111277()(2?±=±∈n s
Z x αμ 22)2(?=s
Z n α,由式中可见,若要求允许误差减半,则要求样本容量
应比原来扩大4倍。
北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分 比为 A. –5% B. –4.76% C. –33.3% D. 3.85%
6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公 斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间
简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公
顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差
第七章参数估计练习题 一.选择题 1.估计量的含义是指() A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体取值 2.一个95%的置信区间是指() A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。 %的置信水平是指() A.总体参数落在一个特定的样本所构造的区间内的概率是95% B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95% C.总体参数落在一个特定的样本所构造的区间内的概率是5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5% 4.根据一个具体的样本求出的总体均值的95%的置信区间() A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 5. 当样本量一定时,置信区间的宽度() A.随着置信水平的增大而减小 B. .随着置信水平的增大而增大 C.与置信水平的大小无关 D。与置信水平的平方成反比 6.当置信水平一定时,置信区间的宽度() A.随着样本量的增大而减小 B. .随着样本量的增大而增大 C.与样本量的大小无关 D。与样本量的平方根成正比 7.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为() A.无偏性 B.有效性 C. 一致性 D. 充分性 8. 置信水平(1-α)表达了置信区间的() A.准确性 B. 精确性 C. 显著性D. 可靠性 9. 在总体均值和总体比例的区间估计中,边际误差由() A.置信水平决定 B. 统计量的抽样标准差确定 C. 置信水平和统计量的抽样标准差 D. 统计量的抽样方差确定 10. 当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是() A.正态分布 B. t分布 C.χ2分布 D. F分布 11. 当正态总体的方差未知,且为大样本条件下,估计总体均值使用的分布是()
应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】
二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值 3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为分;乙班平均分为75分,标准差为分。由此可知两个班考试成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() 公斤公斤公斤公斤 5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% % % % 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显着性 D.规范性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|
参数估计习题参考答案 班级: 姓名: 学号: 得分 一、单项选择题: 1. 区间估计表明的是一个 ( B ) (A )绝对可靠的范围 (B )可能的范围 (C )绝对不可靠的范围 (D )不可能的范围 2. 甲乙是两个无偏估计量,如果甲估计量的方差小于乙估计量的方差,则称 ( D ) (A )甲是充分估计量 (B )甲乙一样有效 (C )乙比甲有效 (D )甲比乙有效 3. 设总体服从正态分布,方差未知,在样本容量和置信度保持不变的情形下,根据不同的样本值得到总体均值的置信区间长度将 ( D ) (A )增加 (B )不变 (C )减少 (D )以上都对 4.设容量为16人的简单随机样本,平均完成工作时间13分钟,总体服从正态分布且标准差为3分钟。若想对完成工作所需时间构造一个90%置信区间,则 ( A ) A.应用标准正态概率表查出z 值 B.应用t-分布表查出t 值 C.应用二项分布表查出p 值 D.应用泊松分布表查出λ值 5. 100(1-α)%是 ( C ) A.置信限 B.置信区间 C.置信度 D.可靠因素 6.参数估计的类型有 ( D ) (A )点估计和无偏估计(B )无偏估计和区间估计 (C )点估计和有效估计(D )点估计和区间估计 7.在其他条件不变的情况下,提高抽样估计的可靠程度,其精度将 (C ) (A )增加 (B )不变 (C )减少 (D )以上都对 二、计算分析题 1、12,, ,n X X X 是总体为2 (, ) N μσ的简单随机样本.记1 1n i i X X n ==∑,2 21 1()1n i i S X X n ==--∑,221T X S n =-.请证明 T 是2 μ的无偏估计量. 解 (I) 因为2 (,)X N μσ,所以2 (, )X N n σμ,从而2 ,E X DX n σμ= = . 因为 221()()E T E X S n =-221 ()E X E S n =- 221()()DX E X E S n =+-222211 n n σμσμ=+-= 所以,T 是2μ的无偏估计 设总体X ~N (μ,σ 2 ),X 1,X 1,…,X n 是来自X 的一个样本。试确定常数c 使2 1 1 21 )(σX X c n i i i 为∑-=+-的无偏估计。 解:由于
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数
= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )
应用统计学概念整理 第一章:导论 1.只能归类于某一类别的非数字型数据称为分类数据 2.只能归于某一有序类别的非数字型数据称为顺序数据 3.按数字尺度测量的观测值称为数值型数据 4.包含所研究的全部个体的集合称为总体 5.从总体中抽取的一部分的元素的集合称为样本 6.用来描述总体特征的的概括性数字度量称为参数 7.用来描述样本特征的概括性数字度量称为统计量 8.说明事物类别的一个名称称为分类变量 9.说明事物有序类别的一个名称称为顺序变量 10.说明事物数字特征的一个名称称为数值型变量 11.只能取可数值的变量称为离散型变量 12.可以在一个或多个区间中取任何值的变量称为连续型变量 第二章:数据收集 1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征 的数据收集方法,称为抽样调查。 2.为特定目的而专门组织的全面调查称为普查 3.按照国家有关法律规定,自上而下地统一布置,自下而上地逐级提供基本数据的调查方 式称为统计报表 第三章:数据的图表展示 1.落在某一特定类别或组中的数据个数,称为频数 2.把各个类别及其落在其中的相应频数全部列出,并用表格形式表示出来,称为频数分布 3.一个样本或总体中各个部分的数据与全部数据之比,称为比例 4.将比例乘以100得到的数值,称为百分比或百分数,用%表示 5.样本或总体中各不同类别数值之间的比值,称为比率 6.分类数据的图示:条形图,pareto图,对比条形图,饼图 7.将各有序类别或组的频数逐级累加起来得到的频数称为累计频数 8.将各有序类别或组的百分比逐级累加起来称为累计频率 9.顺序数据的图示:累计频数分布图,环形图 10.根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组 11.分组后的数据称为分组数据 12.把变量值作为一组称为单变量值分组 13.将全部变量值一次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组 14.在组距分组中,一个组的最小值称为下限,最大值称为上限 15.一个组的上限与下限的差称为组距 16.各组组距相等的组距分组称为等距分组 17.各组组距不相等的组距分组称为不等距分组 18.每一组的下限和上限之间的重点值称为组中值
应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。
A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学
北京工业大学经济与管理学院2007-2008 年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1C2B3A4C5B6B7A8A9C10C 一.单选题(每题 2 分,共 20 分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A50B8C0.02D4 3.某连续变量数列,其末组为“ 500 以上”。又知其邻组的组中值为 480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、 9%,则最后一期的定基增长速度为 A .5%× 7%× 9% B. 105% × 107%× 109% C.(105%× 107%× 109%)- 1 D. 3 105%107%109%1 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品 ,则物价增 (减 )变化的百分比为 A. –5% B. –4.76% C. –33.3% 6.对不同年份的产品成本配合的直线方程为 D. 3.85% ? y 280 1.75x ,回归系数b=-1.75表示 A.时间每增加一个单位,产品成本平均增加 1.75 个单位 B.时间每增加一个单位,产品成本平均下降 1.75 个单位 C. 产品成本每变动一个单位,平均需要 1.75 年时间 D. 时间每减少一个单位,产品成本平均下降 1.75 个单位 7.某乡播种早稻5000 亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8. 甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间 : x =70 件,=5.6 件乙车间 :x =90件,=6.3 件 哪个车间日加工零件的离散程度较大: A 甲车间 B.乙车间 C.两个车间相同 D.无法作比较 9.根据各年的环比增长速度计算年平均增长速度的方法是
参数估计习题参考答案
参数估计习题参考答案 班级:姓名:学号:得分 一、单项选择题: 1、关于样本平均数和总体平均数的说法,下列正确的是( B ) (A)前者是一个确定值,后者是随机变量(B)前者是随机变量,后者是一个确定值 (C)两者都是随机变量(D)两者都是确定值 2、通常所说的大样本是指样本容量( A ) (A)大于等于30 (B)小于30 (C)大于等于10 (D)小于10 3、从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,当样本容量增大时,样本均值的标准差将( B ) (A)增加(B)减小(C)不变(D)无法确定 4、某班级学生的年龄是右偏的,均值为20岁,标准差
为 4.45.如果采用重复抽样的方法从该班抽取容量为100的样本,那么样本均值的分布为( A ) (A)均值为20,标准差为0.445的正态分布(B)均值为20,标准差为4.45的正态分布 (C)均值为20,标准差为0.445的右偏分布(D)均值为20,标准差为4.45的右偏分布 5. 区间估计表明的是一个( B ) (A)绝对可靠的范围(B)可能的范围(C)绝对不可靠的范围(D)不可能的范围 6. 在其他条件不变的情形下,未知参数的1-α置信区间,( A ) A. α越大长度越小 B. α越大长度越大 C. α越小长度越小 D. α与长度没有关系 7. 甲乙是两个无偏估计量,如果甲估计量的方差小于乙估计量的方差,则称( D ) (A)甲是充分估计量(B)甲乙一样有效(C)乙比甲有效(D)甲比乙有效 8. 设总体服从正态分布,方差未知,在样本容量和置信度保持不变的情形下,根据不同的样本值得到总体均
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数: