、单项选择题(每小题 2分,共40分)
1要了解某市工业企业生产设备情况,则统计总体是 A.该市工业企业的全部生产设备 B.该市每一个工业企业
C.该市工业企业的某一台设备
D.该市全部工业企业
2 ?若甲单位的平均数比乙单位的平均数小,但甲单位的标准差比乙单位的标准差大, 则 (B )
A.甲单位的平均数代表性比较大
B. 甲单位的平均数代表性比较小
C.两单位的平均数一样大
D.
无法判断
3.—个统计总体 (C )
A.只能有一个标志
B.只能有一个指标
C.可以有多个标志
D.可以有多个指标
4.品质标志的表现形式是
(D )
A.绝对数
B.相对数
C.平均数
D.文字
5.统计工作的各项任务归纳起来就是两条
(
A )
A.统计调查和统计分析
B.统计设计和统计研究
C.统计预测和统计
D.统计服务和
统计监督
6.对上海港等十多个沿海大港口进行调查, 以了解全国的港口吞吐量情况,则这种调查方 式是(B )
A.普查
B. 重点调查
C.典型调查
D.抽样调查
7.某连续变量分为五组:第一组为 40? 50;第二组为 50?60;第三组为 60?70;第四组
为70?80;第五组为80以上。依习惯上规定 (C ) A. 50在第一组,70在第四组 B. 60在第二组,80在第五组
C. 70在第四组,
80在第五组
D. 80在第四组,50在第二组
&某城市为了解决轻工业生产情况,要进行一次典型调查,在选送调查单位时,应选择生 产情况()的企业。 (D )
该组的分组标志是
A.性别 C.文化程度
10?变量数列中各组频率的总和应该
A.小于1
C.大于1
A.较好
B.中等
C.较差
D.好、中、差 9 ?某厂的职工工人人数构成如下表所示
(A )
11 ?已知变量X 与Y 之间的关系如下图所示,则其相关系数可能为(C )
A. 0.1
B. 0.9
C. -0.9
D. -0.1
12 . 在完成了构造与评价一个回归模型之后,我们可
以
(D )
A.估计未来所需样本的容量
B.计算相关系数和可决系数
C.以给定的因变量的值估计自变量的值
D.以给定自变量的值估计因变量的值 13.回归直线方程,其中x 为自变量,y 为因变量,则
B.可以根据y 推断x
D.可以互相推断
若样本容量n 和置信度1-a 均不变,则对
(B ) B.不变
D.变低
H 1,则称()为犯第二类错误 (C ) B. H 0为真,拒绝比 D. H 0不真,拒绝H 。
(D )
B.直线截距a D.可决系数R 2
(A )
B.圆形图 D.直方图
B.次数最多的变量值
D.最大的变量值
(C )
B.非系统性误差 D.偏差 (D )
A. Z 检验
2
C. 'p
检验
A.可以根据x 推断y C.不能推断
14.设总体X 服从正态分布「严「I , ■:■ 于不同的样本观测值,总体均值
卩 A.无法确定 C.变高
15?在假设检验中,原假设 H o ,备择假设
A. H o 为真,接受比
C. H 0不真,接受H 。
16 ?评价回归直线方程拟合优度如何的指标有
A.回归系数b C.相关系数r
17 ?欲以图形显示两变量 X 与Y 的关系,最好创建
A.散点图 C.条形图
18 ?众数是
(B )
A.最多的变量值 C.最多的次数
19 .在抽样调查中,无法避免的误差是
A.登记性误差 C.抽样误差
未知。
的区间估计的精确度
B. F 检验
D. T 检验
、判断题(每小题2分,共10 分)
1.所谓上组限不在内”原则,是对连续型变量分组采用重合组限时,习惯上规定一般只包
括本组下限变量值的单位,而当个体的变量值恰为组的上限时,不包括在本组。(V)
2.当H1为真时拒绝H1,犯了纳伪”错误。(V
3?假设检验范两类错误的概率可以同时控制。(存
4.X、Y两个变量之间,既可由Y对X回归,也可由X对Y回归,于是可产生两个回归系数。(>)
5.按检验假设的形式,可以把假设检验分为左侧检验与右侧检验。(>
三、计算分析题(共计40分)
1.一个灯泡制造商的广告上说,他们的长寿命灯泡平均能持续使用5000小时,为了验证
这种说法,统计人员随机抽取了100个灯泡,测量每个灯泡的使用时间。在5%的显著性水
平下,我们能否认为这种说法是正确的?请按顺序回答下列问题:
3 (2分)用原假设与备择假设描述该检验问题。
H0 :平均寿命达到5000小时H1 :平均寿命不等于5000小时
4 (4分)定义在该检验中,可能发生的两类错误。
第一类弃真错误:平均寿命真实结果等于5000小时,但检验结论却认为
不等于5000小时。
第二类纳伪错误:平均寿命真实情况是不等于5000小时,但检验结论却
认为等于5000小时。
Statistics Std Error r
cost^Mean*31810.1563^ -40.43077^
95% Confidence Interval Lower BouncP1729.361B^
forMean^Upper Sound*1 51890.9507^
5% Trimmed Mean*31003.2936^
Variance^104617.436^p
4Std. Deviation*3玄44b1 阳
Minimum^M250.0C^
MaximurrM32600.00+1
Stow熾仪[328^.299*3
Kurtosis#3-.472^590+3
(1) ( 2分)当置信水平为95 %时,试确定度假费用的点估计量。(1810.1563)
(2) ( 4分)在95%的置信水平下,抽样误差为多少?(1890.9507-1810.1563=80.7944)
(3) ( 4分)确定每人最近度假费用95 %的置信区间。[1729.3618, 1890.9507]
3.某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值在0?10分,
值越高表示潜在购买力越高。根据下列检验报告,回答如下问题:
5 ( 4分)由检验报告给出的检验的结果,并对该广告给予评价。
结果显示sig值0.217大于显著性水平0.05,所以广告并未显著提高潜在购买力。
4.从某大学统计系的学生中随机抽取16人,对数学和统计学的考试成绩(单位:分)进行
调查,结果如下:
Paired Differences*
Mean*3
std.
Devi ation*3
std Error
Mean*5
95% Confidence
Interval or the
Difference*7
Lower*3Uppers
Pair 佃广告后广告
前心
■^uGSSO
O*
1.30247*..46049+-1713 妙.46339+-1.357*217^
Paired Samples Test^
Sig 肱
七iled护
Model*3
R Square** Adjusted R
Square-
Std Error of
the Estimates
7B5(a>
.616- 538+
B50939*
Cxffi Models
?Q 口目刼。處[Qi.轰a
Coef fl clients^
Standardized Coefficients^
Sig*
羊
Std. Errors
Beta*3
p
Constant}*
5.422* 15.062*
.360*
724+
数学成绩卩
.943* .199^
78
4 738*
OOCh
(1) (2分)根据这些数据,绘制出如下散点图,请说明这两个变量之间存在什么关系?
根据散点图可以看出两个变量之间存在一定的线性关系,并且是正相关。
(2) ( 4分)拟合统计学考试成绩对数学考试成绩的回归直线。
根据回归分析报告, 可以得到回归直线方程: Y = 5.422+0.943X (其中Y :
统计成绩X :数学成绩)
(3) ( 2分)估计的回归方程对数据的拟合好吗?请作出解释。
根据拟和优度指标 R Square 值:0.616,拟和效果不够好。
(4) (2分)t 检验是否表明在数学成绩和统计学成绩之间存在显著的关系?你的结论是什 么?取 a =0.05。
T 检验统计量的Sig 值小于显著性水平,故变量间的线性关系是显著的。
(5) ( 4分)对于数学考试成绩为 80分的学生,估计他的统计学考试成绩。( 80.862 )
四、简答题(共计 25分)
1. (4分)美国商务部报告说 1994年申请马尔科姆国家质量奖的公司中,
23家来自于大型
制造业公司,18家来自大型服务公司,30家来自小企业。要求:
(1 )企业类型是定性变量还是定量变量? (定性变量)
(2 )来自小企业的申请的百分比是多少?
(42% )
2. (6分)一个农民在四个果园中种植了苹果树,这些果园分别位于农场的不同地方。每个
1加血— co 一
的站一
70. CO 一
&0 C0 一
50JOO 一
50.00
60. 00
70. oo so. on
90.00
果园种植了200棵苹果树,为了跟踪这些果树的情况,农民对它们按1至800进行了编号,
现在,这名农民相俩界这些苹果树是否受到某类昆虫的侵害,为此他并没有检查所有800
棵苹果树的情况,而是决定从中选取80棵果树进行检查,他打算采用以下三种抽样方案:
方案A :从800棵苹果树中随机抽取80棵果树。
方案B :在编号为1至10的苹果树中随机抽取1棵果树,然后每隔10棵果树抽取1棵果树。方案C :从4个果园中随机抽取2个果园,并从被挑中的每个果园中随机抽取40棵果树。
请指出上述三个方案分别为哪三种抽样方式。
分别为:A (简单随机抽样方法) B (系统抽样)C (分群抽样)