当前位置:文档之家› 统计学综合练习二

统计学综合练习二

统计学综合练习二
统计学综合练习二

综合练习二:相关与回归分析复习提纲

相关分析

A.变量之间的依存分为两种:

a)确定的关系——函数关系

b)不确定的关系——相关关系

B.相关关系可以用散点图直观的描述

C.相关关系有若干种类,它们是哪些?

D.相关分析用来测度变量之间是否存在相关关系,并确定它们相关的方向和程

度的一个分析方法,两个变量在关系上是对等的。

E.总体相关系数总是客观存在但又未知的,而样本相关系数是随着样本而变化

的可测得数值,对样本相关是否能够很好估计总体相关系数,我们可以通过t统计量进行显著性检验。

回归分析

?回归分析的目的是要根据已知的或者固定的自变量的数值,去估计因变量的

总体平均值。根据变量个数的多少,它可以分为一元回归和多元回归;根据模型的形状可以分为线性回归和非线性回归。

?线性回归模型在各项基本假设满足的条件下,用普通最小二乘法去估计的参

数是总体回归系数的最佳线性无偏估计。

?一元线性回归分析

?一元线性回归的模型是什么?普通最小二乘法估计的参数怎样运算?

? 样本回归系数的估计量是随着样本而变动的随机变量,因此,需要对样本回归系数的显著性进行检验。

? 可决系数是衡量回归方程拟合优劣的指标,它是通过对因变量离差平方和的分解计算而来的,其公式是什么?

? 修正的可决系数的公式是什么?

? 利用回归模型可以进行点预测和区间预测,一元回归中,置信度为(1-α)的预测区间是什么?

? 多元线性回归分析

要求可以读懂EXCEL 输出的结果,能做出正确的结论。

? 非线性回归分析

要求学会几种常用的非线性模型化为线性模型的方法,并能够做出回归模型。

一、单项选择题

1、在线性回归模型中,随机误差μ被假定服从 ( )

A 、 正态分布

B 、 二项分布

C 、 指数分布

D 、 t 分布

2、两变量x 与y 的相关系数为0.8,则其回归直线的判定系数为 ( )

A 、0.5

B 、0.8

C 、0.64

D 、0.9

3、两变量间的线性相关系数为0,表示: ( )

A 、完全相关

B 、无关系

C 、不完全相关

D 、不存在线性关系

4、产量x (千件)与单位成本y(元)的回归方程为x y

277?-=,表明产量每提高1000件,单位成本平均 ( )

A 、增加2元

B 、增加2000元

C 、减少2000元

D 、减少2元

5、对两变量的散点图拟合最好的回归线,必须满足一个基本条件是 ( )

A 、)?(∑-

y y 最大 B 、)?(∑-y y 最小

C 、∑-2)?(y

y 最小 D 、∑-2)?(y y 最大 6、两组数据,如果相关系数很大,那么 ( )

A 、 一定存在相关关系

B 、不一定存在相关关系

C 、一定存在因果关系

D 、不一定存在因果关系

7、评价回归直线方程拟合优度如何的指标有 ( )

A 、 回归系数

B 、 直线截距

C 、判定系数

D 、相关系数

8、回归直线方程dy c x +=,其中,y 为自变量,则 ( )

A 、 可根据y 推断x

B 、可根据x 推断y

C 、可相互推断

D 、不能进行推断 9、已知回归直线方程的判定系数2R =0.81, 则相关系数为 ( )

A 、0.9

B 、 –0.9

C 、-0.9或0.9

D 、无法计算

10、下列中属于负相关关系的是 ( )

A 、身高和体重

B 、正常商品的价格与供给量

C 、 产量与单位成本

D 、广告费用与销售收入

二、多项选择

1、简单线性回归分析的特点是 ( )

A 、两个变量之间不是对等关系

B 、回归系数有正负号

C 、两个变量都是随机的

D 、利用一个回归方程,两个变量可以互相推算

E 、有可能求出两个回归方程

2、反映一元线性回归方程x

b a y ??+=好坏的指标有 ( ) A 、相关系数 B 、判定系数 C 、标准误差 D 、回归系数 E 、其它 3、对相关系数r 进行显著性检验,0:0

=ρH ,结果拒绝原假设,说明( ) A 、两变量不相关 B 、事实上两变量一定相关

C 、不能否认两变量存在线性相关

D 、两变量相关

E 无正确选项

4、一元线性回归分析中,回归系数b 可以表示 ( )

A 、两个变量之间相关关系的密切程度

B 、两个变量之间的相关关系的方向

C 、当自变量增减一个单位时,因变量平均增减的量

D 、当因变量增减一个单位时,自变量平均增减的量

E 回归模型的拟合程度

5、关于相关分析和回归分析,下列说法正确的是 ( )

A 、 回归分析可用于估计和预测

B 、相关分析研究的是变量之间的相互依存关系的密切程度

C 、回归分析中自变量和因变量可以互相推导并进行预测

D 、相关分析需区分自变量和因变量

E 、 相关分析是回归分析的基础

三、计算题

1、 两变量:温度X 和冷饮销售量Y ,已知:

∑=4.9X ∑

=959Y ∑=28.92X ∑=8.924XY

935692=∑Y n=10

(一)计算相关系数,并进行显著性检验;

(二)用最小平方法拟合线性回归方程;

(三)评价拟合优度;

(四)计算标准误差并对回归系数进行检验;

(五)预测温度为1摄氏度时,冷饮销售量的95%的预测区间;

2、已知12户居民家庭收入与储蓄的有关数据。

X :月收入(百元);Y :月储蓄(百元)。ΣX=254,

ΣY=92,ΣX 2=5950,ΣY 2=794,ΣXY=2164。

要求:

(1)计算相关系数;

(2)用最小二乘法求回归模型并解释经济含义;

(3)计算可决系数;

(4)计算回归估计标准差;

(5)对回归系数的显著性进行检验(显著水平5%);

(6)若x 0=40(百元),置信度为95%时,其预测区间是多少?

(1)计算月人均销售额与利润率的相关系数

(2)用最小二乘法求出利润率对于月人均销售额的回归直线方程;

(3)计算估计的标准误和判定系数;

(4)在5%的显著性水平下对回归系数进行显著性检验;

(5)如果某公司月人均销售额为2万元,用此回归模型对其销售利润率进行点估计和区间估计,要求置信度为95%

管理统计学模拟卷及答案

《管理统计学》模拟试题及答案 一、单选题(每小题3分,共30分) 1、对某变量的取值分为五组:第一组为10~20,第二组20~40,第三组为40~60,第四组为60~80,第五组为80以上。习惯上规定()。 A)20在第一组,60在第四组B)20在第二组,80在第四组 C)40在第三组,80在第五组D)60在第三组,80在第四组 2、设从均值为200、标准差为50的总体中,抽取容量为100的样本,用样本均值X 来估计总体均值,则正确的是()。 A)每一个X都是200;B)X的标准差是50; C)X的数学期望是100;D)X的标准差是5。 3、下面关于假设检验的陈述中,正确的是()。 A)假设检验中如果结果拒绝了原假设,就说明备择假设一定是对的。 B)假设检验中如果接受了原假设,则原假设就一定是对的。 C)当拒绝原假设时,只能认为接受它的根据尚不充分,而不能认为它绝对错误。 D)假设检验中如果接受了原假设,则备择假设一定错误。 4、下列关于方差分析的陈述中,错误的是()。 A)检验若干总体的均值是否相等的一种统计方法 B)检验若干总体的方差是否相等的一种统计方法。 C)只要有两个总体的均值不相等,就拒绝原假设。 D)F检验值等于平均组间方差除以平均组内方差。 5、离散指标中受极端值影响最大的是()。 A)平均差B)标准差 C)全距D)方差 6、某企业2006年1~4月初的商品库存额如下,(单位:万元)。 月份 1 2 3 4 月初库存额20 24 18 22 则第一季度的平均库存额为()。 A)(20+24+18+22)/4 B)(20+24+18)/3 C)(10+24+18+11)/3 D)(10+24+9)/3 7、上题中,如果把月初库存指标换成当月企业利润额,则第一季度的平均利润额为()。 A)(20+24+18+22)/4 B)(20+24+18)/3 C)(10+24+18+11)/3 D)(10+24+9)/3 1

医学统计学期末考试模拟题(三)

《医学统计学》期末模拟考试题(三)一.是非题(每题1分,共20分)1.评价某人的某项指标是否正常,所用的范围是。()t2.配对资料若用成组检验处理,就降低了统计效率。() 3.因为两类错误的存在,所以不能凭假设检验的结果下结论。() 4.随机区组设计的区组变异和误差两部分相当于完全随机设计方差分析的组内变异。()P5.抗体滴度资料经对数转换后可做方差分析,若方差分析得<0.05,则可认为实测数据的各总体算术均数不全相等。() 6.五个百分率的差别的假设检验,>,可认为各组总体率都不相同。() ZZZ4.在两样本均数比较的检验中,若≥,则在α=0.05水平上可认为两总体均数不等。0.05()P5.在t检验中,若拒绝H, 值越小,则说明两总体均数差别越大。()06.对三个地区 血型构成(A、B、O、AB型),作抽样调查后比较,若有一个 理论频数小于5大于1且n>40,必须作校正检验。() 7.如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。() 8.Ⅱ期临床试验是指采用随机盲法对照实验,评价新药的有效性及安全性,推荐临床给药剂量。()9.临床试验中,为了避免人为主观因素的影响,保证结果的真实性,通常不让受试者及其家属知道他参与这项试验。()10.假定变量X与Y的相关系数r是0.8,P<0.05;变量M与N的相关系数r为-0.9,P<0.05,1122则X与Y的相关密切程度较高。与Y的相关系数r是0.8,P<0.05;变量M与N

的相关系11数r为-0.9,P<0.05,则X与Y的相关密切程度较 高。()2211.临床试验必须符合《赫尔辛基宣言》和国际医 学科学组织委员会颁布的《人体生物医学研究国际道德指南》 的道德原则。() 12.当直线相关系数r=0时,说明变量之 间不存在任何相关关系。=0时,说明变量之间不存在任何相 关关系。() 13.偏回归系数表示在除X以外的自变量固定 不变的条件下,X每改变一个单位的平均变ii化。以外的自变 量固定不变的条件下,X每改变一个单位的平均变化。()i 14.单盲法是让病人知道自己在实验组或对照组,但不知道用 什么处理。() 15.重复原则是指少选择样本例数。()16.越小,所需样本含量越大。() 17.在相同条件下完全 随机设计比随机区组设计更节约样本含量。() 18.配对符号 秩和检验中,有差值绝对值相等时,可不计算平均秩次。()19.非参数统计的检验效能总是低于参数检验。() nTnTT20.两样本比较的秩和检验,现=15,=153,=10,=126,则 检验统计量=126。()1122二.选择题(每题1分,共20分)1.一种新药可以控制某病,延长寿命,但不能治愈其病,如果 某地采用该药则该地。a.该病发病率将增加 b.该病 发病率将减少c.该病患病率将增加 d.该病患病率将减少e.以上都不对2.用触诊和X摄片对100名妇女作乳癌检查, 触诊有40名阳性,X摄片有70名阴性,两种方法均阳性者10 名,两种方法检查均为阴性的人数是。 a.20 b.30

江西财经大学统计学试卷有答案

1 财经大学 11-12第二学期期末考试试卷 试卷代码:06003B 授课课时:48 课程名称:统计学 适用对象:挂牌 试卷命题人 试卷审核人 一、单项选择题(从下列各题四个备选答案中选出一个正确答案,并将其代号写在答题纸相应位置处。答案错选或未选者,该题不得分。每小题1分,共10分) 1.已知两个同类企业职工工资的标准差分别是50元和60元,则两个企业 职工平均工资的代表性( )。 A.乙大于甲 B.甲大于乙 C.甲乙相等 D .无法判断 2. 根据算术平均数的性质,下列表达式正确的是 ( )。 A .0)(=∑-f x x B .0=-∑f x x C .0)(2=-∑f x x D. min )(=-∑f x x 3. 某地区人均国生产总值2007年比2002年增长45%,每增降1%的绝对值为135元,则( )。 A .五年间人均国生产总值共增6075元 B .五年间人均国生产总值共增1350元 C .五年间人均国生产总值每年递增9% D .五年间人均国生产总值每年递增10% 4. 用各组的组中值代表其实际数据计算算术平均数时,通常假定( )。 A .各组数据在组是均匀分布的 B .各组次数相等 C .各组数据之间没有差异 D. 各组数据次数不等 5.在分组时,凡遇到某一变量值刚好等于相邻两组上下限数值时,一般是( )。 A.将此值归入上限所在组 B.将此值归入下限所在组

C.此值归入两组均可 D.该值不需归入任何一组 6. 一组数25,27,29,30,32,34的中位数值是 ( )。 A .29 B .29.5 C .30 D.不存在 7. 某次人口普查的标准时点为11月1日零点,今有甲,乙、丙、丁四人情况是:甲10月31日夜10点出生,乙10月31日夜11点去世,丙10月31日夜12点半出生,丁11月1日1点去世。调查员登记时,下列说确的是 ( ) A .甲登记、乙不登记 B .甲不登记、丁登记 C .甲登记、丙登记 D .乙登记、丁不登记 8.有效性是指( )。 A .抽样指标的平均数等于被估计的总体指标 B .当样本容量n 充分大时,样本指标充分靠近总体指标 C .随着n 的无限增大,样本指标与未知的总体指标之间的离差任意小的可能性趋于实际必然性 D .作为估计量的方差比其他估计量的方差小 9. 根据月度资料计算的季节指数之和为( )。 A .400% B .100% C .1200% D .800% 10.如果11p q 、分别代表报告期的商品价格、销售量;00p q 、分别代表基期的商品价格、销售量,运用公式1101 p p q k p q = ∑∑编制的指数称为 ( )。 A .拉氏价格指数 B .拉氏销售量指数 C .帕氏价格指数 D .帕氏销售量指数 二、判断题(请在答题纸上写明题号后,在正确的命题后打√,在错误的命题后打×。判断错误者,该题不得分。每小题1分,共10分。) 1.权数对算术平均数的影响作用只表现为各组出现次数的多少,与各组次数占总次数的比重无关。( ) 2.凡是反映现象总规模、总水平和工作总量的统计指标称为质量指标。( ) 3.简单分组涉及总体的某一个标志,复合分组则涉及总体两个以上的标志。因此,将两个简单分组排列起来,就是复合分组。( ) 4.若时间数列各期的环比发展速度相等,则各期逐期增长量一定相等( ) 5. 调查单位与报告单位总是相同的。( )

统计学模拟试题答案

注意:正式考试的计算题除与下述题目一样外,还包括指数分析中的双因素分析,认真看课本的例题 四、计算题(共3题,共40分) 1、(10分)甲、乙两单位人数及月工资资料如下: 根据上表资料: (1)比较甲乙两单位两个单位哪个单位工资水平高; (2) 说明哪个单位平均工资更具代表性 甲、乙两单位人数及月工资资料如下: 根据上表资料: (1)比较甲乙两单位两个单位哪个单位工资水平高; (2) 说明哪个单位平均工资更具代表性 解: (1)人) 元甲 /(1710== ∑∑f Mf x

人) 元乙 /(1832== ∑∑f Mf x 以上计算可知,乙单位工资水平高; (2) %1.10%100=?=x S V 甲σ %2.10%100=?= x S V s 乙 以上计算可知甲单位平均工资的标准差系数小于乙单位,说明甲单位平均工资更具有代表性。 2、(15分)某高校进行一次英语测验,为了解考试情况,随机抽样抽选1%的学生进行调查,所得资料如下: 试以95.45%的可靠性估计(相应的概率度请在教材上查阅): (1)该校学生英语考试的平均成绩的范围; (2)成绩在80分以上的学生所占的比重的范围。 解:(1),100=n )(761 1 分== ∑ ∑==k i i k i i i f f x x ,)(119)(21 1 22分=-= ∑∑==k i i k i i i f f x x s ,用22σ代替s 有: )(09.1)1(2 分=- = N n n x σμ,)(18.2分==?x x t μ,区间范围:18.276±=?±x x 。 (2)%441 == n n p ,用样本比重代替总体比重,%94.4)1()1(=--=N n n P P p μ。 %88.9==?p p t μ,区间范围:%88.9%44±=?±p p 。 3、(15分)4.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下: ) /(186.881 )M (2i 人元乙=--= ∑n f x S i )/(173.071 )M (2i 人元甲=--=∑n f x S i

统计学模拟试题及解答

模拟试题一 一. 单项选择题(每小题2分,共20分) 1. 一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200元, 他们选择在网上购物的主要原因是“价格便宜”。这里的参数是( ) A. 1000个消费者 B. 所有在网上购物的消费者 C. 所有在网上购物的消费者的平均花费额 D. 1000个消费者的平均花费金额 2. 为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种抽样方法属于( ) A. 简单随机抽样 B. 整群抽样 C. 系统抽样 D. 分层抽样 3. 某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分布,可以判断考试分数在70到90分之间的学生大约占( ) A. 95% B. 89% C. 68% D. 99% 4. 已知总体的均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值的数学期望和抽样分布的标准误差分别为( ) A. 50,8 B. 50,1 C. 50,4 D. 8,8 5. 根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生平均考试分数的置信区间为75分~85分。全班学生的平均分数( ) A .肯定在这一区间内 B .有95%的可能性在这一区间内 C .有5%的可能性在这一区间内 D .要么在这一区间内,要么不在这一区间内 6. 一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所作的一项调查中,随机抽取120个新车主中有57人为女性,在05.0=α的显著性水平下,检验2005年新车主中女性的比例是否有显著增加,建立的原假设和备择假设为( ) A .%40:,%40:10≠=ππH H B .%40:,%40:10<≥ππH H C .%40:,%40:10>≤ππH H D .%40:,%40:10≥<ππH H 7. 在回归分析中,因变量的预测区间估计是指( ) A. 对于自变量x 的一个给定值0x ,求出因变量y 的平均值的区间 B. 对于自变量x 的一个给定值0x ,求出因变量y 的个别值的区间 C. 对于因变量y 的一个给定值0y ,求出自变量x 的平均值的区间 D. 对于因变量y 的一个给定值0y ,求出自变量x 的平均值的区间 8. 在多元线性回归分析中,如果F 检验表明线性关系显著,则意味着( ) A. 在多个自变量中至少有一个自变量与因变量之间的线性相关系著 B. 所有的自变量与因变量之间的线性关系都显著 C. 在多个自变量中至少有一个自变量与因变量之间的线性关系不显著 D. 所有的自变量与因变量之间的线性关系都不显著 9. 如果时间序列的逐期观察值按一定的增长率增长或衰减,则适合的预测模型是( ) A. 移动平均模型 B. 指数平滑模型 C. 线性模型 D. 指数模型 10. 设p 为商品价格,q 销售量,则指数∑∑ 01 0q p q p 的实际意义是综合反映( ) A. 商品销售额的变动程度 B. 商品价格变动对销售额影响程度 C. 商品销售量变动对销售额影响程度 D. 商品价格和销售量变动对销售额影响程度 二. 简要回答下列问题(每小题5分,共15分) 1. 简述直方图和茎叶图的区别。

医学统计学模拟卷教程文件

医学统计学模拟卷

医学统计学模拟卷 模拟试卷课程名称: 医学统计学一、名词解释 1. Population and Sample 总体: 根据调查目的确定的同质研究对象的集合。 分为无限总体和有限总体。 样本: 从总体中抽取的部分研究对象。 2. Sampling error 抽样误差: 由个体变异、随机抽样引起的统计量与总体均数之间的差异。 3. Cross-over design 交叉设计: 每个受试者随机地在两个或多个不同试验阶段分别接受指定的处理(试验药或对照药)。 4. Confidence interval 可信区间: 按预先给定的概率(1-a),确定一个包含未知总体参数的范围。 这一范围称为参数的可信区间或置信区间(confidence interval,CI) 5. Coefficient of variation 变异系数:常用于比较度量单位不同或均数相差悬殊的两组(或多组)资料的变异程度,公式为二、填空题 1. 可信区间是指按预先给定的概率(1-a),确定一个包含未知总体参数的范围。 这一范围称为参数的可信区间或置信区间(confidence

interval,CI) 2. 常用的相对数有_________________、 ___________________、__________________ 3. 假设检验的Ⅰ型错误是指拒绝正确的无效假设,用 a 表示,又称为检验水准 4. 统计工作的基本步骤研究设计、资料收集、统计分析、结果表达 5. 对于四格表资料,当 n40 但有 1T5 时,应该选用校正卡方和确切概率方法分析三、选择题 1. 测量身高、体重、转氨酶等指标所得的资料叫做: B (A)计数资料(B)计量资料(C)等级分组资料(D)间断性资料 2. 流行性乙型脑炎发病率的高低与年龄有关,据调查,3~8 岁的儿童较其他年龄的人易患此病,为了反映患者年龄的频数分布规律,应选用: B (A)条图(B)直方图(C)圆图 (D)线图 3. 设某一医学指标的观测值过小或过大都无实际意义,需要详细记录的是介于二者之间的数据,有一化验员记录了某病患者10人该指标的化验结果为: 6.2,2.0的有4个数,8.3,10.0的有 3 个数, 7.5。 请选择合适的平均指标反映该组数据的平均水平: C (A)算术平均数(B)几何平均数(C)中位数(D)调和平均数 4. 测量某医学指标,得到 500 个性质相同且近似服从正态分布的实验数据可求得算术平均数( x ),标准差(s)和标准误(xs )。 区间[ x -1.960s, x +1.960s]所代表的含义为:

统计学模拟试卷2

统计学模拟试卷(二) 一、填空题(每空1分,共10分) 1、总体的三大特征是 、 和 。 2、统计学包括 和 两部分内容。 3、代表性误差包括系统性代表性误差和偶然性代表性误差,不可避免,但可以计算和控制的是 。 4、设考试成绩的全距为100,如果将60分以下为一组,其余按等距分成四组,则各组的组距为 。 5、某一连续工序的四道环节合格率分别为96%、98%、95%、99%,则平均合格率为 。 6、最常用的位置平均数有 和 两种。 7、样本成数的方差是 。 8、回归方程bx a y c +=中的参数b 是________,估计特定参数常用的方法是_________。 9、平均发展速度的计算方法有 法和 法两种。 10、同度量因素在计算综合指数中起两个作用,即 和 。 二、判断题(每题1分,共10分,请填入“√”或“?”) 1、品质标志表明个体属性方面的特征,其标志表现只能用文字来表现,所以品质标志不能转化为统计指标。( ) 2、样本是用来推断总体的,因而其推断结果是必然的。( ) 3、数量指标反映总体内在关系,质量指标反映总体外在关系。( ) 4、所谓序时平均数就是将同一总体的不同时期的平均数按时间先后顺序排列起来。( ) 5、连续型变量可以作单项分组或组距式分组,而离散型变量只能作组距式分组。( ) 6、计算单利利率的平均值时,最适宜采用几何平均数。 ( ) 7、如果每个变量值的权数(次数)都减小10%,则总平均数也减小10%。( ) 8、总体参数虽然未知,但却具有唯一性。 ( ) 9、抽样误差只能指代表性误差中的偶然性代表性误差。 ( )

10、判定系数越大,估计标准误差越大,判定系数越小,估计标准误差越小。( ) 三、单项选择题(每题1分,共10分) 1、标志是说明个体特征的名称;标志值是标志的数值表现,所以( )。 A 、标志值有两大类:品质标志值和数量标志值 B 、品质标志才有标志值 C 、数量标志才有标志值 D 、品质标志和数量标志都具有标志值 2、下列统计指标中属于数量指标的是( )。 A 、职工平均收入 B 、亩产量 C 、某省GDP D 、产品合格率 3、抽样调查与重点调查的主要区别是( )。 A 、作用不同 B 、组织方式不同 C 、灵活程度不同 D 、选取调查单位的方法不同 4、离散系数主要是用于( )。 A 、反映一组数据的离散程度 B 、反映一组数据的平均水平 C 、比较多组数据的离散程度 D 、比较多组数据的平均水平 5、不重复抽样的抽样标准误公式比重复抽样多了一个系数( ) A 、 N N 1- B 、1++N n N C 、N n N - D 、n N N ++1 6、某校对学生的考试成绩和学习时间的关系进行测定,建立了考试成绩倚学习时间的直线回归方程为:x y c 5180-=,该方程明显有错,错误在于( ) A 、a 值的计算有误,b 值是对的 B 、b 值的计算有误,a 值是对的 C 、a 值和b 值的计算都有误 D 、自变量和因变量的关系搞错了 7、定基发展速度和环比发展速度的关系是( )。 A 、相邻两个定基发展速度之商=其相应的环比发展速度; B 、相邻两个定基发展速度之积=其相应的环比发展速度;

最新统计学模拟试题(带答案)

《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体, 是统计工作的成果,是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量, 职工人数、企业数属于变量;变量按分,可分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为 和;按在各个单位上的具体表现是否相同分为和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的 变成,那么原来的指标就相应地变成标志,两者变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。 12、以绝对数形式表示的指标都是数量指标,以相对数 或平均数表示的指标都是质量指标。 13、构成统计总体的条件是各单位的差异性。 14、变异是指各种标志或各种指标之间的名称的差异。 三、单项选择题 1、统计认识过程是() A、从质到量 B、从量到质 C、从质到量,再到质和量的结合 D、从总体到个体 2、某班5名同学的某门课的成绩分别为60、70、75、 80、85,这5个数是() A、指标 B、标志 C、变量 D、变量值 3、调查某市职工家庭的生活状况时,统计总体是() A、该市全部职工家庭 B、该市每个职工家庭 C、该市全部职工 D、该市职工家庭户数 4、调查某班50名学生的学习情况,则总体单位是() A、该班50名学生 B、该班每一名学生 C、该班50名学生的学习情况 D、该班每一名学生的学习情况 5、构成统计总体的基础和前提是() A、综合性 B、同质性 C、大量性 D、变异性 6、统计学研究对象的最基本特征是() A、总体性 B、数量性 C、具体性 D、社会性 7、某企业职工张三的月工资额为500元,则“工资”是() A、品质标志 B、数量标志 C、数量指标 D、质量指标 8、象“性别”、“年龄”这样的概念,可能用来() A、表示总体特征 B、表示个体特征 C、作为标志使用 D、作为指标使用 9、调查某校学生的学习、生活情况,学生“一天中用于学习的时间”是() A、标志 B、指标 C、变异 D、变量 10、一个统计总体() A、只能有一个标志 B、只能有一个指标 C、可以有多个标志 D、可以有多个指标 11、统计对总体数量的认识是() A、从总体到单位 B、从单位到总体 C、从定量到定性 D、以上都对 12、变量是可变的() A、品质标志 B、数量标志 C、数量标志和指标 D、质量指标 13、研究某企业职工文化程度时,职工总人数是() A、数量标志 B、数量指标 C、变量 D、质量指标 14、某银行的某年末的储蓄存款余额() A、一定是统计指标 B、一定是数量标志 C、可能是统计指标,也可能是数量标志 D、既不是统计指标,也不是数量标志 15、年龄是() A、变量值 B、离散型变量

医学统计学试卷

《医学统计学》考查试卷(必修) ---------------------------------------- 说明:本试卷总计100分,全试卷共4页,完成答卷时间2小时。 ---------------------------------------- 一、填空(10小题,每小题2分,共计20分。) 1、统计学分为 和 两大部分。 2、统计思想是用样本 估计(或推测)总体 ,它是通过 和 来实现的。 3、统计步骤包括 、 、 、 。 4、统计资料分为 和 ,后者又分为 、 和 。 5、总体服从正态分布的数值资料,常用 与 来描述其集中趋势与离散趋势。 6、假设检验的原理是 。 7、假设检验得到 ,可认为差别无统计学意义, ,可认为差别有 统计学意义, ,可认为差别有高度统计学意义。 8、直线回归反映两个变量的 ,而直线相关反映的是两个变量的 。 9、2x 检验的思想可以概述为看 和 吻合程度如何。 10、秩和检验和Ridit 分析均属 ,前者关键是 ,后者关键是 。 二、选择题(有单选和多选,10小题,每小题1分,共计10分。) 1、当均数相差很大或量刚不同时,比较多个样本资料的离散趋势指标 应选 。 (1)极差 (2)变异系数 (3)方差 (4)标准差 2、总体均数95%的可信区间为 。 (1))96.1,96.1(s x s x +- (2))58.2,58.2(s x s x +-

(3))96.1,96.1(x x s x s x +- (4))58.2,58.2(x x s x s x +- 3、四个样本均数的比较,参数假设检验为 。 (1)0H :4321x x x x === (2) 1H :4321x x x x ≠≠≠ (3)0H :4321μμμμ=== (4)1H :4321μμμμ≠≠≠ 4、两样本均数比较,经t 检验差别有统计学意义时,P 越小,说明: 。 (1)两样本均数差别越大 (2)两总体均数差别越大 (3)越有理由认为两总体均数不同 (4)越有理由认为两样本均数不同 5、分类资料的配对设计差异性(或优势性)检验需选用 。 (1)Pearson-2x 检验 (2)CMH-2x 检验 (3)McNemar-2x 检验 (4)Fisher 的确切概率法 6、来自医院的资料可求得 。 (1)有效率 (2)无效率 (3)发病率 (4)死亡率 7、作直线相关分析,要求: 。 (1)X 和Y 变量总体均服从正态分布 (2)X 或Y 变量总体服从正态分布 (3)只要因变量Y 总体服从正态分布 (4)两变量总体服从不服从正态分布均可。 8、方差分析可用于 。 (1)两个样本均数的比较 (2)多个样本均数的比较 (3)回归系数的假设检验 (4)多个样本率的比较 9、Fisher 确切概率法可用于 。 (1)两个样本均数的比较 (3)多个样本均数的比较 (3)两个样本率的比较 (4)每组观察例数不太大的多个样本率的比较 10、等级资料(有序多分类资料),可采用的统计分析方法有 。 (1)2x 检验 (2)秩和检验 (3)Ridit 分析 (4)t 检验或F 检验 三、(本题10分)

统计学考试试卷A及答案

2012—2013学年第二学期闽江学院考试试卷 考试课程:统计学 试卷类别:A卷□√B卷□考试形式:闭卷□√开卷□ 适用专业年级:2011级金融学、国际贸易学、保险学专业 注明:试卷答案请做在答题纸上。 一、单选题(每题1分,共30分,30%) 1. 下列不属于描述统计问题的是() A根据样本信息对总体进行的推断B了解数据分布的特征 C分析感兴趣的总体特征D利用图,表或其他数据汇总工具分析数据 2. 根据样本计算的用于推断总体特征的概括性度量值称作() A.参数 B. 总体C.样本 D. 统计量 3. 通过调查或观测而收集到的数据称为() A.观测数据 B. 实验数据 C.时间序列数据 D. 截面数据 4. 从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()。 A.重复抽样 B.不重复抽样 C.分层抽样 D.整群抽样5. 调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这样的调查方式称为()。 A 系统抽样 B 整群抽样 C 滚雪球抽样 D 判断抽样 6. 下面的哪一个图形最适合于描述结构性问题() A.条形图 B.饼图 C.雷达图 D. 直方图 7. 对于大批量的数据,最适合描述其分布的图形是( ) A.条形图 B.茎叶图 C.直方图 D.饼图 8. 将某企业职工的月收入依次分为2000元以下、2000元~3000元,3000元~4000元、4000元~5000元、5000元以上几个组。最后一组的组中值近似为( ) A.5000 B.7500 C.5500 D.6500 9. 下列关于众数的叙述,不正确的是() A.一组数据可能存在多个众数 B.众数主要适用于分类数据 C.一组数据的众数是唯一的 D.众数不熟极端值的影响 10. 一组数据的最大值与最小值之差称为() A.平均数 B.规范差 C.极差 D.四分位差 11.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是() A.至少有75%的数据落在平均数加减3个规范差的范围之内 B. 至少有89%的数据落在平均数加减3个规范差的范围之内

统计学(第五版)贾俊平期末考试模拟试题二

模拟试题二 一. 单项选择题(每小题 2分,共 20 分) 一辆新购买的轿车,在正常行使条件下,一年内发生故障的次数及相应的概率如下表所示: 故障次数()0123 概率() 0.050.250.400.30 正好发生 1次故障的概率为() A . 0.05 B. 0.25 C. 0.40 D . 0.30 要观察 200 名消费者每月手机话费支出的分布状况,最适合的图形是() A.饼图 B.条形图 C.箱线图 D.直方图 从某种瓶装饮料中随机抽取 10 瓶,测得每瓶的平均净含量为 355 毫升。已知该种饮料的净含 量服从正态分布,且标准差为 5 毫升。则该种饮料平均净含量的 90%的置信区间为()

A. B. C. D. 根据最小二乘法拟合线性回归方程是使() A. D. 一项调查表明,大学生中因对课程不感兴趣而逃课的比例为 20%。随机抽取由 200 名学生组 成的一个随机样本,检验假设,,得到样本比例为。检验统计量的值为() A. D. 在实验设计中,将种“处理”随机地指派给试验单元的设计称为() A.试验单元 B.完全随机化设计

C.随机化区组设计 D.因子设计 某时间序列各期观测值依次为 10、24、37、53、65、81,对这一时间序列进行预测适合的模型是() A.直线模型 B.二次曲线模型 C.指数曲线模型 D.修正指数曲线模型 在因子分析中,变量的共同度量反映的是() A .第个公因子被变量的解释的程度 B.第个公因子的相对重要程度 C.第个变量对公因子的相对重要程度 D.变量的信息能够被第个公因子所解释的程度 如果要检验两个独立总体的分布是否相同,采用的非参数检验方法是() A . Mann-Whitney检验 B. Wilcoxon 符号秩检验 C. Kruskal-Wallis检验 D . Spearman 秩相关及其检验 在二元线性回归方程中,偏回归系数的含义是()A.变动一个单位时,的平均变动值为 B.变动一个单位时,因变量的平均变动值为 C.在不变的条件下,变动一个单位时,的平均变动值为

江西财经大学统计学院《统计学》模拟试题一含答案

江西财经大学统计学院《统计学》模拟试题一 [请将答案写在答题纸上] 一、单项选择题(每题1分,共15分) 1.( )是统计的根本准则,是统计的生命线。 A.真实性 B.及时性 C.总体性 D.连续性 2.在抽样设计中最好的方案是( )。 A.抽样误差最小的方案 B.调查单位最少的方案 C.调查费用最少的方案 D.在一定的误差要求下,费用最小的方案 3.某公司将员工分成老、中、青三类,然后根据对各个员工情况的分析,从三类员工中按比例选出若干名员工为代表,调查他们的文化支出金额,再推算出全公司员工文化活动年支出总额的近似值,此为( )。 A.典型调查 B.重点调查 C.抽样调查 D.普查 4.在相关分析中,要求相关的两个变量( ) A.都是随机变量 B.都不是随机变量 C.其中因变量是随机变量 D.其中自变量是随机变量 5.增长1%的绝对值是( )。 A.本期水平的1% B.上期水平的1% C.本期累计增长量的1% D.上期逐期增长的1% 6.在设计综合指数的形式时,最关键的问题是( )。 A.确定指数的公式形式 B.确定对比基期 C.确定同度量因素 D.确定谁是数量指标谁是质量指标 7.某种产品单位成本计划规定比基期下降3%,实际比基期下降3.5%,单位成本计划完成程度相对指标为( )。 A.116.7% B.100.5% C.85.7% D.99.5% 8.已知甲、乙两班同学的某次测验平均成绩分别为甲X =75分,乙X =80分;其成绩的方差2甲σ=12,2乙σ=25,则( )。 A.甲班平均成绩有较大的代表性 B.乙班平均成绩有较大的代表性 C.甲、乙两班的平均成绩有相同大的代表性 D.不可比 9.如果某商店销售额的逐期增长量每年都相等,则其各年的环比增长速度是( )。 A.年年增长 B.年年下降 C.年年不变 D.无法确定 10.直线趋势bt a y c +=中a 和b 的意义是( )。 A.a 是截距,b 表示x=0时的趋势值 B.a 是最初发展水平的趋势值,b 表示平均发展水平 C.a 是最初发展水平的趋势值,b 表示平均发展速度 D.a 表示直线的截距,表示最初发展水平的趋势值;b 是直线的斜率,表示按最小平方法计算的平均增长量 *11.在国民经济核算中,流量与存量是( )。

医学统计学模拟考精彩试题(1-4)及案例分析报告补充

《医学统计学》期末模拟考试题(一) 学号_________ 姓名_______ 班级________ 成绩_________ 一、填空题(每空0.5分,共15分) 1. 科研结果的好坏取决于___________的好坏,研究设计是统计工作的基础和关键,决定着整个统计工作的成败。 2. 概率是________________________________________________。小概率事件是指__________的随机事件。 3. 实验设计四大原则为___________、_________、____________、______________。 4. 实验设计三要素是指_______________、______________、_____________。 5. 假设检验的基本思想是_________________和____________________。 6. 随机抽样是指_____________________________________________。 7. Ⅱ类错误的意思是________________________________________________。 8. 做两样本均数的比较时,如P>0.05,则应_________无效假设,结论为__________________。 9. 变异系数用于_______________,或_______________________________资料间变异程度的比较。 10. 均衡性原则是指_________________________________________________。 11. 正态分布N(μ,σ2)中有两个参数:____________和____________。 12. 标准化死亡比(SMR)是_______________________________________之比。 13. 计算标准化率时,一般选择“标准”的方法有二种: (1)______________________________________________________________; (2)______________________________________________________________。 14. χ2值反映____________________________________________的符合程度。 15.四格表χ2检验的注意事项:(1) 当_______________时,用四格表χ2检验的基本公式或专用公式计算χ2值。 (2) 当_______________时,需要用校正公式计算χ2值。 (3) 当_______________时,不宜计算χ2值,需采用四格表确切概率法直接计算概率。 16. 多发病是指_______________高的疾病。 17. 剂量反应是_____________________________________________。 二、是非题(每题1分,共10分) 1.假定变量X与Y的相关系数r1是0.8,P1<0.05;变量M与N的相关系数r2为-0.9,P2<0.05,则X与Y的相关密切程度较高。() 2. 有9名出生婴儿的头围(cm)为: 60, 55, 45, 48, 56,65,50,62,49,其中位数为56cm。( ) 3. 算得r=0.85,可认为两变量间相关较密切。() 4.实验设计的特点之一就是研究者能人为设置处理因素。( ) 5.患病率高的疾病称为常见病。() 6.δ 越小,所需样本例数越多。() 7.α越大,所需样本含量越小。() 8. 三行四列的表做χ2检验允许有一个T<5。() 9. 两组资料比较的秩和检验中,T值在T界值范围以内时则P值大于界值所对应的概率。() 10.在配对符号秩和检验中,T值在T界值范围以外则P值大于界值所对应的概率。() 三、选择题(每题1分,共10分) 1.t检验中,不同类型资料的t检验的区别是_________。 a.检验步骤不同 b.统计量t的计算公式不同 c.确定P值时查的表不同 d.根据P值判断结果的方法不同 e.以上都不对 2.某医师研究腹腔镜胆囊手术疗效时,实验组用腹腔镜胆囊手术疗法,对照组用传统胆囊手术疗法,这属于____。 a.空白对照b.标准对照 c.实验对照d.历史对照e.安慰剂对照 3.两个四格表一个χ2>χ2(0.01),另一个χ2>χ2(0.05),可认为。 a.前者两个的百分数相差大 b.后者两个的百分数相差大 c.前者更有理由认为两总体率不同d.后者更有理由认为两总体率不同 e.尚不能下结论4.样本例数估计需要事先确定___________。 a.α、β、μ、δb.δ、β、S、σc.δ、β、μ、α d.δ、1-β、s、α e.α、β、μ、1-β5.t检验中,t>t0.05(v),P<0.05,拒绝检验假设,其依据是________。 a.原假设本身是人为的,应该拒绝 b.原假设成立的可能性很小 c.原假设成立是完全荒谬的 d.计算结果证明原假设是错误的 e.原假设不可能成立 6.相关系数检验的无效假设H0是___________。 a.ρ= 0 b.ρ≠ 0 c.ρ>0 d.ρ<0 e.β= 0 7.同一双变量资料,进行直线相关与回归分析,有________。 a.r>0,b<0 b.r>0,b>0 c.r<0,b>0

大学统计学试卷及答案3套

2011年12月考试统计学第一次作业 一、单项选择题(本大题共45分,共 15 小题,每小题 3 分) 1. 对单项数列,其满足左偏斜分布时有( )。(X为均值) A. B. C. D. 2. 报告期总量加权的平均指数在计算形式上主要采取() A. 综合指数形式 B. 算术平均形式 C. 调和平均形式 D. 固定构成指数形式 3. 红星企业的2010年的产值比去年上升了8%,则8%为() A. 平均数指标 B. 总量指标 C. 相对数指标 D. 离散指标 4. 对某种连续生产的产品进行质量检验,要求每隔一小时抽出10钟的产品进 行检验,这种抽查方式是() A. 简单随机抽样 B. 类型抽样 C. 整群抽样 D. 等距抽样 5. 若销售量增加,销售额不变,则物价指数() A. 降低 B. 升高 C. 不变 D. 无法确定 6. 某灯泡厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应当选择() A. 统计报表 B. 重点调查 C. 全面调查 D. 抽样调查 7. 根据各年的月份资料计算的季节指数其平均数为() A. 100% B. 1200% C. 120% D. 400% 8. 直接反映总体规模大小的指标是() A. 平均指标 B. 相对指标 C. 总量 指标 D. 变异指标 9. 说明回归直线拟合程度的统计量主要是() A. 相关系数 B. 回归系数 C. 判定系数 D. 估计标准误差 10. 如果调查对象之中包含的单位很多,而且缺少原始记录可供参考,这种情 况应用() A. 抽样调查 B. 重点调查 C. 普查 D. 统计报表 11. 某连续性变量的分组中,其末组为开口组,下限为200,又知其邻组的组 中值为170,则末组的组中值为()。 A. 260 B. 215 C. 230 D. 185 12. 当已知时,总体均值μ的1- 置信水平下的置信区间为()。 A. B. C. D. 13. 计算平均指标时,最常用的方法和最基本的形式是()。 A. 中位数 B. 众数 C. 调和平均数 D. 算术平均数 14. 若已知是的3倍,

统计学模拟试题(卷)

统计学模拟试卷(一) 一、填空题(每空1分,共10分) 1、古典统计学时期有两大学派,它们分别是和。 2、统计指标反映的是的数量特征,数量标志反映的是的数量特征。 3、统计数据收集过程中,可能存在两种误差:和。 4、统计分组按分组标志的多少分为分组和分组。 5、各个变量值与其算术平均数的等于零,并且为最小值。 6、直接用平均差或标准差比较两个变量数列平均数的代表性的前提条件是两个变量数列的相等。 7、优良估计的三个标准是、和。 8、在相关分析中,要求两个变量都是_______;在回归分析中,要求自变量是_______,因变量是_______。 9、编制动态数列最基本的原则是。 10、综合反映不能直接相加的多种事物综合变动的相对数就是。 二、判断题(每题1分,共10分,请填入“√”或“ ”) 1、可变标志是总体同质性特征的条件,而不变标志是总体差异性特征的条件。() 2、通常情况下,数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。() 3、在异距分组数列中,计算频数密度主要是为了消除组距因素对次数分布的影响。() 4、能够对统计总体进行分组,是由统计总体中的各个单位所具有的“同质性”特点决定的。() 5、位置平均数不受极端值的影响。() 6、登记性误差和系统性误差是可以避免的,而偶然性误差是不可避免的。()

7、变量y 与平均数y 的离差平方和,即2 )(∑-y y 称为y 的总变差。( ) 8、间隔相等的时期数列计算平均发展水平时,应用首尾折半的方法。( ) 9、若时间数列各期的环比增长量Δ相等(Δ>0),则各期的环比增长速度是逐年(期)增加的。( ) 10、价格是价格指数的研究对象,习惯上把它称为指数化指标,而销售量则是销售量指数中的指数化指标。( ) 三、单项选择题(每题1分,共10分) 1、社会经济统计的研究对象是( )。 A 、抽象的数量关系 B 、社会经济现象的规律性 C 、社会经济现象的数量方面 D 、社会经济统计认识过程的规律和方法 2、几位学生的某门课成绩分别是67分、78分、88分、89分、96分,则“成绩”是( )。 A 、品质标志 B 、数量标志 C 、标志值 D 、数量指标 3、对一批商品进行质量检验,最适宜采用的调查方法是( )。 A 、全面调查 B 、抽样调查 C 、典型调查 D 、重点调查 4、如果所有标志值的频数都减少为原来的1/5,而标志值仍然不变,那么算术平均数( ) A 、不变 B 、扩大到5倍 C 、减少为原来的1/5 D 、不能预测其变化 5、在抽样调查时,若有意选择较好或较差的单位,则会产生( ) A 、登记性误差 B 、调查误差 C 、偶然性误差 D 、系统性误差 6、在简单回归直线bx a y c +=中,b 表示( ) A 、当x 增加一个单位时,y 增加a 的数量 B 、当y 增加一个单位时,x 增加b 的数量 C 、当x 增加一个单位时,y 的平均增加值

相关主题
文本预览
相关文档 最新文档