当前位置:文档之家› 人大统计学真题2010-1998

人大统计学真题2010-1998

人大统计学真题2010-1998
人大统计学真题2010-1998

人大统计学考研历年真题精华版(98-10)

2010年人大统计学专业课初试题

2009年人大统计学专业课初试题

一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值?

二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。

三、周期过程

cos()

t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间[-π,π]上服从均

匀分布的随机变量。问{

t

X }是否平稳?说明原因。

四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有相同的估计量方差。(假设各层总体单位数量h

N 都充分大,忽略“有限总体校正系数”)

五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样的。

六、若有线性回归模型

01 (1,2,,)

t t t y x t n ββε=++= ,其中

()0

t E ε=

2

2

2

()t t

E x εδ=,

()0 ()

t s E t s εε=≠,则

(1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。

七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。假定40只白鼠的初始活动状态相同。请详细阐述你用何种方法分析安眠药的效果?

八、某大学从教师中抽取一个随机样本进行满意度调查。1分表示非常不满意,100分表示非常满意。数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则

(1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。 (2)要采用该分析方法,数据必须满足哪些几本假定?请加以说明。

2008年人大统计学专业课初试题

一、(10分)07年香港一则报道说:“随着经济的增长,香港低收入家庭的比例在增长,其中低收入的家庭是指低于中位数的家庭。”请你从统计的角度对该报道做简要评论。

二、(10分)经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。

三、(10分)如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立什么样的预测模型?请你写出模型形式并加以简要说明。

四、(30分)食品厂家说:净含量是每袋不低于250g。但有消费者向消协反映不是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验。

(1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?并说明理由;

(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?并说明理由;

(3)消协抽取20袋,数据如下(略),得p值为0.4297,在α=0.5的显著水平下,检验假设意味着什么?p值的含义是什么?

(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际平均重量是否在该区间?为什么?

五、(15分)在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。

(1)请具体指明这些假设有哪些?

(2)说明这些假设所发挥的主要作用;

(3)请讨论这些假设最终产生的影响。

六、(15分)在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并不包括整群抽样,请说明你赞同与否并详列理由。

七、(30分)叙述贝叶斯判别分析的原理(包括完整的假设)并说明:

(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点?

(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?

八、(30分)在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考虑许多因素。(1)以大坝为例,概略说明需考虑的主要因素;

(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出计算坝高详细的具体步骤。(画出框图,并尽量避免过多使用文字)

2007年人大统计学专业课初试题

一、(20分)下面是一种零件误差的数据(单位:克):

6.1 4.7 6.5 6.2

7.7

6.4 5.5

7.1 6.1 5.3

5.7

6.1 5.3 4.0 4.8

3.2 3.9 1.9

4.9 3.8

5.3 2.6 5.3 5.5 5.8

2.7 6.8 7.4 5.6

3.3

(1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能不能用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法;

(2)对于该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。如果进行t检验,需要假定哪些条件?t检验结果为p值等于0.0807。能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么?

二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。请回答以下问题:

(1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么?

(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的?

(3)这些员工的加班时间是否独立?如果不是,原因可能是什么?

三、(20分)某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。但一家研究机构则认为自驾车上班的人数比例达不到这一水平。为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。

(1)请写出检验的原假设和备择假设;

(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件;

(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著?

四、(10分)在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%”,那么该报告是否负责?一个负责任的调查报告应该给什么有关信息?

五、(10分)对于主成分分析,有人在进行了主成分分析之后,对得到的主成分又进行了第二次主成分分析,以得到更加精确的结果。请问,这样做是否有道理?请加以说明。什么样的数据不适宜于主成分分析?选择那些主成分累计方差贡献率为70-80%之类的准则是不是总是适用?为什么?

六、(20分)回归模型y=β0+β1x1+β2x2+…+βpxp+ε中的ε一定是随机误差吗?如果回答是否定的,讨论在何种情况下,答案是肯定的?此外,最小二乘回归是不是需要对误差项作出假定?如果不是,那么

在什么情况下需要对误差项作出假定?作什么假定?

七、(25分)对于聚类分析,请回答以下问题:

(1)分层聚类前,需要对什么进行选择?

(2)描述分层聚类分析的详细步骤;

(3)描述K均值(快速)聚类分析的详细步骤。

八、(25分)应用多元线性回归模型y=β0+β1x1+β2x2+…+βpxp+ε,如果一个SPSS回归分析的结果如下表所示:

ANOV

a. Predictors:(Constant),Beginning Salary

b. Predictors:(Constant),Beginning Salary,Employment Category

则:

(1)表中所用选择自变量的方法可能是什么?

(2)表中的最后一个Sig.如何求得?意义是什么?

(3)请给出该表最后一个F所表示的统计量服从F分布所需要的假定条件,并对该统计量服从F分布予以证明。

2006年人大统计专业课初试题

一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:

5.5

6.6 6.7 6.8

7.1 7.3 7.4 7.8 7.8

(1)画出第二种排队方式等待时间的茎叶图;

(2)比较两种排队方式等待时间的离散程度;

(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。

二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:克)如下:

已知食品包重量服从正态分布,要求:

(1)确定该种食品平均重量95%的置信区间;

(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;

(3)利用P值进行检验和利用统计量进行检验有什么不同?

(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)

三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平α=0.01下得到的有关结果如下:

差异源SS df MS F P-value F crit

行列误差总计1.55

3.48

0.14

5.17

4

2

8

14

0.39

1.74

0.02

21.72

97.68

0.000236

0.000002

7.01

8.65

(1)不同的车速对磨损程度是否有显著影响?

(2)不同供应商的轮胎之间磨损程度是否显著差异?

(3)在上面的分析中,你都做了哪些假设?

四、(15分)说明什么条件下适合采取简单随机抽样?

五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。

六、(20分)解释因子模型

X=AF+ε

的意义并写出模型的假设。

七、(15分)以下是从《中国统计年鉴-2005》摘引的资料,要求:

单位:元/人

(1)根据国民经济收入分配核算原理,说明居民人均收入低于人均GDP水平的原因;

(2)计算各指标的动态变动率(不考虑价格变化),对其结果予以简要分析。

八、(15分)下表是中国全部国有及规模以上非国有供企业统计的主要指标,要求:

(1)设计并计算反映企业经济效益的指标;

(2)对经济效益指标的动态变化状况做简要分析。

2005年人大统计专业课初试题

一、(15分)一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据如下:

15 19 22 24 30

16 19 22 24 31

17 20 23 25 34

18 20 23 27 38

19 21 23 29 41

(1)画出该组数据的茎叶图;

(2)画出该组数据的箱线图;

(3)根据茎叶图和箱线图说明上网者年龄分布的特征。

二、(15分)设有三个总体的均值分别为:μ1,μ2,μ3。要检验三个总体的均值是否相等(α=0.05),我们为什么不先将它们简单地配对,即H0:μ1=μ2,H0:μ1=μ3,H0:μ2=μ3,,然后分别进行检验,而是采用方差分析的方法?

三、(20分)某城市的餐饮管理协会估计,餐馆的月平均用水量为100吨,一家研究机构认为实际用水量要高于这个数字,该研究机构随机抽取了36家餐馆,记录了每个餐馆的月用水量(单位:吨),经过初步

计算得到样本数据的部分描述统计量如下:

平均107

标准误差 4.99

样本标准差29.96

样本方差897.77

(1)确定餐馆月平均用水量95%的置信区间;

(2)餐馆实际月平均用水量在你所建立的置信区间里吗?请说明原因;

(3)如果要检验研究机构的看法是否正确,应该如何建立原假设和备择假设?请谈谈拒绝和不拒绝原假设的含义;

(4)在上面的估计和检验中,你使用了统计中的哪一个重要定理?请简要解释这一定理。

(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)

四、(20分)一家房地产评估公司想对某城市的房地产销售价格(y)与地产评估价值(x1)、房产评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格做合理预测。为此,收集了15栋住宅的房地产评估数据,经回归得到下面的有关结果(α=0.05):

(1)写出销售价格对地产评估价值、房产评估价值、使用面积的多元线性回归方程,并解释各回归系数的意义;

(2)检验回归方程的线性关系是否显著;

(3)检验各回归系是否显著;

(4)计算多重判定系数R2,并说明它的实际意义;

(5)计算估计标准误差sy,并说明它的实际意义;

(6)你认为使用面积(x3)在预测销售价格时是否有用?试说明理由。

五、(42分)假设一个已知简单总体的全部真实数据列于下表:

(1)绘出散点图;

(2)如果根据Y的数值将总体分成两个子总体,最好的分发是什么?

(3)举例说明上表数据所反映的现象可能是什么?

(4)计算出Y的总体均值Y和总体方差S2;

(5)四种基本抽样方式中最不适合上述总体情形的是哪一种?并说明理由;

(6)对其余三种基本抽样方式,假定n=2,分别列出每一种方式所对应的全部可能样本,并计算样本均值的数学期望和方差;

(7)计算每一种方式在此情形下的设计效应,并说明其意义。

六、(8分)说明抽样里的回归估计与一般回归分析方法的联系与区别。

七、(6分)请解释下面的说法:“生产核算的范围决定了收入分配和收入使用核算的范围”。

八、(9分)A、B两个地区的贫困线均为年收入1000元。A地区有11%的人年收入900元,9%的人年收入200元;B地区有1%的人年收入900元,9%的人年收入500元。

(1)根据上述数据,计算两地区的贫困者比重和贫困深度;(2分)

(2)请根据贫困者比重和贫困深度对两地区贫困状况进行简要的比较分析;(4分)

(3)你觉得这两个指标能够准确反映两地区贫困状况的差异吗?如果不能,应当如何改进?(3分)15分)下面是某国某核算年度的国际收支平衡表(单位:亿元):

九、(

(1)在表中括号内填上适当的数字;(3分)

(2)请解释储备资产所对应的-125亿元的含义;(3分)

(3)请根据表中数字分析该国国内生产总值、国民总收入和国民可支配收入三者之间的关系;(6分)(4)根据表中数字,对于该国当年国内的投融资状况你能得出何种结论?(3分)

2004年人大统计专业课初试题

本试卷分为两部分,一部分为必答题,计105分,一部分为选答题,计45分。

第一部分必答题

1.(25分)下面是A、B两个班学生的数学考试成绩数据:

A班:

55 76 66 85 75 62 79 73 93 76

67 85 74 61 78 71 92 79 65 83

73 57 77 70 90 75 63 81 73 96

B班:

34 71 56 90 66 48 81 58 96 71

55 85 62 44 79 57 95 68 54 84

61 39 73 57 94 68 51 82 61 100

(1)将两个班的考试成绩用一个公共的茎制成茎叶图,比较两个班考试成绩分布的特点;

(2)两个班考试成绩的描述统计量如下,试进行比较分析:

(3)要判断考试成绩是否有离群点,可使用哪些方法?

(4)要判断考试成绩是否服从正态分布,可使用那些描述性方法?

2.(25分)某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每人使用其中的一种方法。通过Excel进行方差分析得到下面的部分结果:

方差分析表

(2)若显著性水平α=0.05,检验三种方法组装的产品数量之间是否有显著性差异;

(3)在上面的方差分析中包含了哪些基本假定?

(4)简述多重比较的前提和作用。

3.(20分)一袋中有黑、白两种球,p表示白球所占的比例,待检验假设为

H0:p=1/2;H1:p=1/5。

从袋中任取4个球(放回抽样),当白球数小于2时,拒绝原假设。试给出以下内容:

(1)总体及其分布;

(2)样本量n;

(3)拒绝域;

(4)第一类错误的概率。

4.(15分)试举例说明方差分析中效应的意义和用效应如何表达它的数学模型。

5.(20分)试证明正态线性回归模型其回归系数的最大似然估计与最小二乘估计相同。

第二部分选答题(在下面五道题中任选三道题)

6.(15分)下表是中国1992和2002两个年份国民经济核算的部分资料。要求:

(1)根据资料,计算反映经济发展状况的基本总量指标和结构比例指标;

(2)根据计算结果,对10年间中国经济发展特征及其变化予以简要说明。

中国国民经济核算有关资料单位:亿元

7.(15分)2003年7月,中央政府和香港特区政府签定了简称CEPA的《内地与香港关于建立更紧密经贸关系的安排》。其中内容之一是自2004年起,273种香港原产货物进入内地市场实行零关税;内容之二是放宽香港企业对内地投资的限制,包括投资的行业、注册资本数额和资质条件等。可以预见,由此将大大促进香港对内地的贸易和投资活动。

要求:根据上述贸易和投资两方面的内容,应用国际收支平衡表原理,说明中国未来国际收支所产生的影响。(说明:根据目前中国国民经济核算,仍将香港作为“非常住单位”,即作为“境外”看待。)

8.(15分)假定某地区人口和劳动力就业统计数据如下表所示,要求:

(1)计算有关指标,描述该地区人口基本结构状况;

(2)计算有关指标,描述该地区人口变动状况;

(3)计算有关指标,描述该地区劳动就业状况。

单位:万人

9.(15分)对(30)的1000元3年定期寿险,死亡年末给付,保费在两年内每年缴一次。已知预定利率为5%,q30=0.02,q31=0.03,q32=0.04,,假设费用发生在保年初,各年费用为:

年份每份保单每1000元保额占总保费的比例

1 10 2.5 0.10

2 5 1.0 0.05

3 5 1.0 —

赔付处理费发生在死亡年末,每1000保额为10元,假设有退保。计算:

(1)每年总保费;

(2)第一年在总保费下的责任准备金。

10.(15分)某人在25岁时计划每年初存入200元建立个人账户,如果他在60岁退休,存款利率假设恒定为4%。

(1)求退休时个人账户的累计额;

(2)如果个人账户累计额在退休后以固定年金方式在30年内每月领取一次,求每月可以领取的数额。2003年人大统计专业课初试题

一、(15分)考虑两个国家之间按GDP进行经济比较。假定在既定汇率水平上,甲国GDP与乙国GDP之间的比例为1:20。一场金融危机放生之后,如果甲国货币相对乙国货币贬值了50%,那么,在新的汇率水平上,两国GDP之间的比例将变化为1:40。请问:我们能否根据比较结果说甲国的经济发展水平下降了50%?这种比较所包含的统计方法问题是什么?

二、(15分)假定一时期国际收支平衡表上“储备资产变动”一项为正差额100亿元,据此,应用国际收支平衡表原理判断当期国际收支的顺、逆差状况。

三、(30分)以下是某经济总体1985和2001两年份城镇居民住户部门的调查资料。要求: (1)列表计算各年城镇住户部门的原始收入、可支配收入和最终消费支出;(15分) (2)计算有关指标,比较说明城镇居民住户部门经济活动特征的变化。(15分)

四、(

30分)一家种业开发股份公司研究出三个新的小麦品种:品种一、品种二、品种三。公司为研究不同品种对产量的影响,选择了四个面积相同的地块进行试验,分别为:地块一、地块二、地块三、地块四。经过试验获得产量数据,经分析得到下面的方差分析表(α=0.05):

(1)将方差分析表中划线部分的数值补齐;(6分) (2)分析小麦品种对产量的影响是否显著;(4分)

(3)分析不同地块对产量的影响是否显著;(4分)

(4)在产量变动的差异中,被品种所解释的百分比是多少?(3分)

(5)在产量变动的差异中,被地块所解释的百分比是多少?(3分)

(6)上面的分析包含哪些假定?(10分)

五、(30分)统计资料表明,某地区职工年人均病假天数为5.1天。某公司从本公司职工中随机抽取了46名职工作为样本,测得其平均病假天数为7天,样本标准差为2.5天。公司领导想知道本公司职工是否比其他单位的职工更容易生病。

(1)公司领导感兴趣的原假设和替换假设是什么?(3分)

(2)若令α=0.05,请用假设检验的方法帮助公司领导作出判断(写清检验步骤,并作示意图)。(10分)

(zα/2=1.96,zα=1.645,tα/2(45)=2.0141,tα(45)=1.6794)

(3)在假设检验中,P值代表什么含义?(6分)

(4)在本例中,P=0.001说明了什么?(3分)

(5)用区间估计的方法找出该公司职工病假天数与其他职工病假天数显著不同的临界点。(8分)

六、(30分)关于回归分析讨论下列问题:

(1)画出回归建模步骤的流程图;(7分)

(2)简要描述各个步骤的内容;(8分)

(3)设

1

?()

X X X y

β-

''

=是多元回归方程参数的最小二乘估计,证明21

?

()()

D X X

βσ-

'

=;

(8分)

(4)根据

21

?

()()

D X X

βσ-

'

=,结合一元线性回归,你能看出对建模有指导意义的什么信息(7分)

2002年人大统计专业课初试题

2000年人大统计专业课初试题

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

人大统计学考研真题

人大统计学考研历年真题精华版(03-09) https://www.doczj.com/doc/8317432052.html,

https://www.doczj.com/doc/8317432052.html, 2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机 样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间 [-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如 采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随 机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样 的。 六、若有线性回归模型01 (1,2,,)t t t y x t n ββε=++= ,其中()0t E ε=,222()t t E x εδ=, ()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一 组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记

统计学原理作业(1)答案

《统计学原理》作业一 一、判断题 1.社会经济统计的研究对象是社会经济现象总体的各个方面。(×) 2.统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。(×) 3.总体的同质性是指总体中的各个单位在所有标志上都相同。(×)4.个人的工资水平和全部职工的工资水平,都可以称为统计指标。(×)5.对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。(√) 6.社会经济统计学的研究对象是社会经济现象的数量方面,但它在具体研究时也离不开对现象质的认识。(√) 7.品质标志表明单位属性方面的特征,其标志表现只能用文字表现,所以品质标志不能直接转化为统计指标。(√) 8.品质标志说明总体单位的属性特征,质量指标反映现象的相对水平或工作质量,二者都不能用数值表示。(×) 9.某一职工的文化程度在标志的分类上属于品质标志,职工的平均工资在指标的分类上属于质量指标。(√) 10.总体单位是标志的承担者,标志是依附于总体单位的。(√) 二、单项选择 1.社会经济统计的研究对象是(C )。 A、抽象的数量特征和数量关系 B、社会经济现象的规律性 C、社会经济现象的数量特征和数量关系 D、社会经济统计认识过程的规律和方法

2.构成统计总体的各个单位称为(A )。 A、调查单位 B、标志值 C、品质标志 D、总体单位 3.对某城市工业企业未安装设备状况进行普查,总体单位是(B )。 A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 4.标志是说明总体单位特征的名称(C)。 A、它有品质标志值和数量标志值两类 B、品质标志具有标志值 C、数量标志具有标志值 D、品质标志和数量标志都具有标志值5.总体的变异性是指( B )。 A.总体之间有差异B、总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化D、总体单位之间有差异 6.工业企业的设备台数、产品产值是(D )。 A、连续变量 B、离散变量 C.前者是连续变量,后者是离散变量 D、前者是离散变量,后者是连续变量 7.几位学生的某门课成绩分别是57分、68分、78分、89分、96分,“学生成绩”是(B )。 A、品质标志 B、数量标志 C、标志值 D、数量指标 8.在全国人口普查中(B )。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 9.下列指标中属于质量指标的是(B )。 A、社会总产值 B、产品合格率 C、产品总成本 D、人口总数

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

人大统计学真题

人大统计学考研历年真题精华版 (03-09) —By fan (声明:这是由fan整理编辑,仅供参考。) https://www.doczj.com/doc/8317432052.html,

https://www.doczj.com/doc/8317432052.html, 2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机 样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间 [-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如 采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随 机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样 的。 六、若有线性回归模型01 (1,2, ,)t t t y x t n ββε=++=,其中()0t E ε=,222()t t E x εδ=, ()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一 组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记

完整版上海交大统计学原理第二次作业及答案

1.同时抛两枚不同的硬币,恰有一枚正面朝上的概率是()(单选) 选择一项: 炒a. 1 炒b. 1/8 O c. 1/4 同d. 1/2 2.对于连续型数据的分组()选择一项: a.水平法 b.累计法 c.推算法 d.直接法 ) 4.各变量值与其算术平均数的离差值和等于(选择一 项: a.最小值 C b.取大值 c.各变量值的算术平均数 d.零 ) 5.下列统计指数,不属于数量指标指数的有(选择一 项: a.零售价格指数

b. 产量指数 诃c?收购量指数 因d.工资总额指数 6. 以下分组标志中属于品质标志的是()(多选) 选择一项或多项: * a.性别 □ b.年龄 "c.职业 d.月收入 门e.职称 7. 我国2003年国内生产总值比上年增长了9.1%,这个指标是() (单选)选择一项: U a.发展速度 拥b.增长速度 目c.发展水平 d.增长量 8. 统计指数区分数量指标指数与质量指标指数,是依据()(单选) 选择一项: 炒a.对比基期的不同 °b.对象范围的大小 ⑥c.统计指标的性质不同 d.同度量因素的固定与否 9. 我国财政收入,2003年比上年增加2787亿元,这是()(单选)选择一项: 炒a.发展水平 b.增长量

炒a.两个数列的平均数代表性相同 °b.平均数的代表性甲数列高于乙数列 同c.平均数的代表性乙数列高于甲数列 口d.平均数的代表性无法判断 11.全年12个月的季节比率之和应是()(单选) 选择一项: 」a.标准差系数 b.平均差系数 ‘ c.全距 * d.平均差

」a.是不同情况下同一指标对比的比率 □ b.反映现象的强度、密度和普遍程度 巫c. 一般有正指标与逆指标之分 門d.是两个性质不同而有密切联系的总量指标对比的结果 "e. 一般是以有名数表示的,但也有采用千分数等形式表示的 15.下列现象的相关密切程度最高的是()(单选)选择一项: a. 某商店的职工人数与商品销售额之间的相关系数0.87 * b.流通费用水平与利润率之间的相关关系为-0.94 口c.商品销售额与利润率之间的相关系数为0.51 口d.商品销售额与流通费用水平的相关系数为-0.81 16在实验中,两个事件有一个发生时,另一个就不发生,称这两个事件()(单选)选择一项: ⑥a.互斥事件 口b.必然事件 c. 独立事件 d. 不可能事件 17. 两组数据的均值不等,但标准差相等,则()(单选) 选择一项:

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

人民大学统计学在职题库统计综述答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学 考试科目:统计思想综述 课程代码:123201 考题卷号:1

除不能导致SSE显著减小为止。 逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除。如此反复, 直到增加变量不能导致SSE显著减少为止。 五、(20分)如果一个时间序列包含趋势、季节成分、随机波动, 适用的预测方法有哪些?对这些方法做检验说明。 可以使用Winter指数平滑模型、引入季节哑变量的多元回归和分解 法等进行预测。 (1)Winter指数平滑模型 包含三个平滑参数,即(取值均在0~1),以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。 L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更新是t期的季节调整因子, 是用于预测的模型。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,

而且需要有四个以上的季节周期(4年以上的数据)。 (2)引入季节哑变量的多元回归 对于以季度记录的数据,引入3个哑变量 ,其中=1(第1季度)或0(其他季度),以此类推,则季节性多元回归模型表示为: 其中b0是常数项,b1是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第1季度的平均差值。(3)分解预测 第1步,确定并分离季节成分。计算季节指数,然后将季节成分从 时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。 第2步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。 第3步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。

西南财大版统计学原理统计学作业练习题及答案。

第四章抽样估计 1.某工厂有1 500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平,如下表: 要求:(1)计算样本平均数和抽样平均误差。(2)以95.45%的可靠性估计该厂工人的月平均工资和工资总额的区间。 2.采用简单随机重复抽样方法,在2 000件产品中抽查200件,其中合格品190件。 要求:(1)计算合格品率及其抽样平均误差。(2)以95.45%的概率保证程度对合格品率和合格品数量进行区间估计。(3)如果极限误差为2.31%,则其概率保证程度是多少? 3.某电子产品使用寿命在3 000小时以下为不合格品,现在用简单随机抽样方法,从 5 000个产品中抽取进行调查.其结果如下: 要求:试根据上述资料:(1)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差。(2)按重复抽样和不重复抽样计算该产品合格率的抽样平均误差。(3)根据重复抽样计算的抽样平均误差,以68.27%的概率保证程度对该产品的平均使用寿命和合格品率进行区间估计。 4.某外贸公司出口一种茶叶,规定每包规格不低于150克,现在用不重复抽样的方法抽取其中1%进行检验,其结果如下: 抽查结果统计表 要求:(1)以99.73%的概率估计该批茶叶平均每包重量的范围,以及确定平均重量是否达到规格要求。(2)以同样的概率保证估计该批茶叶合格率范围。

5.某工厂生产一种新型灯泡5000只,随后抽取100只作耐用时间测试。结果表明,平均寿命为4500小时,标准差300小时,试在90%的概率保证下,估计该新式灯泡平均寿命时间,假定概率保证程度提高到95%,允许误差缩小一半,试问应抽取多少只灯泡进行测试。 6.调查一批机械零件合格率。根据过去资料,合格品率曾有过99%、97%、95%三种情况,现在要求误差不超过1%,要求估计的把握程度为95%,问需要抽查多少零件?(提示:总体方差取最大值) 7.某部门对职工进行家庭经济情况调查,取得年度项抽样资料如下,试以90%的概率保证程度,估计该部门职工的家庭月收入。 抽查结果统计表 8.某市有职工10万人,其中:职员4万人,工人6万人,现进行职工收入抽样调查,并划分职员与工人两类进行选样,要先按不同类型抽查40名职员与60名工人,结果如下:要求这次调查的极限误差不超过2元,概率保证程度 95.45%,试按类型抽样组织计算必要的抽样数目。 如果按简单随机抽样组织,试问:(1)同样的?和t,需按抽取多少样本单位数。(2)同样的样本单位数和概率保证程度,则会有多大的极限抽样误差。(3)同样的样本单位数和?应有多大的概率保证程度。 9.从某县的100个村中抽出10村进行各村的全户调查设平均每户饲养家禽35头,每村平均数的方差为16。 要求:(1)以90%的概率估计全县平均每户饲养家禽数。(2)如果极限误差 2.412 ?= x 则其概率保证程度如何?

统计学-基于R第3版习题答案(第二章)

习题 2.1 (1)简单频数分布表: > load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_1.RData") > summary(exercise2_1) 行业性别满意度 电信业:38 男:58 不满意:75 航空业:19 女:62 满意 :45 金融业:26 旅游业:37 二维列联表: > mytable1<-table(exercise2_1$行业,exercise2_1$满意度) > addmargins(mytable1) # 增加边界和 不满意满意 Sum 电信业 25 13 38 航空业 12 7 19 金融业 11 15 26 旅游业 27 10 37 Sum 75 45 120 三维列联表: > mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业 性别满意度 男不满意 11 7 7 11 满意 6 3 7 6 女不满意 14 5 4 16 满意 7 4 8 4 (2) 条形图: > count1<-table(exercise2_1$行业) > count2<-table(exercise2_1$性别) > count3<-table(exercise2_1$满意度) > par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8) > barplot(count1,xlab="行业",ylab="频数") > barplot(count2,xlab="性别",ylab="频数") > barplot(count3,xlab="满意度",ylab="频数")

2003-2016年中国人民大学统计学805考研真题集

人大统计学考研历年真题精华版(03- 16)

2016年人大学统计学考研真题(完整版) 1,构造几何分布,标准化的样本空间,取值空间,事件空间。 2,X、Y为随机变量,给出条件分布,对于任意y,E(X|Y<=y) = E(X|Y>y),那么X与Y是否独立?写出详细论证过程。 3,给出联合分布,求条件分布,和条件概率。 4,X与Y是相互独立的随机变量,请给出一个充分条件,当X和Y各自服从什么分布时X-Y与X+Y相互独立,如果不存在请说明理由。写出详细论证过程。 5,求一个密度函数的方差的极大似然估计,并求它的Fisher信息量。6,异方差性和自相关是什么,检测方法,加权最小二乘法原理与实际步骤。 7,证明多元回归系数的估计量是无偏估计,是最小方差线性无偏估计。8,多元线性回归,因变量均值与每个自变量间为二次函数关系,根据相互独立的n个样本预测因变量值。

2013年人大805统计学真题 一、证明题:(20分)每题10分 1.袋子里有两种颜色的球红球a个白球b个 第一步从袋子里取出一个球观察其颜色然后丢掉 第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。 证明取出的最后一个球是红球的概率是1/2。 2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。 二、简述:(30分)每题10分 1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。 2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布 3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少? 三、已知Y1,……,Y n是相互独立的随机变量,且均服从。求的矩估计和最大似然估计,并求他们的均方误差。(25分) 四、X和Y是两个相关的随机变量: 求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分) 五、谈谈你对双因素方差分析的理解和认识。(25分) 六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

统计学原理作业1答案

统计学原理作业1答案 统计学原理作业1 第一章~第三章 一、判断题 1、社会经济统计工作的研究对象是社会经济现象总体的数量方面。(×) 2、 统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。(×) 、全面调查包括普查和统计报表。(?) 3 4、统计分组的关键是确定组限和组距。(×) 5、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。(×) 6、我国的人口普查每十年进行一次,因此这是一种连续性调查方法。(?) 7、对全国各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本 情况。这种调查属于非全面调查。(?) 8、对某市工程技术人员进行普查,该市工程技术人员的工资收水平是数量标志。(?) 9、对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生产的 基本情况,这种调查是重点调查。(?) 10、我国人口普查的总体单位和调查单位都是第一个人,而填报单位是户。(?) 二、单项选题 1、设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位 是(C) A、每个工业企业 B、670家工业企业 C、每一件产品 D、全部工业产品 2、某市工业企业2003年生产经营成果年报呈报时间规定在2004年1月31日,则调查时限 ) 为(B A、一日 B、一个月 C、一年 D、一年零一个月

3、在全国人口普查中(B) A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、人国人口是统计指标 4、某机床厂要统计该企业的自动机床的产量和产值,上述两上变量是(D) A、二者均为离散变量 B、二者均为连续变量 C、前者为连续变量,后者为离散变量 D、前者为离散变量,后者为连续变量 5、下列调查中,调查单位与填报单位一致的是(D) A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查 6、抽样调查与重点调查的主要区别是(D) A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 7、下列调查属于不连续调查的是(A) A、每月统计商品库存额 B、每旬统计产品产量 C、每月统计商品的销售额 D、每季统计进口贸易额 8、全面调查与非全面调查的划分是以(C) A、时间是否连续来划分的 B、最后取得的资料是否全面完全来划分 C、调查对象所包括的单位是否完全来划分的 D、调查组织规模的大小来划分 9、下列分组中哪个是按品质标志分组(B) A、企业按年生产能力分组 B、产品按品种分组 C、家庭按年收入水平分组 D、人口按年龄分组 三、多项选择题 1、总体单位是总体的基本组成单位,是标志的直接承担者,因此(A,D) A、在国有企业这个总体下,每个国有企业就是总体单位 B、在工业总产值这个总体下,单位总产值就是总体单位 C、在全国总人口这个总体下,一个省的总人口就是总体单位

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

人大版_贾俊平_统计学_第三版_课后习题答案

第3章 概率与概率分布——练习题(全免) 1 .解:设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6 (4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2 4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。 解:设A =第1发命中。B =命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。 )|()()|()()(A B P A P A B P A P B P += =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1 或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 8.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少? 解: 设A =活到55岁,B =活到70岁。所求概率为: ()()0.63(|)0.75()()0.84 P AB P B P B A P A P A ==== 9.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策? 解:这是一个计算后验概率的问题。 设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。 P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为: 6115.050612 .030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P + 决策者会倾向于采用新的生产管理流程。 10. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。这三个企业产品的次品率分别为4%、5%、3%。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少? 解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:

统计学考试题及答案(中国人民大学第六版)

统计学 一、单选 1、从某高校随机抽出100名学生,调查他们每月的生活费支出,这研究的统计 量是 A 该校学生的总人数 B 该校学生的月月平均生活费支出 C 该校学生的生活费总支出 D 100名学生的月平均生活费支出 2、下列变量中,顺序变量是 A职工人数 B产量 C产品等级 D利润总额 3、将总体中所有单位按某种变量划分为若干层,再从各层中随机抽出一些单位 组成一个样本。这种抽样方式是 A 简单随机抽样 B 分层抽样 C 整群抽样 D 系统抽样 4、指出下面陈述中错误的是 A 抽样误差只存在于概率抽样中 B 非抽样误差只存在于非概率抽样中。 C概率抽样和非概率抽样都存在非抽样误差。 D在普查中存在非抽样误差。 5、展示广告费支出与商品销售量之间是否有某种数量关系,最适合的图形是 A柱形图 B饼图 C线图 D散点图 6、当样本量一定时,置信区间的宽度 A 随置信水平的增大而减小 B随置信水平的增大而增大 C与置信水平的大小无关 D与置信水平的平方根成反比 7、在检验一个正态总体方差时,使用的分布是 A z分布 B t分布 C X 分布 D F分布 8、指出下面陈述中的错误的是 A 抽样误差可以避免 B 抽样误差不可避免 C 非抽样误差可以避免 D 抽样误差可以控制 9、假设检验中,如果计算出的P值越小,说明检验的结果越 A 真实 B 不真实 C 显著 D 不真实 10、双因素方差分析涉及 自变量 A 一个分类型 B 一个数值型 C 两个分类型 D 两个数值型 二、填空题 1、当一组数据对称分布时,经验法则表明,大约有68%的数据分析在( 平均数±一个标准差 )的范围之内 2、对于一组具有单峰分布的数据而言,当数据的m m > 时,可判断数据是 (左偏)分布

统计学原理第三章习题答案

一. 判断题部分 1 : 对统计资料进行分组的目的就是为了区分各组单位之间质的不同。 (×) 2: 统计分组的关键问题是确定组距和组数。 ( × ) 3: 组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平 均分配次数。 ( × ) 3 : 分配数列的实质是把总体单位总量按照总体所分的组进行分配。 ( ∨ ) 4: 次数分配数列中的次数,也称为频数。频数的大小反映了它所对应的标 志值在总体中所起的作用程度。 ( ∨ ) 5: 某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。 (×) 6: 连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重 叠的方法确定组限。 ( ∨ ) 7: 对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所 以这种分组会使资料的真实性受到损害。 ( ∨ ) 8: 任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于 或 100%。( × ) 9: 按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都 可称为次数分布。 ( ∨ ) 10:按数量标志分组的目的,就是要区分各组在数量上的差异。 ( 11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位 的差异。( ∨ ) 12:分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作第三章 统计资料整理 ×)

用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越 小。( × ) .单项选择题部分 2: 在组距分组时,对于连续型变量,相邻两组的组限( A )。 A 、 必须是重叠的 B 、必须是间断的 C 、可以是重叠的,也可以是间断的 D 、必须取整数 3: 下列分组中属于按 品质标志分组 的是( B )。 A 、学生按考试分数分组 B 、产品按品种分组 C 、企业按计划完成程度分组 D 、家庭按年收入分组 4 : 有一个学生考试成绩为70分,在统计分组中,这个变量值应归入 ( B )。 A 、60---70 分这一组 B 、 70---80 分这一组 C 、60— 70或 70—80两组都可以 D 、作为上限的那一组 5: 某主管局将下属企业先按轻、重工业分类,再按企业规模分组,这样的 分组属于( B )。 A 、简单分组 B 、复合分组 C 、分析分组 D 、结构分组 6: 简单分组和复合分组的区别在于( B )。 A 、选择的分组标志的性质不同 B 、选择的分组标志多少不同 1: 统计整理的关键在( B A 、对调查资料进行审核 C 、对调查资料进行汇总 )。 B 、 对调查资料进行统计分组 D 、编制统计表

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

2011年人大考研统计学真题

2011年人大考研统计学真题 感觉很注重统计思想和方法的考察,题目很不错! 一、简答题(50分) 1.简述加权最小二乘估计的基本思想。 2.进行主成分分析需是否要知道数据的具体分布,请说明原因。 3.k-均值聚类对比分层聚类,优点在哪里。 4.题目给出了一个回归分析残差的散点图,有点线性趋势的那种,问据图分析可能出现了什么问题。 5.简述方差分析和回归分析的异同。 二、已知X与W相互独立(30分)。 1.X与W都服从正态分布,且W的期望为零,Y=a+bX+W,求X与Y的联合分布。 2.W服从正态分布,其期望为零,方差为?2(是表示平方),Y=b0+b1X+b2X2(是表示平方) +W,当X=x时求Y的条件期望。 三、CPI是衡量经济发展的重要指标,CPI的计算包括收集数据的四个阶段和确定权数的两个阶段,(他这里描述了这六个阶段的具体操作方法)。(30分) 1.结合调查知识和统计理论说明CPI所属类别(这个有待考证,希望大家来修正~)。 2.指出CPI的调查过程中误差的可能来源。 3.指出这个过程中涉及的调查总体、随机变量及待估总体的特征。 4.如果每个阶段的调查都严格按照1—a的置信水平,那么总的置信水平是多少。 四、假设女性和男性读书的语速都服从正态分布。研究者认为女性读书的语速比男性快,为证明这一点抽取了n1名女性和n2名男性,分别测得他们读书的语速,发现n1名女性的平均语速比n2名男性快,研究者由此得出女性读书的语速比男性快的结论。请问研究者的方法对吗?为什么?应该怎样验证?(20分) 五、题目给出了从2006年1月到2010年6月的商品销售额的时间序列图(有明显线性趋势的),现在想预测2010年下半年的商品销售额,请问用什么应该模型,写出模型的具体形式和模型的建立过程。(20分)

相关主题
文本预览
相关文档 最新文档