当前位置:文档之家› 人大统计学专业课初试题

人大统计学专业课初试题

人大统计学专业课初试题
人大统计学专业课初试题

2003年人大统计学专业课初试题

一、(15分)考虑两个国家之间按GDP进行经济比较。假定在既定汇率水平上,甲国GDP与乙

国GDP之间的比例为1:20。一场金融危机放生之后,如果甲国货币相对乙国货币贬值了50%,那么,在新的汇率水平上,两国GDP之间的比例将变化为1:40。请问:我们能否根据比较结果说甲国的经济发展水平下降了50%?这种比较所包含的统计方法问题是什么?

二、(15分)假定一时期国际收支平衡表上“储备资产变动”一项为正差额100亿元,据此,应

用国际收支平衡表原理判断当期国际收支的顺、逆差状况。

三、(30分)以下是某经济总体1985和2001两年份城镇居民住户部门的调查资料。要求:

(1)列表计算各年城镇住户部门的原始收入、可支配收入和最终消费支出;(15分)

(2)计算有关指标,比较说明城镇居民住户部门经济活动特征的变化。(15分)

四、(30分)一家种业开发股份公司研究出三个新的小麦品种:品种一、品种二、品种三。公司

为研究不同品种对产量的影响,选择了四个面积相同的地块进行试验,分别为:地块一、地

块二、地块三、地块四。经过试验获得产量数据,经分析得到下面的方差分析表(α=0.05):

(1)将方差分析表中划线部分的数值补齐;(6)

(2)分析小麦品种对产量的影响是否显著;(4)

(3)分析不同地块对产量的影响是否显著;(4)

(4)在产量变动的差异中,被品种所解释的百分比是多少?(3)

(5)在产量变动的差异中,被地块所解释的百分比是多少?(3)

(6)上面的分析包含哪些假定?(10)

五、(30分)统计资料表明,某地区职工年人均病假天数为5.1天。某公司从本公司职工中随机

抽取了46名职工作为样本,测得其平均病假天数为7天,样本标准差为2.5天。公司领导想知道本公司职工是否比其他单位的职工更容易生病。

(1)公司领导感兴趣的原假设和替换假设是什么?(3)

(2)若令α=0.05,请用假设检验的方法帮助公司领导作出判断(写清检验步骤,并作示意图)。(10)(zα/2=1.96,zα=1.645,tα/2(45)=2.0141,tα(45)=1.6794)(3)在假设检验中,P值代表什么含义?(6)

(4)在本例中,P=0.001说明了什么?(3)

(5)用区间估计的方法找出该公司职工病假天数与其他职工病假天数显著不同的临界点。(8)

六、(30分)关于回归分析讨论下列问题:

(1)画出回归建模步骤的流程图;(7)

(2)简要描述各个步骤的内容;(8)

(3)设

1

?()

X X X y

β-

''

=是多元回归方程参数的最小二乘估计,证明21

?()()

D X X

βσ-

'

=;(8)

(4)由

21

?()()

D X X

βσ-

'

=,结合一元线性回归,你能看出对建模有指导意义的什么信息(7)

2004年人大统计学专业课初试题

本试卷分为两部分,一部分为必答题,计105分,一部分为选答题,计45分。

第一部分必答题

1.(25分)下面是A、B两个班学生的数学考试成绩数据:

A班:

55 76 66 85 75 62 79 73 93 76

67 85 74 61 78 71 92 79 65 83

73 57 77 70 90 75 63 81 73 96

B班:

34 71 56 90 66 48 81 58 96 71

55 85 62 44 79 57 95 68 54 84

61 39 73 57 94 68 51 82 61 100

(1)将两个班的考试成绩用一个公共的茎制成茎叶图,比较两个班考试成绩分布的特点;

(2)两个班考试成绩的描述统计量如下,试进行比较分析:

(3)要判断考试成绩是否有离群点,可使用哪些方法?

(4)要判断考试成绩是否服从正态分布,可使用那些描述性方法?

2.(25分)某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最

多,随机抽取了30名工人,并指定每人使用其中的一种方法。通过Excel进行方差分析得到下面的部分结果:方差分析表

(1)完成上面的方差分析表;

(2)若显著性水平α=0.05,检验三种方法组装的产品数量之间是否有显著性差异;

(3)在上面的方差分析中包含了哪些基本假定?

(4)简述多重比较的前提和作用。

3.(20分)一袋中有黑、白两种球,p表示白球所占的比例,待检验假设为H0:p=1/2;H1:p=1/5。从袋中任取4个球(放回抽样),当白球数小于2时,拒绝原假设。试给出以下内容:

(1)总体及其分布;

(2)样本量n;

(3)拒绝域;

(4)第一类错误的概率。

4.(15分)试举例说明方差分析中效应的意义和用效应如何表达它的数学模型。

5.(20分)试证明正态线性回归模型其回归系数的最大似然估计与最小二乘估计相同。

第二部分选答题(在下面五道题中任选三道题)

6.(15分)下表是中国1992和2002两个年份国民经济核算的部分资料。要求:

(1)根据资料,计算反映经济发展状况的基本总量指标和结构比例指标;

(2)根据计算结果,对10年间中国经济发展特征及其变化予以简要说明。

中国国民经济核算有关资料单位:亿元

7.(15分)2003年7月,中央政府和香港特区政府签定了简称CEPA的《内地与香港关于建立

更紧密经贸关系的安排》。其中内容之一是自2004年起,273种香港原产货物进入内地市场实行零关税;内容之二是放宽香港企业对内地投资的限制,包括投资的行业、注册资本数额和资质条件等。可以预见,由此将大大促进香港对内地的贸易和投资活动。

要求:根据上述贸易和投资两方面的内容,应用国际收支平衡表原理,说明中国未来国际收支所产生的影响。(说明:根据目前中国国民经济核算,仍将香港作为“非常住单位”,

即作为“境外”看待。)

8.(15分)假定某地区人口和劳动力就业统计数据如下表所示,要求:

(1)计算有关指标,描述该地区人口基本结构状况;

(2)计算有关指标,描述该地区人口变动状况;

(3)计算有关指标,描述该地区劳动就业状况。

单位:万人

9.(15分)对(30)的1000元3年定期寿险,死亡年末给付,保费在两年内每年缴一次。已知

预定利率为5%,q30=0.02,q31=0.03,q32=0.04,,假设费用发生在保年初,各年费用为:

年份每份保单每1000元保额占总保费的比例

1 10 2.5 0.10

2 5 1.0 0.05

3 5 1.0 —

赔付处理费发生在死亡年末,每1000保额为10元,假设有退保。计算:

(1)每年总保费;

(2)第一年在总保费下的责任准备金。

10.(15分)某人在25岁时计划每年初存入200元建立个人账户,如果他在60岁退休,存款利

率假设恒定为4%。

(1)求退休时个人账户的累计额;

(2)如果个人账户累计额在退休后以固定年金方式在30年内每月领取一次,求每月可以领取的数额。

2005年人大统计学专业课初试题

一、(15分)一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据

(1)画出该组数据的茎叶图;

(2)画出该组数据的箱线图;

(3)根据茎叶图和箱线图说明上网者年龄分布的特征。

二、(15分)设有三个总体的均值分别为:μ1,μ2,μ3。要检验三个总体的均值是否相等(α=0.05),我们为什么不先将它们简单地配对,即H0:μ1=μ2,H0:μ1=μ3,H0:μ2=μ3,,然后分别进行检验,而是采用方差分析的方法? 三、(20分)某城市的餐饮管理协会估计,餐馆的月平均用水量为100吨,一家研究机构认为实

际用水量要高于这个数字,该研究机构随机抽取了36家餐馆,记录了每个餐馆的月用水量(单位:吨),经过初步计算得到样本数据的部分描述统计量如下:

平均 107 标准误差 4.99 样本标准差 29.96 样本方差 897.77

(1)确定餐馆月平均用水量95%的置信区间;

(2)餐馆实际月平均用水量在你所建立的置信区间里吗?请说明原因; (3)如果要检验研究机构的看法是否正确,应该如何建立原假设和备择假设?请谈谈拒绝和

不拒绝原假设的含义;

(4)在上面的估计和检验中,你使用了统计中的哪一个重要定理?请简要解释这一定理。 (z0.05=1.645, z0.025=1.96,t0.05=1.69,t0.025=2.03) 四、(20分)一家房地产评估公司想对某城市的房地产销售价格(y )与地产评估价值(x1)、房

产评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格做合理预测。为此,收集了15栋住宅的房地产评估数据,经回归得到下面的有关结果(α=0.05):

15 19 22 24 30

16 19 22 24 31

17 20 23 25 34

18 20 23 27 38

19 21 23 29 41

(1)写出销售价格对地产评估价值、房产评估价值、使用面积的多元线性回归方程,并解释各回归系数的意义;

(2)检验回归方程的线性关系是否显著;

(3)检验各回归系是否显著;

(4)计算多重判定系数R2,并说明它的实际意义;

(5)计算估计标准误差sy,并说明它的实际意义;

(6)你认为使用面积(x3)在预测销售价格时是否有用?试说明理由。

五、(42分)假设一个已知简单总体的全部真实数据列于下表:

(1)绘出散点图;

(2)如果根据Y的数值将总体分成两个子总体,最好的分发是什么?

(3)举例说明上表数据所反映的现象可能是什么?

(4)计算出Y的总体均值Y和总体方差S2;

(5)四种基本抽样方式中最不适合上述总体情形的是哪一种?并说明理由;

(6)对其余三种基本抽样方式,假定n=2,分别列出每一种方式所对应的全部可能样本,并计算样本均值的数学期望和方差;

(7)计算每一种方式在此情形下的设计效应,并说明其意义。

六、(8分)说明抽样里的回归估计与一般回归分析方法的联系与区别。

七、(6分)请解释下面的说法:“生产核算的范围决定了收入分配和收入使用核算的范围”。

八、(9分)A、B两个地区的贫困线均为年收入1000元。A地区有11%的人年收入900元,9%

的人年收入200元;B地区有1%的人年收入900元,9%的人年收入500元。

(1)根据上述数据,计算两地区的贫困者比重和贫困深度;(2)

(2)请根据贫困者比重和贫困深度对两地区贫困状况进行简要的比较分析;(4)

(3)你觉得这两个指标能够准确反映两地区贫困状况的差异吗?如果不能,应当如何改进(3)九、(15分)下面是某国某核算年度的国际收支平衡表(单位:亿元):

(1)在表中括号内填上适当的数字;(3)

(2)请解释储备资产所对应的-125亿元的含义;(3)

(3)根据表中数字分析该国国内生产总值、国民总收入和国民可支配收入三者之间的关系(6)(4)根据表中数字,对于该国当年国内的投融资状况你能得出何种结论?(3)

2006年人大统计学专业课初试题

一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种

是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8

(1)画出第二种排队方式等待时间的茎叶图;

(2)比较两种排队方式等待时间的离散程度;

(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。

二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生

产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:克)如下:

已知食品包重量服从正态分布,要求:

(1)确定该种食品平均重量95%的置信区间;

(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;

(3)利用P值进行检验和利用统计量进行检验有什么不同?

(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)

三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。

为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平α=0.01下得到的有关结果如下:

差异源SS df MS F P-value F crit

行列误差总计1.55

3.48

0.14

5.17

4

2

8

14

0.39

1.74

0.02

21.72

97.68

0.000236

0.000002

7.01

8.65

(1)不同的车速对磨损程度是否有显著影响?

(2)不同供应商的轮胎之间磨损程度是否显著差异?(3)在上面的分析中,你都做了哪些假设?

四、(15分)说明什么条件下适合采取简单随机抽样?

五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。

六、(20分)解释因子模型X=AF+ε的意义并写出模型的假设。

七、(15

(1)根据国民经济收入分配核算原理,说明居民人均收入低于人均GDP水平的原因;(2)计算各指标的动态变动率(不考虑价格变化),对其结果予以简要分析。

八、(15分)下表是中国全部国有及规模以上非国有供企业统计的主要指标,要求:

(1)设计并计算反映企业经济效益的指标;

2007年人大统计学专业课初试题

一、(20分)下面是一种零件误差的数据(单位:克):

6.1 4.7 6.5 6.2

7.7

6.4 5.5

7.1 6.1 5.3

5.7

6.1 5.3 4.0 4.8

3.2 3.9 1.9

4.9 3.8

5.3 2.6 5.3 5.5 5.8

2.7 6.8 7.4 5.6

3.3

(1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,

5.728882)。请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能不能

用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法;

(2)对于该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。如果进行t检验,需要假定哪些条件?t检验结果为p值等于0.0807。

能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么?

二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行

抽样调查。请回答以下问题:

(1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么?

(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的?

(3)这些员工的加班时间是否独立?如果不是,原因可能是什么?

三、(20分)某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。但一家

研究机构则认为自驾车上班的人数比例达不到这一水平。为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。

(1)请写出检验的原假设和备择假设;

(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件;

(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著?

四、(10分)在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%”,

那么该报告是否负责?一个负责任的调查报告应该给什么有关信息?

五、(10分)对于主成分分析,有人在进行了主成分分析之后,对得到的主成分又进行了第二次

主成分分析,以得到更加精确的结果。请问,这样做是否有道理?请加以说明。什么样的数据不适宜于主成分分析?选择那些主成分累计方差贡献率为70-80%之类的准则是不是总是适用?为什么?

六、(20分)回归模型y=β0+β1x1+β2x2+…+βpxp+ε中的ε一定是随机误差吗?如果回答是

否定的,讨论在何种情况下,答案是肯定的?此外,最小二乘回归是不是需要对误差项作出假定?如果不是,那么在什么情况下需要对误差项作出假定?作什么假定?

七、(25分)对于聚类分析,请回答以下问题:

(1)分层聚类前,需要对什么进行选择?

(2)描述分层聚类分析的详细步骤;

(3)描述K均值(快速)聚类分析的详细步骤。

八、(25分)应用多元线性回归模型y=β0+β1x1+β2x2+…+βpxp+ε,如果一个SPSS回归分

析的结果如下表所示:

a. Predictors:(Constant),Beginning Salary

b. Predictors:(Constant),Beginning Salary,Employment Category

则:

(1)表中所用选择自变量的方法可能是什么?

(2)表中的最后一个Sig.如何求得?意义是什么?

(3)请给出该表最后一个F所表示的统计量服从F分布所需要的假定条件,并对该统计量服从F分布予以证明。

一、(10分)07年香港一则报道说:“随着经济的增长,香港低收入家庭的比例在增长,其中低

收入的家庭是指低于中位数的家庭。”请你从统计的角度对该报道做简要评论。

二、(10分)经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?请

谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。

三、(10分)如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立什么

样的预测模型?请你写出模型形式并加以简要说明。

四、(30分)食品厂家说:净含量是每袋不低于250g。但有消费者向消协反映不是250g,消协

据此要求厂家自检,同时消协也从中随机抽取20袋检验。

(1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?并说明理由;

(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?并说明理由;

(3)消协抽取20袋,数据如下(略),得p值为0.4297,在α=0.5的显著水平下,检验假设意味着什么?p值的含义是什么?

(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际平均重量是否在该区间?为什么?

五、(15分)在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。

(1)请具体指明这些假设有哪些?

(2)说明这些假设所发挥的主要作用;

(3)请讨论这些假设最终产生的影响。

六、(15分)在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并不包

括整群抽样,请说明你赞同与否并详列理由。

七、(30分)叙述贝叶斯判别分析的原理(包括完整的假设)并说明:

(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点?

(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?

八、(30分)在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考虑许多因素。

(1)以大坝为例,概略说明需考虑的主要因素;

(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出计算坝高详细的具体步骤。(画出框图,并尽量避免过多使用文字)

一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机样

本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值?

二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。

三、周期过程

cos()t t X A ω?=+,

其中频率ω和振幅A 都是常数,而相位?是一个在区间[-π,π]

上服从均匀分布的随机变量。问{

t X }是否平稳?说明原因。

四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如采用

奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有

相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”)

五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样的。

六、若有线性回归模型01 (1,2,,)t t t y x t n ββε=++= ,其中()0t E ε=,

222

()t t E x εδ=,()0 ()t s E t s εε=≠,则

(1)该模型是否违背古典线性回归模型的假定?请简要说明。

(2)如果对该模型进行估计,你会采用什么方法?请说明理由。

七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一组

10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。假定40只白鼠的初始活动状态相同。请详细阐述你用何种方法分析安眠药的效果?

八、某大学从教师中抽取一个随机样本进行满意度调查。1分表示非常不满意,100分表示非常

满意。数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则

(1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。

(2)要采用该分析方法,数据必须满足哪些几本假定?请加以说明。

2010年人大统计学专业课初试题

一、五道问答题(50分)

1.两地区的什么比例(好像是收入的均值吧),运用t检验得出p值为0.132,据此能否得出这两个地区的均值相等的结论?

2.在参数统计中,卡方分布有哪些应用,并举例说明

3.贝叶斯统计与经典统计的区别

4.时间序列的弱平稳的含义

5.对于多元回归中的多重共线性的解决方法加以评述

二、给出三个运动员10次射击的数据,问哪些统计图图可以表示这些数据,及这些图的适用场

合和特点。用哪些统计量综合分析三个运动员的表现,这些统计量各有什么特点。(15分)

三、R型聚类与Q型聚类含义?聚类分析与判别分析区别?层次聚类的步骤?(25分)

四、消费者认为土豆片平均重量<60g,商家怀疑是运输过程中土豆片碎片沉积造成的。商家从其

最大供应商抽取样品进行检验,H0:均值大于等于60g,H1:均值小于60g,如果得出均值小于60g的结论商家将拒绝该供应商的土豆片并对其起诉。(15分)

(1)该题中的第一类错误是什么?

(2)第二类错误是什么?

(3)顾客认为哪类错误比较重要?厂家认为哪类错误比较重要?

五、给出x1,x2,...,x7个自变量,要求找出能描述某市各县区经济发展的综合变量,从而分析经济

发展的的内在原因。用什么模型?这种模型对数据有什么要求?模型有哪些假设?如何得到参数估计值?如何根据结果分析该模型?(25分)

六、银行估计其排队时间,随机抽取了15位顾客进行调查。得到了一个排队均值的置信区间,

请问要计算出均值的置信区间需要什么假设?如何验证数据是否满足这一假设?能不能说这个区间包含均值的真值?为什么?检验得到的p=一个很小的数(好心是10的负十次方),能不能说银行的认识正确?(20分)

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

人大统计学考研真题

人大统计学考研历年真题精华版(03-09) https://www.doczj.com/doc/453951445.html,

https://www.doczj.com/doc/453951445.html, 2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机 样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间 [-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如 采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随 机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样 的。 六、若有线性回归模型01 (1,2,,)t t t y x t n ββε=++= ,其中()0t E ε=,222()t t E x εδ=, ()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一 组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

南昌大学统计学题

1,在置信水平不变的条件下,要缩小置信区间,则() A 需要增加样本容量 B 需要减少样本容量 C 需要保持样本容量不变 D 需要改变统计量的抽样标准差 2,根据两个匹配的小样本估计两个总体均值之差时使用的分布是()A 正态分布B t分布C 卡方分布D F分布 3,从标准差为6的正态总体中抽取一个n=16的随机样本,算得均值为28.7,则总体均值的95%的置信区间为() A (25.76,31.64) B (26.76,32.64) C (27.76,33.64) D (28.64,34.64) 4,环保部门想检验餐馆一天所用的快餐盒平均是否超过600个,建立的原假设和备择假设为 H0:μ≤600,H1:μ>600,所犯的第I类错误是() A 当μ≤600时,声称μ>600 B当μ=600时,声称μ=600 C 当μ≤600时,声称μ>600 D 当μ≥600时,声称μ>600 5,在现实经济生活中,拉氏价格指数一般()帕氏价格指数 A 大于 B 小于 C 等于 D 不能确定 6,某商产计算期销售额为基期的104.5%,价格平均下降5%,则商品销售量的变动应为() A +4.5 B +0.5 C +9.5 D +10 7,已知某地区粮食产量的环比发展速度2002年为103.5%,2003年为104%,2005年为105%,2005年对于2001年的定基发展速度为116.4%,则2004年的环比发展速度为()

A 103% B 101% C 104.5% D 113% 8,某地区粮食产量的增长量1995-2000年每年均为20万吨,2000-2005年每年也均为20万吨。那么1995-2005年期间,该地区粮食产量每年的增长速度() A 逐年上升 B 逐年下降 C 保持不变 D 不能确定 9,对于有线性相关关系的两变量建立的有意义的直线方程y=a+bx 中,回归系数b() A 可能小于0 B 只能大于0 C 只能小于0 D 可能等于0 10,从3个总体中选取4个观察值,得到组间平方和与组内平方和分别为536、828,问组间均方与组内均方分别为() A 238,92 B 134,103.5 C 179,92 D 268,92 11、变量之间的相关程度越低,则相关系数的数值() A 越小 B 越接近+1 C 越接近-1 D 越接近0 12、在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量标准之一是使它与总体参数的离差越小越好。这种评价标准为() A 无偏性 B 有效性 C 一致性 D 充分性 13、拉氏指数方法是指在编制综合指数时,() A 用基期的变量值加权 B 用报告期的变量值加权 C 用固定某一期的变量值加权 D 选择有代表性时期的变量值加权 14、某组数据的四分之一分位数是45,中位数是65,四分之三分位数是85,则该组数据的分布是()

人大统计学真题

人大统计学考研历年真题精华版 (03-09) —By fan (声明:这是由fan整理编辑,仅供参考。) https://www.doczj.com/doc/453951445.html,

https://www.doczj.com/doc/453951445.html, 2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机 样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间 [-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如 采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随 机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样 的。 六、若有线性回归模型01 (1,2, ,)t t t y x t n ββε=++=,其中()0t E ε=,222()t t E x εδ=, ()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一 组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记

社会统计学自考真题

浙江省2006年4月高等教育自学考试 社会统计学试题 课程代码:00278 一、填空题(本大题共8小题,每空1分,共10分) 请在每小题的空格中填上正确答案。错填、不填均无分。 1.统计资料整理阶段的基本方法是________。 2.调查人员从记录社会现象的各种载体中获取所需信息的调查方法,称为________。 3.若采用异距分组,________用来反映单位组距内分布的频数。 4.将所有变量值按大小顺序排列,中位数就是________的变量值。 5.已知各期的环比发展速度,应采用________法计算平均发展速度。 6.时间数列的两个基本构成要素是________和________。 7.推论统计的两个基本内容是________和________。 8.在数据的各种测量尺度中,既可进行加减运算,也可进行乘除运算的测量尺度是________。 二、单项选择题(本大题共30小题,每小题1分,共30分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.一个总体单位( ) A.只能有一个标志 B.只能有一个指标 C.可以有多个标志 D.可以有多个指标 2.政治算术学派的代表人物是( ) A.康令 B.格朗特 C.凯特勒 D.恩格尔 3.要了解某企业员工的收入,则总体单位是( ) A.该企业的全部员工 B.该企业每个员工的收入水平 C.该企业的每一个员工 D.该企业全部员工的平均收入水平 4.下列属于品质标志的是( ) A.工人年龄 B.工人性别 C.工人体重 D.工人工资等级 5.实际工作中,最常用的分类抽样是( ) A.定额分配 B.等额分配 C.定比分配 D.异比分配 6.抽样调查应遵循的原则是( ) A.灵活性 B.准确性 C.可靠性 D.随机性

人民大学统计学在职题库统计综述答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学 考试科目:统计思想综述 课程代码:123201 考题卷号:1

除不能导致SSE显著减小为止。 逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除。如此反复, 直到增加变量不能导致SSE显著减少为止。 五、(20分)如果一个时间序列包含趋势、季节成分、随机波动, 适用的预测方法有哪些?对这些方法做检验说明。 可以使用Winter指数平滑模型、引入季节哑变量的多元回归和分解 法等进行预测。 (1)Winter指数平滑模型 包含三个平滑参数,即(取值均在0~1),以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。 L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更新是t期的季节调整因子, 是用于预测的模型。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,

而且需要有四个以上的季节周期(4年以上的数据)。 (2)引入季节哑变量的多元回归 对于以季度记录的数据,引入3个哑变量 ,其中=1(第1季度)或0(其他季度),以此类推,则季节性多元回归模型表示为: 其中b0是常数项,b1是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第1季度的平均差值。(3)分解预测 第1步,确定并分离季节成分。计算季节指数,然后将季节成分从 时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。 第2步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。 第3步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。

大学统计学简答题复习及答案

习题一总论 1?简述统计总体和总体单位的含义及其关系。 统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体。总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。总体可以变为总体单位,总体单位可以变为总体。 2 ?什么是指标和标志?指标与标志的关系如何? 指标即统计指标,指反映统计总体综合数量特征的概念和数值。标志指说明总体单位特征的名称。指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的。②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。 习题二统计调查 1.完整的统计调查方案应包括哪些主要内容? 应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④ 确定调查时间和调查期限;⑤确定调查的组织和实施计划。 2.调查对象、调查单位和填报单位有何区别? 调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。 3?重点调查与典型调查的区别是什么? 主要区别表现在两个方面: ①典型单位和重点单位性质不同。典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有 意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。 ②侧重点不同。典型调查的主要目的是认识事物本质特征及其发展规律,调查深入细致,同时也注重定性调查; 而重点调查的目的主要是掌握总体的数量状况,着眼于普遍情况,注重量的调查。

统计学-基于R第3版习题答案(第二章)

习题 2.1 (1)简单频数分布表: > load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_1.RData") > summary(exercise2_1) 行业性别满意度 电信业:38 男:58 不满意:75 航空业:19 女:62 满意 :45 金融业:26 旅游业:37 二维列联表: > mytable1<-table(exercise2_1$行业,exercise2_1$满意度) > addmargins(mytable1) # 增加边界和 不满意满意 Sum 电信业 25 13 38 航空业 12 7 19 金融业 11 15 26 旅游业 27 10 37 Sum 75 45 120 三维列联表: > mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业 性别满意度 男不满意 11 7 7 11 满意 6 3 7 6 女不满意 14 5 4 16 满意 7 4 8 4 (2) 条形图: > count1<-table(exercise2_1$行业) > count2<-table(exercise2_1$性别) > count3<-table(exercise2_1$满意度) > par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8) > barplot(count1,xlab="行业",ylab="频数") > barplot(count2,xlab="性别",ylab="频数") > barplot(count3,xlab="满意度",ylab="频数")

2003-2016年中国人民大学统计学805考研真题集

人大统计学考研历年真题精华版(03- 16)

2016年人大学统计学考研真题(完整版) 1,构造几何分布,标准化的样本空间,取值空间,事件空间。 2,X、Y为随机变量,给出条件分布,对于任意y,E(X|Y<=y) = E(X|Y>y),那么X与Y是否独立?写出详细论证过程。 3,给出联合分布,求条件分布,和条件概率。 4,X与Y是相互独立的随机变量,请给出一个充分条件,当X和Y各自服从什么分布时X-Y与X+Y相互独立,如果不存在请说明理由。写出详细论证过程。 5,求一个密度函数的方差的极大似然估计,并求它的Fisher信息量。6,异方差性和自相关是什么,检测方法,加权最小二乘法原理与实际步骤。 7,证明多元回归系数的估计量是无偏估计,是最小方差线性无偏估计。8,多元线性回归,因变量均值与每个自变量间为二次函数关系,根据相互独立的n个样本预测因变量值。

2013年人大805统计学真题 一、证明题:(20分)每题10分 1.袋子里有两种颜色的球红球a个白球b个 第一步从袋子里取出一个球观察其颜色然后丢掉 第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。 证明取出的最后一个球是红球的概率是1/2。 2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。 二、简述:(30分)每题10分 1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。 2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布 3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少? 三、已知Y1,……,Y n是相互独立的随机变量,且均服从。求的矩估计和最大似然估计,并求他们的均方误差。(25分) 四、X和Y是两个相关的随机变量: 求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分) 五、谈谈你对双因素方差分析的理解和认识。(25分) 六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

2008年中山大学823社会研究方法和社会统计学考研真题【圣才出品】

2008年中山大学823社会研究方法和社会统计学考研真题 中山大学 2008年攻读学位研究生入学考试试题 科目代码:823 科目名称:社会研究方法和社会统计学 社会研究方法部分(75分) 一、名词解释(每小题3分,共18分) 1.社会研究(social research) 2.双盲实验(double—blind experiment) 3.探索性研究(exploration research) 4.封闭式问题(closed—ended questions) 5.同期群研究(cohort studies) 6.语义差异量表(semantic differential scale) 二、简答题(每题7分,共21分) 1.在问卷调查中,一般都是采取由样本“自我报告”或“自我陈述”的方式进行测量。请问:有哪些因素干扰这种测量方式的可靠性? 2.请解释“经典实验设计”(the classical experiment design,也称双组前后测模式)

的基本含义及其基本要素。 3.在抽样中,影响样本规模(sample size)确定的因素主要有哪些? 三、分析:请从下列各小题中任意选择三小题予以回答,多选无效(每题12分,共36分) 1.请简单解释社会研究中的“创新原则”的基本意义,并列举研究中的创新都有哪些方式。 2.对问卷调查的批评之一是认为在测量中将会受到“研究者的主观预设”的影响从而妨碍资料及其研究的真实可靠性,请谈谈你的看法。 3.常有人说可以在一个实证研究项目中结合使用“定量研究方法”和“定性研究方法”,你认为这种结合有没有可能性,如果有,可以采取什么样的具体方式? 4.简述“理论检验”的程序并试举一例说明(不要求在每一步都举例)。 社会统计学部分(75分) 一、选择题(在ABCD四项答案中选择一项最合适的答案写在答题纸上,每题2分,共20分) 1.下列哪种基本技术最适合描述职业的分布() A.折线图 B.直方图 C.箱线图 D.环形图

人大版_贾俊平_统计学_第三版_课后习题答案

第3章 概率与概率分布——练习题(全免) 1 .解:设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6 (4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2 4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。 解:设A =第1发命中。B =命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。 )|()()|()()(A B P A P A B P A P B P += =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1 或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 8.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少? 解: 设A =活到55岁,B =活到70岁。所求概率为: ()()0.63(|)0.75()()0.84 P AB P B P B A P A P A ==== 9.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策? 解:这是一个计算后验概率的问题。 设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。 P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为: 6115.050612 .030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P + 决策者会倾向于采用新的生产管理流程。 10. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。这三个企业产品的次品率分别为4%、5%、3%。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少? 解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:

统计学考试题及答案(中国人民大学第六版)

统计学 一、单选 1、从某高校随机抽出100名学生,调查他们每月的生活费支出,这研究的统计 量是 A 该校学生的总人数 B 该校学生的月月平均生活费支出 C 该校学生的生活费总支出 D 100名学生的月平均生活费支出 2、下列变量中,顺序变量是 A职工人数 B产量 C产品等级 D利润总额 3、将总体中所有单位按某种变量划分为若干层,再从各层中随机抽出一些单位 组成一个样本。这种抽样方式是 A 简单随机抽样 B 分层抽样 C 整群抽样 D 系统抽样 4、指出下面陈述中错误的是 A 抽样误差只存在于概率抽样中 B 非抽样误差只存在于非概率抽样中。 C概率抽样和非概率抽样都存在非抽样误差。 D在普查中存在非抽样误差。 5、展示广告费支出与商品销售量之间是否有某种数量关系,最适合的图形是 A柱形图 B饼图 C线图 D散点图 6、当样本量一定时,置信区间的宽度 A 随置信水平的增大而减小 B随置信水平的增大而增大 C与置信水平的大小无关 D与置信水平的平方根成反比 7、在检验一个正态总体方差时,使用的分布是 A z分布 B t分布 C X 分布 D F分布 8、指出下面陈述中的错误的是 A 抽样误差可以避免 B 抽样误差不可避免 C 非抽样误差可以避免 D 抽样误差可以控制 9、假设检验中,如果计算出的P值越小,说明检验的结果越 A 真实 B 不真实 C 显著 D 不真实 10、双因素方差分析涉及 自变量 A 一个分类型 B 一个数值型 C 两个分类型 D 两个数值型 二、填空题 1、当一组数据对称分布时,经验法则表明,大约有68%的数据分析在( 平均数±一个标准差 )的范围之内 2、对于一组具有单峰分布的数据而言,当数据的m m > 时,可判断数据是 (左偏)分布

社会统计学习题 卢淑华

1、P58习题十五 人数户数 0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21 (1)试作频率统计表,直方图和折线图 (2)试求均值和标准差 2、P59习题十六 设以下是七十二名离婚者的婚龄的统计(见下表)。 (1)试作频率统计表、直方图和折线图 (2)试求众值、中位值和均值,并做简单讨论。 (3)试求四分互差和标准差。 婚龄人数 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 1 3、P59习题十七 设以下是1209名抽烟者年龄的统计(见下表) 年龄人数 21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89 (1)试作频率统计表、直方图和折线图 (2)试求四分互差。 4、P72例10 某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?

5、P73例12 根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少? 6、P75例13 为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少? 7、P75例14 某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少? 8、P76例16 根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少? 9、P77例17 某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少? 10、P78例18 某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20 设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少? 12、P83例22 10人抓阄,其中共有2张球票,问第2个人抓到球票的概率? 13、P85例23 设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。设上海厂得正品率为90%;北京厂的正品率为95%,天津厂的正品率为97%。问(1)任抽一件为正品的概率是多少?(2)在抽得产品是正品的情况下,是上海厂的概率是多少? 14、P99例27 已知随机变量的概率分布为 ξ13.4 13.5 13.6 13.7 13.8 P(ξ=Xi)0.05 0.15 0.60 0.15 0.05 求σ2=? 15、P106习题三 某班对全班订报纸情况进行了统计,中订《人民日报》的有45%;订《北京晚报》的有80%;两种报纸都订的有30%,试求以下事件的概率。 (1)只定人民日报的 (2)至少订以上一种报纸的 (3)只订以上一种报纸的 (4)以上两种报纸都不订的 16、P107习题6 根据统计,由出生活到60岁的概率为0.8,活到70岁的概率为0.4,问现年60岁的人活到70岁的概率为多少?

2011年人大考研统计学真题

2011年人大考研统计学真题 感觉很注重统计思想和方法的考察,题目很不错! 一、简答题(50分) 1.简述加权最小二乘估计的基本思想。 2.进行主成分分析需是否要知道数据的具体分布,请说明原因。 3.k-均值聚类对比分层聚类,优点在哪里。 4.题目给出了一个回归分析残差的散点图,有点线性趋势的那种,问据图分析可能出现了什么问题。 5.简述方差分析和回归分析的异同。 二、已知X与W相互独立(30分)。 1.X与W都服从正态分布,且W的期望为零,Y=a+bX+W,求X与Y的联合分布。 2.W服从正态分布,其期望为零,方差为?2(是表示平方),Y=b0+b1X+b2X2(是表示平方) +W,当X=x时求Y的条件期望。 三、CPI是衡量经济发展的重要指标,CPI的计算包括收集数据的四个阶段和确定权数的两个阶段,(他这里描述了这六个阶段的具体操作方法)。(30分) 1.结合调查知识和统计理论说明CPI所属类别(这个有待考证,希望大家来修正~)。 2.指出CPI的调查过程中误差的可能来源。 3.指出这个过程中涉及的调查总体、随机变量及待估总体的特征。 4.如果每个阶段的调查都严格按照1—a的置信水平,那么总的置信水平是多少。 四、假设女性和男性读书的语速都服从正态分布。研究者认为女性读书的语速比男性快,为证明这一点抽取了n1名女性和n2名男性,分别测得他们读书的语速,发现n1名女性的平均语速比n2名男性快,研究者由此得出女性读书的语速比男性快的结论。请问研究者的方法对吗?为什么?应该怎样验证?(20分) 五、题目给出了从2006年1月到2010年6月的商品销售额的时间序列图(有明显线性趋势的),现在想预测2010年下半年的商品销售额,请问用什么应该模型,写出模型的具体形式和模型的建立过程。(20分)

大学统计学期末考试试题

河南科技学院2016-2017学年第一学期期终考试 统计学试卷(A 卷) 适用班级:人力141-人力145。 注意事项:1.在试卷的标封处填写院(系)、专业、班级、姓名和准考证号。 2.考试时间共100分钟。 3.所需A4演草纸(X )张。 题号 一 二 三 合计 合分人签字 分数 50 25 25 100 得分 评卷人 得分 一 、名词解释 参数 分层抽样 离散系数 中心极限定理 参数估计 院(系) _ __ __ __ __ __ __ ____ __ 专业___ ____ ____ ____ __ 班级__ __ __ __ __ __ _ 姓名___ ____ ____ ____ ____ 准考证号__ __ __ __ __ ____ __ ____ ____ …………… ………………………密… … ……………………… … ……封……………… … … ………………………… 线 …… ………… …… …… … … … ……

评卷人得分 二、选择题. 1、统计学的研究对象是() A、各种现象的内在规律 B、各种现象的数量方面 C、统计活动过程 D、总体与样本的关系 2、以产品的等级来衡量某种产品的质量好坏,则该产品等级是()。 A、数量指标 B、质量指标 C、数量标志 D、品质标志 3、一个统计总体()。 A、只能有一个标志 B、只能有一个指标 C、可以有多个标志 D、可以有多个指标 4、对某企业500名职工的工资收入状况进行调查,则总体单位是()。 A、每一名职工 B、每一名职工的工资水平 C、500名职工 D、500名职工的工资总额 5、在全国人口普查中,()。 A、女性是品质标志 B、某人的年龄30岁是变量 C、人口的平均寿命是数量指标 D、全国人口总数是统计指标 6、重点调查的重点单位是()。 A、收集数据资料的重点单位 B、在全局工作中处于重要地位的单位 C、这些单位的标志值在总体标志总量中占有很大比重 D、这些单位数量占总体单位数的很大比重 7、要了解我国煤炭生产的基本情况,最适合的调查方式是( )。 A、抽样调查 B、重点调查 C、典型调查 D、普查 8、对一批商品进行质量检验,最适宜采用的方法()。 A、全面调查 B、抽样调查 C、典型调查 D、重点调查 9、目前我国城镇职工家庭收支情况调查是采用()。 A、普查 B、抽样调查 C、典型调查 D、重点调查 10、下列分组中属于按品质标志分组的是()。 A、学生按考试分数分组B、产品按品种分组

2014年中国人民大学应用统计初试复试真题及答案解析

2014年中国人民大学应用统计初试复试真题及答案 解析 1.地区对消费者购买汽车价格的影响,使用什么方法,简要说明。 2.时间序列的指数平滑预测法有哪些?分别适用于哪些场合? 3.(1)置信区间和假设检验之间的关系 (2)用文字表述无偏性 (3)无偏估计的样本均值和相应的置信区间的中点的关系。 4.方差分析 (1)计算F值 (2)根据表格做出统计决策 (3)方差分析的假设 5.多元回归分析(有五问,记不清了) (1)t值如何计算 (2)本例的模型拟合优度如何,如何度量 (3)R2和adjustedR2各是什么? (4)P值的含义 中国人民大学招收硕士研究生复试工作管理办法 复试工作是进一步考察考生专业能力和综合素质是否符合硕士研究生(以下简称硕士生)培养要求的重要环节,是选拔优秀人才的重要依据之一,在研究生人才选拔中具有重要作用。各学院应切实重视这项工作,积极探索和完善复试办法。为做好此项工作,特制定本办法。 一、复试原则 复试工作要自始至终贯彻科学选拔、公平公正、全面考察、客观评价、公开透明、严谨严密的原则,坚决抵制各种不正之风。 各学院对拟录取的硕士生必须进行复试,复试合格方可录取。

我校实行差额复试,差额复试比例在120%以上。生源充足的学院可进一步扩大差额复试比例。 二、复试工作管理 我校硕士生入学考试复试工作实行二级管理。学校研究生招生委员会负责制定我校硕士生复试规则和各学科的复试基本要求;各学院依据学校复试要求,负责确定本学院复试名单,制定本学院的复试办法并报学校研究生招生办公室(以下简称研招办)备案。 学院须成立硕士生复试工作领导小组,组长由主管研究生工作的院长担任,成员包括相关专业的学科带头人、学术骨干、硕士生导师。 学院硕士生复试工作领导小组负责组织对本学院拟接收的校内和校外推荐免试生以及统考硕士生的复试工作,具体职责如下职责: 1、根据教育部规定和我校硕士生复试工作管理办法,负责制定本学院具体的硕士生复试办法。 2、严格复试工作人员管理,遴选责任心强、学术水平高、品行端正的人员参与复试工作。 3、负责按专业成立硕士生复试小组,复试小组成员应是我校在职的硕士生导师,人数应不少于五人,组长一人,组员四人或四人以上,按小组另安排记录员一名。 4、负责组织召开所有复试教师工作会议,进行复试工作培训,使复试教师了解复试办法、明确复试要求和工作责任、掌握复试方法,保证质量。 5、负责对所有复试工作人员进行保密工作教育。复试工作人员须对试题、答案及评分标准、复试小组名单、考生分组情况、考生成绩、考生个人信息等保密。 6、负责组织本学院的专业综合课和外语笔试试题的命制、专业课和综合素质面试试题的命制、外语口语听力试题的命制、对同等学力加试科目试题的命制。 7、负责制定本学院的综合素质面试和外语面试的实施方案,认真制定面试评分标准、考核指标。 8、负责审核各专业复试小组的复试记录和复试结果,复试记录和复试结果须妥存备查。 9、负责对参加复试而未录取考生的必要解释和遗留问题的处理。

社会统计学_1_试题卷

山东工商学院 2020学年第一学期社会统计学课程试题 A卷 (考试时间:120分钟,满分100分) 特别提醒:1、所有答案均须填写在960数字加起来827参考答案207上,写在试题纸上无效。 2、每份答卷上均须准确填写函授站、专业、年级、学号、姓名、课程名称。 一单选题 (共20题,总分值40分 ) 1. 标准差的大小取决与()(2 分) A. 平均水平的高低 B. 各标志值与平均水平离差的大小 C. 标志值水平的高低 D. 各标志值与平均水平离差的大小和平均水平的高低 2. 当变量X的值减少时,变量Y的值也随之减少,则变量X与变量Y之间存在()(2 分) A. 直线相关关系 B. 曲线相关关系 C. 正相关关系 D. 负相关关系 3. 抽样调查和典型调查都是非全面调查,二者的根本区别在于()。(2 分) A. 灵活程度不同 B. 作用不同 C. 组织方式不同 D. 选取调查单位的方法不同 4. 统计报表大多数属于()。(2 分) A. 一次性全面调查 B. 经常性全面调查 C. 经常性非全面调查 D. 一次性非全面调查 5. 分配数列中,当标志值较小的一组权数较大时,计算出来的算术平均数()。(2 分) A. 接近标志值大的一方 B. 接近标志值小的一方 C. 不受权数的影响 D. 不能确定其移动方向 6. 在一定的抽样平均误差条件下,()(2 分)

A. 扩大极限误差范围,可以提高推断的可靠程度 B. 扩大极限误差范围,会降低推断的可靠程度 C. 缩小极限误差范围,可以提高推断的可靠程度 D. 缩小极限误差范围,不改变推断的可靠程度 7. 对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的()来比较。(2 分) A. 标准差系数 B. 平均差 C. 全距 D. 均方差 8. 反映样本指标与总体指标之间的平均误差程度的指标是()(2 分) A. 抽样误差系数 B. 概率度 C. 抽样平均误差 D. 抽样极限误差 9. 下列相对指标中,可以用有名数表示的有()。(2 分) A. 计划完成相对指标 B. 结构相对指标 C. 动态相对指标 D. 强度相对指标 10. 在销售量综合指数中,表示()(2 分) A. 商品价格变动引起销售额变动的绝对额 B. 价格不变的情况下,销售量变动引起销售额变动的绝对额 C. 价格不变的情况下,销售量变动的绝对额 D. 销售量和价格变动引起销售额变动的绝对额 11. 下列调查中,调查单位与填报单位一致的是()(2 分) A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 12. 已知某企业总产值2001年比1998年增长187.5%,2000年比1998年增长150%,则2001年比2000年增长()(2 分) A. 37.5% B. 125% C. 115% D. 15% 13. 如果两变量之间的相关系数为-1,说明两变量之间存在()(2 分)

高校统计学期末考试试题及答案

1、一个统计总体( ) A 、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 2、调查某大学2000名学生学习情况,则总体单位是( ) A 、2000名学生 B 、 2000名学生的学习成绩 C 、每一名学生 D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( )。 A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( )。 A 、工业普查 B 、工业设备调查 C 、职工调查 D 、未安装设备调查 5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( )。 A 、调查时间 B 、调查期限 C 、标准时间 D 、登记期限 6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( ) A 、50在第一组,70在第四组 B 、60在第三组,80在第五组 C 、70在第四组,80在第五组 D 、80在第四组,50在第二组 7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A 、简单算术平均法 B 、加权算术平均法 C 、加权调和平均法 D 、几何平均法 8、用水平法检查长期计划完成程度,应规定( ) A 、计划期初应达到的水平 B 、计划期末应达到的水平 C 、计划期中应达到的水平 D 、整个计划期应达到的水平 9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是( )。 A 、平均指标 B 、强度相对指标 C 、总量指标 D 、发展水平指标 10、时间序列中,每个指标数值可以相加的是( )。 A 、相对数时间序列 B 、时期数列 C 、间断时点数列 D 、平均数时间序列 11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( )。 A 、时间序列中各期的逐期增长量大体相等 B 、各期的二级增长量大体相等 C 、各期的环比发展速度大体相等 D 、各期同比增长量的大体相 12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( )。 A 、%4%5 B 、%104%105

相关主题
文本预览
相关文档 最新文档