当前位置:文档之家› 统计学(贾俊平等)第五版课后习题答案(完整版) 人大出版社

统计学(贾俊平等)第五版课后习题答案(完整版) 人大出版社

统计学(贾俊平等)第五版课后习题答案(完整版) 人大出版社
统计学(贾俊平等)第五版课后习题答案(完整版) 人大出版社

第二部分:练习题

整理by__kiss-ahuang

3.1 为评价家电行业售后服务得质量,随机抽取了由100个家庭构成得一个样本。服务质量得等级分别表示为:A.好;B.较好;C 一般;D.较差;E 、差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B

C

要求:

(1)指出上面得数据属于什么类型。 顺序数据

(2)用Excel 制作一张频数分布表。 用数据分析——直方图制作:

(3)绘制一张条形图,反映评价等级得分布。 用数据分析——直方图制作:

(4)绘制评价等级得帕累托图。 逆序排序后,制作累计频数分布表:

接收 频数 频率(%) 累计频率(%)

接收 频率

E 16 D 17 C 32 B 21 A

14

C 32 32 32 B 21 21 53

D 17 17 70

E 16 16 86 A

14

14

100

5101520253035C

D

B

A E

20406080100120

3.2 某行业管理局所属40个企业2002年得产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97

88

123

115

119

138

112

146

113

126

要求:

(1)根据上面得数据进行适当得分组,编制频数分布表,并计算出累积频数与累积频率。 1、确定组数: ()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103

n K =+

=+=+=,取k=6 2、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10、83,取10 3

(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万

元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行

分组。

3.3 某百货公司连续40天得商品销售额如下:

单位:万元

41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42

36

37

37

49

39

42

32

36

35

要求:根据上面得数据进行适当得分组,编制频数分布表,并绘制直方图。 1、确定组数: ()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103

n K =+

=+=+=,取k=6 2、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取5

3.4 利用下面得数据构建茎叶图与箱线图。

57 29 29 36 31

23 47 23 28 28

35 51 39 18 46

18 26 50 29 33

21 46 41 52 28

21 43 19 42 20

data Stem-and-Leaf Plot

Frequency Stem & Leaf

3、00 1 、 889

5、00 2 、 01133

7、00 2 、 6888999

2、00 3 、 13

3、00 3 、 569

3、00 4 、 123

3、00 4 、 667

3、00 5 、 012

1、00 5 、 7

Stem width: 10

Each leaf: 1 case(s)

3.6一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好就是50g。下面就是随机抽取得100袋食品,测得得重量数据如下:

单位:g 57 46 49 54 55 58 49 61 51 49 51 60 52 54 51 55 60 56 47 47 53 51 48 53 50 52 40 45 57 53 52 51 46 48 47 53 47 53 44 47 50 52 53 47 45 48 54 52 48 46 49 52 59 53 50 43 53 46 57 49 49 44 57 52 42 49 43 47 46 48 51 59 45 45 46 52 55 47 49 50 54 47 48 44 57 47 53 58 52 48 55 53 57 49 56 56 57 53 41 48

要求:

(1)构建这些数据得频数分布表。 (2)绘制频数分布得直方图。 (3)说明数据分布得特征。

解:(1)根据上面得数据进行适当得分组,编制频数分布表,并计算出累积频数与累积频率。

1、确定组数:

()lg 100lg()2

111 6.64lg(2)lg 20.30103

n K =+

=+=+=,取k=6或7 2、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(61-40)÷6=3、5,取3或者4、5 组距=( 最大值 - 最小值)÷ 组数=(61-40)÷7=3, 3、分组频数表

组距3,上限为小于

直方图:

组距4,上限为小于等于

直方图:

组距5,上限为小于等于

直方图:

分布特征:左偏钟型。

3、8 下面就是北方某城市1——2月份各天气温得记录数据:

-3 2 -4 -7 -11 -1 7 8 9 -6 14 -18 -15 -9 -6 -1 0 5 -4 -9 6 -8 -12 -16 -19 -15 -22 -25 -24 -19 -8 -6 -15 -11 -12 -19 -25 -24 -18 -17 -14

-22

-13

-9

-6

0 -1 5 -4 -9 -3 2 -4 -4 -16 -1

7

5

-6

-5

要求:

(1)指出上面得数据属于什么类型。 数值型数据

(2)对上面得数据进行适当得分组。

1、确定组数:

()lg 60lg() 1.778151111 6.90989lg(2)lg 20.30103

n K =+

=+=+=,取k=7 2、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(14-(-25))÷7=5、57,取5 3、分组频数表

(3)绘制直方图,说明该城市气温分布得特点。

3

解:

(1)根据上面得数据,画出两个班考试成绩得对比条形图与环形图。

(2)比较两个班考试成绩分布得特点。

甲班成绩中得人数较多,高分与低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。

(3)画出雷达图,比较两个班考试成绩得分布就是否相似。

分布不相似。

3、14 已知1995—2004年我国得国内生产总值数据如下(按当年价格计算):

(1)用Excel绘制国内生产总值得线图。

(2)绘制第一、二、三产业国内生产总值得线图。

(3)根据2004年得国内生产总值及其构成数据绘制饼图。

第四章统计数据得概括性描述

4.1 一家汽车零售店得10名销售人员5月份销售得汽车数量(单位:台)排序后如下:

2 4 7 10 10 10 12 12 14 15

要求:

(1)计算汽车销售量得众数、中位数与平均数。

(2)根据定义公式计算四分位数。

(3)计算销售量得标准差。

(4)说明汽车销售量分布得特征。

解:

Statistics

汽车销售数量

N Valid 10

Missing 0

Mean 9、60

Median 10、00

Mode 10

Std、Deviation 4、169

Percentiles 25 6、25

50 10、00

75 12、50

19 15 29 25 24 23 21 38 22 18 30 20 19 19 16 23 27 22 34 24 41 20 31 17 23

要求;

(1)计算众数、中位数:

1、排序形成单变量分值得频数分布与累计频数分布:

网络用户得年龄

(2)根据定义公式计算四分位数。

Q1位置=25/4=6、25,因此Q1=19,Q3位置=3×25/4=18、75,因此Q3=27,或者,由于25与27都只有一个,因此Q3也可等于25+0、75×2=26、5。

(3)计算平均数与标准差;

Mean=24、00;Std、Deviation=6、652

(4)计算偏态系数与峰态系数:

Skewness=1、080;Kurtosis=0、773

(5)对网民年龄得分布特征进行综合分析:

分布,均值=24、标准差=6、652、呈右偏分布。如需瞧清楚分布形态,需要进行分组。

为分组情况下得直方图:

为分组情况下得概率密度曲线:

分组:

1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103

n K =+

=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4、3,取5

3、分组频数表

网络用户得年龄 (Binned)

分组后得均值与方差:

分组后得直方图:

4.3 某银行为缩短顾客到银行办理业务等待得时间。准备采用两种排队方式进行试验:一种就

是所有颐客都进入一个等待队列:另—种就是顾客在三千业务窗口处列队3排等待。为比较哪种排队方式使顾客等待得时间更短.两种排队方式各随机抽取9名顾客。得到第一种排队方式得平均等待时间为7.2分钟,标准差为1.97分钟。第二种排队方式得等待时间(单位:分钟)如下:

5.5

6.6 6.7 6.8

7.1 7.3 7.4 7.8 7.8

要求:

(1)画出第二种排队方式等待时间得茎叶图。

第二种排队方式得等待时间(单位:分钟) Stem-and-Leaf Plot

Frequency Stem & Leaf

1、00 Extremes (=<5、5)

3、00 6 、 678

3、00 7 、 134

2、00 7 、 88

Stem width: 1、00

Each leaf: 1 case(s)

(2)计算第二种排队时间得平均数与标准差。

Mean7

Std、Deviation0、714143

Variance0、51

(3)比较两种排队方式等待时间得离散程度。

第二种排队方式得离散程度小。

(4)如果让您选择一种排队方式,您会选择哪—种?试说明理由。

选择第二种,均值小,离散程度小。

4.4 某百货公司6月份各天得销售额数据如下:

单位:万元

257 276 297 252 238 310 240 236 265 278

271 292 261 281 301 274 267 280 291 258

272 284 268 303 273 263 322 249 269 295

要求:

(1)计算该百货公司日销售额得平均数与中位数。

(2)按定义公式计算四分位数。

(3)计算日销售额得标准差。

解:

Statistics

百货公司每天得销售额(万元)

N Valid 30

Missing 0

Mean 274、1000

Median 272、5000

Std、Deviation 21、17472

Percentiles 25 260、2500

50 272、5000

75 291、2500

要求:比较两个企业得总平均成本,哪个高,并分析其原因。

调与平均数计算,得到甲得平均成本为19、41;乙得平均成本为18、29。甲得中间成本得产品多,乙得低成本得产品多。

要求:

(1)计算120家企业利润额得平均数与标准差。

(2)计算分布得偏态系数与峰态系数。

解:

Statistics

企业利润组中值Mi(万元)

N Valid 120

Missing 0

Mean 426、6667

Std、Deviation 116、48445

Skewness 0、208

Std、Error of Skewness 0、221

Kurtosis -0、625

438

Std、Error of Kurtosis 0、

4.7 为研究少年儿童得成长发育状况,某研究所得一位调查人员在某城市抽取100名7~17

岁得少年儿童作为样本,另一位调查人员则抽取了1 000名7~17岁得少年儿童作为样本。请回答下面得问题,并解释其原因。

(1)两位调查人员所得到得样本得平均身高就是否相同?如果不同,哪组样本得平均身高较大?

(2)两位调查人员所得到得样本得标准差就是否相同?如果不同,哪组样本得标准差较大?

(3)两位调查人员得到这l 100名少年儿童身高得最高者或最低者得机会就是否相同?如果不同,哪位调查研究人员得机会较大?

解:(1)不一定相同,无法判断哪一个更高,但可以判断,样本量大得更接近于总体平均身高。

(2)不一定相同,样本量少得标准差大得可能性大。

(3)机会不相同,样本量大得得到最高者与最低者得身高得机会大。

4.8 一项关于大学生体重状况得研究发现.男生得平均体重为60kg,标准差为5kg;女生得平

均体重为50kg,标准差为5kg。请回答下面得问题:

(1)就是男生得体重差异大还就是女生得体重差异大?为什么?

女生,因为标准差一样,而均值男生大,所以,离散系数就是男生得小,离散程度就是男生得小。

(2)以磅为单位(1ks=2.2lb),求体重得平均数与标准差。

都就是各乘以2、21,男生得平均体重为60kg×2、21=132、6磅,标准差为5kg×2、21=11、05磅;女生得平均体重为50kg×2、21=110、5磅,标准差为5kg×2、21=11、05磅。

(3)粗略地估计一下,男生中有百分之几得人体重在55kg一65kg之间?

计算标准分数:

Z1=x x

s

-

=

5560

5

-

=-1;Z2=

x x

s

-

=

6560

5

-

=1,根据经验规则,男生大约有68%得人

体重在55kg一65kg之间。

(4)粗略地估计一下,女生中有百分之几得人体重在40kg~60kg之间?

计算标准分数:

Z1=x x

s

-

=

4050

5

-

=-2;Z2=

x x

s

-

=

6050

5

-

=2,根据经验规则,女生大约有95%得人

体重在40kg一60kg之间。

4.9 一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数就是100

分,标准差就是15分;在B项测试中,其平均分数就是400分,标准差就是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该应试者哪一项测试更为理想?

解:应用标准分数来考虑问题,该应试者标准分数高得测试理想。

Z A=x x

s

-

=

115100

15

-

=1;Z B=

x x

s

-

=

425400

50

-

=0、5

因此,A项测试结果理想。

4.10 一条产品生产线平均每天得产量为3 700件,标准差为50件。如果某一天得产量低于

或高于平均产量,并落人士2个标准差得范围之外,就认为该生产线“失去控制”。下面就是一周各天得产量,该生产线哪几天失去了控制?

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

统计学_ 贾俊平 -中国人民大学出版社_第五版

3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表: 接收频数频率(%)累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 100

5101520253035C D B A E 20406080100120 3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求: (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。 1、确定组数: ()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103 n K =+ =+=+=,取k=6 2、确定组距: 组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3 (2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

人大统计学真题

人大统计学考研历年真题精华版 (03-09) —By fan (声明:这是由fan整理编辑,仅供参考。) https://www.doczj.com/doc/4d4036997.html,

https://www.doczj.com/doc/4d4036997.html, 2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机 样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间 [-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如 采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随 机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样 的。 六、若有线性回归模型01 (1,2, ,)t t t y x t n ββε=++=,其中()0t E ε=,222()t t E x εδ=, ()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一 组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记

贾俊平统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(围、数目判定) 样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

人民大学统计学在职题库统计综述答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学 考试科目:统计思想综述 课程代码:123201 考题卷号:1

除不能导致SSE显著减小为止。 逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除。如此反复, 直到增加变量不能导致SSE显著减少为止。 五、(20分)如果一个时间序列包含趋势、季节成分、随机波动, 适用的预测方法有哪些?对这些方法做检验说明。 可以使用Winter指数平滑模型、引入季节哑变量的多元回归和分解 法等进行预测。 (1)Winter指数平滑模型 包含三个平滑参数,即(取值均在0~1),以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。 L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更新是t期的季节调整因子, 是用于预测的模型。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,

而且需要有四个以上的季节周期(4年以上的数据)。 (2)引入季节哑变量的多元回归 对于以季度记录的数据,引入3个哑变量 ,其中=1(第1季度)或0(其他季度),以此类推,则季节性多元回归模型表示为: 其中b0是常数项,b1是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第1季度的平均差值。(3)分解预测 第1步,确定并分离季节成分。计算季节指数,然后将季节成分从 时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。 第2步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。 第3步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。

_统计学概论第六版习题集总答案

第一章总论 一、填空题 1.威廉·配弟、约翰·格朗特 2.统计工作、统计资料、统计学、统计工作、统计资料、统计学3.数量对比分析 4.大量社会经济现象总体的数量方面 5.大量观察法、统计分组法、综合指标法、统计推断法 6.统计设计、统计调查、统计整理、统计分析 7.信息、咨询、监督 8.同质性 9.大量性、同质性、差异性 10.研究目的、总体单位 11.这些单位必须是同质的 12.属性、特征 13.变量、变量值 14.总体单位、总体 15.是否连续、离散、性质 二、是非题 1.非2.非3.是4.非5.是6.非7.是8.是9.是10.非11.非12.非13.非14.是15.非 三、单项选择题 1.C 2.B 3.C 4.A 5.C 6.C 7.A 8.A 9.C 10.B 11.A 12.B 13.C 14.A 15.A 四、多项选择题 1.BC 2.ABC 3.ABE 4.ABCD 5.BCDE 6.AC 7.ABCDE 8.BD 9.AB 10.ABCD 11.BD 12.ABCD 13.BD 14.ABD 15.ABC 五、简答题 略 第二章统计调查

一、填空题 1.统计报表普查重点调查抽样调查典型调查 2.直接观察法报告法采访法 3. 统计报表专门调查 4. 经常性一次性 5. 调查任务和目的调查项目组织实施计划 6. 单一表一览表 7. 基层填报单位综合填报单位 8. 原始记录统计台帐 9. 单一一览 二、是非题 1.是 2.是 3.非 4.是 5.非 6.是 7.是 8.非 9.是 10.是 三、单项选择题 1. D 2. A 3. C 4. A 5. B 6. C 7. B 8. D 9. C 10. B 四、多项选择题 1. BCE 2. ABCDE 3. ADE 4. ADE 5.ACDE 6. ABD 7. BCDE 8. ABE 9.ACD 五、简答题 略 第三章统计整理 一、填空题 1.统计汇总选择分组标志 2.资料审核统计分组统计汇总编制统计表 3.不同相同 4.频率比率(或频率) 5.全距组距 6.上限以下 7.组中值均匀 8.离散连续重叠分组 9.手工汇总电子计算机汇总 10.平行分组体系复合分组体系 11.主词宾词

统计学-基于R第3版习题答案(第二章)

习题 2.1 (1)简单频数分布表: > load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_1.RData") > summary(exercise2_1) 行业性别满意度 电信业:38 男:58 不满意:75 航空业:19 女:62 满意 :45 金融业:26 旅游业:37 二维列联表: > mytable1<-table(exercise2_1$行业,exercise2_1$满意度) > addmargins(mytable1) # 增加边界和 不满意满意 Sum 电信业 25 13 38 航空业 12 7 19 金融业 11 15 26 旅游业 27 10 37 Sum 75 45 120 三维列联表: > mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业 性别满意度 男不满意 11 7 7 11 满意 6 3 7 6 女不满意 14 5 4 16 满意 7 4 8 4 (2) 条形图: > count1<-table(exercise2_1$行业) > count2<-table(exercise2_1$性别) > count3<-table(exercise2_1$满意度) > par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8) > barplot(count1,xlab="行业",ylab="频数") > barplot(count2,xlab="性别",ylab="频数") > barplot(count3,xlab="满意度",ylab="频数")

2003-2016年中国人民大学统计学805考研真题集

人大统计学考研历年真题精华版(03- 16)

2016年人大学统计学考研真题(完整版) 1,构造几何分布,标准化的样本空间,取值空间,事件空间。 2,X、Y为随机变量,给出条件分布,对于任意y,E(X|Y<=y) = E(X|Y>y),那么X与Y是否独立?写出详细论证过程。 3,给出联合分布,求条件分布,和条件概率。 4,X与Y是相互独立的随机变量,请给出一个充分条件,当X和Y各自服从什么分布时X-Y与X+Y相互独立,如果不存在请说明理由。写出详细论证过程。 5,求一个密度函数的方差的极大似然估计,并求它的Fisher信息量。6,异方差性和自相关是什么,检测方法,加权最小二乘法原理与实际步骤。 7,证明多元回归系数的估计量是无偏估计,是最小方差线性无偏估计。8,多元线性回归,因变量均值与每个自变量间为二次函数关系,根据相互独立的n个样本预测因变量值。

2013年人大805统计学真题 一、证明题:(20分)每题10分 1.袋子里有两种颜色的球红球a个白球b个 第一步从袋子里取出一个球观察其颜色然后丢掉 第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。 证明取出的最后一个球是红球的概率是1/2。 2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。 二、简述:(30分)每题10分 1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。 2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布 3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少? 三、已知Y1,……,Y n是相互独立的随机变量,且均服从。求的矩估计和最大似然估计,并求他们的均方误差。(25分) 四、X和Y是两个相关的随机变量: 求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分) 五、谈谈你对双因素方差分析的理解和认识。(25分) 六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

统计学考试题及答案(中国人民大学第六版)

统计学 一、单选 1、从某高校随机抽出100名学生,调查他们每月的生活费支出,这研究的统计 量是 A 该校学生的总人数 B 该校学生的月月平均生活费支出 C 该校学生的生活费总支出 D 100名学生的月平均生活费支出 2、下列变量中,顺序变量是 A职工人数 B产量 C产品等级 D利润总额 3、将总体中所有单位按某种变量划分为若干层,再从各层中随机抽出一些单位 组成一个样本。这种抽样方式是 A 简单随机抽样 B 分层抽样 C 整群抽样 D 系统抽样 4、指出下面陈述中错误的是 A 抽样误差只存在于概率抽样中 B 非抽样误差只存在于非概率抽样中。 C概率抽样和非概率抽样都存在非抽样误差。 D在普查中存在非抽样误差。 5、展示广告费支出与商品销售量之间是否有某种数量关系,最适合的图形是 A柱形图 B饼图 C线图 D散点图 6、当样本量一定时,置信区间的宽度 A 随置信水平的增大而减小 B随置信水平的增大而增大 C与置信水平的大小无关 D与置信水平的平方根成反比 7、在检验一个正态总体方差时,使用的分布是 A z分布 B t分布 C X 分布 D F分布 8、指出下面陈述中的错误的是 A 抽样误差可以避免 B 抽样误差不可避免 C 非抽样误差可以避免 D 抽样误差可以控制 9、假设检验中,如果计算出的P值越小,说明检验的结果越 A 真实 B 不真实 C 显著 D 不真实 10、双因素方差分析涉及 自变量 A 一个分类型 B 一个数值型 C 两个分类型 D 两个数值型 二、填空题 1、当一组数据对称分布时,经验法则表明,大约有68%的数据分析在( 平均数±一个标准差 )的范围之内 2、对于一组具有单峰分布的数据而言,当数据的m m > 时,可判断数据是 (左偏)分布

人大版_贾俊平_统计学_第三版_课后习题答案

第3章 概率与概率分布——练习题(全免) 1 .解:设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6 (4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2 4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。 解:设A =第1发命中。B =命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。 )|()()|()()(A B P A P A B P A P B P += =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1 或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 8.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少? 解: 设A =活到55岁,B =活到70岁。所求概率为: ()()0.63(|)0.75()()0.84 P AB P B P B A P A P A ==== 9.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策? 解:这是一个计算后验概率的问题。 设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。 P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为: 6115.050612 .030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P + 决策者会倾向于采用新的生产管理流程。 10. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。这三个企业产品的次品率分别为4%、5%、3%。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少? 解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:

统计学第六版部分课后题答案

第四章 数据分布特征的测度 4.6 解:先计算出各组组中值如下: 4.8 解: ⑴ ⑵体重的平均数 体重的标准差 ⑶ 55—65kg 相当于μ-1σ到μ+1σ 根据经验法则:大约有68%的人体重在此范围内。 ⑷ 40—60kg 相当于μ-2σ到μ+2σ 2501935030450425501865011426.7120116.5 i M f x f s ?+?+?+?+?=====∑∑ 大。所以,女生的体重差异===离散系数===离散系数女 男10 .010 1 505v 08.012 1 605v =μσ=μσσσ) (1102.250)(1322.260磅=磅=女男=?μ=?μ) (112.25磅==?σ

根据经验法则:大约有95%的人体重在此范围内。 4.9 解: 在A 项测试中得115分,其标准分数为: 在B 项测试中得425分,其标准分数为: 所以,在A 项中的成绩理想。 4.11 解: 成年组的标准差为: 幼儿组的标准差为: 所以,幼儿组身高差异大。 115 100 115X Z =-=σμ-=5.050 400425X Z =-=σμ-= 172.1 4.24.2 2.4%172.1s x x n s s V x = == ====∑ 71.3 2.52.5 3.5% 71.3s x x n s s V x = =====∑

第七章 参数估计 7.7 根据题意:N=7500,n=36(大样本) 总体标准差σ未知,可以用样本标准差s 代替 32 .336 4.119n x x ===∑样本均值 2 1.61 s z α= =样本标准差: 边际误差为:22222 90 1.645 1.6451.61 1.6450.446 3.320.44 (2.883.76)95 1.9699 2.58(2.803.84)(2.634.01) z z x z z z ααααα==?=±=±置信水平%时,=平均上网时间的置信区间为: ,同理,置信水平%时,=;置信水平%时,=平均上网时间的置信区间分别为:,;,

2017年人民大学统计学生物医学统计学考研参考书

2017年人民大学统计学生物医学统计学考研参考书 统计学:生物医学统计学 风险管理与精算学: 《概率论》,李贤平,高等教育出版社 《数理统计基础》,陆璇,清华大学出版社 《概率论与数理统计》,茆诗松、周纪芗,中国统计出版社 《应用回归分析》,何晓群等编,中国人民大学出版社 《统计学》,贾俊平等编,中国人民大学出版社 概率论与数理统计: 《数学分析》上、下册复旦大学数学系陈传璋、金福临等编高等教育出版社《高等代数》北京大学出版社 《概率论》李贤平高等教育出版社 《数理统计基础》陆璇清华大学出版社 《概率论与数理统计》茆诗松、周纪芗中国统计出版社 流行病与卫生统计学: 《流行病学》詹思延人民卫生出版社 《卫生统计学》方积乾、徐勇勇、陈峰编人民卫生出版社 (专业学位)应用统计: 《统计学》第四版贾俊平中国人民大学出版社配套习题 《应用回归分析》何晓群等编中国人民大学出版社 《多元回归分析》何晓群等编中国人民大学出版社 《抽样技术》金勇进等编中国人民大学出版社 《时间序列分析》易丹辉中国人民大学出版社 《概率论与数理统计》第三版刘次华高等教育出版社配套习题 2017年新祥旭考研全程复习计划

一、英语全程规划 基础阶段(3月-6月) 1.学习目标:完成至少1轮的单词背诵,巩固语法基础 2.阶段重点:英语单词、语法 3.复习建议: (1)英语每天抽空背背单词,建议时长0.5-1h;不管是用单词软件还是传统词书,不管是用词根词缀还是死记硬背,最重要的是每天都背。积累到某一天时,你会发现好多文章都看得懂了。 (2)英语基础不牢的童鞋,应该花点时间复习语法。语法知识能帮助你在读文章和翻译时更加流畅、对文章意思把握得更准确。 (3)多看看新闻,关注时事热点。近年来的英语作文和阅读都是涉及到热点话题的。 (4)不建议大家在这个阶段做习题集。 强化阶段(7月-10月) 1.学习目标:熟读并详细分析近10年真题 2.阶段重点:真题真题真题,重点是阅读 3.复习建议: (1)单词记忆每天进行,不间断。 (2)定时做真题阅读,做完后详细分析。 ①利用早上整段的时间做真题(作文可以不写),不要查单词,完全自己做,然后对答案,之后看一下答案分析。 ②每天分析2-3篇,分析包括:第一遍分析正确选项,第二遍分析错误选项的设置,第三遍在原位中找对应的句子,是每个选项对应的句子哟,分析为什么这样出题,第四遍,了解文章的背景,作者的情感。 ③此阶段不建议专门建立单词笔记本,重要的单词在分析时顺便查一下就好。 ④时间比较充足的童鞋可以全文翻译阅读原文。 (3)完成阅读后,用同样的方法完型、翻译和新题型。完型和新题型这两类题型不用全文

统计学(第六版)贾俊平课后习题集规范标准答案

第一章导论 1.1.1 (1)数值型变量。 (2)分类变量。 (3)离散型变量。 (4)顺序变量。 (5)分类变量。 1.2 (1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。 (2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。 1.3 (1)总体是所有IT从业者的集合。 (2)数值型变量。 (3)分类变量。 (4)截面数据。 1.4 (1)总体是所有在网上购物的消费者的集合。 (2)分类变量。 (3)参数是所有在网上购物者的月平均花费。 (4)参数 (5)推断统计方法。

第二章数据的搜集 1.什么是二手资料?使用二手资料需要注意些什么? 与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。 2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。 非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试。 3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法? 实验式、观察式等。 4. 自填式、面方式、电话式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜

(完整版)贾俊平统计学[第六版]思考题答案解析.docx

第一章: 1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定) 样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特 征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数 值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学第六版 人大版 复习笔记

一、统计学原理期末考试试题类型及结构 1、单项选择题:30分。考核对基本概念的理解和计算方法的应用。 2、判断题:10分。考核对基本理论、基本概念的记忆和理解。 3、简答题:30分。考核对基本概念、基本理论、基本方法的理解和掌握情况。 4、计算题:30分。考核对基本计算方法的理解、掌握程度及综合应用能力。 二、期末考试形式及答题时限 期末考试形式为闭卷笔试;答题时限为90分钟;可以携带计算器。 三、各章复习内容 期末复习资料:教材、学习指导书习题、作业 第一章统计总论 1.理解统计学的含义 答:收集、处理、分析、解释数据并从数据中得出结论的科学(收集数据:取得数据;处理数据:整理与图表展示;分析数据:利用统计方法分析数据;数据解释:结果的说明;得到结论:从数据分析中得出客观结论) 第二章数据的搜集 1.数据的来源 答:(1)数据的间接来源:系统外部的数据(统计部门和政府部门公布的有关资料,如各类统计年鉴、各类经济信息中心、信息咨询机构、专业调查机构等提供的数据、各类专业期刊、报纸、书籍所提供的资料、各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料、从互联网或图书馆查阅到的相关资料)系统内部的数据(业务资料,如与业务经营活动有关的各种单据,记录、经营活动过程中的各种统计报表、各种财务,会计核算和分析资料等)(2)数据的直接来源(原始数据)调查数据实验数据 2.收集数据的基本方法:调查的数据(自填式、面访式、电话式);实验的数据 3.抽样误差:由于抽样的随机性所带来的误差;所有样本可能的结果与总体真值之间的平均性差异;影响抽样误差的大小的因素(样本量的大小、总体的变异性) 重点:数据来源、数据搜集方法、抽样误差 第三章数据的图表展示 重点:熟悉条形图、直方图、饼图、环形图、箱线图、线图等

统计学(第六版)贾俊平——-课后习题答案

第一章导论 1、1.1 (1)数值型变量。 (2)分类变量。 (3)离散型变量。 (4)顺序变量。 (5)分类变量。 1、2 (1)总体就是该市所有职工家庭得集合;样本就是抽中得2000个职工家庭得集合。 (2)参数就是该市所有职工家庭得年人均收入;统计量就是抽中得2000个职工家庭得年人均收入。 1、3 (1)总体就是所有IT从业者得集合。 (2)数值型变量。 (3)分类变量。 (4)截面数据。 1、4 (1)总体就是所有在网上购物得消费者得集合。 (2)分类变量。 (3)参数就是所有在网上购物者得月平均花费。 (4)参数 (5)推断统计方法。 第二章数据得搜集 1、什么就是二手资料?使用二手资料需要注意些什么? 与研究内容有关得原始信息已经存在,就是由别人调查与实验得来得,并会被我们利用得资料称为“二手资料”。使用二手资料时需要注意:资料得原始搜集人、搜集资料得目得、搜集资料得途径、搜集资料得时间,要注意数据得定义、含义、计算口径与计算方法,避免错用、误用、滥用。在引用二手资料时,要注明数据来源。 2、比较概率抽样与非概率抽样得特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样就是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中得概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中得概率,概率抽样得技术含量与成本都比较高。如果调查得目得在于掌握与研究总体得数量特征,得到总体参数得置信区间,就使用概率抽样。 非概率抽样就是指抽取样本时不就是依据随机原则,而就是根据研究目得对数据得要求,采用某种方式从总体中抽出部分单位对其实施调查。非概率抽样操作简单、实效快、成本低,而且对于抽样中得专业技术要求不就是很高。它适合探索性得研究,调查结果用于发现问题,为更深入得数量分析提供准备。非概率抽样也适合市场调查中得概念测试。 3、调查中搜集数据得方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据得方法? 实验式、观察式等。 4、自填式、面方式、电话式调查个有什么利弊? 自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题得压力。缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。 面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员得作用。缺点:成本比较高,对调查过程得质量控制有一定难度。对于敏感问题,被访者会有压力。 电话式优点:速度快,对调查员比较安全,对访问过程得控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。 5、请举出(或设计)几个实验数据得例子。 不同饲料对牲畜增重有无影响,新旧技术得机器对组装同一产品所需时间得影响。

人大统计学第四版部分答案

4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2= 5.5,M e =10;平均数:6 .910 96== =∑n x x i (2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.49 4.1561 ) (2 == -= ∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。 4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。 将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23 (2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5 (3)平均数== ∑n x x i 600/25=24,标准差65.61 2510621 ) (2 =-= -= ∑-n i s x x (4)偏态系数SK=1.08,峰态系数K=0.77 (5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。 4.3 (1)茎叶图如下: 茎 叶 频数 5 6 7 5 6 7 8 1 3 4 8 8 1 3 5 (2)== ∑n x x i 63/9=7,714.08 08.41 ) (2 == -= ∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。 第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。 (4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。 4.4 (1)== ∑n x x i 8223/30=274.1 中位数位置=n+1/2=15.5,M e =272+273/2=272.5 (2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5 (3) 17.211 307.130021 ) (2 =-= -= ∑-n i s x x 4.5 (1)甲企业的平均成本=总成本/总产量=41.19340 660030 150020 300015 2100150030002100==++++

人大统计学作业答案

79、【104308】(单项选择题)设连续型随机变量X 的分布函数是)(X F ,密度函数是)(x p , 则对于任意实数α,有= =)(αX P ()。 A.)(X F B.)(x p C.0 D.以上都不对 【答案】C 80、【150761】(单项选择题)设6.0,1,4===XY DY DX ρ,则)23(Y X D -为()。 A.40 B.9.10 C.25.6 D.17.6 【答案】B 81、【104317】(简答题)正态分布概率密度函数的图形有何特点? 【答案】 正态分布概率密度函数()x f 的图形有以下特点: ①()0≥x f ,即整个概率密度曲线都在x 轴上方。 ②曲线()x f 关于μ=x 对称,并在μ=x 处达到最大值 ()σπμ21 = f 。 ③曲线的随缓程度由σ决定,σ越大,曲线越平缓;σ越小,曲线越陡峭。 ④当x 趋于无穷时,曲线以x 轴为其渐近线。 由以上特性可见,正态分布的概率密度曲线()x f 是一条对称的钟形曲线。 82、【104318】(简答题)一事件A 的概率0)(=A P ,能否肯定事件A 是不可能事件?为什 么? 【答案】不能肯定A 是不可能事件。 不可能事件是指在同一组条件下每次试验都一定不出现的事件。而0)(=A P ,并不能肯定A 就是不可能事件。例如在闭区间[]1,0上随意投掷一点,显然该区间上任一点都可能被碰上,但每一点发生的概率都为0,因此概率为0的事件不一定都是不可能事件。 83、【104319】(简答题)常见的随机变量分为哪两种类型?各自都包含哪些常见的分布? 【答案】常见的随机变量分为离散型随机变量和连续型随机变量。 离散型随机变量包括均匀分布、0-1分布、二项分布、泊松分布。 连续型随机变量包括均匀分布、正态分布。正态分布衍生卡方分布、t 分布、F 分布。 84、【104313】(填空题)甲、乙、丙三人参加同一项考试,及格的概率分别为%70,%60, %90,则三人均及格的概率为_____;三个人都不及格的概率为_____;至少有一个人及格的概 率为_____;至少有一个人不及格的概率为_____。 【答案】0.378;0.012;0.988;0.622,(37.8%)( 1.2%)(98.8%)( 62.2%) 85、【104314】(填空题)正态分布的概率密度函数曲线为一对称钟形曲线,曲线的中心 由_____决定,曲线的陡峭程度由_____决定。

相关主题
文本预览
相关文档 最新文档