当前位置:文档之家› 人大_统计学_第四版_习题答案

人大_统计学_第四版_习题答案

人大_统计学_第四版_习题答案
人大_统计学_第四版_习题答案

贾俊平版

第1章绪论

1.什么是统计学?怎样理解统计学与统计数据的关系?

2.试举出日常生活或工作中统计数据及其规律性的例子。

3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求:

(1)描述总体;

(2)描述研究变量;

(3)描述样本;

(4)描述推断。

答:(1)总体:最近的一个集装箱内的全部油漆;

(2)研究变量:装满的油漆罐的质量;

(3)样本:最近的一个集装箱内的50罐油漆;

(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。

4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:

(1)描述总体;

(2)描述研究变量;

(3)描述样本;

(4)一描述推断。

答:(1)总体:市场上的“可口可乐”与“百事可乐”

(2)研究变量:更好口味的品牌名称;

(3)样本:1000名消费者品尝的两个品牌

(4)推断:两个品牌中哪个口味更好。

第2章统计数据的描述——练习题

●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下:

B E

C C A

D C B A E

D A C B C D

E C E E

A D

B

C C A E

D C B

B A

C

D

E A B D D C

C B C E

D B C C B C

D A C B C D

E C E B

B E

C C A

D C B A E

B A

C

D

E A B D D C

A D

B

C C A E

D C B

C B C E

D B C C B C

(1) 指出上面的数据属于什么类型;

(2)用Excel制作一张频数分布表;

(3) 绘制一张条形图,反映评价等级的分布。

解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。

(2)频数分布表如下:

服务质量等级评价的频数分布

服务质量等级家庭数(频数)频率%

A1414

B2121

C3232

D1818

E1515

合计100100

(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题2.1)。即得到如下的条形图:

●2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):

152 124 129 116 100 103 92 95 127 104

105 119 114 115 87 103 118 142 135 125

117 108 105 110 107 137 120 136 117 108

97 88 123 115 119 138 112 146 113 126

(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;

(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,

105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

解:(1)要求对销售收入的数据进行分组,

全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;

为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分;

为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;

按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;

将各组企业数除以企业总数40,得到各组频率,填入表中第三列;

在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。

整理得到频数分布表如下:

(2)按题目要求分组并进行统计,得到分组表如下:

某管理局下属40个企分组表

按销售收入分组(万元)企业数(个)频率(%)

先进企业良好企业一般企业落后企业11

11

9

9

27.5

27.5

22.5

22.5

合计40 100.0

● 3.某百货公司连续40天的商品销售额如下(单位:万元):

41 25 29 47 38 34 30 38 43 40

46 36 45 37 37 36 45 43 33 44

35 28 46 34 30 37 44 26 38 44

42 36 37 37 49 39 42 32 36 35

根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。

解:全部数据中,最大的为49,最小的为25,知数据全距为49-25=24;

为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分;

为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;

按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数——天数,(见Excel练习题2.3)并填入表内,得到频数分布表如下表中的左两列;

将各组天数除以总天数40,得到各组频率,填入表中第三列;

得到频数分布表如下:

某百货公司日商品销售额分组表

按销售额分组(万元)频数(天)频率(%)

25~30 30~35 35~40 40~45

4

6

15

9

10.0

15.0

37.5

22.5

45~50 6 15.0

合计40 100.0

直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.3)

●4.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:

700 716 728 719 685 709 691 684 705 718

706 715 712 722 691 708 690 692 707 701

708 729 694 681 695 685 706 661 735 665

668 710 693 697 674 658 698 666 696 698

706 692 691 747 699 682 698 700 710 722

694 690 736 689 696 651 673 749 708 727

688 689 683 685 702 741 698 713 676 702

701 671 718 707 683 717 733 712 683 692

693 697 664 681 721 720 677 679 695 691

713 699 725 726 704 729 703 696 717 688

(1)利用计算机对上面的数据进行排序;

(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;

(3)绘制茎叶图,并与直方图作比较。

解:(1)排序:将全部数据复制到Excel中,并移动到同一列,点击:数据→排序→确定,即完成数据排序的工作。(见Excel练习题2.4)

(2)按题目要求,利用已排序的Excel表数据进行分组及统计,得到频数分布表如下:(见Excel练习题2.4)

100只灯泡使用寿命非频数分布

按使用寿命分组(小时)灯泡个数(只)频率(%)

650~660 2 2

660~670 5 5

670~680 6 6

680~690 14 14

690~700 26 26

700~710 18 18

710~720 13 13

720~730 10 10

730~740 3 3

740~750 3 3

合计100 100

制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,选择全表后,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:

(见Excel练习题2.4)

(3)制作茎叶图:以十位以上数作为茎,填入表格的首列,将百、十位数相同的数据的个位数按由小到大的顺序填入相应行中,即成为叶,

得到茎叶图如下:

●5.下面是北方某城市1~2月份各天气温的记录数据:

-3 2 -4 -7 -11 -1 7 8 9 -6 -7

-14 -18 -15 -9 -6 -1 0 5 -4 -9 -3

-6 -8 -12 -16 -19 -15 -22 -25 -24 -19 -21

-8 -6 -15 -11 -12 -19 -25 -24 -18 -17 -24

-14 -22 -13 -9 -6 0 -1 5 -4 -9 -3

-3 2 -4 -4 -16 -1 7 5 -6 -5

(1)指出上面的数据属于什么类型;

(2)对上面的数据进行适当的分组;

(3)绘制直方图,说明该城市气温分布的特点。

解:(1)由于各天气温的记录数据属于数值型数据,它们可以比较高低,且0不表示没有,因此是定距数据。

(2)分组如下:

由于全部数据中,最大的为9,最小的为-25,知数据全距为9-(-25)=34;

为便于计算和分析,确定将数据分为7组,各组组距为5,组限以整5的倍数划分;

为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值-25已落在最小组之中,最大值9已落在最大组之中,故将各组均设计成闭口形式;

按照“上限不在组内”的原则,用划记法(或Excel排序法,见Excel练习题2.5)统计各组内数据的个数——天数,并填入表内,得到频数分布表如下表;

北方某城市1~2月份各天气温

分组天数(天)

-25~-20 8

-20~-15 8

-15~-10 10

-10~-5 14

-5~0 14

0~5 4

5~10 7

合计65

(3)制作直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.5)

(1)对这个年龄分布作直方图;

(2)从直方图分析成人自学考试人员年龄分布的特点。

解:(1)制作直方图:将上表复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel练习题2.6)

(2)年龄分布的特点:自学考试人员年龄的分布为右偏。

7.下面是A、B两个班学生的数学考试成绩数据:

A班:

44 57 59 60 61 61 62 63 63 65

66 66 67 69 70 70 71 72 73 73

73 74 74 74 75 75 75 75 75 76

76 77 77 77 78 78 79 80 80 82

85 85 86 86 90 92 92 92 93 96

B班:

35 39 40 44 44 48 51 52 52 54

55 56 56 57 57 57 58 59 60 61

61 62 63 64 66 68 68 70 70 71

71 73 74 74 79 81 82 83 83 84

85 90 91 91 94 95 96 100 100 100

(1)将两个班的考试成绩用一个公共的茎制成茎叶图;

(2)比较两个班考试成绩分布的特点。

(2)比较可知:A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。

8.1997年我国几个主要城市各月份的平均相对湿度数据如下表,试绘制箱线图,并分析各

解:

●9.某百货公司6月份各天的销售额数据如下(单位:万元):

257 276 297 252 238 310 240 236 265 278

271 292 261 281 301 274 267 280 291 258

272 284 268 303 273 263 322 249 269 295

(1)计算该百货公司日销售额的均值、中位数和四分位数;

(2)计算日销售额的标准差。

解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,于是得该百货公司日销售额的均值:(见Excel练习题2.9)

x=

x

n

=

8223

30

=274.1(万元)

或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。

在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:

M e=272273

2

+

=272.5(万元)

由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15

个数据的中间位置(第8位)靠上四分之一的位置上,

由重新排序后的Excel表中第8位是261,第15位是272,从而:

Q L=261+273272

4

-

=261.25(万元)

同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而:

Q U=291-273272

4

-

=290.75(万元)。

(2)未分组数据的标准差计算公式为:

s

利用上公式代入数据计算是个较为复杂的工作。手工计算时,须计算30个数据的离差平方,并将其求和,()再代入公式计算其结果:得s=21.1742。(见Excel练习题2.9)我们可以利用Excel表直接计算标准差:

点选数据列(A列)的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:21.17412,即为这30个数据的标准差。于是:

17

.

21

=

s(万元)。(见Excel练习题2.9)

●10.

解:设产品单位成本为x,产量为f,则总成本为xf,

由于:平均成本x=

xf

f

∑=

总成本

总产量

,而已知数据中缺产量f的数据,

又因个别产品产量f =

该产品成本

该产品单位成本

=

xf

x

从而x=

xf

xf

x

,于是得:

甲企业平均成本=

xf

xf

x

210030001500

210030001500

152030

++

++

=19.41(元),

乙企业平均成本=

xf

xf

x

325515001500

325515001500

152030

++

++

=18.29(元),

对比可见,甲企业的总平均成本较高。

原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

●11.在某地区抽取的120家企业按利润额进行分组,结果如下:

按利润额分组(万元)企业数(个)

200~300 19

300~400 30

400~500 42

500~600 18

600以上11

合计120

计算120家企业利润额的均值和标准差。

解:设各组平均利润为x,企业数为f,则组总利润为xf,

由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:

按利润额分组(万元)组中值企业数(个)总利润x f xf

200~300 250 19 4750

300~400 350 30 10500

400~500 450 42 18900

500~600 550 18 9900

600以上650 11 7150

合计—120 51200 于是,120家企业平均利润为:

x=

xf

f

∑=

51200

120

= 426.67(万元);

分组数据的标准差计算公式为:

s

手动计算须列表计算各组数据离差平方和(x-426.67)2f,并求和,再代入计算公式:列表计算如下

组中值企业数(个)

(x-426.67)2f

x f

250 19 593033.4891

350 30 176348.667

450 42 22860.1338

550 18 273785.2002

650 11 548639.1779

合计120 1614666.668

表格中(x-426.67)2f的计算方法:

方法一:将表格复制到Excel表中,点击第三列的顶行单元格后,在输入栏中输入:=(a3-426.67)* (a3-426.67)*b3,回车,得到该行的计算结果;

点选结果所在单元格,并将鼠标移动到该单元格的右下方,当鼠标变成黑“+”字时,压下左键并拉动鼠标到该列最后一组数据对应的单元格处放开,则各组数据的(x-426.67)2f 计算完毕;

于是得标准差:(见Excel练习题2.11)

(万元)。

点击第三列的合计单元格后,点击菜单栏中的“∑”号,回车,即获得第三列数据的和。

方法二:将各组组中值x复制到Excel的A列中,并按各组次数f在同列中复制,使该列中共有f个x,120个数据生成后,点选A列的最末空格,再点击菜单栏中“∑”符号右边的小三角“▼”,选择“其它函数”→选择函数“STDEV”→“确定”,在出现的函数参数窗口中的Number1右边的空栏中输入:A1:A30,→“确定”,即在A列最末空格中出现数值:116.4845,即为这120个数据的标准差。(见Excel练习题2.11)

于是得标准差:

s =116.4845(万元)。

●12.为研究少年儿童的成长发育状况,某研究所的一位调查人员在某城市抽取100名7~17岁的少年儿童作为样本,另一位调查人员则抽取了1000名7~17岁的少年儿童作为样本。请回答下面的问题,并解释其原因。

(1)哪一位调查研究人员在其所抽取的样本中得到的少年儿童的平均身高较大?或者这两组样本的平均身高相同?

(2)哪一位调查研究人员在其所抽取的样本中得到的少年儿童身高的标准差较大?或者这两组样本的标准差相同?

(3)哪一位调查研究人员有可能得到这1100名少年儿童的最高者或最低者?或者对两位调查研究人员来说,这种机会是相同的?

解:(1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差的大小基本上不受样本大小的影响。

(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。

●13.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题:

(1)是男生的体重差异大还是女生的体重差异大?为什么?

(2)以磅为单位(1公斤=2.2磅),求体重的平均数和标准差。

(3)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?

(4)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间?

解:(1)由于两组的平均体重不相等,应通过比较离散系数确定体重差异较大的组:因为女生的离散系数为

V=s

x

5

50

=0.1

男生体重的离散系数为

V=s

x

5

60

=0.08

对比可知女生的体重差异较大。

(2) 男生:x =

602.2公斤公斤=27.27(磅),s =2.25公斤

公斤=2.27(磅);

女生:x =2.250公斤公斤=22.73(磅),s =2.25公斤

公斤

=2.27(磅);

(3)68%;

(4)95%。

● 14.对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果如下:

成年组 166 169 172 177 180 170 172 174 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75

(1)要比较成年组和幼儿组的身高差异,你会采用什么样的指标测度值?为什么?

(2)比较分析哪一组的身高差异大? 解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。

(2)利用Excel 进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得:

成年组身高的离散系数:024.01

.1722

.4==

s v ; 又得幼儿组身高的平均数为71.3,标准差为2.497,从而得:

幼儿组身高的离散系数: 2.497

0.03571.3

s v =

=; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。

15.一种产品需要人工组装,现有三种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用三种方法组装。下面是15个工人分别用三种方法在相同的时间内组装的产品数量(单位:个):

方法A 方法B 方法C

164 129 125 167 130 126 168 129 126 165 130 127 170 131 126 165 130 128 164 129 127 168 127 126 164 128 127 162 128 127 163 127 125 166 128 126 167 128 116 166 125 126 165

132

125

(1) 你准备采用什么方法来评价组装方法的优劣?

(2) 如果让你选择一种方法,你会作出怎样的选择?试说明理由。 解:

方法A 的离散系数V A =

2.13

165.6=0.0129, 方法B 的离散系数V B = 1.75

128.73=0.0136,

方法C 的离散系数V C = 2.77

125.53

=0.0221;

对比可见,方法A 的离散系数最低,说明方法A 最优。

(2)我会选择方法A ,因为方法A 的平均产量最高而离散系数最低,说明方法A 的产量高且稳定,有推广意义。

16.在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。预期收益率的变化越小,投资风险越低,预期收益率的变化越大,投资风险就越高。下面的两个直方图,分别反映了200种商业类股票和200种高科技类股票的收益率分布。在股票市场上,高收益率往往伴随着高风险。但投资于哪类股票,往往与投资者的类型有一定关系。

(1)你认为该用什么样的统计测度值来反映投资的风险?

(2)如果选择风险小的股票进行投资,应该选择商业类股票还是高科技类股票?

(3)如果你进行股票投资,你会选择商业类股票还是高科技类股票?

-30

解:(117.频数

第3章概率与概率分布——练习题(全免)

1 .某技术小组有12人,他们的性别和职称如下,现要产生一名幸运者。试求这位幸运者分别是以下几种可能的概率:(1)女性;(2)工程师;(3)女工程师,(4)女性或工程师。并说明几个计算结果之间有何关系?

解:设A=女性,B=工程师,AB=女工程师,A+B=女性或工程师

(1)P(A)=4/12=1/3

(2)P(B)=4/12=1/3

(3)P(AB)=2/12=1/6

(4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2

2. 某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种零件的次品率。

P A。解:求这种零件的次品率,等于计算“任取一个零件为次品”(记为A)的概率()

考虑逆事件A=“任取一个零件为正品”,表示通过三道工序都合格。据题意,有:P A=---=

()(10.2)(10.1)(10.1)0.648

于是 ()1()10.6480.352P A P A =-=-=

3. 已知参加某项考试的全部人员合格的占80%,在合格人员中成绩优秀只占15%。试求任一参考人员成绩优秀的概率。

解:设A 表示“合格”,B 表示“优秀”。由于B =AB ,于是

)|()()(A B P A P B P ==0.8×0.15=0.12

4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。

解:设A =第1发命中。B =命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。

)|()()|()()(A B P A P A B P A P B P += =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1

或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1

5.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少? 解: 设A =活到55岁,B =活到70岁。所求概率为:

()()0.63

(|)0.75()()0.84

P AB P B P B A P A P A =

=== 6.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策?

解:这是一个计算后验概率的问题。

设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。 P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为:

6115.050612

.030951

.0)|()()|()()|()()|(===

A B P A P A B P A P A B P A P B A P +

决策者会倾向于采用新的生产管理流程。

7. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。这三个企业产品的次品率分别为4%、5%、3%。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少?

解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:

(1))|()()|()()|()()(332211A B P A P A B P A P A B P A P B P ++=

=0.25×0.04+0.30×0.05+0.45×0.03=0.0385

(2)3506.00385

.00135

.00.030.450.050.300.040.2503.045.0)|(3==++=

????B A P

8.某人在每天上班途中要经过3个设有红绿灯的十字路口。设每个路口遇到红灯的事件是相

互独立的,且红灯持续24秒而绿灯持续36秒。试求他途中遇到红灯的次数的概率分布及其期望值和方差、标准差。

解:据题意,在每个路口遇到红灯的概率是p =24/(24+36)=0.4。

设途中遇到红灯的次数=X ,因此,X ~B(3,0.4)。其概率分布如下表:

9. 一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用):

(1)至少获利50万元的概率; (2)亏本的概率;

(3)支付保险金额的均值和标准差。

解:设被保险人死亡数=X ,X ~B (20000,0.0005)。

(1)收入=20000×50(元)=100万元。要获利至少50万元,则赔付保险金额应该不超过50万元,等价于被保险人死亡数不超过10人。所求概率为:P(X ≤10)=0.58304。 (2)当被保险人死亡数超过20人时,保险公司就要亏本。所求概率为: P(X >20)=1-P(X ≤20)=1-0.99842=0.00158 (3)支付保险金额的均值=50000×E (X ) =50000×20000×0.0005(元)=50(万元) 支付保险金额的标准差=50000×σ(X )

=50000×(20000×0.0005×0.9995)1/2=158074(元) 10.对上述练习题3.09的资料,试问:

(1)可否利用泊松分布来近似计算? (2)可否利用正态分布来近似计算?

(3)假如投保人只有5000人,可利用哪种分布来近似计算?

解: (1)可以。当n 很大而p 很小时,二项分布可以利用泊松分布来近似计算。本例中,λ= np =20000×0.0005=10,即有X ~P (10)。计算结果与二项分布所得结果几乎完全一致。 (2)也可以。尽管p 很小,但由于n 非常大,np 和np(1-p)都大于5,二项分布也可以利用正态分布来近似计算。

本例中,np=20000×0.0005=10,np(1-p)=20000×0.0005×(1-0.0005)=9.995, 即有X ~N (10,9.995)。相应的概率为: P (X ≤10.5)=0.51995,P(X ≤20.5)=0.853262。

可见误差比较大(这是由于P 太小,二项分布偏斜太严重)。

【注】由于二项分布是离散型分布,而正态分布是连续性分布,所以,用正态分布来近似计算二项分布的概率时,通常在二项分布的变量值基础上加减0.5作为正态分布对应的区间点,这就是所谓的“连续性校正”。

(3)由于p =0.0005,假如n =5000,则np =2.5<5,二项分布呈明显的偏态,用正态分

布来计算就会出现非常大的误差。此时宜用泊松分布去近似。

11.某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。若规定寿命低于150小时为不合格品。试求该企业生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9。 解:(1))6667.1()30

200

150()150(-<-<

=

(2) 设所求值为K ,满足电池寿命在200±K 小时范围内的概率不小于0.9,即有:

|200|(|200|){||}0.93030

X K

P X K P Z --<=<≥=

即:{}0.9530

K

P Z <

≥,K /30≥1.64485,故K ≥49.3456。 12.某商场某销售区域有6种商品。假如每1小时内每种商品需要12分钟时间的咨询服务,而且每种商品是否需要咨询服务是相互独立的。求:(1)在同一时刻需用咨询的商品种数的最可能值是多少?(2)若该销售区域仅配有2名服务员,则因服务员不足而不能提供咨询服务的概率是多少?

解:设X =同一时刻需用咨询服务的商品种数,由题意有X ~B(6,0.2)

(1)X 的最可能值为:X 0=[(n+1)p]=[7×0.2]=1 (取整数) (2)∑=--

=≤-=>2

668.02.01)2(1)2(k k k k C X P X P

=1-0.9011=0.0989

第4章 抽样与抽样分布——练习题(全免)

1. 一个具有64=n 个观察值的随机样本抽自于均值等于20、标准差等于16的总体。

⑴ 给出x 的抽样分布(重复抽样)的均值和标准差

⑵ 描述x 的抽样分布的形状。你的回答依赖于样本容量吗? ⑶ 计算标准正态z 统计量对应于5.15=x 的值。 ⑷ 计算标准正态z 统计量对应于23=x 的值。 解: 已知 n=64,为大样本,μ=20,σ=16,

⑴在重复抽样情况下,x 的抽样分布的均值为

a. 20, 2

b. 近似正态

c. -2.25

d. 1.50 2 . 参考练习4.1求概率。

⑴x <16; ⑵x >23; ⑶x >25; ⑷.x 落在16和22之间; ⑸x <14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013

3. 一个具有100=n 个观察值的随机样本选自于30=μ、16=σ的总体。试求下列概率的近似值:

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699

4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。

⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远?

⑶ 为了回答b 你必须要知道μ吗?请解释。

解:a. 101, 99 b. 1 c. 不必

5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。

解:趋向正态

6. 美国汽车联合会(AAA )是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、

金融、保险以及与汽车相关的各项服务。1999年5月,AAA 通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News ,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA 所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。 ⑴ 描述x (样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x 服从怎样

的分布以及x 的均值和方差是什么?证明你的回答;

⑵ 对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率

呢?在209美元和217美元之间的概率呢?

解: a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938

7. 技术人员对奶粉装袋过程进行了质量检验。每袋的平均重量标准为406=μ克、标准差

为1.10=σ克。监控这一过程的技术人者每天随机地抽取36袋,并对每袋重量进行测量。现考虑这36袋奶粉所组成样本的平均重量x 。

(1)描述x 的抽样分布,并给出x μ和x σ的值,以及概率分布的形状;

(3) 假设某一天技术人员观察到8.400=x ,这是否意味着装袋过程出

现问题了呢,为什么?

解: a. 406, 1.68, 正态分布 b. 0.001 c. 是,因为小概率出现了

8. 在本章的统计实践中,某投资者考虑将1000美元投资于5=n 种不同的股票。每一种股

票月收益率的均值为%10=μ,标准差%4=σ。对于这五种股票的投资组合,投资

者每月的收益率是∑

=

5

i

r r 。投资者的每月收益率的方差是2.32

2==n

r σ

σ,

它是投资者所面临风险的一个度量。

⑴ 假如投资者将1000美元仅投资于这5种股票的其中3种,则这个投资者所面对的

风险将会增加还是减少?请解释;

⑵ 假设将1000美元投资在另外10种收益率与上述的完全一样的股票,试度量其风险,

并与只投资5种股票的情形进行比较。

解:a. 增加 b. 减少

9. 某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以

牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE )希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算x ,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。 ⑴ 如果该生产过程仍旧正常,则x 的样本分布为何? ⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,

样本均值x ≤830牛顿的概率是多少? ⑶ 在检验人员假定生产过程的标准差固定不变时,你对b 部分有关当前生产过程的现

状有何看法(即夹克级别均值是否仍为840牛顿)?

⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛

顿。在这种情况下x 的抽样分布是什么?当x 具有这种分布时,则x ≤830牛顿的概率是多少?

解: a. 正态 b. 约等于0 c. 不正常 d. 正态, 0.06

10. 在任何生产过程中,产品质量的波动都是不可避免的。产品质量的变化可被分成两类:

由于特殊原因所引起的变化(例如,某一特定的机器),以及由于共同的原因所引起的变化(例如,产品的设计很差)。

一个去除了质量变化的所有特殊原因的生产过程被称为是稳定的或者是在统计控制中的。剩余的变化只是简单的随机变化。假如随机变化太大,则管理部门不能接受,但只要消除变化的共同原因,便可减少变化(Deming,1982,1986;De V or, Chang,和Sutherland,1992)。

通常的做法是将产品质量的特征绘制到控制图上,然后观察这些数值随时间如何变动。例如,为了控制肥皂中碱的数量,可以每小时从生产线中随机地抽选5=n 块试验肥皂作为样本,并测量其碱的数量,不同时间的样本含碱量的均值x 描绘在下图中。假设这个过程是在统计控制中的,则x 的分布将具有过程的均值μ,标准差具有过程

的标准差除以样本容量的平方根,n

x σ

σ=。下面的控制图中水平线表示过程均值,

两条线称为控制极限度,位于μ的上下3x σ的位置。假如x 落在界限的外面,则有充分的理由说明目前存在变化的特殊原因,这个过程一定是失控的。

当生产过程是在统计控制中时,肥皂试验样本中碱的百分比将服从%2=μ和

%1=σ的近似的正态分布。

⑴ 假设,4=n 则上下控制极限应距离μ多么远? ⑵ 假如这个过程是在控制中,则x 落在控制极限之外的概率是多少?

⑶ 假设抽取样本之前,过程均值移动到%3=μ,则由样本得出这个过程失控的(正

确的)结论的概率是多少?

解:a. 0.015 b. 0.0026 c. 0.1587

4.11. 参考练习4.10。肥皂公司决定设置比练习4.10中所述的x σ3这一限度更为严格的控制

极限。特别地,当加工过程在控制中时,公司愿意接受x 落在控制极限外面的概率是

0.10。 ⑴ 若公司仍想将控制极限度设在与均值的上下距离相等之处,并且仍计划在每小时的

样本中使用4=n 个观察值,则控制极限应该设定在哪里?

⑵ 假设a 部分中的控制极限已付诸实施,但是公司不知道,μ现在是3%(而不是2%)。若4=n ,则x 落在控制极限外面的概率是多少?若9=n 呢?

解: a. (0.012, 0.028) b. 0.6553, 0.7278

4.12. 参考练习4.11。为了改进控制图的敏感性,有时将警戒线与控制极限一起画在图上。

警戒限一般被设定为x σμ96.1±。假如有两个连续的数据点落在警戒限之外,则这个过程一定是失控的(蒙哥马利,1991年)。 ⑴ 假设肥皂加工过程是在控制中(即,它遵循%2=μ和%1=σ的正态分布),则x

的下一个值落在警戒限之外的概率是什么? ⑵ 假设肥皂加工过程是在控制中,则你预料到画在控制图上的x 的这40个值中有多

少个点落在上控制极限以上? ⑶ 假设肥皂加工过程是在控制中,则x 的两个未来数值落在下警戒线以下的概率是多

少?

解: a. 0.05 b. 1 c. 0.000625

第5章 参数估计

●1. 从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差x σ等于多少?

(2) 在95%的置信水平下,允许误差是多少?

解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差

σ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96,

于是,允许误差是E =

α/2

Z 6×0.7906=1.5496。 ●2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(3) 假定总体标准差为15元,求样本均值的抽样标准误差; (4) 在95%的置信水平下,求允许误差;

(5) 如果样本均值为120元,求总体均值95%的置信区间。 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为

x σ15

=2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96,

于是,允许误差是E =

α/2

Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为

±α/2

x Z 0±4.2=124.2115.8

可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

统计学原理作业(1)答案

《统计学原理》作业一 一、判断题 1.社会经济统计的研究对象是社会经济现象总体的各个方面。(×) 2.统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。(×) 3.总体的同质性是指总体中的各个单位在所有标志上都相同。(×)4.个人的工资水平和全部职工的工资水平,都可以称为统计指标。(×)5.对某市工程技术人员进行普查,该市工程技术人员的工资收入水平是数量标志。(√) 6.社会经济统计学的研究对象是社会经济现象的数量方面,但它在具体研究时也离不开对现象质的认识。(√) 7.品质标志表明单位属性方面的特征,其标志表现只能用文字表现,所以品质标志不能直接转化为统计指标。(√) 8.品质标志说明总体单位的属性特征,质量指标反映现象的相对水平或工作质量,二者都不能用数值表示。(×) 9.某一职工的文化程度在标志的分类上属于品质标志,职工的平均工资在指标的分类上属于质量指标。(√) 10.总体单位是标志的承担者,标志是依附于总体单位的。(√) 二、单项选择 1.社会经济统计的研究对象是(C )。 A、抽象的数量特征和数量关系 B、社会经济现象的规律性 C、社会经济现象的数量特征和数量关系 D、社会经济统计认识过程的规律和方法

2.构成统计总体的各个单位称为(A )。 A、调查单位 B、标志值 C、品质标志 D、总体单位 3.对某城市工业企业未安装设备状况进行普查,总体单位是(B )。 A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 4.标志是说明总体单位特征的名称(C)。 A、它有品质标志值和数量标志值两类 B、品质标志具有标志值 C、数量标志具有标志值 D、品质标志和数量标志都具有标志值5.总体的变异性是指( B )。 A.总体之间有差异B、总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化D、总体单位之间有差异 6.工业企业的设备台数、产品产值是(D )。 A、连续变量 B、离散变量 C.前者是连续变量,后者是离散变量 D、前者是离散变量,后者是连续变量 7.几位学生的某门课成绩分别是57分、68分、78分、89分、96分,“学生成绩”是(B )。 A、品质标志 B、数量标志 C、标志值 D、数量指标 8.在全国人口普查中(B )。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 9.下列指标中属于质量指标的是(B )。 A、社会总产值 B、产品合格率 C、产品总成本 D、人口总数

统计学作业答案

1. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该 电信的服务的满意情况。调查人员随机访问了30名去该电信营业厅办理业务 的大客户,发现受访的大客户中有9名认为营业厅现在的服务质量较两年前 好。试在95%的置信水平下对大客户中认为营业厅现在的服务质量较两年前 好的比率进行区间估计。 4.据某市场调查公司对某市80名随机受访的购房者的调查得到了该市购房 者中本地人购房比率p 的区间估计,在置信水平为10%下,其允许误差E = 0.08。则: (1)这80名受访者样本中为本地购房者的比率是多少? (2)若显著性水平为95%,则要保持同样的精度进行区间估计,需要调查 多少名购房者。 解:这是一个求某一属性所占比率的区间估计的问题。根据已知n =30,2 /αz =1.96,根据抽样结果计算出的样本比率为%30309?==p 。 总体比率置信区间的计算公式为: ()n p p z p ?1??2/-±α 计算得: ()n p p z p ?1??2/-±α=30%()30 %301%3096.1-??± =(13.60%,46.40%) 5、某大学生记录了他一个月31天所花的伙食费,经计算得出了这个月平均每天 花费10.2元,标准差为2.4元。显著性水平为在5%,试估计该学生每天平 均伙食费的置信区间。 解:由已知:=x 10.2,s =2.4,96.1025.0=z ,则其置信区间为: 314 .296.12.10025.0?±=±n s z x =〔9.36,11.04〕。 该学生每天平均伙食费的95%的置信区间为9.36元到11.04元。

6、据一次抽样调查表明居民每日平均读报时间的95%的置信区间为〔2.2,3.4〕 小时,问该次抽样样本平均读报时间t 是多少?若样本量为100,则样本标准 差是多少?若我想将允许误差降为0.4小时,那么在相同的置信水平下,样 本容量应该为多少? 解:样本平均读报时间为:t = 24.32.2+=2.8 由()96 .121002.24.322.24.305.0?-=?-==s n s z E =3.06 2254 .006.396.122 22205.02=?=?=E s z n 7、某电子邮箱用户一周内共收到邮件56封,其中有若干封是属于广告邮件,并 且根据这一周数据估计广告邮件所占比率的95%的置信区间为〔8.9%, 16.1%〕。问这一周内收到了多少封广告邮件。若计算出了20周平均每周收 到48封邮件,标准差为9封,则其每周平均收到邮件数的95%的置信区间 是多少?(设每周收到的邮件数服从正态分布) 解:本周收到广告邮件比率为:p =2 161.0089.0+=0.125 收到广告邮件数为:n ×p =56×0.125=7封 根据已知:x =48,n =20,s =9,093.2)19(025.0=t ()199 093.24819025.0?±=±n s t x =[43.68,52.32] 8、为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅 办理该业务的柜台办理每笔业务的时间,随机记录了15名客户办理业务的时间,测得平均办理时间为t =12分钟,样本标准差为s =4.1分钟,则: (1)其95%的置信区间是多少? (2)若样本容量为40,而观测的数据不变,则95%的置信区间又是多少? 解:(1)根据已知有()145.214025.0=t ,n =15,t =12,s =4.1。 置信区间为:()151 .4145.21214025.0?±=±n s t t =〔9.73,14.27〕

完整版上海交大统计学原理第二次作业及答案

1.同时抛两枚不同的硬币,恰有一枚正面朝上的概率是()(单选) 选择一项: 炒a. 1 炒b. 1/8 O c. 1/4 同d. 1/2 2.对于连续型数据的分组()选择一项: a.水平法 b.累计法 c.推算法 d.直接法 ) 4.各变量值与其算术平均数的离差值和等于(选择一 项: a.最小值 C b.取大值 c.各变量值的算术平均数 d.零 ) 5.下列统计指数,不属于数量指标指数的有(选择一 项: a.零售价格指数

b. 产量指数 诃c?收购量指数 因d.工资总额指数 6. 以下分组标志中属于品质标志的是()(多选) 选择一项或多项: * a.性别 □ b.年龄 "c.职业 d.月收入 门e.职称 7. 我国2003年国内生产总值比上年增长了9.1%,这个指标是() (单选)选择一项: U a.发展速度 拥b.增长速度 目c.发展水平 d.增长量 8. 统计指数区分数量指标指数与质量指标指数,是依据()(单选) 选择一项: 炒a.对比基期的不同 °b.对象范围的大小 ⑥c.统计指标的性质不同 d.同度量因素的固定与否 9. 我国财政收入,2003年比上年增加2787亿元,这是()(单选)选择一项: 炒a.发展水平 b.增长量

炒a.两个数列的平均数代表性相同 °b.平均数的代表性甲数列高于乙数列 同c.平均数的代表性乙数列高于甲数列 口d.平均数的代表性无法判断 11.全年12个月的季节比率之和应是()(单选) 选择一项: 」a.标准差系数 b.平均差系数 ‘ c.全距 * d.平均差

」a.是不同情况下同一指标对比的比率 □ b.反映现象的强度、密度和普遍程度 巫c. 一般有正指标与逆指标之分 門d.是两个性质不同而有密切联系的总量指标对比的结果 "e. 一般是以有名数表示的,但也有采用千分数等形式表示的 15.下列现象的相关密切程度最高的是()(单选)选择一项: a. 某商店的职工人数与商品销售额之间的相关系数0.87 * b.流通费用水平与利润率之间的相关关系为-0.94 口c.商品销售额与利润率之间的相关系数为0.51 口d.商品销售额与流通费用水平的相关系数为-0.81 16在实验中,两个事件有一个发生时,另一个就不发生,称这两个事件()(单选)选择一项: ⑥a.互斥事件 口b.必然事件 c. 独立事件 d. 不可能事件 17. 两组数据的均值不等,但标准差相等,则()(单选) 选择一项:

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

统计学课后题答案第四版中国人民大学出版社

●3.2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元): 1521241291161001039295127104 10511911411587103118142135125 117108105110107137120136117108 9788123115119138112146113126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为152-87=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下: 40个企业按产品销售收入分组表 (2)按题目要求分组并进行统计,得到分组表如下: 某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40100.0

人民大学统计学在职题库统计综述答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学 考试科目:统计思想综述 课程代码:123201 考题卷号:1

除不能导致SSE显著减小为止。 逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除。如此反复, 直到增加变量不能导致SSE显著减少为止。 五、(20分)如果一个时间序列包含趋势、季节成分、随机波动, 适用的预测方法有哪些?对这些方法做检验说明。 可以使用Winter指数平滑模型、引入季节哑变量的多元回归和分解 法等进行预测。 (1)Winter指数平滑模型 包含三个平滑参数,即(取值均在0~1),以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。 L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更新是t期的季节调整因子, 是用于预测的模型。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,

而且需要有四个以上的季节周期(4年以上的数据)。 (2)引入季节哑变量的多元回归 对于以季度记录的数据,引入3个哑变量 ,其中=1(第1季度)或0(其他季度),以此类推,则季节性多元回归模型表示为: 其中b0是常数项,b1是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第1季度的平均差值。(3)分解预测 第1步,确定并分离季节成分。计算季节指数,然后将季节成分从 时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。 第2步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。 第3步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。

西南财大版统计学原理统计学作业练习题及答案。

第四章抽样估计 1.某工厂有1 500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平,如下表: 要求:(1)计算样本平均数和抽样平均误差。(2)以95.45%的可靠性估计该厂工人的月平均工资和工资总额的区间。 2.采用简单随机重复抽样方法,在2 000件产品中抽查200件,其中合格品190件。 要求:(1)计算合格品率及其抽样平均误差。(2)以95.45%的概率保证程度对合格品率和合格品数量进行区间估计。(3)如果极限误差为2.31%,则其概率保证程度是多少? 3.某电子产品使用寿命在3 000小时以下为不合格品,现在用简单随机抽样方法,从 5 000个产品中抽取进行调查.其结果如下: 要求:试根据上述资料:(1)按重复抽样和不重复抽样计算该产品平均寿命的抽样平均误差。(2)按重复抽样和不重复抽样计算该产品合格率的抽样平均误差。(3)根据重复抽样计算的抽样平均误差,以68.27%的概率保证程度对该产品的平均使用寿命和合格品率进行区间估计。 4.某外贸公司出口一种茶叶,规定每包规格不低于150克,现在用不重复抽样的方法抽取其中1%进行检验,其结果如下: 抽查结果统计表 要求:(1)以99.73%的概率估计该批茶叶平均每包重量的范围,以及确定平均重量是否达到规格要求。(2)以同样的概率保证估计该批茶叶合格率范围。

5.某工厂生产一种新型灯泡5000只,随后抽取100只作耐用时间测试。结果表明,平均寿命为4500小时,标准差300小时,试在90%的概率保证下,估计该新式灯泡平均寿命时间,假定概率保证程度提高到95%,允许误差缩小一半,试问应抽取多少只灯泡进行测试。 6.调查一批机械零件合格率。根据过去资料,合格品率曾有过99%、97%、95%三种情况,现在要求误差不超过1%,要求估计的把握程度为95%,问需要抽查多少零件?(提示:总体方差取最大值) 7.某部门对职工进行家庭经济情况调查,取得年度项抽样资料如下,试以90%的概率保证程度,估计该部门职工的家庭月收入。 抽查结果统计表 8.某市有职工10万人,其中:职员4万人,工人6万人,现进行职工收入抽样调查,并划分职员与工人两类进行选样,要先按不同类型抽查40名职员与60名工人,结果如下:要求这次调查的极限误差不超过2元,概率保证程度 95.45%,试按类型抽样组织计算必要的抽样数目。 如果按简单随机抽样组织,试问:(1)同样的?和t,需按抽取多少样本单位数。(2)同样的样本单位数和概率保证程度,则会有多大的极限抽样误差。(3)同样的样本单位数和?应有多大的概率保证程度。 9.从某县的100个村中抽出10村进行各村的全户调查设平均每户饲养家禽35头,每村平均数的方差为16。 要求:(1)以90%的概率估计全县平均每户饲养家禽数。(2)如果极限误差 2.412 ?= x 则其概率保证程度如何?

统计学第四版答案(贾俊平)

第1章统计和统计数据 指出下面的变量类型。(1)年龄。(2)性别。(3)汽车产量。 (4)员工对企业某项改革措施的态度(赞成、中立、反对)。(5)购买商品时的支付方式(现金、信用卡、支票)。详细答案:(1)数值变量。(2)分类变量。(3)数值变量。(4)顺序变量。(5)分类变量。 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。 (1)这一研究的总体是什么样本是什么样本量是多少(2)“月收入”是分类变量、顺序变量还是数值变量(3)“消费支付方式”是分类变量、顺序变量还是数值变量详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。(2)数值变量。 (3)分类变量。 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。 (1)这一研究的总体是什么 (2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量详细答案: (1)总体是“所有的网上购物者”。(2)分类变量。 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。 (1)这种抽样方式是分层抽样、系统抽样还是整群抽样(2)样本量是多少详细答案:(1)分层抽样。(2)100。 第3章用统计量描述数据

排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为分钟,标准差为分钟,第二种排队方式的等待时间(单位:分钟)如下: (1)计算第二种排队时间的平均数和标准差。 (2)比两种排队方式等待时间的离散程度。 (3)如果让你选择一种排队方式,你会选择哪一种试说明理由。 详细答案: (1)(岁);(岁)。 (2);。第一中排队方式的离散程度大。 (3)选方法二,因为平均等待时间短,且离散程度小。 在某地区随机抽取120家企业,按利润额进行分组后结果如下:按利润额分组(万元)企业数(个) 300以下19 300~40030 400~50042 500~60018 600以上11 合计120 计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。 详细答案: =(万元);(万元)。

统计学-基于R第3版习题答案(第二章)

习题 2.1 (1)简单频数分布表: > load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_1.RData") > summary(exercise2_1) 行业性别满意度 电信业:38 男:58 不满意:75 航空业:19 女:62 满意 :45 金融业:26 旅游业:37 二维列联表: > mytable1<-table(exercise2_1$行业,exercise2_1$满意度) > addmargins(mytable1) # 增加边界和 不满意满意 Sum 电信业 25 13 38 航空业 12 7 19 金融业 11 15 26 旅游业 27 10 37 Sum 75 45 120 三维列联表: > mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业 性别满意度 男不满意 11 7 7 11 满意 6 3 7 6 女不满意 14 5 4 16 满意 7 4 8 4 (2) 条形图: > count1<-table(exercise2_1$行业) > count2<-table(exercise2_1$性别) > count3<-table(exercise2_1$满意度) > par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8) > barplot(count1,xlab="行业",ylab="频数") > barplot(count2,xlab="性别",ylab="频数") > barplot(count3,xlab="满意度",ylab="频数")

统计学原理作业1答案

统计学原理作业1答案 统计学原理作业1 第一章~第三章 一、判断题 1、社会经济统计工作的研究对象是社会经济现象总体的数量方面。(×) 2、 统计调查过程中采用的大量观察法,是指必须对研究对象的所有单位进行调查。(×) 、全面调查包括普查和统计报表。(?) 3 4、统计分组的关键是确定组限和组距。(×) 5、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。(×) 6、我国的人口普查每十年进行一次,因此这是一种连续性调查方法。(?) 7、对全国各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本 情况。这种调查属于非全面调查。(?) 8、对某市工程技术人员进行普查,该市工程技术人员的工资收水平是数量标志。(?) 9、对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生产的 基本情况,这种调查是重点调查。(?) 10、我国人口普查的总体单位和调查单位都是第一个人,而填报单位是户。(?) 二、单项选题 1、设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位 是(C) A、每个工业企业 B、670家工业企业 C、每一件产品 D、全部工业产品 2、某市工业企业2003年生产经营成果年报呈报时间规定在2004年1月31日,则调查时限 ) 为(B A、一日 B、一个月 C、一年 D、一年零一个月

3、在全国人口普查中(B) A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、人国人口是统计指标 4、某机床厂要统计该企业的自动机床的产量和产值,上述两上变量是(D) A、二者均为离散变量 B、二者均为连续变量 C、前者为连续变量,后者为离散变量 D、前者为离散变量,后者为连续变量 5、下列调查中,调查单位与填报单位一致的是(D) A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查 6、抽样调查与重点调查的主要区别是(D) A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 7、下列调查属于不连续调查的是(A) A、每月统计商品库存额 B、每旬统计产品产量 C、每月统计商品的销售额 D、每季统计进口贸易额 8、全面调查与非全面调查的划分是以(C) A、时间是否连续来划分的 B、最后取得的资料是否全面完全来划分 C、调查对象所包括的单位是否完全来划分的 D、调查组织规模的大小来划分 9、下列分组中哪个是按品质标志分组(B) A、企业按年生产能力分组 B、产品按品种分组 C、家庭按年收入水平分组 D、人口按年龄分组 三、多项选择题 1、总体单位是总体的基本组成单位,是标志的直接承担者,因此(A,D) A、在国有企业这个总体下,每个国有企业就是总体单位 B、在工业总产值这个总体下,单位总产值就是总体单位 C、在全国总人口这个总体下,一个省的总人口就是总体单位

统计学课程作业及答案2

统计学作业2 单项选择题 第1题某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是()。 A、平均指标 B、强度相对指标 C、总量指标 D、发展水平指标 答案:B 第2题某企业2002年工业总产值比1992年增长了3倍,则该公司1992-2002年间工业总产值平均增长速度为() A、11.61% B、14.87% C、13.43% D、16.65% 答案:A 第3题某工业企业的某种产品成本,第一季度是连续下降的。1月份产量750件,单位成本20元;2月份产量1000件,单位成本18元;3月份产量1500件,单位成本15元。则第一季度的平均成本为()。 A、17.67 B、17.54 C、17.08 D、16.83 答案:C 第4题已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。 A、简单算术平均数 B、加权算术平均数 C、加权调和平均数 D、几何平均数 答案:C

第5题如果分配数列把频数换成频率,那么方差()。 A、不变 B、增大 C、减小 D、无法预期变化 答案:A 第6题某厂5年的销售收入如下:200万、220万、250万、300万、320万,则平均增长量为()。 A、120/5 B、120/4 C、320/200的开5次方 D、320/200的开4次方 答案:B 第7题直接反映总体规模大小的指标是()。 A、平均指标 B、相对指标 C、总量指标 D、变异指标 答案:C 第8题计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()。 A、小于100% B、大于100% C、等于100% D、小于或大于100% 答案:C 多项选择题 第9题下列统计指标属于总量指标的是()。 A、工资总额

商务统计学(第四版)课后习题答案第八章

288 Chapter 8: Confidence Interval Estimation CHAPTER 8 8.1 X ±Z ?σ n = 85±1.96? 864 83.04 ≤μ≤ 86.96 8.2 X ±Z ? σ n = 125±2.58?24 36 114.68 ≤μ≤ 135.32 8.3 If all possible samples of the same size n are taken, 95% of them include the true population average monthly sales of the product within the interval developed. Thus you are 95 percent confident that this sample is one that does correctly estimate the true average amount. 8.4 Since the results of only one sample are used to indicate whether something has gone wrong in the production process, the manufacturer can never know with 100% certainty that the specific interval obtained from the sample includes the true population mean. In order to have 100% confidence, the entire population (sample size N ) would have to be selected. 8.5 To the extent that the sampling distribution of sample means is approximately normal, it is true that approximately 95% of all possible sample means taken from samples of that same size will fall within 1.96 times the standard error away from the true population mean. But the population mean is not known with certainty. Since the manufacturer estimated the mean would fall between 10.99408 and 11.00192 inches based on a single sample, it is not necessarily true that 95% of all sample means will fall within those same bounds. 8.6 Approximately 5% of the intervals will not include the true population. Since the true population mean is not known, we do not know for certain whether it is contained in the interval (between 10.99408 and 11.00192 inches) that we have developed. 8.7 (a) X ±Z ?σ n =0.995±2.58? 0.02 50 0.9877≤μ≤1.0023 (b) Since the value of 1.0 is included in the interval, there is no reason to believe that the mean is different from 1.0 gallon. (c) No. Since σ is known and n = 50, from the Central Limit Theorem, we may assume that the sampling distribution of X is approximately normal. (d) The reduced confidence level narrows the width of the confidence interval. X ±Z ? σ n =0.995±1.96? 0.02 50 0.9895≤μ≤1.0005 (b) Since the value of 1.0 is still included in the interval, there is no reason to believe that the mean is different from 1.0 gallon.

人大版_贾俊平_统计学_第三版_课后习题答案

第3章 概率与概率分布——练习题(全免) 1 .解:设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6 (4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2 4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。 解:设A =第1发命中。B =命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。 )|()()|()()(A B P A P A B P A P B P += =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1 或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 8.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少? 解: 设A =活到55岁,B =活到70岁。所求概率为: ()()0.63(|)0.75()()0.84 P AB P B P B A P A P A ==== 9.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策? 解:这是一个计算后验概率的问题。 设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。 P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为: 6115.050612 .030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P + 决策者会倾向于采用新的生产管理流程。 10. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。这三个企业产品的次品率分别为4%、5%、3%。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少? 解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:

统计学原理第三章习题答案

一. 判断题部分 1 : 对统计资料进行分组的目的就是为了区分各组单位之间质的不同。 (×) 2: 统计分组的关键问题是确定组距和组数。 ( × ) 3: 组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平 均分配次数。 ( × ) 3 : 分配数列的实质是把总体单位总量按照总体所分的组进行分配。 ( ∨ ) 4: 次数分配数列中的次数,也称为频数。频数的大小反映了它所对应的标 志值在总体中所起的作用程度。 ( ∨ ) 5: 某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。 (×) 6: 连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重 叠的方法确定组限。 ( ∨ ) 7: 对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所 以这种分组会使资料的真实性受到损害。 ( ∨ ) 8: 任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于 或 100%。( × ) 9: 按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都 可称为次数分布。 ( ∨ ) 10:按数量标志分组的目的,就是要区分各组在数量上的差异。 ( 11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位 的差异。( ∨ ) 12:分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作第三章 统计资料整理 ×)

用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越 小。( × ) .单项选择题部分 2: 在组距分组时,对于连续型变量,相邻两组的组限( A )。 A 、 必须是重叠的 B 、必须是间断的 C 、可以是重叠的,也可以是间断的 D 、必须取整数 3: 下列分组中属于按 品质标志分组 的是( B )。 A 、学生按考试分数分组 B 、产品按品种分组 C 、企业按计划完成程度分组 D 、家庭按年收入分组 4 : 有一个学生考试成绩为70分,在统计分组中,这个变量值应归入 ( B )。 A 、60---70 分这一组 B 、 70---80 分这一组 C 、60— 70或 70—80两组都可以 D 、作为上限的那一组 5: 某主管局将下属企业先按轻、重工业分类,再按企业规模分组,这样的 分组属于( B )。 A 、简单分组 B 、复合分组 C 、分析分组 D 、结构分组 6: 简单分组和复合分组的区别在于( B )。 A 、选择的分组标志的性质不同 B 、选择的分组标志多少不同 1: 统计整理的关键在( B A 、对调查资料进行审核 C 、对调查资料进行汇总 )。 B 、 对调查资料进行统计分组 D 、编制统计表

教育统计学课后练习参考答案

教育统计学课后练习参考答案 第一章 1、教育统计学,就是应用数理统计学的一般原理和方法,对教育调查和教育实验等途径所获得的数据资料进行整理、分析,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律的一门科学。 教育统计学既是统计科学中的一个分支学科,又是教育科学中的一个分支学科,是两种科学相互结合、相互渗透而形成的一门交叉学科。从学科体系来看,教育统计学属于教育科学体系的一个方法论分支;从学科性质来看,教育统计学又属于统计学的一个应用分支。 2、描述统计主要是通过对数据资料进行整理,计算出简单明白的统计量数来描述庞大的资料,以显示其分布特征的统计方法。 推断统计又叫分析统计,它根据统计学的原理和方法,从我们所研究的全体对象(即总体)中,按照等可能性原则采取随机抽样的方法,抽出总体中具有代表性的部分个体组成样本,在样本所提供的数据的基础上,运用概率理论进行分析、论证,在一定可靠程度上对总体的情况进行科学推断的一种统计方法。 3、在自然界或教育研究中,一种事物常存在几种可能出现的情况或获得几种可能的结果,这类现象称为随机现象。 随机现象具的特点: (1)一次条件完全相同的实验有多种可能的结果(这样的实验称为随机实验); (2)在实验之前不能确切知道哪种结果会发生; (3)在相同的条件下可以重复进行这样的实验。 4、总体,也叫做母体或全域,是指具有某种共同特征的个体的总和。 当所研究的总体数量非常大时,可以从总体中抽取其中一部分个体来观测,由此来推断总体的信息,从总体中抽出的这部分个体就称为样本,它是用以表征总体的个体的集合。 通常将样本中样本个数大于或等于30个的样本称为大样本,小于30个的称为小样本。 5、复置抽样指每次抽出的个体经观测后,仍放回原总体,然后再从总体中抽取下一个个体。 6、反映总体特征的量数叫做总体参数,简称参数。反映样本特征的量数叫做样本统计量,简称统计量。 参数是总体的真正数值,是固定的常量,理论上应该通过计算总体中全部个体的数值而获得,但由于总体中个体的数量通常很大,总体参数往往很难获得,在统计分析中一般通过样本的数值来估计。在进行推断统计时,就是根据样本统计量来推断总体相应的参数。 第二章 1、按照数据的来源,可分为计数数据和度量数据;按照数据的取值情况,可分为间断性数据和连续性数据;按照数据的测量水平,可分为称名数据、顺序数据、等距数据和比率数据。 2、数据整理的基本方法包括对数据进行排序、统计分组、绘制统计图表等。 3、表的结构要简洁明了;表的层次要清晰;主谓分明。 4、连续性数据:(2),(3);间断性数据:(1),(4)。 5、略 6、(1)50;(2)75;(3)34;(4)5;(5)45

统计学贾俊平_第四版课后习题答案 2

3.3 某百货公司连续40天的商品销售额如下: 单位:万元 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 1、确定组数: ()l g 40l g () 1.60206 111 6.32l g (2)l g 20.30103 n K =+ =+=+=,取k=6 2、确定组距: 组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取5 3、分组频数表 销售收入(万元) 频数 频率% 累计频数 累计频率% <= 25 1 2.5 1 2.5 26 - 30 5 12.5 6 15.0 31 - 35 6 15.0 12 30.0 36 - 40 14 35.0 26 65.0 41 - 45 10 25.0 36 90.0 46+ 4 10.0 40 100.0 总和 40 100.0 频数 246810121416<= 25 26 - 30 31 - 35 36 - 40 41 - 45 46+ 销售收入 频数 频数 3.9.下面是某考试管理中心对2002年参加成人自学考试的12000名学生的年龄分组数据: 年龄 18~19 21~21 22~24 25~29 30~34 35~39 40~44 45~59 % 1.9 34.7 34.1 17.2 6.4 2.7 1.8 1.2 (1) 对这个年龄分布作直方图; (2) 从直方图分析成人自学考试人员年龄分布的特点。 解:(1)制作直方图:将上表复制到Excel 表中,点击:图表向导→柱形图→选择子图表类型→完成。即得到如下的直方图:(见Excel 练习题2.6)

相关主题
文本预览
相关文档 最新文档