summary(exercise2_1)行业性别满意度电信业:38男:58不满意:75航空业:19女:62满意:45金融业:26旅游业:37二维列联表:>mytable1>addmargins(mytabl" />
当前位置:文档之家› 统计学-基于R第3版习题答案(第二章)

统计学-基于R第3版习题答案(第二章)

统计学-基于R第3版习题答案(第二章)
统计学-基于R第3版习题答案(第二章)

习题

2.1

(1)简单频数分布表:

> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_1.RData")

> summary(exercise2_1)

行业性别满意度

电信业:38 男:58 不满意:75

航空业:19 女:62 满意 :45

金融业:26

旅游业:37

二维列联表:

> mytable1<-table(exercise2_1$行业,exercise2_1$满意度)

> addmargins(mytable1) # 增加边界和

不满意满意 Sum

电信业 25 13 38

航空业 12 7 19

金融业 11 15 26

旅游业 27 10 37

Sum 75 45 120

三维列联表:

> mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业

性别满意度

男不满意 11 7 7 11

满意 6 3 7 6

女不满意 14 5 4 16

满意 7 4 8 4

(2)

条形图:

> count1<-table(exercise2_1$行业)

> count2<-table(exercise2_1$性别)

> count3<-table(exercise2_1$满意度)

> par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8)

> barplot(count1,xlab="行业",ylab="频数")

> barplot(count2,xlab="性别",ylab="频数")

> barplot(count3,xlab="满意度",ylab="频数")

帕累托图:

> count1<-table(exercise2_1$行业)

> par(mai=c(0.7,0.7,0.1,0.8),cex=0.8)

> x<-sort(count1,decreasing = T)

> bar<-barplot(x,xlab="行业",ylab="频数",ylim=c(0,1.2*max(count1)),col=2:5) > text(bar,x,labels = x,pos=3) # 条形图增加数值

> y<-cumsum(x)/sum(x) # cumsum累计求和

> par(new=T)

> plot(y,type="b",lwd=1.5,pch=15,axes=F)

> axis(4) # 右Y轴

> mtext("累积频率",side=4,line=3)

> mtext("累积分布曲线",line=-2.5,cex=0.8,adj=0.75)

复式条形图:

> mytable1<-table(exercise2_1$满意度,exercise2_1$行业)

> barplot(mytable1,xlab="行业",ylab="频数",legend=rownames(mytable1),args.legend=list(x= 13), beside = T)

脊形图:

> library(vcd)

> spine(行业~满意度,data=exercise2_1,xlab="满意度", ylab="行业",margins=c(4,3.5,1,2.5))

马赛克图:

> mosaicplot(~性别+行业+满意度,data=exercise2_1,col=2:3)

(3)

饼图:

> count1<-table(exercise2_1$行业)

> name<-names(count1)

> percent<-prop.table(count1)*100

> label1<-paste(name," ",percent,"%",sep="")

> par(pin=c(3,3),mai=c(0.1,0.4,0.1,0.4),cex=0.8) # 圆的大小> pie(count1,labels=label1,init.angle = 90)

扇形图:

> count1<-table(exercise2_1$行业)

> name<-names(count1)

> percent<-count1/sum(count1)*100

> labs<-paste(name," ",percent,"%",sep="")

> library(plotrix)

> fan.plot(count1,labels=labs,ticks=200)

2.2

(1)分10组,绘制频数分布表

> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_2.RData")

> library(actuar)

> v<-as.vector(exercise2_2$灯泡寿命)

> gd1<-grouped.data(v, breaks = 10, right = FALSE)

> table1<-data.frame(gd1);table1

Var.1 v

1 [2600, 2800) 1

2 [2800, 3000) 4

3 [3000, 3200) 12

4 [3200, 3400) 13

5 [3400, 3600) 27

6 [3600, 3800) 20

7 [3800, 4000) 19

8 [4000, 4200) 4

(2)直方图

> d<-exercise2_2$灯泡寿命

> hist(d,breaks=10,xlab="寿命",ylab="频数")

茎叶图:

> stem(exercise2_2$灯泡寿命)

The decimal point is 2 digit(s) to the right of the |

26 | 0

28 | 968

30 | 0557882356799

32 | 7888990134569

34 | 11335667799112223344455559

36 | 033566600024445567788

38 | 22455566670055669

40 | 001017

2.3

(1)箱线图:

> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_3.RData")

> boxplot(exercise2_3[,-1],xlab="城市",ylab="气温",https://www.doczj.com/doc/fd15033375.html,b=0.8,cex.axis=0.6) # 从第二列开始,到最后

小提琴图:

> library(vioplot)

> x1<-exercise2_3$北京

> x2<-exercise2_3$沈阳

> x3<-exercise2_3$上海

> x4<-exercise2_3$南昌

> vioplot(x1,x2,x3,x4,names=c("北京","沈阳","上海","南昌"))

(2)点图:

> library(reshape)

> table1_1<-melt(exercise2_3,id.vars=c("月份"),variable_name="城市") > table1_1<-rename(table1_1,c(value="温度"))

> dotchart(table1_1$温度,groups=table1_1$城市,xlab="温度",pch=20)

> library(lattice)

> dotplot(温度~城市,data=table1_1,pch=19)

核密度图:

> library(lattice)

> dp1<-densityplot(~温度,group=城市,data=table1_1,auto.key=list(columns=1,x=0.01,y=0.95, cex=0.6),cex=0.5)

> plot(dp1)

> library(sm)

> https://www.doczj.com/doc/fd15033375.html,pare(table1_1$温度,table1_1$城市,lty=1:6,col=1:6)

> legend("topleft",legend = levels(table1_1$城市),lty=1:6,col=1:6)

(3)轮廓图

> matplot(t(exercise2_3[,-1]),type="b",xlab="城市",ylab="温度",pch=1,xaxt="n")

> axis(side=1,at=1:10,labels = c("北京","沈阳","上海","南昌","郑州","武汉","广州","海口","重庆","昆明"))

> legend("bottomright",legend=names(exercise2_3[,-1])) # 取列名

雷达图:

> library(fmsb)

> table1<-data.frame(t(exercise2_3[,2:11])) #行列进行转换,并数据框

> radarchart(table1,axistype=0,seg=4,maxmin=F,vlabels=exercise2_3[,1])

> legend(x="topleft",legend=names(exercise2_3[,2:11]), col=1:10, lty=1:10) #lty图例

(4)星图:

> matrix1<-as.matrix(exercise2_3[,2:11])

> rownames(matrix1)<-exercise2_3[,1]

> stars(matrix1,key.loc=c(7,2,5),cex=0.8)

脸谱图:

> library(aplpack)

> faces(t(matrix1),nrow.plot = 5,ncol.plot = 2,face.type = 0) effect of variables:

modified item Var

"height of face " "1月"

"width of face " "2月"

"structure of face" "3月"

"height of mouth " "4月"

"width of mouth " "5月"

"smiling " "6月"

"height of eyes " "7月"

"width of eyes " "8月"

"height of hair " "9月"

"width of hair " "10月"

"style of hair " "11月"

"height of nose " "12月"

"width of nose " "1月"

"width of ear " "2月"

"height of ear " "3月"

2.4

(1)散点图:

> plot(地区生产总值,最终消费支出,xlab="",ylab='最终消费支出')

> abline(lm(最终消费支出~地区生产总值,data=exercise2_4))

> points(固定资产投资,最终消费支出,ylab='最终消费支出',pch=2,col="blue") > abline(lm(最终消费支出~固定资产投资,data=exercise2_4),col="blue")

气泡图:

> r<-sqrt(最终消费支出/pi)

> symbols(最终消费支出,地区生产总值,circles=r, inches=0.3, fg="white",bg="lightblue",ylab="最终消费支出",xlab="地区生产总值")

> text(最终消费支出,地区生产总值,rownames(exercise2_4))

> mtext("气泡大小=最终消费支出",line=-2.5,adj=0.1)

(2)星图:

> matrix1<-as.matrix(exercise2_4[,2:4])

> rownames(matrix1)<-exercise2_4[,1]

> stars(matrix1,key.loc=c(7,2,5),cex=0.8)

脸谱图:

> library(aplpack)

> faces(matrix1,nrow.plot = 6,ncol.plot = 6,face.type = 0)

2.5

时序图:

> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_5.RData")

> table1<-ts(exercise2_5,start=2004)

> plot(table1[,2],xlab="年份",ylab="价格指数",type="n")

> points(table1[,2],type="o",xlab="年份",ylab="城镇价格指数")

> lines(table1[,3],type="b")

2.6

洛伦茨曲线:

> load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_6.RData")

> library(DescTools)

> Lc(exercise2_6$不同阶层人口数的收入额*10000/exercise2_6$不同收入阶层的人口数,exercise2_6$不同收入阶层的人口数) # 标红为组中值,收入/人数

$p

[1] 0.0000000 0.3478261 0.6086957 0.8260870 0.9565217 1.0000000

$L

[1] 0.00000000 0.06060606 0.15151515 0.33333333 0.63636364 1.00000000

$L.general

[1] 0 20000 50000 110000 210000 330000

$Gini

[1] 0.6232632

$x

[1] 1250.00 2500.00 6000.00 16666.67 60000.00

$n

[1] 80 60 50 30 10

attr(,"class")

[1] "Lc"

> plot(Lc(exercise2_6$不同阶层人口数的收入额*10000/exercise2_6$不同收入阶层的人口数,exercise2_ 6$不同收入阶层的人口数),xlab="人数比例",ylab="收入比例",col=4,panel.first=grid(10,10,col="gr ay70"))

结论:>0.4,收入差距巨大

(完整版)旅游统计学教案

旅游统计学 主讲人王兴琼 四川师范大学旅游学院 主要参考书目 ?[1]《欧美统计学派发展简史》,李惠村主编,中国统计出版社,1984。 ?[2] 《统计发展史》,陈善林、张哲主编,中国统计出版社。 ?[3] 《商务与经济统计技术(11ED)》,Douglas A, Lind, William G. Marchal, Robert D. Mason, 中信出版社(CFA系列教材)(英) ?[4] 《商务统计:一种制定决策的方法》,David F. Groebner, Prtrick W. Shannon, Philip C.Fry, Kent D. Smith, 中国统计出版社(英) ?[5] 《管理统计学》,缪柏其,中国科学技术大学出版社 ?[6]《统计学》,袁卫、庞晧、曾五一主编,高等教育出版社(面向二十一世纪课程教材) 成绩评定方法 ? 1.闭卷考试成绩(80%) ? 2.平时作业,包括解题作业、课堂提问:(要求独立完成,须准时提交,迟交扣分)和考勤(无论正当理由或无故缺席在本课中不应多于2次。缺席第3次或以上者,每次在总成绩中扣去2分)(20%) 课程的引入 ?人人都来学点统计知识 ?旅游统计资料 第一章绪论 本章提要 主要讲述旅游统计学的概念、任务、产生、发展及其特点;重点阐述旅游统计的理论基础、基本环节与主要方法。 第一节统计与统计学 ?本节的重点: ?统计学的涵义 ?统计学的产生与发展 ?本节的难点: ?统计学的涵义 一、什么是统计p1 ?三种涵义:统计工作、统计资料和统计学 ?两重关系:统计工作是统计实践活动,统计资料是统计工作的成果;统计学是统计实践经验的理论概括和深化,它们是理论与实践的关系。 什么是旅游统计学? ?旅游统计学是统计学的一个重要分支,是社会统计学的重要组成部分,是专门研究旅游经济现象数量方面的一门科学。 二、统计的产生与发展 (一)“统计”一词的由来 ?统计语源最早出现于拉丁语的Status,意思指各种现象的状态和状况。由这一语根组成意大利语Stato,表示“国家”的概念。 ?十八世纪德国政治学教授亨瓦尔在1749年所著《近代欧洲各国国家学纲要》一书绪言中,把国家学名定为"Statistika"(统计)这个词。原意是指"国家显著事项的比较和记述"或"国势学"。

统计学(第三版课后习题答案

Hah 和网速是无形的 1:各章练习题答案 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: 40个企业按产品销售收入分组表 按销售收入分组(万元)企业数 (个) 频率 (%) 向上累积向下累积 企业数频率企业数频率 100以下100~110 110~120 120~130 130~140 140以上 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计40 100.0 ————(2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0

2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%) 650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 (3)茎叶图如下: 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

旅游统计学答案

《新编旅游统计学》(第四版)计算题参考答案 P 60 第三章 统计资料的整理与分析练习题答案: 1.整理后的分组资料为: P 118 第四章 综合指标练习题答案: 1. 20052005%= 100% 20052005=1080110%=1188()2004(1+8%)=20051080 2004= 1000()1+8% 20052004%2005-2004200411881?∴??∴=∴=-= 年实际营业收入 年营业收入计划完成年计划营业收入 年后实际营业收入万元又年实际营业收入年计划营业收入年实际营业收入万元年实际营业收入比年增长年实际营业收入年实际营业收入 年实际营业收入 000100%18.8% 1000?= 2. =1+5% 100%108.15%103% 672 %=100%97.8% 69912 = ?==?=-实际完成百分比营业收入计划完成相对数计划完成百分比 今年实际成本成本计划完成今年计划成本 3.

m 2:=2m 5m 616m 5.33() 2m m 3m 2: = (2+1)m 5m 621m 5.25() (2+1)m m 4m ??+?= ==+??+?= ==+∑∑∑∑设乙商品的销售量为, 若甲商品的销售量是乙商品的倍,则销售量销售价格 甲、乙商品平均销售价格销售量 元若甲商品的销售量比乙商品多倍,则销售量销售价格甲、乙商品平均销售价格销售量元 4. 1.06399 1.064106.4%==≈≈该笔银行存款的平均利率(按复利计算) 5. xf 14250x 25.9()f 550===∑∑ 岁 f 8.337548.34σ= ===≈

统计学第三版答案

第1章统计和统计数据 第2章 1.1 指出下面的变量类型。 (1)年龄。 (2)性别。 (3)汽车产量。 (4)员工对企业某项改革措施的态度(赞成、中立、反对)。 (5)购买商品时的支付方式(现金、信用卡、支票)。 详细答案: (1)数值变量。 (2)分类变量。 (3)数值变量。 (4)顺序变量。 (5)分类变量。 1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行 调查,其中60%回答他们的月收入在5000元以上,50%的人回答他 们的消费支付方式是用信用卡。 (1)这一研究的总体是什么?样本是什么?样本量是多少? (2)“月收入”是分类变量、顺序变量还是数值变量? (3)“消费支付方式”是分类变量、顺序变量还是数值变量? 详细答案: (1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。 (2)数值变量。 (3)分类变量。 1.3 一项调查表明,消费者每月在网上购物的平均花费是200元, 他们选择在网上购物的主要原因是“价格便宜”。

(1)这一研究的总体是什么? (2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量? 详细答案: (1)总体是“所有的网上购物者”。 (2)分类变量。

1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业 抽取50人、市场营销专业抽取30、企业管理20人进行调查。 (1)这种抽样方式是分层抽样、系统抽样还是整群抽样? (2)样本量是多少? 详细答案: (1)分层抽样。 (2)100。 第2章用图表展示数据

(3)帕累托图如下: (4)饼图如下: 2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:

商务统计学(第四版)课后习题答案第八章

288 Chapter 8: Confidence Interval Estimation CHAPTER 8 8.1 X ±Z ?σ n = 85±1.96? 864 83.04 ≤μ≤ 86.96 8.2 X ±Z ? σ n = 125±2.58?24 36 114.68 ≤μ≤ 135.32 8.3 If all possible samples of the same size n are taken, 95% of them include the true population average monthly sales of the product within the interval developed. Thus you are 95 percent confident that this sample is one that does correctly estimate the true average amount. 8.4 Since the results of only one sample are used to indicate whether something has gone wrong in the production process, the manufacturer can never know with 100% certainty that the specific interval obtained from the sample includes the true population mean. In order to have 100% confidence, the entire population (sample size N ) would have to be selected. 8.5 To the extent that the sampling distribution of sample means is approximately normal, it is true that approximately 95% of all possible sample means taken from samples of that same size will fall within 1.96 times the standard error away from the true population mean. But the population mean is not known with certainty. Since the manufacturer estimated the mean would fall between 10.99408 and 11.00192 inches based on a single sample, it is not necessarily true that 95% of all sample means will fall within those same bounds. 8.6 Approximately 5% of the intervals will not include the true population. Since the true population mean is not known, we do not know for certain whether it is contained in the interval (between 10.99408 and 11.00192 inches) that we have developed. 8.7 (a) X ±Z ?σ n =0.995±2.58? 0.02 50 0.9877≤μ≤1.0023 (b) Since the value of 1.0 is included in the interval, there is no reason to believe that the mean is different from 1.0 gallon. (c) No. Since σ is known and n = 50, from the Central Limit Theorem, we may assume that the sampling distribution of X is approximately normal. (d) The reduced confidence level narrows the width of the confidence interval. X ±Z ? σ n =0.995±1.96? 0.02 50 0.9895≤μ≤1.0005 (b) Since the value of 1.0 is still included in the interval, there is no reason to believe that the mean is different from 1.0 gallon.

贾俊平统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(围、数目判定) 样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

旅游统计学重点

旅游统计学 第一章总论 第一节旅游统计学的产生和发展 一、统计学的创立时期 1、在我国古代,四千多年前的夏朝就开始了土地和人口统计。据《尚书》记载,我国 两千多年前已有数量标志和分组的统计慨念。 2、17世纪中叶,英国威廉.配第《政治算术》一书的问世标志着古典政治经济学的诞 生,也标志着统计学的诞生。 二、统计学的发展时期 三、现代统计学时期 第二节旅游统计学的研究对象和研究方法 一、旅游统计学的特点:1、数量性2、总体性3、具体性4、社会性5、服务性 二、旅游统计学的研究方法 1、大量观察法:指在对旅游经济现象的研究过程中总要从总体上加以考察,对现象总 体中的全部或足够多数的单位进行调查研究,以充分详实的资料作为认识的基础。 2、分组法:(基本方法)根据,旅游经济现象的特点以及统计研究的目的,把旅游经 济现象总体按一定的标志划分为不同类型的组,这就是统计分组。 3、综合分析法 4、归纳推断法 第三节旅游统计的作用和组织 一、旅游统计的基本作用 1、统计的基本任务:对国民经济和社会发展情况进行调查统计、统计分析、提供统计 资料、实行统计监督。 2、旅游统计的基本任务:对旅游企事业单位的经营、业务情况进行统计调查、统计分 析,提供统计资料和咨询,实行统计监督。 3、旅游统计的主要作用:a、反馈信息b、提供咨询c、实施监督d、支持决策 二、旅游统计工作的过程 1、旅游统计任务的确定 2、旅游统计设计(准备阶段) 3、旅游统计资料收集(基础阶段) 4、旅游统计资料的整理(过渡阶段) 5、旅游统计资料的分析(决定性阶段) 6、旅游统计资料的管理和提供 三、我国的旅游统计组织 1、国家综合旅游统计组织 2、业务部门专门旅游统计组织 3、基层单位旅游统计组织

第三版统计学基础练习题部分答案

第一章 1统计数据可分为哪几种类型不同类型的数据各有什么特点 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 2变量分为那几类:分类变量、顺序变量和数值型变量。 3举例说明离散型变量和连续型变量: 离散变量是指其数值只能用自然数或整数单位计算的则为离散变量.例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得. 在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得.

练习书上有答案:需注意:用数值表示的属于数值变量。分类选择的属于分类变量。投票选举的属于顺序变量。 第二章: 简述普查和抽样调查的特点: 抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查是为某一特定目的而专门组织一次性全面调查。 特点:第一普查通常是一次性的或周期性的。第二普查一般需要规定统一的调查时间。第三普查的数据一般笔记哦啊准确,规范化程度也较高,因此它可以为抽样调查或其他调查提供基本的依据。第四普查使用范围比较狭窄,只能调查一些最基本的、特定的现象。 调查方案包括哪几方面的内容:调查目的、调查对象和调查单位、调查项目和调查表。 什么是调查问卷:它由哪几部分组成 调查问卷是用来收集调查数据的一种工具,是调查者根据调查目的和要求所涉及的,有一系列问题、备选答案、说明以及码表组成的一种调查形式。结构:开头部分、甄别部分、主体部分和背景部分组成。

《统计学》(第四版)学习指导书以及课后习题答案

附录:教材各章习题答案 第1章统计与统计数据 1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5) 分类数据。 1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”; (2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。 1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者 的月平均花费;(4)统计量;(5)推断统计方法。 1.5(略)。 1.6(略)。 第2章数据的图表展示 2.1(1)属于顺序数据。 (2)频数分布表如下 (4)帕累托图(略)。 2.2(1)频数分布表如下

2.3 2.5(1)排序略。 (2)频数分布表如下 (4)茎叶图如下

2.6 (3)食品重量的分布基本上是对称的。 2.7 2.8(1)属于数值型数据。

2.9 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 布比A 班分散, 且平均成绩较A 班低。 2.11 (略)。 2.12 (略)。 2.13 (略)。 2.14 (略)。 2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量 3.1 (1)100=M ;10=e M ;6.9=x 。

(2)5.5=L Q ;12=U Q 。 (3)2.4=s 。 (4)左偏分布。 3.2 (1)190=M ;23=e M 。 (2)5.5=L Q ;12=U Q 。 (3)24=x ;65.6=s 。 (4)08.1=SK ;77.0=K 。 (5)略。 3.3 (1)略。 (2)7=x ;71.0=s 。 (3)102.01=v ;274.02=v 。 (4)选方法一,因为离散程度小。 3.4 (1)x =274.1(万元);M e=272.5 。 (2)Q L =260.25;Q U =291.25。 (3)17.21=s (万元)。 3.5 甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原 因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 3.6 (1)x =426.67(万元);48.116=s (万元)。 (2)203.0=SK ;688.0-=K 。 3.7 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相 同,因为均值和标准差的大小基本上不受样本大小的影响。 (3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 3.8 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生 体重的离散系数0.08。 (2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%; (4)95%。 3.9 通过计算标准化值来判断,1=A z ,5.0=B z ,说明在A项测试中 该应试者比平均分数高 出1个标准差,而在B 项测试中只高出平均分数0.5个标准差,由于A 项测试的标准化值高于B 项测试,所以A 项测试比较理想。 3.10 通过标准化值来判断,各天的标准化值如下表 日期 周一 周二 周三 周四 周五 周六 周日 标准化值Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。

_统计学概论第六版习题集总答案

第一章总论 一、填空题 1.威廉·配弟、约翰·格朗特 2.统计工作、统计资料、统计学、统计工作、统计资料、统计学3.数量对比分析 4.大量社会经济现象总体的数量方面 5.大量观察法、统计分组法、综合指标法、统计推断法 6.统计设计、统计调查、统计整理、统计分析 7.信息、咨询、监督 8.同质性 9.大量性、同质性、差异性 10.研究目的、总体单位 11.这些单位必须是同质的 12.属性、特征 13.变量、变量值 14.总体单位、总体 15.是否连续、离散、性质 二、是非题 1.非2.非3.是4.非5.是6.非7.是8.是9.是10.非11.非12.非13.非14.是15.非 三、单项选择题 1.C 2.B 3.C 4.A 5.C 6.C 7.A 8.A 9.C 10.B 11.A 12.B 13.C 14.A 15.A 四、多项选择题 1.BC 2.ABC 3.ABE 4.ABCD 5.BCDE 6.AC 7.ABCDE 8.BD 9.AB 10.ABCD 11.BD 12.ABCD 13.BD 14.ABD 15.ABC 五、简答题 略 第二章统计调查

一、填空题 1.统计报表普查重点调查抽样调查典型调查 2.直接观察法报告法采访法 3. 统计报表专门调查 4. 经常性一次性 5. 调查任务和目的调查项目组织实施计划 6. 单一表一览表 7. 基层填报单位综合填报单位 8. 原始记录统计台帐 9. 单一一览 二、是非题 1.是 2.是 3.非 4.是 5.非 6.是 7.是 8.非 9.是 10.是 三、单项选择题 1. D 2. A 3. C 4. A 5. B 6. C 7. B 8. D 9. C 10. B 四、多项选择题 1. BCE 2. ABCDE 3. ADE 4. ADE 5.ACDE 6. ABD 7. BCDE 8. ABE 9.ACD 五、简答题 略 第三章统计整理 一、填空题 1.统计汇总选择分组标志 2.资料审核统计分组统计汇总编制统计表 3.不同相同 4.频率比率(或频率) 5.全距组距 6.上限以下 7.组中值均匀 8.离散连续重叠分组 9.手工汇总电子计算机汇总 10.平行分组体系复合分组体系 11.主词宾词

2014广州旅游统计分析报告(整理资料)

2014年,面对错综复杂的国内外政治、经济大环境,全市旅游行业在市委、市政府的正确领导和上级旅游部门的支持和关心下,坚持稳中求进的工作总基调,采取有效措施应对经济下行压力,保持全市旅游经济在新常态下平稳运行。在全市旅游行业的共同努力下,实现了旅游业持续健康较快发展,相关旅游经济指标 保持平稳增长的年度目标。 一、总体情况 (一)广州市接待旅游总人次稳步增长 2014年,我市全年共接待旅游总人次为16226.28万人次,同比增长7.00%;其中:接待过夜旅游者5330.05万人次,同比增长5.71%;不过夜(一日游)游客10896.24万人次,同比增长7.64%。全市接待一日游游客和过夜游客的比例约为2:1。我市旅游接待总人次近年来保持在6%—7%的增长区间,在全国各大城市中也位居前列,反映出广州旅游业已进入平稳增长期,也反映出广州作为国家中心城市的引领、辐射、集散功能继续得到凸显,对国内外游客的吸引力得到进一步增强。 表12014年广州接待境内外游客 统计表 分项 单 位 2014年合 计 与2013年同 比(%)

旅游接待总人数万人 次 16226.287.00 一.接待过夜人 数万人 次 5330.05 5.71 入境旅游者万人 次 783.30 1.97 外国人万人 次 300.267.62 香港同胞万人 次 377.66 -1. 80 澳门同胞万人 次 48.70-1.68 台湾同胞万人 次 56.69 2.89 国内旅游者万人 次 4546.75 6.39 二.人天数总计万人 天 12260.48 5.39 入境旅游者万人 天 1821.28 1.98

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

《统计学》答案_第三版

第2章 统计数据的描述——练习题 ●2. 解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为152-87=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也 可以用Excel 进行排序统计(见Excel 练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列; 将各组企业数除以企业总数40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的 向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下: ●13. 因为女生的离散系数为 V= s x =550 =0.1 男生体重的离散系数为 V= s x =560 =0.08 对比可知女生的体重差异较大。 (2) 男生:x = 602.2公斤公斤=27.27(磅),s =2.25公斤 公斤=2.27(磅); 女生:x = 2.250公斤公斤=22.73(磅),s =2.25公斤 公斤 =2.27(磅); (3)68%; (4)95%。 14 解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较

不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。 (2)利用Excel 进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得: 成年组身高的离散系数:024.01 .1722 .4== s v ; 又得幼儿组身高的平均数为71.3,标准差为2.497,从而得: 幼儿组身高的离散系数: 2.497 0.03571.3 s v = =; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。 第四章参数估计 (1) ●1. 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ 5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2. 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15 =2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 ±α/2 σ x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3. 解:⑴计算样本均值x :将上表数据复制到Excel 表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x =3.316667, ⑵计算样本方差s :删除Excel 表中的平均值,点击自动求值→其它函数→STDEV →选定计算数据列→确定→确定,得到s=1.6093 也可以利用Excel 进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=(a7-3.316667)^2”,回车,即得到各数据的离差平方,在最下行求总和,得到: ∑ 2i (x -x )=90.65

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

旅游统计学调查方案

包公文化园旅游纪念品调查方案 合肥包公文化园由包公祠、包公墓及清风阁三个部分组成; 位于合肥市老城区东南,占地面积31.8公顷,由包公祠、包公墓园、清风园、包河、浮庄、脚印塘等组成,这里不仅风景优美,而且到处飘逸着浓郁的包公文化气息,是旅游观光、瞻仰包公之胜地。“包河秀色”被评为“合肥十景”之首。 一、调查目的 我们包公祠的调查方案,就是为了设计具有包公文化特征的旅游纪念品。那么什么才能反映包公那种公私分明、不畏权贵、正义凛然的光辉形象呢?“龙头铡”、“虎头铡”、“狗头铡”就是很好的证明。现在我们要设计的就是包公祠旅游纪念品——“龙头铡”、“虎头铡”、“狗头铡”装饰品。 我们的调查目的是为了调查龙头铡、虎头铡、狗头铡能否受到广大学生旅游者的欢迎,能否推广到学生旅游市场上;也为了更好的提升包公的形象,改进我们包公祠的旅游纪念品而设计。同时通过学生旅游者的消费来推广了解广大旅游者的消费需求趋势,目标客源市场旅游消费者购买旅游纪念品的意愿、动机。 二、确定调查对象和调查单位 主要针对合肥市的一些高校 对于一些学校,我们可以选择在大学城那边调研,作为一名在合肥上学的学生,都多少了解一些包公文化,知道包公的大概生平经历。选择以他们作为调查对象,他们能更好的提出一

些可行性的建议。而且,高校各班级一般会组织一些春游、踏青等活动,包工文化园作为合肥的5张名片之一,它自然也会被纳入考虑之中。 我们所设计的包公旅游纪念品主要是针对合肥市各大高校的学生,包公的生平经历等,学生可以从中了解到包公生活的政治背景,了解一些北宋时期的政治文化知识,可以开展针对学生的“包公教育游”。当然,针对学生的经济能力水平的限制,我们会设计一些比较适宜学生购买的旅游纪念品。 当然,景点的游客也是可以调查的对象,他们的意见可以作为专为学生打造的教育游的活动提供一种参考价值。 三、调查主要内容 我们包工文化园旅游纪念品就是对“龙头铡”、“虎头铡”、“狗头铡”装饰品的设计。 对于纪念品的设计,我们可以设计“龙头铡”、“虎头铡”、“狗头铡”。这3个铡的设计丝毫没有包公时期的等级差别,我们的学生当然不是包公时期的贪官污吏,我们所设计的纪念品只是反映包公的不畏强权、公正无私、刚直不阿的优良品质。它只是一种旅游纪念品,教育学生学习包公大公无私、不畏强权的精神;也可以起到增进学生之间协调合作的作用;也起到了一些警戒、提醒、自勉的作用,时刻向正确的道路迈进。 龙头铡:在包公时代龙头铡为犯法的皇亲国戚准备;身为皇亲国戚最应该遵守法律,如果犯法就用龙头铡,它的特点是:

统计学第四版答案解析(贾俊平)

第1章统计和统计数据 1.1 指出下面的变量类型。(1)年龄。(2)性别。(3)汽车产量。 (4)员工对企业某项改革措施的态度(赞成、中立、反对)。(5)购买商品时的支付方式(现金、信用卡、支票)。详细答案:(1)数值变量。(2)分类变量。(3)数值变量。(4)顺序变量。(5)分类变量。 1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。 (1)这一研究的总体是什么?样本是什么?样本量是多少?(2)“月收入”是分类变量、顺序变量还是数值变量?(3)“消费支付方式”是分类变量、顺序变量还是数值变量?详细答案: (1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。(2)数值变量。 (3)分类变量。 1.3 一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。 (1)这一研究的总体是什么? (2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的网上购物者”。(2)分类变量。 1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调查。 (1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。(2)100。

第3章用统计量描述数据

偏度 1.08 极差26 最小值15 最大值41 从集中度来看,网民平均年龄为24岁,中位数为23岁。从离散度来看,标准差在为6.65岁,极差达到26岁,说明离散程度较大。从分布的形状上看,年龄呈现右偏,而且偏斜程度较大。 3.2 某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验。一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下: 5.5 6.6 6.7 6.8 7.1 7.3 7.4 7.8 7.8 (1)计算第二种排队时间的平均数和标准差。 (2)比两种排队方式等待时间的离散程度。 (3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。 详细答案: (1)(岁);(岁)。 (2);。第一中排队方式的离散程度大。 (3)选方法二,因为平均等待时间短,且离散程度小。

相关主题
文本预览
相关文档 最新文档