当前位置：文档之家› 数据分析课后习题答案

数据分析课后习题答案

数据分析第一次上机实验报告

班级：信计091 学号：200900901023 姓名：李骏

习题一

1.1

某小学60位学生（11岁）的身高（单位：cm）数据如下：

（数据略）

（1）计算均值、方差、标准差、变异系数、偏度、峰度；

（2）计算中位数，上、下四分位数，四分位极差，三均值；

（3）做出直方图；

（4）做出茎叶图；

解：（1）使用软件计算得到

变异系数=标准差/均值=5.08%

（2）部分答案在解（1）

四分位极差=Q3-Q1=144.75-135=9.75

三均值=0.25*Q1+0.5*M+0.25*Q3=139.4375

（3）使用软件画图得到

（4）使用软件画图得到

身高 Stem-and-Leaf Plot

Frequency Stem & Leaf

1.00 Extremes (=<120)

1.00 12 . 3

5.00 12 . 67889

7.00 13 . 1122244

18.00 13 . 555677777888899999

13.00 14 . 0112222223344

13.00 14 . 5566677778999

2.00 15 . 01

Stem width: 10.00

Each leaf: 1 case(s)

1.8

对20名中年人测量6个指标，其中3个生理指标：体重（x1）、腰围(x2)、脉搏（x3）；3个训练指标：引体向上(x4)、直坐次数(x5)、跳跃次数(x6)。数据如下表

(表格略)

(1)计算协方差矩阵，Pearson相关矩阵;

(2)计算Spearman相关矩阵;

(3)分析各指标间的相关性。

解：

(1)使用软件得到下表

(2)使用软件得到下表

数据分析期末试题及答案

数据分析期末试题及答案一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2)，一岁儿童疫苗接种率(x3)的数据，试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分) 解： 1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2)，一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系上图是以人均GDP(x1)为横轴，地区平均寿命(y)为纵轴的散点图，由图可知，他们之间没有呈线性关系。尝试多种模型后采用曲线估计，得出表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系

上图是以成人识字率(x2)为横轴，地区平均寿命(y)为纵轴的散点图，由图可知，他们之间基本呈正线性关系。上图是以疫苗接种率(x3)为横轴，地区平均寿命(y)为纵轴的散点图，由图可知，他们之间没有呈线性关系。 x）为横轴，地区平均寿命(y)为纵轴的散点图，上图是以疫苗接种率(x3)的三次方（3 3 由图可知，他们之间呈正线性关系所以可以采用如下的线性回归方法分析。

2.线性回归先用强行进入的方式建立如下线性方程设Y=β0+β1*（Xi1）+β2*Xi2+β3* X+εi i=1.2 (24) 3i 其中εi（i=1.2……22）相互独立，都服从正态分布N（0，σ^2）且假设其等于方差 R值为0.952，大于0.8，表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2)，一岁儿童疫苗接种率(x3)一起表示出来。建立总体性的假设检验提出假设检验H0：β1=β2=β3=0，H1,：其中至少有一个非零得如下方差分析表上表是方差分析SAS输出结果。由表知，采用的是F分布，F=58.190，对应的检验概率P值是0.000.，小于显著性水平0.05，拒绝原假设，表示总体性假设检验通过了，平均寿命(y)与人均GDP(x1)、成人识字率(x2)，一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。

数据分析基础测试题含答案

数据分析基础测试题含答案一、选择题 1．已知一组数据a，b，c的平均数为5，方差为4，那么数据a﹣2，b﹣2，c﹣2的平均数和方差分别是.（） A．3，2 B．3，4 C．5，2 D．5，4 【答案】B 【解析】试题分析：平均数为（a?2 + b?2 + c?2 ）=（3×5-6）=3；原来的方差：；新的方差：，故选 B. 考点：平均数；方差. 2．甲、乙、丙三个不同品种的苹果树在同一地区进行对比试验，从每个品种的苹果树中随机各抽取10棵，对它们的产量进行统计，绘制统计表如下：品种甲乙丙平均产量/(千克/棵)9090 方差10.224.88.5 若从这三个品种中选择一个在该地区推广，则应选择的品种是() A．甲B．乙C．丙D．甲、乙中任选一个【答案】A 【解析】【分析】根据平均数、方差等数据的进行判断即可．【详解】根据平均数、方差等数据的比较可以得出甲品种更适在该地区推广．故选：A 【点睛】本题考查了平均数、方差，掌握平均数、方差的定义是解题的关键． 3．某射击俱乐部将11名成员在某次射击训练中取得的成绩制成如图所示的条形统计图，由图可知，11名成员射击成绩的众数和中位数分别是（）

A．8，9 B．8，8 C．8，10 D．9，8 【答案】B 【解析】分析：中位数，因图中是按从小到大的顺序排列的，所以只要找出最中间的一个数（或最中间的两个数）即可，本题是最中间的那个数；对于众数可由条形统计图中出现频数最大或条形最高的数据写出．详解：由条形统计图知8环的人数最多，所以众数为8环，由于共有11个数据，所以中位数为第6个数据，即中位数为8环，故选B．点睛：本题主要考查了确定一组数据的中位数和众数的能力．注意找中位数的时候一定要先排好顺序，然后再根据奇数和偶数个来确定中位数，如果数据有奇数个，则正中间的数字即为所求．如果是偶数个，则找中间两个数的平均数． 4．已知一组数据a、b、c的平均数为5，方差为4，那么数据a+2、b+2、c+2的平均数和方差分别为（） A．7，6 B．7，4 C．5，4 D．以上都不对【答案】B 【解析】【分析】根据数据a，b，c的平均数为5可知a+b+c=5×3，据此可得出1 3 （-2+b-2+c-2）的值；再由方差为4可得出数据a-2，b-2，c-2的方差．【详解】解：∵数据a，b，c的平均数为5，∴a+b+c=5×3=15， ∴1 3 （a-2+b-2+c-2）=3， ∴数据a-2，b-2，c-2的平均数是3；∵数据a，b，c的方差为4， ∴1 3 [（a-5）2+（b-5）2+（c-5）2]=4，

《数据分析》练习题

《数据分析》练习题 1.一个地区某月前两周从星期一到星期五各天的最低气温依次是(单位:℃):x 1, x 2, x 3, x 4, x 5和x 1+1, x 2+2, x 3+3, x 4+4, x 5+5,若第一周这五天的平均最低气温为7℃,则第二周这五天的平均最低气温为。 2.有10个数据的平均数为12，另有20个数据的平均数为15，那么所有这30个数据的平均数是( ) A ．12 B. 15 C. 1 3.5 D. 14 3.一组数据8,8,x ,6的众数与平均数相同，那么这组数据的中位数是（） A. 6 B. 8 C.7 D. 10 4.某校在一次考试中，甲乙两班学生的数学成绩统计如下：请根据表格提供的信息回答下列问题：（1）甲班众数为分，乙班众数为分，从众数看成绩较好的是班；（2）甲班的中位数是分，乙班的中位数是分；（3）若成绩在80分以上为优秀，则成绩较好的是班；、（4）甲班的平均成绩是分，乙班的平均成绩是分，从平均分看成绩较好的是班. 5.在方差的计算公式 ()()()222 21210120202010 s x x x ??= -+-+???+-??中，数字10和20分别表示的意义可以是( ) A ．数据的个数和方差 B ．平均数和数据的个数 C ．数据的个数和平均数 D ．数据组的方差和平均数 6..如果将所给定的数据组中的每个数都减去一个非零常数，那么该数组的（） A.平均数改变，方差不变 B.平均数改变，方差改变 C.平均输不变，方差改变 D.平均数不变，方差不变 7..已知7,4,3,,321x x x 的平均数是6，则_____________321=++x x x . 8..已知一组数据-3，-2，1，3，6，x 的中位数为1，则其方差为 . 9..已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2，方差是 3 1 ，那么另一组数据3x 1－2,3x 2－2,3x 3－2, 3x 4－2,3x 5－2的平均数是和方差分别是 . 10..关于一组数据的平均数、中位数、众数，下列说法中正确的是（） A.平均数一定是这组数中的某个数 B. 中位数一定是这组数中的某个数 C.众数一定是这组数中的某个数 D.以上说法都不对分数 50 60 70 80 90 100 人数甲 1 6 12 11 15 5 乙 3 5 15 3 13 11

数据分析与处理答案

数据分析与处理答案 Prepared on 24 November 2020

一、简答题（5×2分，共10分） 1、请解释质量控制图中三条主要控制线的意义：CL 、UCL 、LCL 未学，不考 2、请解释正交设计表“L 934” 这个符号所指代的意义。如果要做6因素4水平实验，应该选择以下哪一个正交表（不考虑交互作用）：L 1645，L 3249 L: 正交； 9：9行或9次实验； 3：3个水平； 4：4列或4个因素选L 3249 二、计算题（90分） 1、某分析人员分别进行4次平行测定，得铅含量分别是、、、、，试分别用3s 法、Dixon 法和Grubbs 检验法判断是否为离群值。（，4=， ,5=）（12分） x =, s=, 3s 法：∣ 应保留 Dixon ：70.6360.08 0.89671.8560.08 Q -= =-> ,5=, 应舍去 Grubbs: G 计= 60.0868.455/5.61-=> ，4，应舍去· ·· 2、4次测定结果为：%、%、%、%，根据这些数据估计此样品中铬的含量范围（P=95%）（8分） ( 2.353%903,10.0=?=t P ， 3.182%9530.05=?=，t P ， 5.841%9930.01=?=，t P ) x =%, s=% 3、用一种新方法测定标准试样中的氧化铁含量（%），得到以下8个数据：、、、、、、、。标准偏差为%，标准值为%问这种新方法是否可靠（P=95%，，7=）（10分）

x = 34.3034.33 1.770.048 t -==< ，7，所以新方法可靠 4、某小组做加标回收试验考查方法的准确性，测得加标前1000mL 样品浓度为L ，加入浓度为1000mg/L 的标准样品后，测得样品总浓度为L ，求回收率是多少。（8分）没讲，不考 5、两分析人员测定某试样中铁的含量，得到如下结果：已知A 的标准偏差s 1=，B 的标准偏差s 2=，请比较两个人测定结果的精密度和准确的有无显着性差异。（12分） F （,4,4）=， t （,8）= F==< F （,4,4）,故精密度无显着性差异 t=< t （,8）,故准确度无显着性差异 5. 拟考察茶多酚浓度、浸泡时间、维生素C 等3个因素对米粉保鲜效果的影响，实验因素水平表如下表。请完成下列正交表格，并指出各因素的主次顺序，求出最优水平组合，并做方差分析，填方差分析表，并对实验结果做出讨论（可结合因素指标变化图）。（25分）