《数据分析》练习题
1.一个地区某月前两周从星期一到星期五各天的最低气温依次是(单位:℃):x 1, x 2, x 3, x 4, x 5和x 1+1, x 2+2, x 3+3, x 4+4, x 5+5,若第一周这五天的平均最低气温为7℃,则第二周这五天的平均最低气温为 。
2.有10个数据的平均数为12,另有20个数据的平均数为15,那么所有这30个数据的平均数是( ) A .12 B. 15 C. 1
3.5 D. 14
3.一组数据8,8,x ,6的众数与平均数相同,那么这组数据的中位数是 ( ) A. 6 B. 8 C.7 D. 10
4.某校在一次考试中,甲乙两班学生的数学成绩统计如下:
请根据表格提供的信息回答下列问题:
(1)甲班众数为 分,乙班众数为 分,从众数看成绩较好的是 班; (2)甲班的中位数是 分,乙班的中位数是 分; (3)若成绩在80分以上为优秀,则成绩较好的是 班;、
(4)甲班的平均成绩是 分,乙班的平均成绩是 分,从平均分看成绩较好的是 班. 5.在方差的计算公式
()()()222
21210120202010
s x x x ??=
-+-+???+-??中,
数字10和20分别表示的意义可以是( )
A .数据的个数和方差
B .平均数和数据的个数
C .数据的个数和平均数
D .数据组的方差和平均数 6..如果将所给定的数据组中的每个数都减去一个非零常数,那么该数组的 ( ) A.平均数改变,方差不变 B.平均数改变,方差改变 C.平均输不变,方差改变 D.平均数不变,方差不变
7..已知7,4,3,,321x x x 的平均数是6,则_____________321=++x x x .
8..已知一组数据-3,-2,1,3,6,x 的中位数为1,则其方差为 . 9..已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是
3
1
,那么另一组数据3x 1-2,3x 2-2,3x 3-2, 3x 4-2,3x 5-2的平均数是和方差分别是 .
10..关于一组数据的平均数、中位数、众数,下列说法中正确的是( )
A.平均数一定是这组数中的某个数
B. 中位数一定是这组数中的某个数
C.众数一定是这组数中的某个数
D.以上说法都不对
分数
50 60 70 80 90 100 人数
甲
1
6
12 11 15
5
乙
3
5
15
3
13 11
11..甲、乙两班举行电脑汉字输入速度比赛,?参赛学生每分钟输入汉字的个数经统计计算后结果如下表:
班级参加人数中位数方差平均数
甲 55 149 191 135
乙 55 151 110 135
某同学根据上表分析得出如下结论:
(1)甲、乙两班学生成绩的平均水平相同;(2)甲班成绩的波动情况比乙班成绩的波动小
(3)乙班优秀的人数多于甲班优秀的人数;(每分钟输入汉字≥150个为优秀)上述结论中正确的是() A.(1)(2)(3) B.(1)(2) C.(1)(3) D.(2)(3)
12.甲、乙两人在相同的条件下,各射靶10次,经过计算:甲、乙的平均数均是7,甲的方差是1.2。乙的
方差是5.8,下列说法中不正确的是()
A、甲、乙射中的总环数相同。
B、甲的成绩稳定。
C、乙的成绩波动较大
D、甲、乙的众数相同。
13.在数据-1,0,4,5,8中插入一个数x,使这组数据的中位数为3,则x=
14、将一组数据中的每一个数减去40后,所得新的一组数据的平均数是2,?则原来那组数据的平均数是()
A.40 B.42 C.38 D.2
15.一个射手连续射靶22次,其中3次射中10环,7次射中9环,9次射中8环,3次射中7环.则射中环
数的中位数和众数分别为()
A.8,9 B.8,8 C.8.5,8 D.8.5,9
16.期中考试后,学习小组长算出全组5位同学数学成绩的平均分为M,如果把M?当成另一个同学的分数,与原来的5个分数一起,算出这6个分数的平均值为N,那么M:?N为()
A.5
6
B.1 C.
6
5
D.2
17、下列说法错误的是()
A.一组数据的平均数、众数、中位数可能是同一个数; B.一组数据中中位数可能不唯一确定
C.一组数据中平均数、众数、中位数是从不同角度描述了一组数据的集中趋势
D.一组数据中众数可能有多个
18、数据按从小到大排列为1,2,4,x,6,9,这组数据的中位数为5,那么这组数据的众数是() A:4 B:5 C:5.5 D:6
19、从鱼塘捕获同时放养的草鱼240条,从中任选8条称得每条鱼的质量分别为1.5、1.6、1.4、1.3、1.5、
1.2、1.7、1.8(单位:千克),那么可估计这240条鱼的总质量大约为()
A: 300千克 B:360千克 C:36千克 D:30千克
20、一组数据同时减去80,所得新的一组数据的平均数为2.3,?
那么原数据的平均数为__________;
21、一个射手连续射靶22次,其中三次射中10环,7次射中9环,9次射中8环,3?次射中7环,则射中
环数的中位数和众数分别为( )
A :8,9
B :8,8
C :8.5,8
D :8.5,9
22、若样本x 1+1,x 2+1,…,x n +1的平均数为10,方差为2,则对于样本x 1+2,x 2+2,…,x n +2, 下列结论正确的是( )
A :平均数为10,方差为2
B :平均数为11,方差为3
C :平均数为11,方差为2
D :平均数为12,方差为4
23、 8个数的平均数是12,4个数的平均为18,则这12个数的平均数为 ; 24. 一组数据的方差是,22221231
[(4)(4)(4)10
s x x x =
-+-+-+…210(4)]x +-,则这组数据 个, 平均数是 ;
25、某公司欲招聘工人,对候选人进行三项测试:语言、创新、综合知识,并按测试得分
1:4:3的比例确定测试总分,已知三项得分分别为88,72,50,?则这位候选人的招聘得分为________; 26、一段山路长5千米,小明上山用了1.5小时,下山用了1小时,
则小明上山、下山的平均速度为 千米/小时________;。
27. 有一组数据如下:2,3,a ,5,6,它们的平均数是4,则这组数据的方差是
28.已知321,,x x x 的平均数=x 10,方差=2
S 3,则3212,2,2x x x 的平均数为 ,方差为 .
29.在数据-1,0,4,5,8中插入一数据x ,使得该数据组的中位数为3,则x =____ . 30.已知数据,,a b c 的平均数为8,那么数据1,2,3a b c +++的平均数是______ _.
31.某班主任老师为了对学生乱花钱的现象进行教育指导,对班里每位同学一周内大约花钱数额 进行了统计,如下表:根据这个统计表可知,该班学生一周花钱数额的众数、平均数是( ) A .15,14 B .18,14 C .25,12 D .15,12
32、体育课,在引体向上项目考核中,某校初三年级100名男生考核成绩如下 表所示: 成绩(单位:次)
10 9 8 7 6 5 4 3 人数
30
19
15
14
11
4
4
3
(1)分别求这些男生考核成绩的众数、中位数与平均数。
(2)规定成绩在8次(含8次)为优秀,求这些男生考核成绩的优秀率。
学生花钱数(元)
5 10 15 20 25 学生人数
7
12
18
10
3
012
34
5
12345678
12
345
12345678环数
环数
次
次
甲
乙
33.某乡镇企业生产部有技术工人15人,?生产部为了合理制定产品的每月生产定额,统计了15人 某月的加工零件个数:
(1)写出这15人该月加工零件数的平均数、中位数和众数.
(2
)假如生产部负责人把每位工人的月加工零件数定为260(件),?你认为这个定额是否合理,为什
34.甲、乙两人在相同的条件下各射靶5次,每次射靶的成绩情况如图所示:
⑴ 分别计算甲、乙的平均数和方差 (2)从平均数和方差相结合看,分析谁的成绩好些.
35.振兴中华某班的学生对本校学生会倡导的“抗震救灾,众志成城”自愿捐款活动进行抽样调查,得到一
组学生捐款情况的数据,并绘制成统计图(如图),图中从左到右各矩形的高度之比为3:4:5:8:6,又知此次调查中捐款25元和30元的学生一共42人。
(1)他们一共调查了多少人?(2)这组数据的众数、中位数各是多少? (3)若该校共有1560名学生,估计全校学生共捐款多少元?
每人加工件数 540 450 300 240 210 120 人 数
1
1
2
6
3
2
36.在学校组织的“喜迎奥运,知荣明耻,文明出行”的知识竞赛中,每班参加比赛的人数相同,成绩分为
A B C D ,,,四个等级,其中相应等级的得分依次记为100分,90分,80分,70分,学校将某年级的
一班和二班的成绩整理并绘制成如下的统计图:
请你根据以上提供的信息解答下列问题:
(1)此次竞赛中二班成绩在C 级以上(包括C 级)的人数为 ; (2)请你将表格补充完整:
平均数(分) 中位数(分) 众数(分)
一班 87.6 90 二班
87.6
100
(3)请从下列不同角度对这次竞赛成绩的结果进行分析:
①从平均数和中位数的角度来比较一班和二班的成绩;②从平均数和众数的角度来比较一班和二班的成绩; ③从B 级以上(包括B 级)的人数的角度来比较一班和二班的成绩.
37.下表是某校八年级(1)班20名学生某次数学测验的成绩统计表
成绩(分) 60 70 80 90 100 人数(人) 1
5
x
y
2
(1)若这20名学生成绩的平均分数为82分,求x 和y 的值;
(2)在(1)的条件下,设这20名学生本次测验成绩的众数为a ,中位数为b ,求a ,b 的值.
A B C D
等级
12 10 8 6
4
2
0 人数
6
12
2 5 一班竞赛成绩统计图 二班竞赛成绩统计图
16%
D 级 36%
C 级 44% A 级
B 级4%
,,,38.某校为了了解九年级学生体育测试成绩情况,以九年(1)班学生的体育测试成绩为样本,按A B C D
四个等级进行统计,并将统计结果绘制如下两幅统计图,请你结合图中所给信息解答下列问题:
(说明:A级:90分~100分;B级:75分~89分;C级:60分~74分;D级:60分以下)
(1)求出D级学生的人数占全班总人数的百分比;
(2)求出扇形统计图中C级所在的扇形圆心角的度数;
(3)该班学生体育测试成绩的中位数落在哪个等级内;
(4)若该校九年级学生共有500人,请你估计这次考试中A级和B级的学生共
有多少人?
39.当今,青少年视力水平下降已引起全社会的关注,为了了解某市30000名学生的视力情况,从中抽取了
一部分学生进行了一次抽样调查,利用所得数据绘制的频数分
布直方图如下:
解答下列问题:
(1)本次抽样调查共抽测了名学生;
(2)参加抽测的学生的视力的众数在范围内;中位数在范围内;
(3)若视力为4.9及以上为正常,试估计该市学生的视力正常的人
1.化简:4
x 24x 216x 42--
++-. 2.已知23y 32x -=+=,,求y x y x )y x (224
4++÷-的值. 3、化简:)2x 2x 5(2x 6x 2---÷-- 4、化简2244)
2)(1(22-÷??
????--+--+a a a a a a a a a
5、已知12,4-=-=+xy y x ,求1
111+++++y x x y 的值. 6、22213
(1)69x x x x x x x -+÷-?+++
7.先化简代数式)n m ()n m (mn
2n m n m n m n m 22222-+÷???
? ??+---+,然后请你自取一组m 、n 的值代入求值
8.已知122y 22x -=-=,,求
2y xy 2x y x y x y x 2
22
2-++-++- .
9、化简或求值:22111244
a a a a a a a ---÷-+++,其中a=2
10.已知实数x 、y 满足04y 2x 32|1y x 2|=+-++-,求代数式2
22
2y 4xy 4x y x y 2x y x 1+--÷---的值.
11、课堂上,李老师给大家出了这样一道题:当x 分别取3,225-,
37+时,求代数式1x 2
x 21
x 1x 2x 22+-÷-+-的值。小明一看:“太复杂了,怎么算呢?”你能帮小明解决这个问题吗?请你写出具体解题过程。
12、已知:两个分式1111A x x =
-
+-,22
1
B x =-,其中x ≠ ±1。下面三个结论:①A=B,②A、B 为倒数,③A、B 互为相反数。请问这三个结论中哪一个结论正确?为什么?
13、(2006年黑龙江省) 先化简1
1112
-÷??? ??
-+x x
x ,再选择一个恰当的x 值代人并求值.
14、(大连市中考试题)已知22
2211
11x x x y x x x x
+++=÷-+--.试说明不论x 为何值,y 的值不变.
15、(08乌鲁木齐)22
111
1121
x x x x x +-÷+--+,其中31x =-.
16、有一道题“先化简,再求值: 2221
()244
x x x x x -+÷+-- 其中,x=-3”小玲做题时把“x=-3”
错抄成了“x=3”,但她的计算结果也是正确的,请你解释这是怎么回事?
《数据分析》练习题 1.一个地区某月前两周从星期一到星期五各天的最低气温依次是(单位:℃):x 1, x 2, x 3, x 4, x 5和x 1+1, x 2+2, x 3+3, x 4+4, x 5+5,若第一周这五天的平均最低气温为7℃,则第二周这五天的平均最低气温为 。 2.有10个数据的平均数为12,另有20个数据的平均数为15,那么所有这30个数据的平均数是( ) A .12 B. 15 C. 1 3.5 D. 14 3.一组数据8,8,x ,6的众数与平均数相同,那么这组数据的中位数是 ( ) A. 6 B. 8 C.7 D. 10 4.某校在一次考试中,甲乙两班学生的数学成绩统计如下: 请根据表格提供的信息回答下列问题: (1)甲班众数为 分,乙班众数为 分,从众数看成绩较好的是 班; (2)甲班的中位数是 分,乙班的中位数是 分; (3)若成绩在80分以上为优秀,则成绩较好的是 班;、 (4)甲班的平均成绩是 分,乙班的平均成绩是 分,从平均分看成绩较好的是 班. 5.在方差的计算公式 ()()()222 21210120202010 s x x x ??= -+-+???+-??中, 数字10和20分别表示的意义可以是( ) A .数据的个数和方差 B .平均数和数据的个数 C .数据的个数和平均数 D .数据组的方差和平均数 6..如果将所给定的数据组中的每个数都减去一个非零常数,那么该数组的 ( ) A.平均数改变,方差不变 B.平均数改变,方差改变 C.平均输不变,方差改变 D.平均数不变,方差不变 7..已知7,4,3,,321x x x 的平均数是6,则_____________321=++x x x . 8..已知一组数据-3,-2,1,3,6,x 的中位数为1,则其方差为 . 9..已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是 3 1 ,那么另一组数据3x 1-2,3x 2-2,3x 3-2, 3x 4-2,3x 5-2的平均数是和方差分别是 . 10..关于一组数据的平均数、中位数、众数,下列说法中正确的是( ) A.平均数一定是这组数中的某个数 B. 中位数一定是这组数中的某个数 C.众数一定是这组数中的某个数 D.以上说法都不对 分数 50 60 70 80 90 100 人数 甲 1 6 12 11 15 5 乙 3 5 15 3 13 11
运营数据分析指标文档 一.流量分析 1.1概览 ①时间范围选择功能:以数据记录时间为筛选条件显示本页下数据,默认首个时间范围框为当前日期前30天,第二个时间范围框为当前日期前一日。点击每一个选择区域弹出日历,用户可选择年份、月份和日期,日历内日期默认选择为当前日期前一日,最终结果以两个选择区域内选择的时间的时间差为筛选标准,不分前后。有按照昨天、最近7天和最近30天的快速筛选按钮,点击对应按钮以对应时间进行数据筛选。选择范围最长为365天。选择范围最长为365天。 ②时间统计方式选择:可选择按小时和按单日来作为统计的维度,如选择小时则可显示每天12:00到13:00(或其他时间段内)网站浏览量(或访客数)的数据统计。 ③数据统计区域(表格):首行显示全网站昨日的浏览量、独立访客数、新独立访客数、ip、跳出率和平均访问时长,第二行对应显示全网站从统计之日起至昨日的上述平均数值。 ④折线图:可选指标为pv、uv、pv/uv、vv、平均访问时长,默认选中uv,指标支持单选。横坐标为时间轴,与1.1和1.2中的时间范畴相关;纵坐标为各项指标对应的数据。鼠标移至折线图上时会浮窗显示鼠标所处位置垂直线所对应的日期或时间段,以及选中指标的具体数值,默认选中uv。 ⑤在新页面查看完整数据:点击该按钮跳转至“概览信息详情页。” 1.1.1概览信息详情页 ①时间范围选择功能:以数据记录时间为筛选条件显示本页下数据,默认首个时间范围框为当前日期前30天,第二个时间范围框为当前日期前一日。点击每一个选择区域弹出日历,用户可选择年份、月份和日期,日历内日期默认选择为当前日期前一日,最终结果以两个选择区域内选择的时间的时间差为筛选标准,不分前后。有按照昨天、最近7
例谈高考地理试题数据分析的方法和技巧 地理数据是地理事物和现象空间位置、属性特征及其动态变化等的数量化表示。通过地理数据的分析,可以解析其所表达的地理事物的分布、特征及其运动变化的地理过程,进而了解自然和人文地理环境特征以及人类活动与地理环 境之间的关系。全国各地高考试题近年来出现了不同类型的地理数据分析类试题,其解析方法和技巧各不相同。 一、比较法 比较法是高考试题中地理数据分析的常用方法,包括纵比法、横比法和联系比较法等。纵比法是将不同历史阶段的地理数据加以比较,借以揭示地理现象在历史发展过程各阶段的共性与个性。横比法是将同一属性的不同地理事物加以比较,找出其在同一发展阶段在地理特征、发展趋势等方面的差异。联系比较法是联系相关地理事物进行比较,以利于探求地理规律,解决地理问题。 例题1:图1示意某城市20世纪80年代和90年代平均人口年变化率,当前,该城市总人口约1300万。据此完成(1)~(2)题。 (1)20世纪90年代和80年代相比,该城市 A.总人口增长速度加快 B.总人口减少 C.人口自然增长率降低
D.人口净迁入量减少 (2)该城市所在的国家可能是 A.美国 B.日本 C.俄罗斯 D.德国 解析:该题涉及了人口地理学的相关地理数据,主要有人口的自然增长率、迁移率、总人口增长率。第(1)题的解题方法是典型的纵比法,可以将“1981~1990”和“1991~2000”两个不同历史阶段的同类地理数据进行比较,排除A、C,由于总人口增长率一直为正值,所以B选项“总人口减少”是错误的,所以选D。 技巧:纵比法主要用于同一地理实体不同历史阶段气候资料、水文信息、自然资源、人口数量、农业分布、工业产值等的比较,可以揭示同一地理事物属性特征的时间变化过程,利用纵比法进行比较时,一是要注意比较实体和属性数据的同一性,必须是同一地理实体不同时期的同类属性数据的比较。二是要注意将属性数据变化值与时间尺度联系起来分析地理实体的变化特征,不能夸大或缩小地理实体特征的变化幅度。横比法主要用于不同地理实体间同一历史阶段属性数据的比较,可以是国家间的作物面积的比较,可以是河流间水文特征的比较,也可以是功能区间属性的比较等等。利用横比法进行比较时,一是要注意所比较的地理实体间的同质性和层次性,例如,不能将城市功能区与农业规划区进行比较,也不能将国家的工业产值与城市的工业产值进行比
数据分析期末试题及答案 一、人口现状.sav数据中是1992年亚洲各国家和地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)的数据,试用多元回归分析的方法分析各国家和地区平均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的关系。(25分) 解: 1.通过分别绘制地区平均寿命(y)、按购买力计算的人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间散点图初步分析他们之间的关系 上图是以人均GDP(x1)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系。尝试多种模型后采用曲线估计,得出 表示地区平均寿命(y)与人均GDP(x1)的对数有线性关系
上图是以成人识字率(x2)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间基本呈正线性关系。 上图是以疫苗接种率(x3)为横轴,地区平均寿命(y)为纵轴的散点图,由图可知,他们之间没有呈线性关系 。 x)为横轴,地区平均寿命(y)为纵轴的散点图,上图是以疫苗接种率(x3)的三次方(3 3 由图可知,他们之间呈正线性关系 所以可以采用如下的线性回归方法分析。
2.线性回归 先用强行进入的方式建立如下线性方程 设Y=β0+β1*(Xi1)+β2*Xi2+β3* X+εi i=1.2 (24) 3i 其中εi(i=1.2……22)相互独立,都服从正态分布N(0,σ^2)且假设其等于方差 R值为0.952,大于0.8,表示两变量间有较强的线性关系。且表示平均寿命(y)的95.2%的信息能由人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)一起表示出来。 建立总体性的假设检验 提出假设检验H0:β1=β2=β3=0,H1,:其中至少有一个非零 得如下方差分析表 上表是方差分析SAS输出结果。由表知,采用的是F分布,F=58.190,对应的检验概率P值是0.000.,小于显著性水平0.05,拒绝原假设,表示总体性假设检验通过了,平均寿命(y)与人均GDP(x1)、成人识字率(x2),一岁儿童疫苗接种率(x3)之间有高度显著的的线性回归关系。
数据分析课程设计 题目:四川农村居民的消费结构浅析 班级:2009级数学与应用数学1班 学号:20091615310028 姓名:张雪梅 指导老师:张燕 时间:2012年6月19日
【摘要】 随着人们生活水平的提高,消费结构也在日益变化,为了能够更好的为四川农村人们服务,更快的发展农村建设,让人们过上更好的生活。在此,有必要研究农村人们的消费结构变化情况,以便做出正确的判断。本文是基于四川统计年鉴中1995年—2010年中的14年的四川省农村居民人均纯收入与消费支出的相关数据,运用sas软件,采用因子分析方法,实证研究了该省农村居民的消费结构变动情况。结论表明, 四川农村居民的生活质量有所提高,大多数人解决了住房、温饱等生活问题,对生活方面的支出有所减少,更多的开始关注文化教育和精神娱乐方面,最后给农村今后的发展提出了小小的建议。 【关键字】 四川省农村居民消费结构因子分析 sas
目录 摘要 (2) 关键字 (2) 目录 (3) 一、消费简介 (6) 1.消费结构概念 (6) 2 研究我省农村居民消费结构的必要性 (6) 二、因子分析概述 (7) 1、因子分析的概念和意义 (7) 2、因子分析的的数学模型 (7) 3、因子分析的基本步骤 (8) 4、因子的命名 (10) 5、计算因子得分 (10) 6、具体实施步骤 (10) 三、实证分析过程 (10) 1、数据的收集整理 (10) 2、相关系数矩阵的计算 (11) 3、因子载荷矩阵的计算 (12)
4、因子的方差贡献率及变量的共同度计算及分析 (14) 5、计算因子得分 (14) 四、结论与建议 (16) 1、结果分析 (16) 2、对于四川省农村居民消费结构的建议 (16) 五、参考文献 (18)
数据分析练习题 第 小组 姓名: 练习一: 1、老师在计算学期总平均分的时候按如下标准:作业占100%、测验占30%、期中占35%、期末考试占35% x 小关 = . x 小兵 = . 2、结果如下表:(单位:小时) 求这些灯泡的平均使用寿命? . x = .小时 3、在一个样本中,2出现了x 1次,3出现了x 2次,4出现了x 3次,5出现了x 4次,则这个样本的平均数为 . 4、某人打靶,有a 次打中x 环,b 次打中y 环,则这个人平均每次中靶 环。 5、某校为了了解学生作课外作业所用时间的情况,对学生作课外作业所用时间进行调查,下表是该校初二某班50名学生某一天做数学课外作业所用时间的情况统计表 (1)、第二组数据的组中值是多少? (2)、求该班学生平均每天做数学作业所用时间 答:(1)组中值为: . (2)解: 6、某公司有15名员工,他们所在的部门及相应每人所创的年利润如下表该公司每人所创年利润的平均数是多少万元?
7、为调查居民生活环境质量,环保局对所辖的50个居民区进行了噪音(单位:分贝)水平的调查,结果如下图,求每个小区噪音的平均分贝数。 8、某公司销售部有营销人员15人,销售部为了制定某种商品的销售金额,统计了这15个人的销售量如下(单位:件) 1800、510、250、250、210、250、210、210、150、210、150、120、120、210、150 求这15个销售员该月销量的中位数和众数。 假设销售部负责人把每位营销员的月销售定额定为320件,你认为合理吗?如果不合理,请你制定一个合理的销售定额并说明理由。 练习二: 1. 数据8、9、9、8、10、8、99、8、10、7、9、9、8的中位数是 ,众数是 2. 一组数据23、27、20、18、X 、12,它的中位数是21,则X 的值是 . 3. 数据92、96、98、100、X 的众数是96,则其中位数和平均数分别是( ) A.97、96 B.96、96.4 C.96、97 D.98、97 4. 如果在一组数据中,23、25、28、22出现的次数依次为2、5、3、4次,并且没有其他的数据, 则这组数据的众数和中位数分别是( ) A.24、25 B.23、24 C.25、25 D.23、25 请你根据上述数据回答问题: (1).该组数据的中位数是什么? (2).若当气温在18℃~25℃为市民“满意温度”,则我市一年中达到市民“满意温度”的大约有多少天? 60 噪音/分贝 80 70 50 40 90
《数据分析》课程标准 1.课程定位与课程设计 1.1课程的性质与作用 本课程是大数据应用技术专业的核心课程。通过本课程的学习,使学生掌握调查方案设计、数据资料的收集、整理、分析和数据分析报告的撰写方法和思路,及运用相关数据处理工具进行数据分析的基本方法。该课程主要是培养学生完整数据分析的理念与运用相关数据处理工具进行数据分析的能力,为学生学习和掌握《数据挖掘》等其他专业课程提供必备的专业基础知识,也为学生从事大数据应用技术相关岗位工作打下良好的基础。 1.2课程设计理念 课程设计遵循“以学生为主体”教育思想,依据“任务引领”为课程内容设计原则,以提高学生整体素质为基础,以培养学生市场调查与数据分析工具的使用能力、特别是创新能力和实际操作能力为主线,兼顾学生后续发展需要,选取符合数据分析职场所要求的知识、素质和能力为教学内容;在基本理论和基础知识的选择上以应用为目的,以“必需、够用”为度,服从培养能力的需要,突出针对性和实用性 (2)遵循能力本位的教学观。注重培养学生在工作中对数据资料的收集、整理和分析处理能力,训练学生的专业能力、社会能力和方法能力。课程设计以能力为核心,围绕能力的形成学习相关知识。 1.3 课程设计思路 在课程设计上根据大数据应用技术专业就业岗位群任职要求,改革传统的课程体系和教学方法,形成以就业为导向,立足于学生职业能力培养和职业素养养成,突出课程的应用性和操作性。数据分析工作是一个有序开展的工作,顺序性和过程性很强,课程设计的思路正是依据工作任务的顺序和过程开展的,数据分析工作过程主要分为五个步骤,这五个步骤也就是五个工作项目,构成了本课程学习内容的框架。通过任务驱动充分发挥学生的主体作用,让学生在完成具体任务的过程中来构建相关理论知识,发展职业能力,并提升职业素养。在教学内容上遵循“理论够用、适度,重在应用”的原则,弱化理论,剔除抽象的公式推导和复杂计算分析,把数据资料的收集特别是利用互联网收集数据资料及运用数据分析工具软件进行数据分析,作为重点内容进行讲授和训练,适应社会经济和科技进步给市场信息分析与预测带来的发展。 2.课程目标 通过本课程的学习,学生掌握从调查方案设计、数据资料的收集、处理、分析到数据分析报告的撰写整个工作流程,学会运用相关数据处理工具进行数据分析的基本方法。同时还要培养学生自主学习能力、自我管理能力、沟通能力、组织协调能力、市场开拓意识、竞争意识和团队协作精神,使学生既具备较高的业务素质,又具有良好的职业道德和敬业精神。
《统计分析在Excel 中的实现》练习题 1.Excel 中提供了常用的内置函数包括__________、__________、__________等。 2. 在Excel 中制作问卷,可使用________令用户选择的结果自动填入指定位置的单元格。 3. 饼图可以展示________个数据序列。 4. _________可以用于表明针对某个社会现象的观测值在一定时间、地点条件下达到的一般水平,概括总体的数量特征。 5. 抽样方法有__________、_______________两大类。 6. 根据显著性水平得到相应的检验统计量的数值称为_________。 7. 用来衡量因素在不同水平下不同样本之间的误差叫做 _________。 8 回归分析的内容主要包括确定自变量和因变量、 _________________、_____________和预测与估计。 9 . 同一现象在不同时间的相继观测值排列而成的序列称为 __________。一.填空题: 二、选择题 1. 以下关于Excel 数据处理与分析的描述,说法不正确的是( )。 A.Excel 不仅可以利用公式进行简单的代数运算,还可以用于复杂的数学模型的分析 B. 存放在记事本中的数据,无论是否有结构,可以一次性导入为Excel 数据表
C.Excel 可以通过手动、公式生成和复制生成的方式输入数据 D.Excel 绘图功能可以根据选定的统计数据绘制统计图 2. 为了调查某学校学生的上网时间,从一年级中抽取80名学生调查,从二年级学生中抽取50名学生调查,这种调查方法是( )。 A. 简单随机抽样 B. 整群抽样 C. 系统抽样 D. 分层抽样 3. 以下关于Excel 制图的描述不正确的是( )。 A.Excel 中可以制作曲面图、面积图、气泡图等多种类型图表 B. 制作图表时,往往需要对原始数据进行调整,以符合Excel 制图对数据摆放的要求 1 C. 股价图只可以用于金融股市数据的显示,无法显示其他类型数据 D. 以上都正确 4. 反映数据分布离中趋势最主要的指标值是( ) 。 A. 全距 B. 方差 C. 标准差 D. 离散系数 5. 估计量是指( ) 。 A. 用来估计总体参数的统计量名称 B. 用来估计总体参数的统计量的具体数值 C. 总体参数的名称 D. 总体参数的具体数值 6. 假设检验是检验下列哪个假设值的成立情况的?() A. 样本指标 B. 总体指标 C. 样本方差 D. 样本平均数 7. 方差分析的目的是判断()。
《数据分析方法》 课程实验报告 1.实验内容 (1)掌握回归分析的思想和计算步骤; (2)编写程序完成回归分析的计算,包括后续的显著性检验、残差分析、Box-Cox 变换等内容。 2.模型建立与求解(数据结构与算法描述) 3.实验数据与实验结果 解:根据所建立的模型在MATLAB中输入程序(程序见附录)得到以下结果:(1)回归方程为: 说明该化妆品的消量和该城市人群收入情况关系不大,轻微影响,与使用该化妆品的人数有关。 的无偏估计: (2)方差分析表如下表: 方差来源自由度平方和均方值 回归() 2 5384526922 56795 2.28
误差()12 56.883 4.703 总和()14 53902 从分析表中可以看出:值远大于的值。所以回归关系显著。 复相关,所以回归效果显著。 解:根据所建立的模型,在MATLAB中输入程序(程序见附录)得到如下结果:(1)回归方程为: 在MTLAB中计算学生化残差(见程序清单二),所得到的学生化残差r的值由残差可知得到的r的值在(-1,1)的概率为0.645,在(-1.5,1.5)的概率为0.871,在(-2,2)之间的概率为0.968. 而服从正态分布的随机变量取值在(-1,1)之间的概率为0.68,在(-1.5,1.5)之间的概率为0.87,在(-2.2)之间的概率为0.95,所以相差较大,所以残差分析不合理,需要对数据变换。 取=0.6进行Box-Cox变换 在MATLAB中输入程序(见程序代码清单二) 取,所以得到r的值(r的值见附录二)其值在(-1,1)之间的个数大约为20/31=0.65,大致符合正态分布,所以重新拟合为: 拟合函数为: 通过F值,R值可以检验到,回归效果显著 (3)某医院为了了解病人对医院工作的满意程度和病人的年龄,病情的严重程度和病人的忧虑程度之间的关系,随机调查了该医院的23位病人,得数据如下表: