当前位置:文档之家› 大数据技术形考一题库

大数据技术形考一题库

大数据技术形考一题库
大数据技术形考一题库

窗体顶端

下列关于大数据的分析理念的说法中,错误的是()。

A. 在数据基础上倾向于全体数据而不是抽样数据

B. 在数据规模上强调相对数据而不是绝对数据

C. 在分析效果上更追究效率而不是绝对精确

D. 在分析方法上更注重相关分析而不是因果分析

反馈

正确答案是:在数据规模上强调相对数据而不是绝对数据题目2

未回答

满分

标记题目

题干

下列关于计算机存储容量单位的说法中,错误的是()。

A. 一个字节能够容纳一个英文字符

B. 一个汉字需要一个字节的存储空间

C. 基本单位是字节(Byte)

D. 1KB<1MB<1GB

反馈

正确答案是:一个汉字需要一个字节的存储空间

题目3

未回答

满分

标记题目

题干

摩尔定律指出,当价格不变时,集成电路上可容纳的晶体管数目,约每隔()便会增加一倍,性能也将提升一倍。

A. 6个月

B. 18个月

C. 24个月

D. 12个月

反馈

正确答案是:18个月

题目4

未回答

满分

标记题目

题干

大数据时代,数据使用的关键是()。

A. 数据存储

B. 数据分析

C. 数据收集

D. 数据再利用

反馈

正确答案是:数据再利用

题目5

未回答

满分

标记题目

题干

数据仓库的最终目的是()。

A. 为用户和业务部门提供决策支持

B. 开发数据仓库的应用分析

C. 建立数据仓库逻辑模型

D. 收集业务需求

反馈

正确答案是:为用户和业务部门提供决策支持题目6

未回答

满分

标记题目

题干

高德2014年被()全资收购了。

A. 搜狐

B. 阿里巴巴

C. 百度

D. 腾讯

反馈

正确答案是:阿里巴巴

题目7

未回答

满分

标记题目

题干

下列关于网络用户行为的说法中,错误的是()。

A. 用户离散的交互痕迹能够为企业提升服务质量提供参考

B. 数字轨迹用完即自动删除

C. 网络公司能够捕捉到用户在其网站上的所有行为

D. 用户的隐私安全很难得以规范保护

反馈

正确答案是:数字轨迹用完即自动删除

题目8

未回答

满分

标记题目

题干

与大数据密切相关的技术是()

A. wifi

B. 云计算

C. 蓝牙

D. 博弈论

反馈

正确答案是:云计算

题目9

未回答

满分

标记题目

题干

智慧城市的构建,不包含()。

A. 云计算

B. 数字城市

C. 联网监控

D. 物联网

反馈

正确答案是:联网监控

题目10

未回答

满分

标记题目

题干

第一个提出大数据概念的公司是()。

A. 微软公司

B. 谷歌公司

C. 麦肯锡公司

D. 脸谱公司

反馈

正确答案是:麦肯锡公司

题目11

未回答

满分

标记题目

题干

大数据的本质是()。

A. 挖掘

B. 搜集

C. 洞察

D. 联系

反馈

正确答案是:洞察

题目12

未回答

满分

标记题目

题干

大数据要求企业设置的岗位是()。

A. 首席分析师和首席工程师

B. 首席信息官和首席工程师

C. 首席分析师和首席数据官

D. 首席信息官和首席数据官

反馈

正确答案是:首席信息官和首席数据官题目13

未回答

满分

标记题目

题干

()反映数据的精细化程度,越细化的数据,价值越高。

A. 活性

B. 关联度

C. 颗粒度

D. 规模

反馈

正确答案是:颗粒度

题目14

未回答

满分

标记题目

题干

当前大数据技术的基础是由()首先提出的。

A. 谷歌

B. 微软

C. 百度

D. 阿里巴巴

反馈

正确答案是:谷歌

题目15

未回答

满分

标记题目

题干

2008年以后,第()信息传输技术:传输2亿路信号。

A. 一代

B. 四代

C. 三代

D. 二代

反馈

正确答案是:四代

题目16

未回答

满分

标记题目

题干

规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是()。

A. 富数据

B. 大数据

C. 贫数据

D. 繁数据

反馈

正确答案是:大数据

题目17

未回答

满分

标记题目题干

大数据的起源是()。

A. 公共管理

B. 金融

C. 电信

D. 互联网

反馈

正确答案是:互联网

题目18

未回答

满分

标记题目

题干

逻辑域构建了协议、()、数据等组成的信息活动域。

A. 网络

B. 附件

C. 软件

D. 硬件

反馈

正确答案是:软件

题目19

未回答

满分

标记题目

题干

在连接互联网的计算机上()处理、存储涉及国家秘密和企业秘密信息。

A. 可以

B. 严禁

C. 只要网络环境是安全的,就可以

D. 不确定

反馈

正确答案是:严禁

题目20

未回答

满分

标记题目

题干

当前社会中,最为突出的大数据环境是()。

A. 综合国力

B. 物联网

C. 自然资源

D. 互联网

反馈

正确答案是:互联网

窗体底端

窗体顶端

人与人之间沟通信息、传递信息的技术,这指的是()。

A. 感测技术

B. 微电子技术

C. 计算机技术

D. 通信技术

反馈

正确答案是:通信技术

题目2

未回答

满分

标记题目

题干

以下说法错误的是哪项

A. 大数据是一种思维方式

B. 大数据不仅仅是讲数据的体量大

C. 大数据的英文名称是large data

D. 大数据会带来机器智能

反馈

正确答案是:大数据的英文名称是large data 题目3

未回答

满分

标记题目

题干

在数据生命周期管理实践中,()是执行方法。

A. 数据存储和备份规范

B. 数据应用开发和管理

C. 数据管理和维护

D. 数据价值发觉和利用

反馈

正确答案是:数据管理和维护

题目4

未回答

满分

标记题目

题干

棱镜计划(PRISM)是一项由()自2007年起开始实施的绝密电子监听计划。

A. 美国天平洋舰队

B. 美国联邦法院

C. 美国国家安全局

D. 美国驻华大使馆

反馈

正确答案是:美国国家安全局

题目5

未回答

满分

标记题目

题干

梅特卡尔夫定律主要是描述信息网络,指出网络的价值在于网络的互联,联网的接点数与其价值呈现()的方式,联网越多,系统的价值越大。

A. 指数

B. 对数

C. 正比

D. 反比

反馈

正确答案是:指数

题目6

未回答

满分

标记题目

题干

一个网络信息系统最重要的资源是()

A. 计算机硬件

B. 网络设备

C. 数据库

D. 数据库管理系统

反馈

正确答案是:数据库

题目7

未回答

标记题目

题干

下列关于数据重组的说法中,错误的是()。

A. 数据重组实现的关键在于多源数据融合和数据集成

B. 数据重组能够使数据焕发新的光芒

C. 数据重组是数据的重新生产和重新采集

D. 数据重组有利于实现新颖的数据模式创新

反馈

正确答案是:数据重组是数据的重新生产和重新采集

题目8

未回答

满分

标记题目

题干

能健康手环的应用开发,体现了()的数据采集技术的应用。

A. API接口

B. 传感器

C. 统计报表

D. 网络爬虫

正确答案是:传感器

题目9

未回答

满分

标记题目

题干

大数据的最显著特征是()。

A. 数据类型多样

B. 数据价值密度高

C. 数据处理速度快

D. 数据规模大

反馈

正确答案是:数据规模大

题目10

未回答

满分

标记题目

题干

支撑大数据业务的基础是()。

A. 数据应用

B. 数据硬件

C. 数据人才

D. 数据科学

反馈

正确答案是:数据应用

题目11

未回答

满分

标记题目

题干

世界上第一台电子计算机(ENIAC)是在哪一年宣告诞生的

A. 1947年

B. 1946年

C. 1949年

D. 1948年

反馈

正确答案是:1946年

题目12

未回答

满分

标记题目

题干

智慧城市的构建,不包含()。

A. 物联网

B. 云计算

C. 数字城市

D. 联网监控

反馈

正确答案是:联网监控

题目13

未回答

满分

标记题目

题干

以下选项中,不属于大数据对人才能力的要求是()。

A. 业务能力

B. 数学统计能力

C. IT技术能力

D. 逻辑思维能力

反馈

正确答案是:逻辑思维能力

题目14

未回答

满分

标记题目

题干

下列关于聚类挖掘技术的说法中,错误的是()。

A. 不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别

B. 要求不同类数据的内容相似度尽可能小

C.

D. 要求同类数据的内容相似度尽可能小

反馈

正确答案是:要求同类数据的内容相似度尽可能小

题目15

未回答

满分

标记题目

题干

Mac OS系统的开发者是()。

A. IBM公司

2019继续教育公需科目大数据技术及应用试题答案

2019年度大数据技术及应用试题 单选题: 1、本课程提到,近年来,我国(A)在GDP中占的比例逐年增大。 A互联网经济 B信息经济 C数码消费 D电子商务 2、法律大数据演示的结果表明,针对“酒驾”这一查询,相关刑罚中主要的是(A) A以上都是 B拘役 C罚金 D有期徒刑 3、根据本课程,取得成功的关键是要从(A)出发 A数据 B技术 C设备 D问题 4、1965年英特尔公司创始人之一摩尔先生,提出来在之后的十几年里,半导体处理器的性能,比如容量、计算速度和复杂程度每18个月左右可以翻一番,这被称为(摩尔定律) 5、21世纪初,关于查询结果排序我们找到了一种新的方法。(大数据方法:用户的点击数据) 6、根据本课程,(查询结果)排序是一个在搜索引擎中处于核心位置的工作。 7、今天,随着信息科学技术的高速发展,人类对数据的收集和分享能力空前强大,其中,(互联网)可以收集虚拟世界的数据。 8、根据本课程,交通数据采集的来源不包括(A) A通讯信号 B视频监控 C微波采集 D车载RFID 9、根据本课程,(实时分析)希望能够全面突破搜索引擎框架所蕴含的3个假设,使得我们能以很快的速度对互联网上出现的数据进行分析,从而发掘出相关的高阶知识,满足用户的信息需求。 10、六度分割理论认为,世界上任何两个人通过最多(六)个人就可以相互认识。 11、新经验主义是用经验数据解决问题,但是这些经验是(群体性的经验)。 12、根据本课程,科学家们认为,2013年全世界储存的大数据容量是(1.2ZB) 13、本课程提到,当前(云计算)服务的逐渐成熟,为大数据发展提供了有利的基础设施支撑。 14、(RFID)是一种标签,可以把一个物体身上的各种特征和信息都收集起来。

中南大学数据库考试题库

1?在数据库设计中,用E-R图来描述信息结构但不涉及信息在计算机中的表示,它属于数据库设计的()阶段。 A需求分析 B概念设计 C逻辑设计 D物理设计 参考答案 B 数据库设计步骤: (1)规划(必要性、可行性,总目标) (2)需求分析(分析用户活动,产生业务流程图;确定系统范围,产生系统范围图;分析用户活动涉及的数据,产生数据流程图;分析系统数据,产生数据字典。)(3)概念设计(设计出独立于计算机硬件和DBMS的概念模式。E-R模型是主要设计工具) (4)逻辑结构设计(把概念设计阶段设计好的全局E-R模式转换成与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构,包括数据库模式和外模式)(5)数据库的物理设计(对于给定的数据模型选取一个垠适合应用环境的物理结构的过程。数据库的物理结构主要指数据库的存储记录格式、存储记录安排和存取方法)(6)数据库的实现(建立实际数据库结构;装入试验数据对应用程序进行调试;装入实际数据,进入试运行状态) (7)数据库的运行与维护(维护数据库的安全性与完整性;监测并改善数据库运行性能; 根据用户要求对数据库现有功能进行扩充;及时改正运行中发现的系统错误) 2.关于数据库概念设计阶段的工作目标,下列说法错谋的是 A定义和描述应用系统涉及的信息结构和范围 B定义和描述应用系统中数据的属性特征和数据之间的联系 C描述应用系统的数据需求 D描述需要存储的记录及其数量 参考答案 3. SQL Server 2000的字符型系统数据类型主要包括()。 A int、money、char B char> varchar、text

C datetime、binary> int D char、varchar> int 参考答案 B 4. 具有联系的相关数据按一定的方式组织排列,并构成一定的结构,这种结构即()。 A数据模型 B数据库 C关系模型 D数据库管理系统 参考答案 A 5. 在数据库系统中,下列哪个映像关系用于提供数据与应用程序间的逻辑独立性? A外模式/模式 B模式/内模式 C外模式/内模式 D逻辑模式/内模式 参考答案 B 6. 关系模型的数据结构是 A树 B图 C表 D二维表 参考答案 D 7. 数据字典是数据库管理系统的重要组成部分,其中存储的各类信息通常由 A数据库管理员维护 B程序员维护 C数据库管理系统维护 D—般用户维护 参考答案 A 8. E-R图用于描述数据库的

大数据试题答案与解析_最全

1、当前大数据技术的基础是由( C)首先提出的。(单选题,本题2分) A:微软 B:百度 C:谷歌 D:阿里巴巴 2、大数据的起源是(C )。(单选题,本题2分) A:金融 B:电信 C:互联网 D:公共管理 3、根据不同的业务需求来建立数据模型,抽取最有意义的向量,决定选取哪种方法的数据分析角色人员是 ( C)。(单选题,本题2分) A:数据管理人员 B:数据分析员 C:研究科学家 D:软件开发工程师 4、(D )反映数据的精细化程度,越细化的数据,价值越高。(单选题,本题2分) A:规模 B:活性 C:关联度 D:颗粒度 5、数据清洗的方法不包括( D)。(单,本题2分)

A:缺失值处理 B:噪声数据清除 C:一致性检查 D:重复数据记录处理 6、智能健康手环的应用开发,体现了( D)的数据采集技术的应用。(单选题,本题2分) A:统计报表 B:网络爬虫 C:API接口 D:传感器 7、下列关于数据重组的说法中,错误的是( A)。(单选题,本题2分) A:数据重组是数据的重新生产和重新采集 B:数据重组能够使数据焕发新的光芒 C:数据重组实现的关键在于多源数据融合和数据集成 D:数据重组有利于实现新颖的数据模式创新 8、智慧城市的构建,不包含( C)。(单选题,本题2分) A:数字城市 B:物联网 C:联网监控 D:云计算 大数据的最显著特征是( A)。(单选题,本题2分) A:数据规模大 B:数据类型多样

C:数据处理速度快 D:数据价值密度高 10、美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地 点。这体现了大数据分析理念中的(B )。(单选题,本题2分) A:在数据基础上倾向于全体数据而不是抽样数据 B:在分析方法上更注重相关分析而不是因果分析 C:在分析效果上更追究效率而不是绝对精确 D:在数据规模上强调相对数据而不是绝对数据 11、下列关于舍恩伯格对大数据特点的说法中,错误的是(D )。(单选题,本题2分) A:数据规模大 B:数据类型多样 C:数据处理速度快 D:数据价值密度高 12、当前社会中,最为突出的大数据环境是(A )。(单选题,本题2分) A:互联网 B:物联网 C:综合国力 D:自然资源 13、在数据生命周期管理实践中,( B)是(单选题,本题2分) A:数据存储和备份规 B:数据管理和维护 C:数据价值发觉和利用

继续教育公需科目大数据技术及应用习题答案

精心整理 2019年度大数据技术及应用试题 单选题: 1、本课程提到,近年来,我国(A)在GDP中占的比例逐年增大。A互联网经济 B信息经济数码消费电子商务D A这一查询相关刑罚中主要的是(2法律大数据演示的结果表明针酒以上都拘罚金有期徒刑)出、根据本课程,取得成功的关键是要从A数据A B技术C设备D问题年英特尔公司创始人之一摩尔先生,提出来在之后的十几年里,半导体处理19654、摩这被称为(18器的性能,比如容量、计算速度和复杂程度每个月左右可以翻一番,)尔定律大数据方法:用户的(215、世纪初,关于查询结果排序我们找到了一种新的方法。精心整理. 精心整理 点击数据) 6、根据本课程,(查询结果)排序是一个在搜索引擎中处于核心位置的工作。 7、今天,随着信息科学技术的高速发展,人类对数据的收集和分享能力空前强大,其中,(互联网)可以收集虚拟世界的数据。 8、根据本课程,交通数据采集的来源不包括(A) A通讯信号

视频监控微波采RFID 车个假设)希望能够全面突破搜索引擎框架所蕴含3、根据本课程实时分使得我们能以很快的速度对互联网上出现的数据进行分析,从而发掘出相关的高知识,满足用户的信息需求。)个人就可以相互认识。 1、六度分割理论认为,世界上任何两个人通过最多六、新经验主义是用经验数据解决问题,但是这些经验是群体性的经)111.2Z年全世界储存的大数据容量是()1、根据本课程,科学家们认为2013)服务的逐渐成熟,为大数据发展提供了有利的基、本课程提到,当前(云计算13 础设施支撑。)是一种标签,可以把一个物体身上的各种特征和信息都收集起来。、(RFID14、本课程提出,搜索引擎是一个搜索框,输一些关键词,然后出来一些页面的列15 A)表,需要用户点开看,这种架构蕴含的基本假设不包括(这些文档彼此不是独立的A B这些文档是静态的假设用户找一个文档,而不是找一个答案C 精心整理. 精心整理 D这些文档是独立的 16、根据本课程,以下哪项不属于智慧城市的特点(C) A更广泛的互联互通 B更深入的智慧化 C更传统的方式 D更透彻的感知 17十二期间,我国数据总量年均增长率达到了50

(完整版)大学数据库考试复习试题带答案

2019数据库期末复习内容 1.选择题 (1)(数据库)是存储在计算机内结构化的数据的集合 (2)下述关于数据系统正确的描述是(数据库系统减少了数据冗余)。 (3)数据库(DB)、与数据库系统(DBS)和数据库管理系统(DBMS)之间的关系是(DBS 包含DB 和DBMS )。(4)数据库管理系统的工作不包括(为定义的确据库提供操作系统)。 (5)用于对现实世界进行描述的工具是(数据模型)。 (6)在数据库的三级模式结构中,描述数据库中全局逻辑结构和特征的是(模式)。 (7)E-R图用来建立数据库的(概念模型)。 (8)下列模型中不能直接描述实体间多对多的联系的是(关系模型)。 (9)数据模型的三个要素是(数据结构、数据操作、完整性约束) (10)数据库的设计人员和用户之间沟通信息的桥梁是(实体联系图)。 (11)数据的独立性分为(逻辑独立性和物理独立性)。 (12)数据库通常是根据(数据模型)来分类的。 (13)关系数据库系统能实现专门的关系运算,包括(选择、投影、连接、除)。 (14)在关系模型中,下述关于关键字的说法正确的是(可以由一个或多个其值能唯一标识该关系模式中任何元组的属性组成)。 (15)被称为关系的两个不变性,由关系数据库系统自动支持的是(实体完整性和参照完整性)。 (16)在关系中不能出现相同元组的约束是通过(主码)来实现。 (17)下列数据模型中,数据独立性最高的是(关系模型). (18)规范化理论是关系数据库进行逻辑设计的理论依据。根据这个理论,关系数据库中的关系必须满足:每一属性都是(不可分解的)。 (19)关系数据库规范化是为解决关系数据库中(插入异常、删除异常和数据冗余)问题而引入的。 (20)在关系数据库中,任何二元关系模式的最高范式必定是(BCNF ) (21)若属性X函数依赖于属性Y时,则属性X与属性Y之间的关系是(多对一)。 (22)设有关系模式:部门(部门代码,部门名称,部门成员,部门经理)由于其中(部门成员)属性存在,使该关系不属于第一范式。 (23)若关系模式R中的属性都是主属性,则R最高属于(3NF )。 (24)若要彻底消除插入异常和删除异常,关系模式最低要属于(BCNF)。 (25)关系模式分解的无损连接和保持函数依赖两个特性之间的联系是(没有必然联系)。 (26)关系模式中数据依赖的存在,可能会导致成立蕴涵后者数据插入异常,这是指(该插入的数据未被插入)。(27)设要对关系模式R(学号,姓名,课程代码,课程名,课程成绩)进行分解,将其规范化到3NF,下列(B)是正确的规范化结果。B.R1(学号,姓名)R2(课程代码,课程名)R3 (学号,课程代码,课程成绩) (28)有如下关系R(是BCNF)。 (29)对用户访问数据库的权限加以限定是为了保护数据库的(安全性)。 (30)下面(可移植性)不是数据库系统必须提供的数据控制功能。 (31)数据库系统中,对存取权限定义为(授权)。 (32)在数据库的安全性控制中,为了保证用户只能存取他有权存取的数据,在授权的定义中,数据对象的(范围越小),授权子系统就越灵活。 (33)数据库安全性遭到破坏的情况属于(非法用户读取数据库中的数据)。 (34)数据库的(完整性)是指数据的正确性和相容性。 (35)数据完整性保护中的约束条件是指(值的约束和结构的约束)。 (36)实体完整性和参照完整性属于(静态关系约束)。 (37)数据类型、取值范围、空值约束属于(静态列级约束)。

电信运营商行业大数据应用考试试题及答案

企业级大数据平台架构 电信行业大数据应用案例分享 互联网+行业大数据应用案例分享 第一套题 1、哪个选项不属于大数据4V特点?( B ) A、Volume B、Valid C、Variety D、Value 2、大数据的特点不包含( B ) A、数据体量大 B、价值密度高 C、处理速度快 D、数据不统一 3、业界对大数据典型特征定义,一下哪像描述正确 ABC 4、Hadoop包括(ABC) A、Hadoop Distrbuted Filesystem(HDFS) B、HadoopMapReduce C、Hbase D、HadoopStreaming 5、有关HDFS文件系统说法正确的是以下那些?(AD) A、HDFS本身是个高可用系统架构 B、HDFS采取的是多NameNode、DataNode架构 C、HDFS数据副本的数量越大越好 D、HDFS NameNode分主备,主备不同时对外服务 6、关于大数据的理念的描述,以下哪些不正确(BD) A、相关性比因果更重要 B、要效率也要绝对精准 C、大数据的核心价值是预测 D、遵从隐私和法律并非大数据的风险 7、HDFS文件系统适用于以下哪些场景(AC) A、将单文件分割成很多小块存储 B、存储大量小文件 C、流式数据读取 D、实时数据读取 8、对海量大数据管理可能面临的难题包括(ABCD) A、如何实现快速查找,提升检索效率; B、如何保证数据真实性,防止数据诈骗; C、如何实现PB级不同类型数据的存储; D、如何降低数据产生数量,节约存储资源。 9、大数据应用大大方便教育资源的管理,彻底改变教育模式,特别是在科研领域,面向数据密集型科研发现,将成为继三大范式之后的第四范式,此处提到的科学发展领域的三大范式是指(ABC) A、理论 B、推演 C、模拟 D、计算

大数据技术及应用题库

大数据技术及应用题库 单选题: 1从大量数据中提取知识的过程通常称为(A)。 a. . 数据挖掘 b. . 人工智能 c. . 数据清洗 d. . 数据仓库 2下列论据中,能够支撑“大数据无所不能”的观点的是(A)。 A、互联网金融打破了传统的观念和行为 B、大数据存在泡沫 C、大数据具有非常高的成本 D、个人隐私泄露与信息安全担忧 3数据仓库的最终目的是(D)。 a. . 收集业务需求 b. . 建立数据仓库逻辑模型 c. . 开发数据仓库的应用分析 d. . 为用户和业务部门提供决策支持 4大数据处理技术和传统的数据挖掘技术最大的区别是(A)。

a. . 处理速度快(秒级定律) b. . 算法种类更多 c. . 精度更高 d. . 更加智能化 5大数据的起源是(C)。 a. . 金融 b. . 电信 c. . 互联网 d. . 公共管理 6大数据不是要教机器像人一样思考。相反,它是(A)。 a. . 把数学算法运用到海量的数据上来预测事情发生的可能性 b. . 被视为人工智能的一部 c. . 被视为一种机器学习 d. . 预测与惩罚 7人与人之间沟通信息、传递信息的技术,这指的是(D)。 a. . 感测技术 b. . 微电子技术 c. . 计算机技术 d. . 通信技术

8数据清洗的方法不包括(D)。 a. . 缺失值处理 b. . 噪声数据清除 c. . 一致性检查 d. . 重复数据记录处理 9. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是(D)。 a. . 富数据 b. . 贫数据 c. . 繁数据 d. . 大数据 11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的(D)。 a. . 新一代信息技术 b. . 新一代服务业态

大数据试题

一、填空题(将正确的答案写入答题纸中。每空1分,共20分) ,_ DataNode__ _和 4、HBase中通过_ HDFS__ _存储底层数据,通过_ _Zookeeper_ _提供消息通信机制 5、HIVE默认采用_ _Derby _ __ __ _数据库进行元数据的存储,而真实的数据是存储在_ __HDFS __ __ _中。 6、如何在浏览器中查看HDFS 7、HDFS中当前block大小为128M,如果当前要上传到HDFS中的文件大小为300M,那 block进行存储。 8、HDFS 获取根目录下的文件列表的命令shell命令是_hadoop fs -ls -R / __ __ __ __ __ _;根目录下创建hdfs文件夹的shell命令是_ _hadoop fs -mkdir /hdfs__ __ __ __ _ 。 9、Y ARN架构中整个集群同一时间提供服务的ResourceManager有_ 1__ _个,负责集群资源的统一管理和调度。 二、选择题(将正确的答案写入答题纸中。每题2分,共20分) 1、配置Hadoop时,JA V A_HOME包含在哪一个配置文件中(B) A.hadoop-default.xml B.hadoop-env.sh C.hadoop-site.xml D.configuration.xs 2、下面哪个程序负责HDFS 数据存储。(C) A)NameNode B)Jobtracker C)Datanode D)secondaryNameNode 3、下列关于Hadoop API的说法错误的是(A) A.Hadoop的文件API不是通用的,只用于HDFS文件系统 B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的C.FileStatus对象存储文件和目录的元数据 D.FSDataInputStream是java.io.DataInputStream的子类 4、HDfS 中的block 默认保存几份? (A) A)3 份 B)2 份 C)1 份 D)不确定

北京科技大学数据库考试题库

机考201601 数据库应用1. 项目文件的扩展名是() A..PJX 2. 在命令窗口中键入下面哪个命令并按回车,可以退出Visual FoxPro ()C.QUIT 3. 选择哪个菜单下的“工具栏”,可以打开工具栏对话框() B. “显示” 4. 命令窗口被关闭后,将其重新打开的快捷键是() D.〈Ctrl 〉+〈F2〉 5. 如果一个学生可以选修多门课程,而每门课程又可以被多个学生选修,则学生和课程之间联系属于() C. 多对多联系 6. 要想将日期中的年份用4 位数字显示,应当使用的设置命令是() A. SET CENTURY ON 7. 将“学生”表中所有学生的“入学成绩”加10 分,正确的命令是() B. REPLACE ALL A学成绩WITH入学成绩+10 8. 设当前记录是第5 条,若要将记录指针指向第8 条记录,不能使用的命令是() D. SKIP 8 9. 将“学生”表中1990 年出生的学生记录显示出来(“出生日期”字段为日期型),正确的命令是() C. LIST FOR YEAR(出生日期)=1990

) OPEN 10. Visual FoxPro 不支持SQL 的哪项功能() D. 数据控制 11. 在命令窗口中输入并执行如下命令: X=275 Y= Z 二{^2010/05/28} M=.T. 内存变量X 、Y 、Z M 的数据类型分别是() D . N 、 C 、 D 、 L 12. 顺序执行下列命令之后,“学生成绩”表在几号工作区( DATABASES 学管理 USE 学生 SELECT 2 USE 课程 SELECT 0 USE 学生成绩 D . 3 13. 向数据库中添加自由表的命令是( ) A. ADD TABLE 表名 14. 打开“教学管理”数据库的正确命令是( ) D. OPEN DATABAS 教学管理 15. 在“数据工作期”窗口中可以( )

大数据技术及应用题库

大数据技术及应用题库单选题: 1 从大量数据中提取知识的过程通常称为(A)。 a. . 数据挖掘 b. . 人工智能 c. . 数据清洗 d. . 数据仓库 2 下列论据中,能够支撑“大数据无所不能”的观点的是( A )。 A、互联网金融打破了传统的观念和行为 B、大数据存在泡沫 C、大数据具有非常高的成本 D、个人隐私泄露与信息安全担忧 3 数据仓库的最终目的是(D)。 a. . 收集业务需求 b. . 建立数据仓库逻辑模型 c. . 开发数据仓库的应用分析 d. . 为用户和业务部门提供决策支持 4 大数据处理技术和传统的数据挖掘技术最大的区别是(A)。 a. . 处理速度快(秒级定律)

b. . 算法种类更多 c. . 精度更高 d. . 更加智能化 5 大数据的起源是( C )。 a. . 金融 b. . 电信 c. . 互联网 d. . 公共管理 6 大数据不是要教机器像人一样思考。相反,它是( A )。 a. . 把数学算法运用到海量的数据上来预测事情发生的可能性 b. . 被视为人工智能的一部 c. . 被视为一种机器学习 d. . 预测与惩罚 7 人与人之间沟通信息、传递信息的技术,这指的是(D)。 a. . 感测技术 b. . 微电子技术 c. . 计算机技术 d. . 通信技术

8 数据清洗的方法不包括(D)。 a. . 缺失值处理 b. . 噪声数据清除 c. . 一致性检查 d. . 重复数据记录处理 9. 下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B. 数据类型多样 C. 数据处理速度快 D. 数据价值密度高 10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指 的是(D)。 a. . 富数据 b. . 贫数据 c. . 繁数据 d. . 大数据 1大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分 析,从中发现新知识、创造新价值、提升新能力的(D)。 a. . 新一代信息技术 b. . 新一代服务业态 c. . 新一代技术平台 d. . 新一代信息技术和服务业态

2017贵州大数据考试题目和答案

2017贵州大数据考试题目和答案

? 1.大数据元年是指(单选题1分)得分:1分 o A.2010年 o B.2011年 o C.2012年 o D.2013年 ? 2.《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》提出,到2020年,统筹区域布局,依托现有资源建成()区域临床医学数据示范中心。(单选题1分)得分:1分 o A.100个 o B.200个 o C.300个 o D.400个

? 3.近几年,我国电子信息产业一直保持了()以上的年增长速度,成为国民经济各个领域中间的佼佼者。(单选题1分)得分:1分 o A.7% o B.8% o C.9% o D.10% ? 4.宁家骏委员指出,过去我们研制一个新型号的航天器,平均需要多长时间?(单选题1分)得分:1分 o A.1-2年 o B.3-4年 o C.5-6年 o D.7-8年

? 5.具体来说,摩尔定律就是每()个月,产品的性能将提高一倍。(单选题1分)得分:1分 o A.6 o B.12 o C.16 o D.18 ? 6.以下说法错误的是哪项?(单选题1分)得分:1分 o A.大数据是一种思维方式 o B.大数据不仅仅是讲数据的体量大 o C.大数据会带来机器智能 o D.大数据的英文名称是large data ?7.第一个提出大数据概念的公司是(单选题1分)得分:1分

o A.微软公司 o B.脸谱公司 o C.谷歌公司 o D.麦肯锡公司 ?8.大数据要求企业设置的岗位是(单选题1分)得分:0分 o A.首席分析师和首席工程师 o B.首席信息官和首席工程师 o C.首席分析师和首席数据官 o D.首席信息官和首席数据官 ?9.世界上第一台电子计算机(ENIAC)是在哪一年宣告诞生的?(单选题1分)得分:1分 o A.1946年 o B.1947年

(完整版)郑州大学数据库原理_期末考试试题

第一章 一、单项选择题 1、文件系统与数据库系统相比较,其缺陷主要表现在数据联系弱、数据冗余和(C ) A、数据存储量低 B、处理速度慢 C、数据不一致 D、操作繁琐 2、数据的存储结构与数据逻辑结构之间的独立性成为数据的(B) A、结构独立性 B、物理独立性 C、逻辑独立性 D、分布独立性 3、在数据库系统中,对数据操作的最小单位是(B ) A、字节 B、数据项 C、记录 D、字符 4、数据的逻辑结构与用户视图之间的独立性称为数据的(C) A、结构独立性 B、物理独立性 C、逻辑独立性 D、分布独立性 5、下述各项中,属于数据库系统的特点的是(C) A、存储量大 B、存取速度快 C、数据共享 D、操作方便 6、在数据库系统中,模式/内模式映像用于解决数据的(B) A、结构独立性 B、物理独立性 C、逻辑独立性 D、分布独立性 7、在数据库系统中,模式/外模式映像用于解决数据的(C) A、结构独立性 B、物理独立性 C、逻辑独立性 D、分布独立性 8、数据库结构的描述,称为(D ) A、数据库模式 B、数据库 C、数据库管理系统 D、数据字典 9、数据库中全体数据的整体逻辑结构描述成为(D ) A、存储模式 B、内模式 C、外模式 D、概念模式 10、保证数据库中数据及语义的正确性和有效性,是数据库的(C) A、安全性 B、准确性 C、完整性 D、共享性 11、在数据库系统中,数据独立性是指(C) A、用户与计算机系统的独立性 B、数据库与计算机的独立性 C、数据与应用程序的独立性 D、用户与数据库的独立性 12、结构数据模型的三个组成部分是数据结构、数据操作和(C) A、数据安全型控制 B、数据一致性规则 C、数据完整性约束 D、数据处理逻辑 13、数据操纵语言(DML)的基本功能中,不包括的是( B ) A、插入新数据B描述数据库结构 C、数据库中数据排序 D、删除数据库中数据 14、控制数据库整体结构、负责数据库物理结构和逻辑结构的定义与修改人员是( D )

大数据考试题含答案精编WORD版

大数据考试题含答案精 编W O R D版 IBM system office room 【A0816H-A0912AAAHH-GX8Q8-GNTHHJ8】

1 多选传统大数据质量清洗的特点有: A. 确定性 B. 强类型性 C. 协调式的 D. 非确定性 2 多选以下选项中属于数据的作用的是()。 A. 沟通 B. 验证假设 C. 建立信心 D. 欣赏 3 多选数据建立信心的作用需具备的条件包括()。 A. 可靠数据源 B. 多方的数据源 C. 合适的数据分析 D. 信得过的第三方单位 4 多选数据只有在与()的交互中才能发挥作用。

A. 人 B. 物 C. 消费者 D. 企业 5 单选大数据可能带来(),但未必能够带来()。 A. 精确度;准确度 B. 准确度;精确度 C. 精确度;多样性 D. 多样性;准确度 6 多选大数据的定义是: A. 指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合 B. 任何超过了一台计算机处理能力的数据量 C. 技术 D. 商业 7 多选大数据五大类应用方向是: A. 查询

B. 触达 C. 统计 D. 预警 E. 预测 8 多选以下哪些指标是衡量大数据应用成功的标准? A. 成本更低 B. 质量更高 C. 速度更快 D. 风险更低 9 多选大数据有哪些价值? A. 用户身份识别 B. 描述价值 C. 实时价值 D. 预测价值 E. 生产数据的价值 10 多选大数据的预测价值体现在:

A. 预测用户的偏好、流失 B. 预测热卖品及交易额 C. 预测经营趋势 D. 评价 11 单选什么是大数据使用的最可靠方法? A. 大数据源 B. 样本数据源 C. 规模大 D. 大数据与样本数据结合 12 多选大数据是描述()所发生的行为。 A. 未来 B. 现在 C. 过去 D. 实时 13 多选传统研究中数据采集的方法包括: A. 网络监测

上海海事大学数据库试题

上海海事大学试卷 2013—2014学年第一学期期末考试 《数据库原理及应用》(A卷) 班级:学号:姓名:总分 (请将答案写在答题纸上,否则无效;试卷不许带出考场,试卷上写明班级、学号、姓名) 一、选择题,每道题只有一个正确答案(1.5分/题,共36分) 1.数据库的()是为了防止数据库中存在不符合语义的数据。 A.完整性 B.安全性 C.并发控制 D.恢复技术 答案:A 2.()规定在对任何数据进行读、写操作之前,事务首先要获得对该数据的封锁;在释放一个封锁之后,事务不再申请和获得任何其他封锁。 A.一次封锁法 B.顺序封锁法 C.两段锁协议 D.多粒度封锁法 答案:C 3.在视图上不能完成的操作是() A.更新视图 B.查询 C.在视图上定义新的表 D.在视图上定义新的视图 答案:C 4.在对用户进行权限授予时,()短语表示获得某种权限的用户可以传播该权限。 A.with check option B.with view option C.with grant option D.with function option c 5.数据的逻辑独立性是指() A.存储结构与物理结构的逻辑独立性 B.数据与存储结构的逻辑独立性 C.数据与程序的逻辑独立性 D.数据元素之间的逻辑独立性 C 6.三级模式间存在两种映像,他们是() A.模式与子模式间,模式与内模式间 B.子模式与内模式间,外模式与内模式 C.子模式与外模式间,模式与内模式间 D.模式与内模式间,模式与模式间 A 7.事务的一致性是指(d ) A.事务中包括的所有操作要么不做,要么都做(原子性) B.事务一旦提交,对数据库的改变是永久的持续性 C.一个事物内部的操作及使用的数据对并发的其他事务是隔离的隔离性 D.事务必须使得数据库从一个一致性状态变到另一个一致性状态

中南大学数据库考试题库

基础知识(单选) 1.在数据库设计中,用E-R图来描述信息结构但不涉及信息在计算机中的表示,它属于数据库设计的( )阶段。 A 需求分析 B 概念设计 C 逻辑设计 D 物理设计 参考答案 B 数据库设计步骤: (1)规划(必要性、可行性,总目标) (2)需求分析(分析用户活动,产生业务流程图;确定系统范围,产生系统范围图;分析用户活动涉及的数据,产生数据流程图;分析系统数据,产生数据字典。) (3)概念设计(设计出独立于计算机硬件和DBMS的概念模式。E-R模型是主要设计工具) (4)逻辑结构设计(把概念设计阶段设计好的全局E-R模式转换成与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构,包括数据库模式和外模式) (5)数据库的物理设计(对于给定的数据模型选取一个最适合应用环境的物理结构的过程。数据库的物理结构主要指数据库的存储记录格式、存储记录安排和存取方法) (6)数据库的实现(建立实际数据库结构;装入试验数据对应用程序进行调试;装入实际数据,进入试运行状态) (7)数据库的运行与维护(维护数据库的安全性与完整性;监测并改善数据库运行性能;根据用户要求对数据库现有功能进行扩充;及时改正运行中发现的系统错误) 2. 关于数据库概念设计阶段的工作目标,下列说法错误的是 A 定义和描述应用系统涉及的信息结构和范围 B 定义和描述应用系统中数据的属性特征和数据之间的联系 C 描述应用系统的数据需求 D 描述需要存储的记录及其数量 参考答案 D 3. SQL Server 2000的字符型系统数据类型主要包括( )。 A int、money、char B char、varchar、text C datetime、binary、int D char、varchar、int

大学数据库复习题及答案整理

数据库原理 第一章 1. 单个用户使用的数据视图的描述称为(A)(2001年10月全国卷) A. 外模式 B. 概念模式 C. 内模式 D. 存储模式 2. 子模式DDL用来描述(B)(2001年10月全国卷) A. 数据库的总体逻辑结构 B. 数据库的局部逻辑结构 C. 数据库的物理存储结构 D. 数据库的概念结构 3. 在DBS中,DBMS和OS之间的关系是(B)(2001年10月全国卷) A. 相互调用 B. DBMS调用OS C. OS调用DBMS D. 并发运行 4.数据库物理存储方式的描述称为( B)(2003年1月全国卷) A.外模式 B.内模式 C.概念模式 D.逻辑模式 5.在下面给出的内容中,不属于DBA职责的是( C)(2003年1月全国卷) A.定义概念模式 B.修改模式结构 C.编写应用程序 D.编写完整性规则 6.在数据库三级模式间引入二级映象的主要作用是(A )(2003年1月全国卷) A.提高数据与程序的独立性 B.提高数据与程序的安全性 C.保持数据与程序的一致性 D.提高数据与程序的可移植性 7.DB、DBMS和DBS三者之间的关系是( B)(2003年1月全国卷) A.DB包括DBMS和DBS B.DBS包括DB和DBMS C.DBMS包括DB和DBS D.不能相互包括 8.DBS中“第三级存储器”是指( B)(2002年10月全国卷) A.磁盘和磁带 B.磁带和光盘 C.光盘和磁盘 D.快闪存和磁盘 9.位于用户和操作系统之间的一层数据管理软件是(C) A.DBS B.DB C.DBMS D.MIS 10.数据库系统中的数据模型通常由(A)三部分组成 A、数据结构、数据操作和完整性约束 B、数据定义、数据操作和安全性约束 C、数据结构、数据管理和数据保护 D、数据定义、数据管理和运行控制 12.数据库技术的三级模式中,数据的全局逻辑结构用(C)来描述 A、子模式 B、用户模式 C、模式 D、存储模式 13.用户涉及的逻辑结构用(D)描述

大数据技术及应用题库

1从大量数据中提取知识的过程通常称为( A )。 a. .数据挖掘 b. .人工智能 c. .数据清洗 d. .数据仓库 2下列论据中,能够支撑“大数据无所不能”的观点的是(A)。 A、互联网金融打破了传统的观念和行为 B、大数据存在泡沫 C、大数据具有非常高的成本 D、个人隐私泄露与信息安全担忧 3数据仓库的最终目的是(D)。 a. .收集业务需求 b. .建立数据仓库逻辑模型 c. .开发数据仓库的应用分析 d. .为用户和业务部门提供决策支持 4大数据处理技术和传统的数据挖掘技术最大的区别是(A)。 a. .处理速度快(秒级定律) b. .算法种类更多 c. .精度更高 d. .更加智能化 5大数据的起源是(C)。 a. .金融 b. .电信 c. .互联网 d. .公共管理 6大数据不是要教机器像人一样思考。相反,它是(A )。 a. .把数学算法运用到海量的数据上来预测事情发生的可能性 b. .被视为人工智能的一部 c. .被视为一种机器学习 d. .预测与惩罚 7人与人之间沟通信息、传递信息的技术,这指的是(D)。 a. .感测技术 b. .微电子技术 c. .计算机技术

叮叮小文库d. .通信技术 8数据清洗的方法不包括(D )。 a. .缺失值处理 b. .噪声数据清除 c. . 一致性检查 d. .重复数据记录处理 9.下列关于舍恩伯格对大数据特点的说法中,错误的是(D) A. 数据规模大 B.数据类型多样 C.数据处理速度快 D.数 据价值密度高 10规模巨大且复杂,用现有的数据处理工具难以获取、整理、管理以及处理的数据,这指的是(D) o a. .富数据 b. .贫数据 c. .繁数据 d. .大数据 11大数据正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分 析,从中发现新知识、创造新价值、提升新能力的(D)o a. .新一代信息技术 b. .新一代服务业态 c. .新一代技术平台 d. .新一代信息技术和服务业态 12万维网之父是(C) A. 彼得?德鲁克 B.舍恩伯格 C.蒂姆?伯纳斯一李 D.斯科特?布朗 13下列演示方式中,不属于传统统计图方式的是(D)o A、柱形图 B、饼状图 C、曲线图 D、网络图 14当前社会中,最为突出的大数据环境是(A)o A、互联网 B、物联网 C、综合国力 D、自然资源

大数据考试题

《大数据》试题 单选题 1、大数据的核心就是(B) A、告知与许可 B、预测 C、匿名化 D、规模化 2、大数据不是要教机器像人一样思考。相反,它是(A) A、把数学算法运用到海量的数据上来预测事情发生的可能性。 B、被视为人工智能的一部分。 C、被视为一种机器学习。 D、预测与惩罚。 3、采样分析的精确性随着采样随机性的增加而(C),但与样本数量的增加关系不大。 A、降低 B、不变 C、提高 D、无关 4、大数据是指不用随机分析法这样的捷径,而采用(A)的方法 A、所有数据 B、绝大部分数据 C、适量数据 D、少量数据 5、大数据的简单算法与小数据的复杂算法相比(A) A、更有效 B、相当 C、不具备可比性 D、无效 6、相比依赖于小数据和精确性的时代,大数据因为更强调数据的(D),帮助我们进一步接近事实的真相。 A、安全性 B、完整性 C、混杂性 D、完整性和混杂性 7、大数据的发展,使信息技术变革的重点从关注技术转向关注(A) A、信息 B、数字 C、文字 D、方位 8、大数据时代,我们是要让数据自己“发声”,没必要知道为什么,只需要知道(B) A、原因 B、是什么 C、关联物 D、预测的关键 9、建立在相关关系分析法基础上的预测是大数据的(C) A、基础 B、前提 C、核心 D、条件 10、(C)下列说法正确的是 A、有价值的数据是附属于企业经营核心业务的一部分数据; B、数据挖掘它的主要价值后就没有必要再进行分析了; C、所有数据都是有价值的; D、在大数据时代,收集、存储和分析数据非常简单; 11、关于数据创新,下列说法正确的是(D) A、多个数据集的总和价值等于单个数据集价值相加; B、由于数据的再利用,数据应该永久保存下去; C、相同数据多次用于相同或类似用途,其有效性会降低; D、数据只有开放价值才能得到真正释放。 12、关于数据估值,下列说法错误的是(B) A、随着数据价值被重视,公司所持有和使用的数据也渐渐纳入了无形资产的范畴; B、无论是向公众开放还是将其锁在公司的保险库中,数据都是有价值的; C、数据的价值可以通过授权的第三方使用来实现 D、目前可以通过数据估值模型来准确的评估数据的价值评估 13、在大数据时代,下列说法正确的是(B)。 A、收集数据很简单 B、数据是最核心的部分 C、对数据的分析技术和技能是最重要的 D、数据非常重要,一定要很好的保护起来,防止泄露 14、随着数据科学家的崛起,(C)的地位将发生动摇。 A、国家领导人 B、大型企业 C、行业专家和技术专家 D、职业经理人 15、大数据公司的多样性表明了(B) A、数据作用的体现 B、数据价值的转移 C、数据技术的发展 D、数据思维的创新 16、以下哪种说法是错误的(B) A、将罪犯的定罪权放在数据手中,借以表达对数据和分析结果的崇尚,这实际上是一种滥用。 B、随着数据量和种类的增多,大数据促进了数据内容的交叉检验,匿名化的数据不会威胁到任何人的隐私。 C、采集个人数据的工具就隐藏在我们日常生活所必备的工具当中,比如网页和智能手机应用程序。 D、预测与惩罚,不是因为所做,而是因为将做。 17、只要得到了合理的利用,而不单纯只是为了“数据”而“数据”,大数据就会变成(B) A、强大的威胁 B、强大的武器 C、预测工具 D、分析工具 18、在大数据时代,我们需要设立一个不一样的隐私保护模式,这个模式应该更着重于(A)为其行为承担责任。 A、数据使用者 B、数据提供者 C、个人许可 D、数据分析者

大学计算机文化基础考试题(本科)数据库部分

大学计算机文化基础考试试题 数据库部分: 一、单项选择题(每小题1分) 1.关于数据仓库的系统,下列说法不正确的是()。 A 数据仓库的数据可以来源于多个异种数据源 B 数据库系统主要提供了执行联机事务和查询处理,数据仓库系统主要提供了数据分析和决策支持 C 数据仓库的主要特征之一是面向主题的即围绕某一主题建模和分析 D 数据库系统和数据仓库系统管理的数据内容相同 2下列哪一个不属于关系数据库中的关系运算() A 合并 B 投影 C 选择 D 连接 3.在关系中选择某些属性的值的操作称为()。 A 投影运算 B 合并运算 C 连接运算 D 选择运算 4.Access2003提供了一个内置组“收藏夹”,用户能() A 添加或删除数据库对象的快捷方式 B 重命名这个组 C 删除这个组 D 在这个组中建立表 5在数据管理中数据共享性高,冗余度小的是()。。 A 数据库系统阶段 B 文件系统阶段 C 信息管理阶段 D 人工管理阶段 6 Access提供的七种对象从功能和彼此间的关系考虑,可以分为三个层次,第一层次是()。 A 查询对象和报表对象 B 宏对象和查询对象 C 表对象和查询对象 D 表对象和报表对象 7.简称DBMS的是()。 A 数据 B 数据库 C 数据库系统 D 数据库管理系统 8.数据管理技术发展中的数据库系统阶段数据的最小存取单位是()。。 A 一组记录 B 数据项 C 文件 D 记录 9.在关系数据库中,关于关键字下列说法不正确的是()。 A 主关键字是被挑选出来做表的行的唯一标识的候选关键字 B 如果两个关系中具有相同或相容的属性或属性组,那么这个属性或属性组称为这两个关系的公共关键字 C 对于一个关系来讲,主关键字只能有一个 D 外关键字要求能够唯一标识表的一行 二、多项选择题(每题2分) 1.Access2003数据库的对象包括() A 表 B 窗体 C 报表 D 宏 E 查询 2.在Access2003中,关于数据库窗口的基本操作,可以完成的是() A 数据库中的组均可以删除 B 可以改变对象的显示方式 C 允许用户创建自定义的组(新组) D 在数据库中表是不可以隐藏的

《大数据时代下的数据挖掘》试题及答案..

《海量数据挖掘技术及工程实践》题目 一、单选题(共80题) 1)( D )的目的缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到 和原始数据相同的分析结果。 A.数据清洗 B.数据集成 C.数据变换 D.数据归约 2)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖 掘的哪类问题?(A) A. 关联规则发现 B. 聚类 C. 分类 D. 自然语言处理 3)以下两种描述分别对应哪两种对分类算法的评价标准? (A) (a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。 (b)描述有多少比例的小偷给警察抓了的标准。 A. Precision,Recall B. Recall,Precision A. Precision,ROC D. Recall,ROC 4)将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?(C) A. 频繁模式挖掘 B. 分类和预测 C. 数据预处理 D. 数据流挖掘 5)当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数 据相分离?(B) A. 分类 B. 聚类 C. 关联分析 D. 隐马尔可夫链 6)建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的 哪一类任务?(C) A. 根据内容检索 B. 建模描述 C. 预测建模 D. 寻找模式和规则 7)下面哪种不属于数据预处理的方法? (D) A.变量代换 B.离散化

C.聚集 D.估计遗漏值 8)假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内? (B) A.第一个 B.第二个 C.第三个 D.第四个 9)下面哪个不属于数据的属性类型:(D) A.标称 B.序数 C.区间 D.相异 10)只有非零值才重要的二元属性被称作:( C ) A.计数属性 B.离散属性 C.非对称的二元属性 D.对称属性 11)以下哪种方法不属于特征选择的标准方法: (D) A.嵌入 B.过滤 C.包装 D.抽样 12)下面不属于创建新属性的相关方法的是: (B) A.特征提取 B.特征修改 C.映射数据到新的空间 D.特征构造 13)下面哪个属于映射数据到新的空间的方法? (A) A.傅立叶变换 B.特征加权 C.渐进抽样 D.维归约 14)假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方 法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:(D) A.0.821 B.1.224 C.1.458 D.0.716 15)一所大学内的各年纪人数分别为:一年级200人,二年级160人,三年级130人,四年 级110人。则年级属性的众数是: (A) A.一年级 B.二年级 C.三年级 D.四年级

相关主题
文本预览
相关文档 最新文档