当前位置:文档之家› Gartner:大数据和BI商业智能的差别和影响

Gartner:大数据和BI商业智能的差别和影响

Gartner:大数据和BI商业智能的差别和影响
Gartner:大数据和BI商业智能的差别和影响

Gartner:大数据和BI商业智能的差别和影响

之所以要区分大数据应用与BI(商业智能),是因为大数据应用与BI、数据挖掘等,并没有一个相对完整的认知。

BI(BusinessIntelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策。

伴随着BI的发展,是ETL,数据集成平台等概念的提出。ETL,Extraction Transformation Loading,数据提取、转换和加载,数据集成平台主要功能对各种业务数据进行抽取和相关转化,

以此来满足BI、数据仓库对数据格式和内容挖掘的要求。

数据集成平台的基础工作与ETL有很大的相似性,其主要功能是实现不同系统不同格式数据地抽取,并且按照目标需求转化成为相应的格式。数据集成开始是点对点的,慢慢地发现这种模式对于系统之间,不同所有权的企业数据流向以及数据标准控制很难,为此,诞生了对统一企业数据平台的需求,来实现企业级之间的数据交互。

数据集成平台就像网络中Hub,可以连接所有应用系统,实现系统之间数据的互通有无。数据集成平台以BI、数据仓库需求而产生,现在已经跨越了最初的需求,上升到了一个更高的阶段。

如今大数据应用更多关注非结构化数据,更多谈论互联网,Twitter、Facebook、博客等非结构化数据,如此理解大数据应用,显然就有些走偏了。结构化数据也属于大数据,且呈现出相同的特点和特征,如数据量大,增长越来越快,对数据处理要求高等。

结构化数据是广义大数据中含金量或者价值密度最高的一部分数据,与之相比,非结构化数据含金量高但价值密度低。在Hadoop平台出现之前,没有人谈论大数据。数据应用主要是结构化数据,多采用IBM、HP等老牌厂商的小型机或服务器设备。

采用传统方法处理这些价值密度低的非结构化数据,被认为是不值得的,因为其产出实在是有限。Hadoop平台出现之后,提供了一种开放的、廉价的、基于普通商业硬件的平台,其核心是分布式大规模并行处理,从而为非结构化数据处理创造条件。

大数据应用的数据来源应该包括结构化数据,如各种数据库、各种结构化文件、消息队列和应用系统数据等,其次才是非结构化数据,又可以进一步细分为两部分,一是社交媒体,如Twitter、Facebook、博客等产生的数据,包括用户点击的习惯/特点,发表的评论,评论的特点,网民之间的关系等,这些都构成了大数据来源。另外一部分数据,也是数据量比较大的数据,就是机器设备以及传感器所产生的数据。以电信行业为例,CDR、呼叫记录,这些数据都属于原始传感器

数据,主要来自路由器或者基站。此外,手机的置传感器,各种手持设备、门禁系统,摄像头、ATM机等,其数据量也非常巨大。

对于分析大数据的工具,目前所有的分析工具都侧重于结构化分析,例如针对社交媒体评论方向的分析,根据特定的词频或者语义,通过统计正面/负面评论的比例,来确定评论性质。如果有一个应用系统是接收结构化数据的,例如一个分析系统,接收这些语义就可以便于分析。

让大数据应用落地,其中的关键在于与行业应用的深度融合。

公安行业的视频影像处理是一个特定应用领域,传统BI、ETL工具拿这些数据没有办法,采用分布式Hadoop进行处理能够带来很好的效益,因为Hadoop可以处理数据量足够大。公安行业实际上已采集了大量视频影像数据,利用这些数据,可以追踪一个嫌疑犯的行踪,什么时间在全国哪些地区出现过。这些应用不可能单纯依靠人的力量,需要借助人脸识别、图像识别技术、模式处理,数据压缩等技术,需要海量处理软件,抓出相关特征,帮助公安人员提高工作效率。

在电信行业,计费系统实际上是对各种数据进行整合后的结果,是一个缩小的数据。借助大数据应用,运营商可以原始大数据进行分析,例如分析传感器数据是否有异常,从而判断设备异常等,这些都是一些用传统BI工具无法实现的分析,其结果往往会出乎意料,帮助运营商提高服务水平以及用户的满意度。

在互联网行业,通过分析手机上网轨迹,可以分析了解客户群,了解用户的偏好,此外,获取地理位置的信息,也具有特定价值。

从这些行业大数据应用分析来看,一个是视频影像处理,一个是日志分析,另外一个是处理特定文件格式的分析处理,彼此之间显然没有任何通用性的特点,其共同点就是利用了廉价的大数据

处理平台。

Gartner:大数据宣传在商务智能市场成效不明显

市场研究公司Gartner指出,去年的大数据宣传未能促进全球商务智能和分析市场出现快速增长。

Gartner称,尽管商务智能和分析市场在2013年增长了8%,增长至144亿美元,但是涨幅低于预期。大数据通常指对来自社交网络、传感器等来源的海量非结构化信息进行的挖掘与分析,而传统的商务智能只是报告和分析结构化数据存储。

Gartner 分析师Dan Sommer和Bhavish Sood在报告写道:“虽然大数据宣传力度在2013年达到了高潮,但是对分析市场的影响却不是很大。”报告称,在Gartner调研的机构中,仅8%的机构实际部署了大数据项目,57%的机构仍处于调研和规划阶段。这一水平已经影响到了大量企业的创新周期。

大数据巨头在2013年的营利与增长速度之间出现了脱节。SAP、甲骨文、IBM和赛仕研究所等四大商务智能公司的增长率严重低于市场平均增长率。这些厂商面临的核心挑战是他们的成熟程度。“他们的核心解决方案一直是IT主导的企业商务智能平台,并通过语义层将信息与报告、查询与在线分析处理等功能连接在一起。尽管价值昂贵,但是大多数机构部署的均为这种类型的商务智能解决方案。”

为此类工具提升了低成本备选方案的Jaspersoft和Pentaho等公司在去年获得了快速增长,其增长率高于市场平均增长率。Gartner的报告指出,Tibco Spotfire和Tableau等公司在2013年推出的数据发现工具对于商务智能终端用户体验来说可以说是一种全新的标准。这些工具让用户对数据集有了更多的视觉感受。

分析师指出,大型商务智能厂商去年一直在不遗余力的开发自己的数据发现产品。这一举措将整个市场的竞争推出到了一个更激烈的阶段。基于云的商务智能在去年开始受到关注。尽管其仅占有4%的市场份额,但是其增长率达到了42%。“尤其是小型公司已经开始向云迁移,并将其视为一种可以处于有关大数据和分析等事务的使能器。”

摘自:199it

传统分析与大数据分析的对比

传统分析与大数据分析的 对比 This manuscript was revised on November 28, 2020

“大数据”是用来表示大量的没有按照传统的相关格式存储在企业数据库中的非结构化数据的总术语。以下是大数据的一般特点。 数据存储量相对于当前企业TB(TERA BYTES)字节的存储限制,定义在PB(PETA BYTES)字节,EXA字节以及更高的容量顺序。 通常它被认为是非结构化数据,并不适合企业已经习惯使用的关系型数据库之下 数据的生成使用的是数据输入非传统的手段,像无线射频识别(RFID),传感器网络等。 数据对时间敏感,且由数据的收集与相关的时区组成。 在过去,专业术语“分析”应用于商业智能(BI)世界来提供工具和智能,通过对各种各样可能的信息视角的快速的、一致的、交互式访问获得洞察力。 与分析的概念非常接近,数据挖掘已经应用于企业以保持关键监测和海量信息的分析。最大的挑战就是如何通过大量的数据挖掘出所有的隐藏信息。 传统数据仓库(DW)分析相对于大数据分析 企业数据的分析朝着在一段时间内在那种内容中的信息的有意义的洞察,是大数据分析区别于传统数据仓库分析的原因所在。下表总结了一些它们之间的差别。 大数据分析用例 基于用例,企业可以理解大数据分析的价值和在大数据分析的帮助下如何解决传统的问题。以下是一些用法。 客户满意度和保证分析:也许这是基于产品的企业所担心的最大的一个领域。在当今时代,没有一个清晰的方式来衡量产品的问题和与客户满意度相关的问题,除非他们以一个正式的方式出现在一个电子表格中。

信息质量方面,它是通过各种外部渠道收集的,而且大多数时候的数据没有清洗 因为数据是非结构化数据,无法关联相关的问题,所以长期的解决方案提供给客户 分类和分组的问题陈述都缺失了,导致企业不能对问题进行分组 从上面的讨论中,对客户满意度和保证分析使用大数据分析将帮助企业在急需的客户注意力设置中获得洞察力,并有效地解决他们的问题以及在他们的新产品线上避免这些问题。 竞争对手的市场渗透率分析:在今天高度竞争的经济环境下,我们需要通过一种实时分析对竞争者强大的区域和他们的痛点进行衡量。这种信息是可适用于各种各样的网站、社交媒体网站和其他公共领域。对这种数据的大数据分析可以向企业提供关于他们产品线的优势、劣势、机遇、威胁等非常需要的信息。 医疗保健/流行病的研究和控制:流行病和像流感这样的季节性疾病在人群中以一定的模式开始,如果没有及早发现和控制,它们就会传播到更大的区域。这对发展中以及发达的国家都是一个最大的挑战。当前绝大部分时间的问题是人们之间的症状各异,而且不同的医护人员治疗他们的方法也不同。人群中也没有一种常见的症状分类。在这种典型的非结构化数据上采用大数据分析将有助于地方ZF有效地应对疫情的情况。 产品功能和用法分析:大多数产品企业,尤其是消费品,不断在他们的产品线上增加许多功能,但有可能一些功能不会真正地被顾客所使用,而有些功能则更多地被使用,对这种通过各种移动设备和其它基于无线射频识别(RFID)输入捕捉到的数据的有效分析,可以为产品企业提供有价值的洞察力。 未来方向的分析:研究小组分析在各种业务中的趋势,而这种信息通过行业特定门户网站甚至常见的博客可以获得。对这种未来数据的不断分析将有助于企业期待未来,并将这些期待带入他们的生产线。 总结 大数据分析为企业和ZF分析非结构化的数据提供了新的途径,这些非结构化数据到目前为止在典型的企业数据仓库的情景中被数据清洗的惯例所拒绝。然而从以上用例明显看出,这些分析在改善企业的运营方面有很长的路要走。我们在未来的日子里将会看到更多的产品和应用系统在这个市场上出现。

2013年商业智能BI与大数据行业分析报告

2013年商业智能BI与大数据行业分析报告 2013年8月

目录 一、行业:BI是为客户真正创造价值的大数据核心应用 (4) 1、大数据时代来临,迎接她,拥抱她 (4) (1)数据爆发性增长,潜在价值巨大 (4) (2)IT巨头重金投入大数据,抢位关键环节 (6) 2、BI是贴近客户并且为客户创造价值的大数据核心应用 (7) (1)BI处于大数据分析应用层的核心位置 (7) (2)BI体系架构:辅助决策,帮助客户拓展业务 (7) (3)BI贴近客户并为客户创造价值,最具含金量 (8) 3、BI应用快速推广,未来消费智能百倍增长空间 (9) (1)BI成为全球CIO首选技术,我国BI市场提速发展 (9) (2)从商业智能到消费智能,前景广阔 (10) ①BI发展趋势一:从O/B域向M域延伸 (10) ②BI发展趋势二:企业全员BI (11) ③BI发展趋势三:消费智能 (11) 二、标杆分析:东方国信 (12) 1、BI龙头,有能力发展成全产业链解决方案提供商 (12) (1)国内BI格局 (12) (2)公司深耕BI领域,具备成为全产业链解决方案提供商的能力 (14) 2、战术措施:纵向产业链延伸,横向行业拓展 (17) (1)纵向延伸,向上管理咨询,向下业务运营 (17) (2)横向拓展,重点突破金融、制造、能源等领域 (20) 3、业务:电信领域稳健成长,非电信领域倍增空间 (21) (1)电信领域:从O/B域向M域扩展,从联通向移动电信渗透 (21) ①从O/B域向M域扩展将提升BI业务的体量和效果 (21) ②基于联通的成功,大力拓展移动电信业务 (22) (2)非电信领域:并购进入金融和制造业BI领域,能源空间广阔 (23) ①金融行业是BI的下一个主战场 (23)

电信运营商基于大数据的商业智能应用思考

电信运营商基于大数据的商业 智能应用的思考
孙少陵 中国移动通信有限公司研究院 2012年11月
1

目录
3 1 2 3
电信运营商商业智能面临的挑战 基于大数据的商业智能系统的初步构想 “大云”在大数据商业智能领域的实践
2

全球数据量高速增长,信息成为运营商战略资产
?信息社会的信息增量在高速发展 ?随着互联网/移动互联网、数码设备、物联网/传感器等技术的发展,全球数据生产在 高速增长 ?Jim Gray的新摩尔定理认为,每18个月全球新增的信息量是计算机有史以来全部信息 量的总和。据IDC研究报告,未来10年全球数据量将以40+%的速度增长,2020年全球数 据量将达到35ZB(35,000,000PB),为2009年(0.8ZB)的44倍 ?信息成为企业战略资产,市场竞争和政策管制要求越来越多的数据被长期保存 ?企业越来越需要长期保存各类数据,以进行用户行为分析、市场研究,信息服务企业 更是需要积累越来越多的信息资源 ?为了遵从萨巴斯、上网日志审计等管制要求,企业需要长期保存越来越多的生产数据
3

基于大数据的商业智能(BI)为运营商带来新的机遇
在网络时代,运营商是数据交换中心,运营商的网络管道、业务平台、 支撑系统中每天都在产生大量有价值的数据,基于这些数据的商业智能 应用为运营商带来巨大的机遇
改善用户体验 优化网络质量 助力市场决策 刺激业务创新
? 分析用户行为,改进产品设计 ? 通过用户偏好分析,及时、准确进行业务推荐和客户关怀
? 分析流量、流向变化,调整资源配置 ? 分析网络日志,进行网络优化和故障定位
? 通过业务、资源、财务等各类数据的综合分析,快速准确确 定公司管理和市场竞争策略
? 在确保用户隐私不被侵犯的前提下,对数据进行深度加工, 对外提供信息服务,提升企业价值
4

数据挖掘、数据仓库、商业智能在电子商务领域的应用

2010 年第4 期福建教育学院学报 随着网络技术的迅速发展和数据库技术的成熟, 电子商务显示出巨大的市场价值和发展潜力。当企业 采用电子商务时,迫切需要把企业信息系统产生的大 量数据转换为有用的数据,为企业创造更大的财富。 数据仓库和数据挖掘技术,可以使企业把数据转化为 有用的信息并帮助决策,从而是企业在激烈的市场竞 争中处于优势地位。 一、数据仓库与数据挖掘 1. 数据仓库 数据仓库是面向主题的(subject-oriented)、集成 的(integrated)、非违约的(non-volatile)且时变的(time-variant)用于管理和决策制定的数据集。由此可见,数据仓库是一种分析型数据库,基于标准企业模 型集成的、带有时间属性的、面向主题的数据集合,与传统支持查询为主的事务性操作数据库有着本质区 别,具备以下四个特征: (1)面向主题 主题是一个抽象的概念。基于主题组织的数据, 根据领域的逻辑内涵,分为独立的领域,互不交叉,并形成相应的数据视图,汇总表等,因此适于联机分析 处理(OLAP)。 (2)集成化 当数据从面向应用提取到数据仓库时,由于命名 冲突、数据结构转换等的冲突,需要对原有数据进行 抽取、清理、加工,形成一致的命名、变量度量、编码结构、物理属性等。 (3)非违约性 由于数据仓库中的数据是历史数据,当数据集成 到数据仓库后,不需要更改。仅限于装数据和访问数据;并不存在数据恢复,数据同步,修复死锁等复杂问题。(4)时变性 出于决策的需要,数据仓库中的数据需要标明时 间参数,并随时间不断变化,即随着时间变化,不断有新的数据内容添加;不断导出和删除没用的数据内 容;不断地重新综合数据。 2. 数据挖掘 数据挖掘(Data Mining)就是从大量的、不完全 的、模糊的、有噪声的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和 知识的非平凡过程,这些信息的表现形式为:规则、概念、规律及模式等。决策者使用它分析历史数据和当 前数据,提取出隐藏的关系和模式,对未来发生的行 为进行预测。

商业智能+大数据分析报告

2016年出版

正文目录 1、BI行业增长强劲,下游需求突出,竞争壁垒有抬升趋势 (4) 1.1、商业智能(BI)认可度持续提高,市场规模不断扩大 (4) 1.2、BI 产业链结构分析 (6) 1.2.1、BI 上游 (6) 1.2.2、BI 下游 (6) (1)、电信行业:大数据潜在金矿、亟待规模开发 (8) (2)、金融行业:效率与安全双轮驱动大数据应用深化 (8) (3)、电子政务:政务信息化政策利好大数据整体解决方案商用 (9) (4)、电力行业:生产信息决策与节能减排双重利好于大数据 (10) 1.3、BI 与大数据的联系与区别 (10) 2、大数据:逐步走向成熟,市场进入爆发成长期 (11) 2、从BI 到大数据4.0的演变历程 (12) 2.1、大数据核心技术不断演进,年增50% (12) 2.1.1、大数据的史前时代 (16) 2.1.2、大数据1.0 效率为先(2012-2015):非结构化数据处理加速 (17) 2.1.3、大数据2.0 变现为王(2015-2020):用户画像与标签 (18) 2.1.4、大数据3.0 与4.0 决策为本(2020-2030):机器学习与洞察 (19) 2.2、大数据产业步入快速增长、国内相关企业产业布局呈哑铃型 (20) 2.2.1、从概念热炒到实际应用,大数据步入快速成长期 (20) 2.2.2、大数据产业链分工明晰,发展侧重数据采集及应用、呈现哑铃型 (21) 2.3、大数据助力产业升级创新 (22) 3、大数据主要应用分析 (23) 3.1、电信行业大数据应用 (23) 3.1.1、电信大数据爆发式增长,但运营商进入存量经营时代 (23) 3.1.2、电信运营商大数据变现具备基础 (24) 3.1.3、利用大数据,聚焦服务、创新、运行支撑 (25) 3.1.4、海外成功先例,值得借鉴 (26) (1)、全球电信运营商大数据实践 (26) (2)、法国电信:利用大数据开拓新服务领域 (28) (3)、西班牙电信大数据应用 (29) 3.2、金融行业大数据应用 (29) 3.2.1、强调大数据环境下的客户、市场、运营洞察 (29) 3.2.2、工商银行:利用大数据洞察客户心声 (31) 3.3、互联网大数据应用分析 (32) 3.3.1、大数据先行者,促进营销、信息与业务多重变革 (32) 3.3.2、BAT:领军大数据变革时代 (33) 3.3.3、亚马逊:用户行为数据分析助推个性化营销 (36) 3.4、工业大数据应用 (37) 3.4.1、借力大数据,实现设备、系统、决策智能化 (37) 3.4.2、工业大数据:中国制造2025 核心技术 (37) 3.4.3、汽车行业:“变形金刚”改变行业战斗方式 (38) 3.5、航空业大数据应用分析 (39)

数据挖掘及商务智能总结

第一章绪论 什么是数据挖掘,什么是商业智能 从大型数据库中提取有趣的(非平凡的、蕴涵的、先前未知的且是潜在有用的)信息或模式。 商业智能是要在必须的时间段内,把正确有用的信息传递给适当的决策者,以便为有效决策提供信息支持。 分类算法的评价标准 召回率recall =系统检索到的相关文件数/相关文件总数 准确率precision(查准率)= 系统检索到的相关文件数/系统返回的文件总数第二章数据仓库 什么是数据仓库 是运用新信息科技所提供的大量数据存储、分析能力,将以往无法深入整理分析的客户数据建立成为一个强大的顾客关系管理系统,以协助企业制定精准的运营决策。 数据仓库的基本特征 1面向主题2整合性 3长期性 4稳定性 第三章数据挖掘简介 数据挖掘的一般功能 1分类2估计3 预测4关联分类5聚类 数据挖掘的完整步骤 1理解数据与数据所代表的含义 2获取相关知识与技术 3整合与检查数据 4取出错误或不一致的数据 5建模与假设 6数据挖掘运行 7测试与验证所挖掘的数据 8解释与使用数据 数据挖掘建模的标准 CRISP-CM 跨行业数据挖掘的标准化过程 第四章数据挖掘中的主要方法 基于SQL Server 2005 SSAS的十种数据挖掘算法是什么 1.决策树 2.聚类 3.Bayes分类 4.有序规则 5. 关联规则 6.神经网络 7.线性回归 8. Logistic回归 9. 时间序列10. 文本挖掘 第五章数据挖掘与相关领域的关系 数据挖掘与机器学习、统计分析之间的区别与联系(再看看书整理下) 32页 处理大量实际数据更具优势,并且使用数据挖掘工具无需具备专业的统计学背景。 数据分析的需求和趋势已经被许多大型数据库所实现,并且可以进行企业级别的数据挖掘应用。 相对于重视理论和方法的统计学而言,数据挖掘更强调应用,毕竟数据挖掘目的

商业智能与商业分析区别

商业智能与商业分析区别 一、商业智能的能够干什么? Reasoning——对于企业的运营和管理,能够解决以下三方面的问题——确定问题的根源,明确问题的原因和影响,以及科学和合理得出相关的结论; Planning ——基于相应的情况和推理,确定一系列的行动计划; Prediction ——基于严格的推理,得到对于未来的各种可能性的预期; Problem solving ——通过相应的问题特点,提供解决根本问题的方法和措施;Abstraction ——通过具体的明细数据和场景,能够生成一般性的概念,模式,观点和结论等等; Comprehend and understand ——能够感知,辨别和确认相应的问题——特别是,对于现状和问题条件的感知,以及从表面确定本质问题等; Innovate ——通过测试和学习能够获取相应新的发现; Learn ——对于技能和知识的认知过程,其是一个无限循环的过程; 二、相对于商业智能,商业分析又能够干什么? Purposeful——当我们收集相关的信息,进行相关的分析活动时,商业分析是具有绝对的目的性的:例如,商业运营的财务,市场,销售等分析评估,以及员工绩效,风险等等商业管理方面的分析;

Insightful——在我们发现问题的根本原因,以及相应的结论时,商业分析能够提供有见地的说明; Actionable——商业分析的目标是提供可执行的行动方案和规划; 三、商业分析的基本原则 First Define the Problem and Then the Solution——首先明确问题,然后是提出解决方案;Users have the information,Do Not Have Requirements——商业分析需要通过原始的信息中归纳出相应的商业需求; Improve the Process First, Then Add Technology——首先“先下”流程解决,然后“线上”流程规范; The Business Analyst Owns the Solution Requirements——商业分析师是商业需求,以及商业分析报告的第一责任人(而非股东,以及商业问题的利益攸关方); Communicate, Cooperate, Collaborate——交流,沟通,协作; 【编辑推荐】 大数据,小数据,哪道才是你的菜 大数据分析师“钱途”无量 大数据时代统计学依然是数据分析灵魂 IT系统分析师如何学习大数据 大数据的进击:从占领IT部门到争取业务人员的芳心

大数据三大应用领域

大数据在企业商业智能、公共服务和市场营销三个领域拥有巨大的应用潜力和商机。 今天,大数据似乎成了万灵药,从总统竞选到奥斯卡颁奖、从web安全到灾难预测,正如那句俗语: “当你手里有了锤子,什么都看上去像钉子。 ”当IT经理成功部署一套Hadoop系统后,任何事看上去都与大数据有关(事实也是如此)。 类似的事情在云计算的普及中也出现过,一开始大家认为所有的IT都可以搬到云端,而现实是我们依然需要虚拟化技术和基础设施。 对于大数据来说,如果IT经理们初期不能正确选择应用领域,有可能会导致达不到期望值,招致麻烦。 其实,综合来看,未来几年大数据在商业智能、政府服务和市场营销三个领域的应用非常值得看好,大多数大数据案例和预算将发生在这三个领域。 商业智能过去几十年,分析师们都依赖来自Hyperion、Microstrategy和Cognos的BI产品分析海量数据并生成报告。 数据仓库和BI工具能够很好地回答类似这样的问题: “某某人本季度的销售业绩是多少?”(基于结构化数据),但如果涉及决策和规划方面的问题,由于不能快速处理非结构化数据,传统的BI会非常吃力和昂贵。 大多数传统BI工具都受到以下两个方面的局限: 首先,它们都是“预设-抓取”工具,由分析师预先确定收集什么数据用于分析。 其次,它们都专注于报告“已知的未知”(Known unknowns),也就是我们知道问题是什么,然后去找答案。

(而大数据会给出一些未知的未知,也就是你没有想到的一些问题的结果)传统BI工具主要用于企业运营,侧重于成本控制和计划执行报告。 而大数据技术最主要的功能/应用是ETL(Extract、Transform、Load)。 将近80%的Hadoop应用都与ETL有关,例如在导入Vertica这样的分析数据库之前对日志文件或传感器数据的处理。 今天计算和存储硬件变得非常便宜,配合大量的开源大数据工具,人们可以非常“奢侈”地先抓取大量数据再考虑分析命题。 可以说,低廉的计算资源正在改变我们使用数据的方式。 此外,处理性能的大幅提高(例如内存计算)使得实时互动分析更加容易实现,而“实时”和“预测”将BI带到了一个新的境界——未知的未知。 这也是大数据分析与传统BI之间最大的区别。 今天的大数据技术还处于战国时期,未来几年,随着企业间的兼并和新产品的不断推出,BI厂商们将能推出完善的,让CEO感到满意的“大数据套件”,但这并不意味着企业IT经理们的工作将受到威胁。 因为正如云计算在理想和现实间达成妥协一样,大数据也会经历类似的发展过程。 传统的BI工具将与大数据分析并存。 公共服务大数据另外一个重大的应用领域是社会和政府。 如今,数据挖掘已经能够预测疾病暴发、理解交通模型并改善教育。 今天,城市正面临预算超支、基础设施难题以及从农村和郊区涌入的大量人口。 这些都是非常紧迫的问题,而城市,也正是大数据计划的绝佳实验室。 以纽约这样的大都市为例,政府公共数据公开化、以及市民生活的高度数字化(购物、交通、医疗等)等都是大数据分析的理想对象。

艾瑞报告:中国商业智能行业研究报告2017(附PDF下载)

艾瑞报告:中国商业智能行业研究报告2017(附PDF下载) 区别于能够实现海量数据的管理、简单分析与可视化的传统商业智能,艾瑞的此份商业智能报告将聚焦于人工智能技术如何用于商业智能决策,实现商业经营的智能化与自动化。本报告将通过剖析商业智能行业发展背景、技术动态、多场景应用状况等方面,对人工智能在商业落地的真实现状进行说明,凸显AI技术(不包含语音、视觉等感知智能)在现阶段真实应用的价值。 报告核心观点 1、中国企业精细化运营的需求正在爆发 2、商业智能,帮助企业实现数据驱动认知到数据驱动决策的转变 3、商业智能主要应用于金融、电商、物流、出行等领域 4、中国AI论文成果达到国际一线水平 5、技术方面,商业智能的未来将从强调单一技术,到各学科、分支、算法等融会贯通 6、技术以外,企业、技术供应商对场景的理解是产业升级的关键 7、商业智能的落地是一项系统工程,企业的工程实践能力有待增强 目录 报告摘要1 商业智能概述1.1 商业智能行业概念界定1.2 商业智能与大数据1.3 商业智能发展宏观环境分析1.4 商业智能产业图谱1.5 投融资状况分析2 商业智能核心技术剖析

2.1 机器学习2.2 知识图谱2.3 运筹学3 商业智能典型应用 3.1 广告营销3.2 电商3.3 交通出行3.4 供应链3.5 金融风控3.6 投研分析 3.7 智能投顾3.8 智能客服4 典型公司案例 4.1明略数据 4.2第四范式4.3 杉数科技4.4 百分点4.4 文因互联4.5 ZRobot5 商业智能的未来与挑战 商业智能行业概念界定商业智能的下一步,智能化与自动化商业智能(BI,Business Intelligence)概念的提出可追溯至1958年,通常将其视为把企业中现有数据转化为知识,帮助企业做出明智的业务经营决策的工具。过去的商业智能不能给出决策方案,也不能自动处理企业运行过程中遇到的问题。借助于人工智能与其他相关学科的技术进步,现代商业智能已能在特定场景中实现商业经营的智能化与自动化。因此,本报告聚焦于将人工智能技术用于商业智能决策,试图对人工智能在商业落地的真实现状进行说明,凸显AI技术(不包括智能语音、计算机视觉等感知智能)在现阶段应用的价值。商业智能与大数据大数据为商业智能的发展提供土壤互联网、移动互联网高速发展,海量、高维度且可实时接入更新的数据随之而来,为机器学习等前沿技术在各领域中的探索及落地提供可能,进一步拓展了被服务人群且显著提升服务质量。另一面,产业缺乏通用标准约束,数据在采集及流转过程中污染程度不一,数据加密不规范引致的数据泄露时有发生,数据孤岛亦成为企业业务发展的掣肘(如金融

《EXCEL基于大数据的商业智能分析》

EXCEL基于大数据的商业智能分析 课程背景: “大数据”的概念出现至今已经超过十年了,然而,大部人还是不知道“大数据”为何物,企业内相关员工由于缺乏大数据分析的技能,还在使用原始低效的统计和分析方法。不是因为大数据离我们太远,而是因为你没有找对分析方法! 如果你是一家生产型企业,如何根据市场调查结果调整产品特性? 如果你是一家销售型企业,如何根据产品销售记录发现提高销售额的方法? 如果你是一家服务型企业,如何根据客户资料区分出高价值的客户? 如何利用Excel这一常见工具完成颇具挑战的大数据统计分析工作;通过科学分析与精准预测,为企业提供更优秀的决策建议;从茫茫如海的商业数据中挖掘出价值十足的商业信息?此课程为你揭晓答案。 课程收益: 本课程从大数据的宏观知识背景开始,探讨如何将数据分析的技能应用于企业日常的管理运营当中。通过你最熟悉的EXCEL及其他工具,不需要高深的统计学理论,也不需要专业的统计分析软件,以解决实际问题为根本,详细介绍依托EXCEL进行大数据分析的原理、方法和实践。 学习本课程您将可以掌握以下内容: 1.了解大数据的概念,大数据包含哪些技术框架和工具 2.大数据分析如何跟企业的管理工作相结合 3.用数据分析解决问题的基本思路 4.数据分析的工具与数据分析实战 课程对象: 1.常年纠缠于成千上万行数据,嫌EXCEL慢的人 2.经常要从不同系统导出数据,并整理到眼花瞭乱的人 3.经常被领导要求的报表折磨到“吐血”的人 4.想点一点就自动生成可视化报表的超级“懒人” 课程模型:

课程时间:2天,6小时/天 课程软件: 1.Microsoft EXCEL 2013/2016 2.Microsoft POWER BI 课程大纲第一讲:揭开大数据的面纱 1.大数据到底“大”在哪? 2.大数据的全景视图 3.大数据时代,悄然改变着我们的生活 4.最热门的大数据工具有哪些 5.微软商业智能与数据分析 6.Power BI 是什么? 7.Any data, Any where, Any time 第二讲:让数据获取更快捷 1.理解数据的“颗粒度” 2.神奇的ETL是什么 3.从各种文件中获取动态数据 4.从网页抓取动态数据 5.从数据库中获取海量数据

数据仓库与数据挖掘课后答案

第1章数据仓库的概念与体系结构 1.数据仓库就是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。 2.元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据元数据用途的不同可将数据仓库的元数据分为技术元数据和业务元数据两类。 3.数据处理通常分成两大类:联机事务处理OLTP和联机分析处理OLAP。 4.多维分析是指对以“维”形式组织起来的数据(多维数据集)采取切片(Slice)、切块(dice)、钻取(Drill-down 和Roll-up 等)和旋转(pivot)等各种分析动作,以求剖析数据,使用户能从不同角度、不同侧面观察数据仓库中的数据,从而深入理解多维数据集中的信息。 5. ROLAP是基于关系数据库的OLAP实现,而MOLAP是基于多维数据结构组织的OLAP实现。 6.数据仓库按照其开发过程,其关键环节包括数据抽取、数据存储与管理和数据表现等。 7.数据仓库系统的体系结构根据应用需求的不同,可以分为以下4种类型:两层架构、独立型数据集市、依赖型数据集市和操作型数据存储、逻辑型数据集市和实时数据仓库。 8.操作型数据存储实际上是一个集成的、面向主题的、可更新的、当前值的(但是可“挥发”的)、企业级的、详细的数据库,也叫运营数据存储。 9.“实时数据仓库”意味着源数据系统、决策支持服务和数据仓库之间以一个接近实时的速度交换数据和业务规则。 10.从应用的角度看,数据仓库的发展演变可以归纳为5个阶段:以报表为主、以分析为主、以预测模型为主、以营运导向为主、以实时数据仓库和自动决策为主。 11.什么是数据仓库?数据仓库的特点主要有哪些? 答:数据仓库就是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,通常用于辅助决策支持。 数据仓库的特点包含以下几个方面:(1)面向主题。操作型数据库的数据组织是面向事务处理任务,各个业务系统之间各自分离;而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点领域,一个主题通常与多个操作型业务系统或外部档案数据相关。(2)集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据作抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企事业单位一致的全局信息。也就是说存放在数据仓库中的数据应使用一致的命名规则、格式、编码结构和相关特性来定义。(3)相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供单位决策分析之用,对所涉及的数据操作主要是数据查询和加载,一旦某个数据加载到数据仓库以后,一般情况下将作为数据档案长期保存,几乎不再做修改和删除操作,也就是说针对数据仓库,通常有大量的查询操作及少量定期的加载(或刷新)操作。(4)反映历史变化。操作型数据库(OLTP)主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含较久远的历史数据,因此总是包括一个时间维,以便可以研究趋势和变化。数据仓库系统通常记录了一个单位从过去某一时点(如开始启用数据仓库系统的时点)到目前的所有时期的信息,通过这些信息,可以对单位的发展历程和未来趋势做出定量分析和预测。 12. 简述数据仓库4种体系结构的异同点及其适用性。 答:(1)两层架构(Generic Two-Level Architecture)。 (2)独立型数据集市(Independent Data Mart)。 (3)依赖型数据集市和操作型数据存储(Dependent Data Mart and Operational Data Store)。 (4)逻辑型数据集市和实时数据仓库(Logical Data Mart and Real-Time Data Warehouse)。 13. 答:数据仓库技术的发展包括数据抽取、存储管理、数据表现和方法论等方面。在数据抽取方面,未来的技术发展将集中在系统集成化方面。它将互连、转换、复制、调度、监控纳入标准化的统一管理,以适应数据仓库本身或数据源可能的变化,使系统更便于管理和维护。在数据管理方面,未来的发展将使数据库厂商明确推出数据仓库引擎,作为数据仓库服务器产品与数据库服务器并驾齐驱。在这一方面,

数据仓库 商业智能相关面试题带答案

1商务智能 1.1数据仓库 1.1.1数据仓库的4大特点(特征)? 面向主题的,集成的,相对稳定的,反映历史变化的。 1.1.2数据仓库的四个层次体系结构? 1.数据源 是数据仓库系统的基础,是整个系统的数据源泉。通常包括企业内部信息和外部信息。内部信息包括存放于RDBMS中的各种业务处理数据和各类文档数据。外部信息包括各类法律法规、市场信息和竞争对手的信息等等; 2.数据的存储与管理 是整个数据仓库系统的核心。数据仓库的真正关键是数据的存储和管理。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心,则需要从数据仓库的技术特点着手分析。针对现有各业务系统的数据,进行抽取、清理,并有效集成,按照主题进行组织。数据仓库按照数据的覆盖范围可以分为企业级数据仓库和部门级数据仓库(通常称为数据集市) 3.OLAP服务器 对分析需要的数据进行有效集成,按多维模型予以组织,以便进行多角度、多层次的分析,并发现趋势。其具体实现可以分为:ROLAP(关系型在线分析处理)、MOLAP(多维在线分析处理)和HOLAP(混合型线上分析处理)。ROLAP基本数据和聚合数据均存放在RDBMS 之中;MOLAP基本数据和聚合数据均存放于多维数据库中;HOLAP 基本数据存放于RDBMS 之中,聚合数据存放于多维数据库中。 4.前端工具 主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以数据挖掘及各种基于数据仓库或数据集市的应用开发工具。其中数据分析工具主要针对OLAP 服务器,报表工具、数据挖掘工具主要针对数据仓库。 1.1.3描述一下联机分析处理OLAP?(维的概念,基本多维操作, 层次结构,与OLTP的区别) OLAP(联机分析处理On-Line Analytical Processing)也叫多维DBMS。 OLAP是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。 OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是"

传统分析与大数据分析的对比知识讲解

传统分析与大数据分 析的对比

“大数据”是用来表示大量的没有按照传统的相关格式存储在企业数据库中的非结构化数据的总术语。以下是大数据的一般特点。 数据存储量相对于当前企业TB(TERA BYTES)字节的存储限制,定义在PB (PETA BYTES)字节,EXA字节以及更高的容量顺序。 通常它被认为是非结构化数据,并不适合企业已经习惯使用的关系型数据库之下 数据的生成使用的是数据输入非传统的手段,像无线射频识别(RFID),传感器网络等。 数据对时间敏感,且由数据的收集与相关的时区组成。 在过去,专业术语“分析”应用于商业智能(BI)世界来提供工具和智能,通过对各种各样可能的信息视角的快速的、一致的、交互式访问获得洞察力。 与分析的概念非常接近,数据挖掘已经应用于企业以保持关键监测和海量信息的分析。最大的挑战就是如何通过大量的数据挖掘出所有的隐藏信息。 传统数据仓库(DW)分析相对于大数据分析 企业数据的分析朝着在一段时间内在那种内容中的信息的有意义的洞察,是大数据分析区别于传统数据仓库分析的原因所在。下表总结了一些它们之间的差别。 大数据分析用例 基于用例,企业可以理解大数据分析的价值和在大数据分析的帮助下如何解决传统的问题。以下是一些用法。

客户满意度和保证分析:也许这是基于产品的企业所担心的最大的一个领域。在当今时代,没有一个清晰的方式来衡量产品的问题和与客户满意度相关的问题,除非他们以一个正式的方式出现在一个电子表格中。 信息质量方面,它是通过各种外部渠道收集的,而且大多数时候的数据没有清洗 因为数据是非结构化数据,无法关联相关的问题,所以长期的解决方案提供给客户 分类和分组的问题陈述都缺失了,导致企业不能对问题进行分组 从上面的讨论中,对客户满意度和保证分析使用大数据分析将帮助企业在急需的客户注意力设置中获得洞察力,并有效地解决他们的问题以及在他们的新产品线上避免这些问题。 竞争对手的市场渗透率分析:在今天高度竞争的经济环境下,我们需要通过一种实时分析对竞争者强大的区域和他们的痛点进行衡量。这种信息是可适用于各种各样的网站、社交媒体网站和其他公共领域。对这种数据的大数据分析可以向企业提供关于他们产品线的优势、劣势、机遇、威胁等非常需要的信息。 医疗保健/流行病的研究和控制:流行病和像流感这样的季节性疾病在人群中以一定的模式开始,如果没有及早发现和控制,它们就会传播到更大的区域。这对发展中以及发达的国家都是一个最大的挑战。当前绝大部分时间的问题是人们之间的症状各异,而且不同的医护人员治疗他们的方法也不同。人群中也没有一种常见的症状分类。在这种典型的非结构化数据上采用大数据分析将有助于地方ZF有效地应对疫情的情况。 产品功能和用法分析:大多数产品企业,尤其是消费品,不断在他们的产品线上增加许多功能,但有可能一些功能不会真正地被顾客所使用,而有些功能则更多地被使用,对这种通过各种移动设备和其它基于无线射频识别(RFID)输入捕捉到的数据的有效分析,可以为产品企业提供有价值的洞察力。 未来方向的分析:研究小组分析在各种业务中的趋势,而这种信息通过行业特定门户网站甚至常见的博客可以获得。对这种未来数据的不断分析将有助于企业期待未来,并将这些期待带入他们的生产线。 总结 大数据分析为企业和ZF分析非结构化的数据提供了新的途径,这些非结构化数据到目前为止在典型的企业数据仓库的情景中被数据清洗的惯例所拒绝。然而从以上用例明显看出,这些分析在改善企业的运营方面有很长的路要走。我们在未来的日子里将会看到更多的产品和应用系统在这个市场上出现。

数据仓库和Oracle-BI

数据仓库和Oracle-BI

一、数据仓库和Oracle BI ORACLE数据库11GR2:数据仓库- 网上课程 二、甲骨文快递/ OLAP 打不开 三、商业智能 1.Oracle商务智能11g的R1:创建分析和仪表盘 2.Oracle商务智能11g的R1:BUILD库 3.Oracle商业智能套件企业版10g第3版:BUILD库 4.Oracle商业智能套件企业版10g第3版:创建报表和仪表板 5.ORACLE BI EE10g第3版:报表/仪表板及商业智能发布加速 6.Oracle商业智能发布11G R1:基本面 7.Oracle商业智能10G:分析概述 8.Oracle BI应用7.9:对于Oracle EBS实施 9.Oracle商业智能套件企业版10g BOOTCAMP 10.Oracle BI应用7.9:开发数据仓库 11.ORACLE的实时决策(RTD)开发 12.ORACLE的实时决策3.0(RTD)开发 13.Oracle商业智能10G:分析概述– RWC 14.Oracle商业智能应用7.9.6实施

15.到Siebel商业分析7.7:第二部分- 网上课程 16.Oracle BI应用7.9:概述- 网上课程 17.到Siebel商业分析7.7:第一部分- 网上课程 18.Data WarehousingOracle商务智能11g的简介:最终用户工具- 网上课程 四、数据挖掘 打不开 五、Oracle Warehouse Builder将10g的 1.Oracle Warehouse Builder中10G:实现部分我 2.Oracle Warehouse Builder中10G:第二部分实施 3.Oracle Warehouse Builder中10G:新功能- 在线课程 4.Oracle9i的仓库构建器:脚本- 网上课程 六、Oracle商务智能 1.Oracle商务智能11g的升级和新功能 2.ORACLE BI Discoverer管理员11G:制定一个EUL 3.Oracle商务智能Discoverer Plus中11G:关系型和OLAP数据进行分析 4.Oracle商业智能发布10g第3版:基本面 5.ORACLE BI Discoverer管理员11G:制定一个EUL 6.Oracle商务智能11g的R1:系统管理- 网络课程

BI商业智能与大数据应用的区别

BI商业智能与大数据应用的区别 摘要:BI(BusinessIntelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策。 关键词:BI 商业智能大数 BI(BusinessIntelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策。 伴随着BI的发展,是ETL,数据集成平台等概念的提出。ETL,Extraction Transformation Loading,数据提取、转换和加载,数据集成平台主要功能对各种业务数据进行抽取和相关转化,以此来满足BI、数据仓库对数据格式和内容挖掘的要求。 数据集成平台的基础工作与ETL有很大的相似性,其主要功能是实现不同系统不同格式数据地抽取,并且按照目标需求转化成为相应的格式。数据集成开始是点对点的,慢慢地发现这种模式对于系统之间,不同所有权的企业数据流向以及数据标准控制很难,为此,诞生了对统一企业数据平台的需求,来实现企业级之间的数据交互。 数据集成平台就像网络中Hub,可以连接所有应用系统,实现系

统之间数据的互通有无。数据集成平台以BI、数据仓库需求而产生,现在已经跨越了最初的需求,上升到了一个更高的阶段。 如今大数据应用更多关注非结构化数据,更多谈论互联网,Twitter、Facebook、博客等非结构化数据,如此理解大数据应用,显然就有些走偏了。结构化数据也属于大数据,且呈现出相同的特点和特征,如数据量大,增长越来越快,对数据处理要求高等。 结构化数据是广义大数据中含金量或者价值密度最高的一部分数据,与之相比,非结构化数据含金量高但价值密度低。在Hadoop 平台出现之前,没有人谈论大数据。数据应用主要是结构化数据,多采用IBM、HP等老牌厂商的小型机或服务器设备。 采用传统方法处理这些价值密度低的非结构化数据,被认为是不值得的,因为其产出实在是有限。Hadoop平台出现之后,提供了一种开放的、廉价的、基于普通商业硬件的平台,其核心是分布式大规模并行处理,从而为非结构化数据处理创造条件。 大数据应用的数据来源应该包括结构化数据,如各种数据库、各种结构化文件、消息队列和应用系统数据等,其次才是非结构化数据,又可以进一步细分为两部分,一是社交媒体,如Twitter、Facebook、博客等产生的数据,包括用户点击的习惯/特点,发表的评论,评论的特点,网民之间的关系等,这些都构成了大数据来源。另外一部分数据,也是数据量比较大的数据,就是机器设备以及传感器所产生的数据。以电信行业为例,CDR、呼叫记录,这些数据都属于原始传感器数据,主要来自路由器或者基站。此外,手机的置传感器,各种手

大数据与商务智能高效实战版

《大数据与商务智能》 启发思考题 1.本次巴西世界杯报道中,腾讯为什么能够胜出? 答:一、腾讯网不仅包括了传统的报道方式,设置了各个视角下的视频、新闻、直播、专题,还与IBM 合作,将社交媒体上球迷的观点和喜好融入到世界杯的报道中,让分散的网络球迷声

音汇聚成全新的观赛体验:准确分析并报道了社交平台上中国球迷对赛事、球星以及球队的态度,挖掘出球迷的热点话题。不仅如此,利用球迷他们自己的一些言论、信息以及人物性格分析模型勾画出鲜活的“球迷画像”,把不同球迷群体的行为和特点,生动地展现出来。 二、在传统的赛事报道当中,支持率一般用投票来获得,比如某一个网站推出阿根廷对阵德国,

球迷支持哪个球队,就可以投谁的票。这个投票数有时会达到10 万量级以上,貌似很客观了。但其实,这样得出的支持率数据是个主观的数据,如果哪支球队的球迷比较热情的话,他们可能扑上去点,使劲投票,所以,得出的支持率也不一定是球迷内心真正的想法。腾讯则是借助IBM 技术,在社交网络上和微博上抓取球迷的声音,通过分析,得出“德阿被看好,巴西前景被

看衰”的结论,并早在7 月8 日,世界杯还未进入半决赛阶段,发布了“1/4 决赛回顾:巴西遭嫌内少惹人怜J 罗火翻天”的报道,在报道中,已经给出了一个很有意思的分析结果,中国球迷对四强的支持率是——德国第一,阿根廷第二,荷兰第三,巴西第四。这个结果是腾讯利用IBM社交数据分析结果给出的,而IBM 则是根据 6 月15 日到7 月7 日这段时间中国

球迷对所有的球队的支持数据累计分析来获得球迷内心最真实的想法。另外,在“世界杯球迷声量大比拼”中,根据IBM 实时社交媒体数据分析的结果,德国支 持率为64%,巴西的支持率为36%。虽然没有投票,但每一个球迷的观点都已经被听到,都已经被展现。 三、在世界杯观赛期间,同为一个球队、一名球星的粉丝,拉近

数据仓库与数据挖掘(陈志泊)_复习题答案

数据仓库与数据挖掘习题答案 第1章数据仓库的概念与体系结构 1. 面向主题的,相对稳定的。 2. 技术元数据,业务元数据。 3. 联机分析处理OLAP。 4. 切片(Slice),钻取(Drill-down和Roll-up等)。 5. 基于关系数据库。 6. 数据抽取,数据存储与管理。 7. 两层架构,独立型数据集市,依赖型数据集市和操作型数据存储,逻辑型数据集市和实时数据仓库。 8. 可更新的,当前值的。 9. 接近实时。 10. 以报表为主,以分析为主,以预测模型为主,以营运导向为主。 11. 答: 数据仓库就是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,通常用于辅助决策支持。 数据仓库的特点包含以下几个方面: (1)面向主题。操作型数据库的数据组织是面向事务处理任务,各个业务系统之间各自分离;而数据仓库中的数据是按照一定的主题域进行组织。主题是一个抽象的概念,是指用户使用数据仓库进行决策时所关心的重点领域,一个主题通常与多个操作型业务系统或外部档案数据相关。 (2)集成的。面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据作抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企事业单位一致的全局信息。也就是说存放在数据仓库中的数据应使用一致的命名规则、格式、编码结构和相关特性来定义。 (3)相对稳定的。操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供单位决策分析之用,对所涉及的数据操作主要是数据查询和加载,一旦某个数据加载到数据仓库以后,一般情况下将作为数据档案长期保存,几乎不再做修改和删除操作,也就是说针对数据仓库,通常有大量的查询操作及少量定期的加载(或刷新)操作。 (4)反映历史变化。操作型数据库(OLTP)主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含较久远的历史数据,因此总是包括一个时间维,以便可以研究趋势和变化。数据仓库系统通常记录了一个单位从过去某一时点(如开始启用数据仓库系统的时点)到目前的所有时期的信息,通过这些信息,可以对单位的发展历程和未来趋势做出定量分析和预测。 12. 答: (1)两层架构(Generic Two-Level Architecture)。 (2)独立型数据集市(Independent Data Mart)。 (3)依赖型数据集市和操作型数据存储(Dependent Data Mart and Operational Data Store)。 (4)逻辑型数据集市和实时数据仓库(Logical Data Mart and Real-Time Data

相关主题
文本预览
相关文档 最新文档