首页 > 大数据 > 正文

数据仓库的远见性

2014-02-17 10:10:39  来源:互联网

摘要:数据仓库的远见性直到今日仍在扩张。目前数据仓库现有的远见包含文本数据的收集与转换。数据库管理系统曾经对文本的存储和管理感到棘手。
关键词: 数据仓库 商业智能

    人人都知道数据仓库是一种远见性的现象。不像其他产品驱动的现象,数据仓库从愿景开始。


    想一想在没有数据仓库之前的世界。没有商业智能(BI)。没有企业数据。也谈不上什么关键绩效指标 (KPI)。那曾经是联机事务处理 (OLTP) 的世界。曾经有这样的说法“真正的行家才做联机事务处理 (OLTP)。”其它任何东西被认为是无价值的,都不值得“真正”专业人士关注。


    联机事务处理 (OLTP) 观念中的奇特性之一是有一个且只有一个数据库。这个数据库服务于所有的信息目的。不难看出这一观念从何处得来。在线数据库之前,是主文件。有多种主文件 — 会计、销售、财务等等。数据库背后的概念是所有的这些主文件都应该聚集和整合。所以很容易就明白为什么联机事务处理 (OLTP) 的数据库理论会过时地认为应该有一个也是唯一的一个数据库服务于所有的目的。


    但数据库理论并没有解释在线处理和信息处理之间服务的显着不同这一事实。事实上,即使是为了这些目的所需要的数据也是大不相同的。操作数据通常是以应用为目的,而分析数据则是以联合为目的。在数据仓库的早期,数据基础转换的需要并不明显。换句话讲,应用系统所要的数据是地方性的。操作数据这种地方性的本质根本不适合于数据的合作,而数据的合作需要多种应用程序数据的整合。


    但早期数据仓库远见性上最值得注意的一件事或许是数据存储之上的物理介质。在1990年代早期的存储容量成本和眼下的情况是相当不同的。早期的数据仓库存储成本很高而容量有限。而今天的存储成本便宜得多而存储容量则要大得多。


    数据仓库的远见指出在合作中会有比以往所见证的更多的数据。从一开始,大家就都知道在数据仓库中会有大量的数据。如果数据成本和数据容量仍然停留在1990年代早期的水平,数据仓库就永远不会成为现实。事实上,成本下降而容量也扩大了。瞧,结果就是今天很大的数据仓库。要让数据仓库的远见性成为现实,在数据仓库的远见性最初时所未知的存储技术上就必须要加以改进。


    数据仓库的远见性直到今日仍在扩张。目前数据仓库现有的远见包含文本数据的收集与转换。数据库管理系统曾经对文本的存储和管理感到棘手。但是现在有文本ETL技术能够将文本收集、转换、并存储在一种关系型数据库管理系统中。在关系型数据库管理系统中文本的转化和储存打开了文本分析处理的世界。


    因此,数据仓库的预见性还在继续增长。


第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:chenjian

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。