导读:数据仓库是数据挖掘过程中的一个非常重要的环节,它涉及到数据的整合和清洗。在许多行业中已被广泛应用。本文介绍了DW的基本概念、特征、体系结构,并着重阐述了其在烟草企业中的应用。
引 言
近几年来,国内烟草企业的市场竞争格局正在发生着巨大变化,“以信息化带动工业化”成为行业发展的大趋势,由此引发的烟草企业的信息化也从最初的单机应用发展到了目前的统一平台,统一数据库,统一网络的新阶段。数字化烟草的迅速发展为烟草企业积累了大量的运营数据,提供了管理从粗放型向精细化转变的有效手段。怎样快速从这些资源中得出科学、正确的决策是目前企业信息化建设的新课题,也是企业生存和发展的关键。数据仓库技术为解决这一新任务应运而生,对这门技术进行思考和探索,具有十分重要的现实意义。
1、什么是数据仓库
数据仓库是近几年来在国内外信息领域悄然兴起的一种数据库管理技术,为决策需要而产生的。数据仓库概念的创始人W.H.Inmon在《建立数据仓库》一书中指出:“数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持经营管理中的决策制定过程,对原始海量数据进行统筹规划和转换处理的过程。”
2、建立数据仓库的目的
数据仓库的目的是要建立一种体系化的数据存贮环境,将分析决策所需的大量数据从传统的操作环境中分离出来,使分散的、不一致的操作数据转换成高集成的、统一的规范信息,企业内不同级别的成员都可以在此单一的环境之下,共享其中的数据信息,发现全新的视野和新的问题、确定正发展的方向、得出解决问题的正确结论,进而发展成制度化的决策系统,并获取更多经营效益。
3、数据仓库的体系结构
对数据仓库而言,最关键也最为重要的是如何以一种有效的方式逐步整理各个业务处理系统中积累下来的历史数据,并通过灵活有效的方式为各级业务人员提供统一的信息视图,从而在整个企业内实现真正的信息共享。其关键的结构有如下几部分:

源数据库:为数据仓库提供最底层数据的各个业务数据库系统及外部数据,可以是部门级的应用系统,可以是竞争对手的情报信息;
监视器:负责感知和捕捉源数据库发生的变化,并按数据仓库的需求更新中央数据仓库中的数据;
数据转换接口:将从各个源数据库中提取的数据经过转换、计算、增补、修改等操作集成到中央数据仓库中;
中央数据仓库及管理平台:存贮已经按企业级视图转换的数据,供分析处理用。根据不同的分析要求,数据按不同的综合程度存储。数据仓库中还应存储元数据,其中记录了数据的结构和数据仓库的任何变化,以支持数据仓库的开发和使用;
管理平台:供系统管理员日常对整个系统的维护和特殊情况的处理;
数据展示工具:供企业对数据仓库中的数据进行访问查询,并以直观的方表示分析结果的工具,就是通常说的BI。
评论列表
|
||||||
相关新闻
最近更新
| 关于我们| 版权声明| 广告服务|欢迎合作|友情链接|联系我们|诚聘英才 |
| Copyright © 2004 CIO时代网 版权所有 京ICP证030336号 本网站服务器由北京联通IDC提供 |

