首页 > 大数据 > 正文

商业智能体系结构研究

2012-05-31 10:19:49  来源:互联网

摘要:商业智能也称作BI是英文单词Business Intelligence的缩写。商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。
关键词: 商业智能

    商业智能也称作BI是英文单词Business Intelligence的缩写。商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。与DSS系统相比,商业智能具有更美好的发展前景。这些年来,商业智能市场持续增长,许多的国外企业已经进入了中端BI,也就是所说的数据分析阶段。同时,也有一些企业开始进入BI的高端数据挖掘阶段。而目前我国的大部分企业还停留在报表阶段。传统的报表系统技术上包括大家熟悉的Excel、水晶报表、Reporting Service等都已经被广泛使用。但是,随着数据的增多与需求的提高,传统报表系统面临的挑战也越来越多。


    1 BI的具体内容


    随着企业ERP、CRM和SCM等应用系统的使用,企业不再停留在事务处理阶段,而更注重有效的利用企业的数据来为准确和更快的决策提供支持,也就是说商业智能的需求越来越强。商业智能的概念最早在1996年提出。当时对商业智能的定义是由数据仓库、查询报表、数据分析、数据挖掘、数据备份和恢复等部分组成的,可以帮助企业决策的技术及其应用。现在,对商业智能的理解是将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。这里所说的数据包括来自企业内部的业务数据,以及来自企业外部环境中的各种数据。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。从技术层面上讲,商业智能只是数据仓库、OLAP和数据挖掘等技术的综合运用。如何把数据转化为信息,使得企事业人员能够充分掌握、利用这些信息,并且辅助决策,就是商业智能主要解决的问题。


    2 BI平台搭建


    主流的商业智能工具包括BO、COGNOS、BRIO。一些国内的软件工具平台如KCOM(也集成了一些基本的商业智能工具。智能商业平台提供一切必要的工具包括管理和提供文件,分析系统模型,控制与预策系统。每一种文档都保留它的特点,但每个在体系中的组件都提供了应用于执行环境。商业智能的完整的体被划分为4个大的层面,并根据数据的处理和应用过程再细分成7个环节。从数据源经过抽取、转换、装载过程加载到中央数据仓库,再从数据仓库经过分类加工放到数据集市,或者将数据集市中的数据进一步存放到多维数据库中,这都属于数据组织的问题,从中间层到终端用户或从多维数据库到终端用户可将其划归为前端应用实现的问题。而贯穿整个体系数据处理环节的,是系统的流程调度控制和元数据管理。


    本项目的目的是完成一个强大体系结构来实现智能商业解决方案。目前,全世界计算机软件应用范畴内已经存在许多自由,开源软件项目,比如报表工具、数据挖掘工具和算法等等,但是它们主要针对的是商业智能领域的一个特定问题,但当需要一个完整的解决方案时,这些独立的开源项目就显得无能为力了。本项目将利用现有的最好的自由/开源软件解决方案来实现—个真正的综合的智能商业平台。由于包括内容较多,整个系统就显得比较复杂。包括的模块内容有:(1)企业应用程序集模块:主要是和普通的接口程序相关,可以特定为商业智能接口或普通企业接口服务,能使系统全面管理有用的智能商业服务;(2)BI应用模块:支持智能商务平台的核心分析工作,包括结果验证,它能以同样的方式管理结果验证、参数激活、过程导航和存储等工作。它支持参数管理,支持引发和交互双模式,支持能见度和授权的政策与准则,支持不同的文档的组织和导航;(3)BI引擎:是实现分析数据与文件的接口程序。[page]    2.1 数据仓库


    数据源可以是企业日常运作积累下来的各类的业务数据,也可以是外部的数据。这些数据对于商业智能的实现具有非常重要的意义,首先是数据仓库的搭建,数据仓库的一个目的就是把企业的信息访问基础,从一种非结构化的或发展中的环境改变成一种结构化或规划良好的环境。随着我国企业信息化建设步伐的不断加快,全球性市场竞争的加剧,越来越多的企业开始建设自己的数据仓库系统,希望能对历史数据进行具体而又有针对性的分析与挖掘,以期从中发现新客户和客户新的需求。目前市场上的主流数据仓库产品包括Business Objects、Oracle、IBM、Sybase等,但对于智能商务而言,需要一个集查询、报表和OLAP技术为一身的智能支持系统。要实现“语义层”技术和“动态微立方”技术来表示数据库中的多维数据,具有良好的查询和报表功能,提供钻取等多维分析技术,同时支持多种平台。对于有自主开发商业智能产品需求的企业,可以选取JPIVOT/ONDRIAN,JPivot是一种轻量级的OLAP产品,它使用Mondrian and XMLA作为它的OLAP引擎,JPIVOT利用一组JSP通用标签库来来获取OLAP表格,可以执行典型的OLAP操作,例如钻取,切片和切块等。


    2.2 数据转换


    ETL是智能商业(BI)和数据挖掘(DW)的核心和灵魂,它按照统一的规则集成并提高数据的质量,负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。目前,主流的ETL工具有Informatica、Data stage、Data Integrator和OWB,以上四种产品已经占领了市场的绝大部分份额,对于有自主开发商业智能产品需求的企业,可以选取一些开源数据转换工具,例如BIE和Octopus.BIE全称是商业集成组件,它的目的是帮助企业解决不同应用中数据的交换问题,从而产生适合统一处理的过程数据流。Octopus是一个ETL工具,它可以连接JDBC数据库,执行XML格式转换。


    2.3 数据挖掘


    数据挖掘(Data Mining)是采用数学、统计、人工智能和神经网络等领域的科学方法,从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,为商业智能系统服务的各业务领域提供预测性决策支持的方法、工具和过程。在日常的数据库操作中,经常使用的是从数据库中抽取数据以生成一定格式的报表。对于有自主开发商业智能产品需求的企业,可以选取一些开源数据转换工具,怀卡托智能分析环境Weka是一个基于java的,用于数据挖掘和知识发现的开源项目,经过12年的发展历程Weka已发展为现今最完备的数据挖掘工具之一,被公认是数据挖掘开源项目中最著名的一个。和其他数据挖掘工具的艰深复杂不同,使用weka软件的技术门槛很低。


    3 结束语


    随着企业CRM、ERP、SCM等应用系统的引入,企业不停留在事务处理过程而注重有效利用企业的数据为准确和更快的决策提供支持的需求越来越强烈,由此带动的对商业智能的需求将是巨大的。


第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:fanwei

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。