首页 > 大数据 > 正文

数据仓库产品介绍及第三方评测

2010-03-04 10:18:35  来源:CIO时代网

摘要:Oracle 、IBM、Sybase、CA、NCR、Informix、Microsoft、SAS等公司都有自己的数据仓库解决方案,BO和Brio等专业软件公司也 在前端在线分析处理工具市场上占有一席之地。 下面针对这些数据仓库解决方
关键词: 数据库 数据仓库

  Oracle 、IBM、Sybase、CA、NCR、Informix、Microsoft、SAS等公司都有自己的数据仓库解决方案,BO和Brio等专业软件公司也 在前端在线分析处理工具市场上占有一席之地。 下面针对这些数据仓库解决方案的性能和特点做分析和比较。
  Oracle
  Oracle拥有完整的数据仓库解决方案,其ETL工具是Oracle Data Integrator-ODI,前端展现工具是BI EE-Business Intelligence Enterprise Edition。OLAP Server是Oracle OLAP Option,数据挖掘工具是Oracle Data Mining Option。下面分别予以简要介绍。
  ODI的主要工作步骤包括扫描元数据、进行mapping、生成native SQL Code、部署和分发运行代码到目标数据库。开发人员只要考虑需要"什么样的"转换(声明规则)即可,而不用知道"如何"来做(流程的技术步骤),这是与传统的ETL工具最大的不同。ODI使用图形化mapping界面、内置大量的现成函数和功能块,减少开发量。ODI还可通过知识模块-Knowledge module固化专家经验,极大地提高生产力。ODI提供面向事件的集成,并可将数据转换过程封装成web service,融入SOA架构。ODI可以对数据转换过程中的元数据进行管理,包括增加、修改和删除等,并可以非常方便地浏览这些元数据。
  BI EE是多维分析的前端展现工具,属客户端应用。它架构在数据仓库基础或是多维立方体之上,用来对数据仓库中的数据进行分析和展现。相比BI EE来说,OLAP option是后台的OLAP server。
  BI EE的突出特点是三层次架构(客户端/应用服务器端/数据库端),应用服务器端可以完成大量的计算功能,有利于减少数据库端的负载,同时应用服务器设有缓存,可以减少后台数据库的查询次数,极大地提高并发响应数和速度。特别适用于大型数据仓库和并发度高的应用场合。
  OLAP option本质上就是 OLAP Server。用来生成多维立方体(Cube),并存储在Oracle DB中。可以实现在Cube和关系表中的透明切换(汇总数据在Cube中,需要看细节数据时,可以drill through到关系表中)。可以灵活地进行切片、切块、旋转等功能。可以与数据库一起扩展。此外,OLAP cube可以储存成千上万个MV,便于管理并且性能更高。
  DM Option提供的数据挖掘功能嵌入在 Oracle 数据库 10g 中,它能使业务人员提取隐藏的模式和洞察力,基于这些发现的模式和规律,数据分析人员可以帮助公司做出预测和评估,从而提高收益,降低风险和成本。它提供的主要算法包括:属性重要性、分类和回归、集群、关联、特性提取、文本挖掘、序列匹配和比对等。它将数据变换、构建和评估模型以及打分等功能集成在一起,形成完整而一体的应用环境。另外,由于和数据库集成在一起,避免了数据的迁移,节约了工作量和时间,并可以与数据库一起扩展来提高分析和响应能力。
  IBM
  IBM公司提供了一套基于可视数据仓库的商业智能(BI)解决方案,包括:Visual Warehouse(VW)、Essbase/DB2 OLAP Server 5.0、IBM DB2 UDB,以及来自第三方的前端数据展现工具(如BO)和数据挖掘工具(如SAS)。其中,VW是一个功能很强的集成环境,既可用于数据仓库建模和元数据管理,又可用于数据抽取、转换、装载和调度。Essbase/DB2 OLAP Server支持"维"的定义和数据装载。
  Essbase/DB2 OLAP Server是IBM OEM海波龙(Hperion)的产品,海波龙也是一家知名的BI软件厂商。Essbase不是ROLAP(Relational OLAP)服务器,而是一个MOLAP服务器,在Essbase完成数据装载后,数据存放在系统指定的DB2 UDB数据库中。严格说来,IBM自己并没有提供完整的数据仓库解决方案,该公司采取的是合作伙伴战略。例如,它的前端数据展现工具可以是Business Objects的BO、Lotus的Approach、Cognos的Impromptu或IBM的Query Management Facility;统计分析工具采用SAS系统。
  需要说明的是现在海波龙已经被Oracle收购,IBM也早已与海波龙解除了OEM关系。
  产品特点:IBM提供了集成的、完整的、端到端的商业智能解决方案。IBM Warehouse Manager提供了强有力的工具来定义、建立、管理、监控和维护数据仓库;DB2 OLAP Server是一套独特的OLAP工具,能够快速地分析用户的业务需求;;DB2 OLAP Analyzer提供强大的报表、图形化分析功能,而Intelligent Miner则通过丰富的挖掘方法帮助用户从数据资产中识别和提炼有价值的信息。
  应用领域:银行、证券、制造等行业。
  公司网址:www.ibm.com/cn/software
  Sybase
  Sybase提供的数据仓库解决方案称为Warehouse Studio,包括数据仓库的建模、数据抽取与转换、数据存储与管理、元数据管理以及可视化数据分析等工具。其中,Warehouse Architect是PowerDesigner中的一个设计模块,它支持星形模型、雪花模型和ER模型;数据抽取与转换工具包括PowerStage、Replication Server、Carleton PASSPORT,PowerStage是Sybase提供的可视化数据迁移工具。Adaptive Server Enterprise是Sybase企业级关系数据库,Adaptive Server IQ是Sybase公司专为数据仓库设计的关系数据库,它为高性能决策支持系统和数据仓库的建立作了优化处理,Sybase IQ支持各种流行的前端展现工具(如Cognos Impromptu、Business Objects、Brio Query等);数据分析与展现工具包括PowerDimensions、EnglishWizard、InfoMaker、PowerDynamo等,PowerDimensions是图形化的OLAP分析工具,它支持SMP和多维缓存技术,能够集成异构的关系型数据仓库和分布式数据集市,从而形成单一的、新型的多维模式;数据仓库的维护与管理工具包括Warehouse Control Center、Sybase Central、Distribution Director,其中Warehouse Control Center是为数据仓库开发人员提供的元数据管理工具。
  Quick Start DataMart,具有良好的性能,并支持第三方数据展现工具。从Quick Start DataMart的名称不难看出,它尤其适合于数据集市应用。另外,Sybase可以提供面向电信、金融、保险、医疗保健这4个行业的客户关系管理(CRM)产品,在这4个产品中,有80%的功能是共性的,有20%的功能需要Sybase与合作伙伴针对不同需求共同开发。
  Adaptive Server IQ
  产品特点:Adaptive Server IQ,简称Sybase IQ,具有新的多线索体系结构与多丛特性支持多节点配置,并可运行于Unix平台或NT平台,支持Java;实现数据库的维护与处理并行,IQ引擎充分利用了64位机体系结构的优势,每个多丛配置由多个SMP机节点构成,所有节点经由光纤与同一IQ数据库相连以实现数据共享。在这种环境下,无须作数据分划,简化系统的管理。
  应用领域:数据仓库及智能商务
  公司网址:www.sybase.com.cn
  NCR
  NCR Teradata是高端数据仓库市场最有力的竞争者,主要运行在NCR WorldMark SMP硬件的Unix操作系统平台上。1998年,该公司也提供了基于Windows NT的Teradata,试图开拓数据集市(Data Mart)市场。总的来看,NCR的产品性能很好,Teradata数据仓库在100GB、300GB、1TB和3TB级的TPCD指标测试中均创世界纪录。但是,NCR产品的价格相对较高,中小企业用户难以接受。
  产品特点:NCR的动态数据仓库可以用最新的客户信息武装企业员工,有了动态数据仓库,当客户浏览公司网站时,企业的前台员工可以在非常短的时间里获得客户信息,从而根据客户特征做出服务决策。此外,NCR Teradata数据库的隐私特性可存储和保留客户进入数据库的隐私优先权。
  应用领域:各个行业。
  公司网址:www.teradata.com
  Informix
  Informix于1998和1999年相继收购了国际上享有盛誉的数据仓库供应商Red Brick System和数据管理软件供应商Ardent,并提供了完整、集成的数据仓库解决方案。该解决方案还包括一个"快速启动"咨询服务,能够帮助用户快速完成数据仓库或数据集市的开发。
  Informix产品能够集成Microsoft IIS或Netscape Enterprise/FastTrack服务器,从而支持基于Web的数据仓库应用。Informix没有提供自己的报表和数据挖掘工具,但他们与Brio和SAS公司建立了战略联盟,并推出了"Informix商务智能联盟计划"。该计划以Informix为主,结合Brio的前端数据分析和报表功能,以及SAS的数据挖掘功能,形成了一个"BI中心"打包方案。(今年4月Informix Software已被IBM公司收购,此举将给IBM公司数据库及数据仓库产品,从技术和市场占有率上带来极大的提升。)
  CA
  CA于1999年收购了Platinum Technology公司后,得到了完整的数据仓库解决方案,包括:Erwin数据仓库设计工具、InfoPump数据转换与抽取工具、InfoBeacon ROLAP服务器、Forest&Trees前端数据展现工具、Provision系统监视与作业调度工具和DecisionBase元数据管理工具等。与Informix解决方案相似,CA解决方案也提供了数据仓库建模、元数据管理、数据抽取与转换、基于关系数据库的在线分析服务器、系统监视与作业调度、前端数据展现等功能,同时还支持Web应用。不同之处是Informix提供了专门为数据仓库设计的高性能目标数据库(Red Birck),而CA解决方案则提供ODBC接口,并将数据存储在第三方关系数据库(如Oracle、Sybase、SQL Server、Informix和IBM DB2等)中,其性能要打一些折扣,但开放性要好些。另外,CA的OLAP服务器目前只能与Microsoft的IIS Web服务器集成。
  产品特点:方案涵盖数据仓库构造过程的每一个环节,包括:用户需求分析及数据仓库模型的设计;构造数据仓库(包括数据抽取、映射和转换;数据仓库的前端展现);进行数据仓库的元数据管理。CA提供的一体化数据仓库解决方案,不仅有完整的数据仓库所需的产品和技术,而且开放的接口可以集成其他的产品和技术。此外,所有的产品都是以元数据为核心进行集成和管理的。
  应用领域:适用于不同领域各种类型的企业。
  公司网址:www.ca.com.cn
  Microsoft
  Microsoft将OLAP功能集成到Microsoft SQL Server 7.0中,提供可扩充的基于COM的OLAP接口。它通过一系列服务程序支持数据仓库应用。数据传输服务DTS(Data Transformation Services)提供数据输入/输出和自动调度功能,在数据传输过程中可以完成数据的验证、清洗和转换等操作,通过与Microsoft Repository集成,共享有关的元数据;Microsoft Repository存储包括元数据在内的所有中间数据;SQL Server OLAP Services支持在线分析处理;PivotTable Services提供客户端OLAP数据访问功能,通过这一服务,开发人员可以用VB或其他语言开发用户前端数据展现程序,PivotTable Services还允许在本地客户机上存储数据;MMC(Microsoft Management Console)提供日程安排、存储管理、性能监测、报警和通知的核心管理服务;Microsoft Office 2000套件中的Access和Excel可以作为数据展现工具,另外SQL Server还支持第三方数据展现工具。
  SAS
  SAS公司在20世纪70年代以"统计分析"和"线性数学模型"而享誉业界,90年代以后,SAS公司也加入了数据仓库市场的竞争,并提供了特点鲜明的数据仓库解决方案,包括30多个专用模块。其中,SAS/WA(Warehouse Administrator)是建立数据仓库的集成管理工具,包括定义主题、数据转换与汇总、更新汇总数据、元数据管理、数据集市的实现等;SAS/MDDB是SAS用于在线分析的多维数据库服务器;SAS/AF提供了屏幕设计功能和用于开发的SCL(屏幕控制语言);SAS/ITSV(IT Service Vision)是IT服务的性能评估和管理的软件,这些IT服务包括计算机系统、网络系统、Web服务器和电话系统等。SAS系统的优点是功能强、性能高、特长突出,缺点是系统比较复杂。
  Business Objects
  Business Objects(BO)是集查询、报表和OLAP技术为一身的智能决策支持系统。它使用独特的"语义层"技术和"动态微立方"技术来表示数据库中的多维数据,具有较好的查询和报表功能,提供钻取(Drill)等多维分析技术,支持多种数据库,同时它还支持基于Web浏览器的查询、报表和分析决策。虽然BO在不断增加新的功能,但从严格意义上说,BO只能算是一个前端工具。也许正因为如此,几乎所有的数据仓库解决方案都把BO作为可选的数据展现工具。虽然国内有很多大学和研究机构从事数据仓库技术的研究,但到目前为止,国内基本上没有成熟的数据仓库解决方案。
  Brio Performance Suite
  产品特点: Brio Performance Suite是Brio公司强大的、完全集成的企业智能信息门户平台。它的设计能够满足"e-企业"的全范围的信息访问及处理需求。Brio Performance Suite由三个产品有机地组成一个整体,它们是:易于使用、易于管理、功能强大的分析与报表工具Brio Intelligence;智能的、强大的分析型门户产品Brio Portal;性能极佳的企业级报表引擎Brio Report。
  应用领域:各个行业。
  公司网址: www.brio.com.cn
  第三方机构测评
  数据仓库的发展历史已经有20年了,从数据仓库的定义可以看得出,数据仓库是随着时间的推移数据量会越来越大,因此对系统的要求也会越来越高。Winter Corporation 是一家独立的权威的评测机构,专门针对OLTP和DSS系统进行调查和评测。其最新的全球最大的前10位数据仓库调查结果如下图:

数据仓库评比


  此外,另外一家权威的第三方评测机构Gartner 2007年也对主要的数据仓库厂家作出了评估:

数据仓库排名


第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。