首页 > 大数据 > 正文

悉数那些“巨型”数据仓库

2012-05-31 09:27:08  来源:TechTarget中国

摘要:你能想象一个企业的数据仓库究竟有多大吗?虽然下面的数据来自于两年前,但是还是挺震撼的。相信目前,这些巨型的数据仓库“怪物”的体积又增大了几倍。
关键词: 数据仓库

    你能想象一个企业的数据仓库究竟有多大吗?虽然下面的数据来自于两年前,但是还是挺震撼的。相信目前,这些巨型的数据仓库“怪物”的体积又增大了几倍。行业分析师Curt Monash曾经见过许多非常大型的数据仓库,并进行了总结,其中用到的数据管理软件工具更是多种多样,有传统的Teradata数据仓库,也有Greenplum这样的MPP数据库,还有许多开源的技术,比如Hadoop/Hive等。


    1、ebay:公司有超过6.5 PB的数据库运行在Greenplum上,另外2.5 PB的企业数据仓库运行在Teradata上。


    2、Facebook:脸书公司刚刚完成IPO,它们是著名的互联网数据巨鳄,也以使用开源技术著称。它们有2.5 PB的数据运行在Hadoop/Hive集群上。


    3、沃尔玛、美国银行都有非常大的数据仓库,与戴尔公司一起使用了大型的Teradata


    4、雅虎公司的网络日志数据库运行在私有软件上,据说大小是eBay Greenplum系统的六分之一。


    5、福克斯/Myspace有几百TB的数据库运行在Greenplum和AsterData的nCluster上。


    6、TEOCO公司有100多TB数据运行在DATAllegro上。


    7、戴尔公司除了Teradata之外,也有大量的数据运行在DATAllegro上。


    8、有多家公司还选择使用Vertica,其数据量也超过了200 TB。


    随着国内互联网等行业的飞速发展,包括淘宝、京东等电商的数据量也是达到了非常恐怖的程度,据了解京东正在测试Oracle Exadata,像Teradata在国内的各大银行中也有很广泛的应用。以后可以考虑写一写国内的几个大型数据仓库系统,只不过国内用户是否愿意透露数据量还存在疑问。


第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:fanwei

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。