首页 > 大数据 > 正文

开源技术领军大数据应用

2012-10-17 11:04:16  来源:机房360

摘要:“大数据”这一术语2009年才开始出现,但它却很快变成了自虚拟化的热潮以来,影响信息技术领域最重要的术语。
关键词: 大数据 开源

    企业将被迫根据数据量的增长点来扩大他们的基础设施的规模,而传统的“规模”技术,遗留系统和授权模式根本不起作用。从其发端开始,开源技术就一直站在海量数据管理的最前沿。今天,开源提供了最有效的方式来解决这样一个大规模的问题,并能够保证较之一小部分的替代解决方案做得更快,更准确。


    开源的数据和分析产品不再是其曾经的那样属于危险的赌注。他们现在不可或缺的业务组成部分,专有软件真正的替代。其具有一套基本的工具和坚实的技术基础,开源已成为一个引人注目的非常强大、极具成本效益的企业应用和基础设施建设模块。它已经登上了主流:不仅在供应商领域,同时还包括所有类型和规模的企业客户内部。


    一个全新世界的创新


    大多数新的大数据框架和数据库在开放源代码的世界里都有其根源,开发者经常创造出一些还没有进入主流的新的问题解决方法。这方面的代表企业包括许多大的网上通讯和数据交易供应商--Facebook、雅虎、亚马逊、Twitter和易趣网。他们均使用有助于创新开放性开发的举措。大数据重要性的普及及其成长可直接归因于开放源码。


    最终用户都开始改变他们的商业模式以支持Hadoop,努力创造新的数据服务。这改变了企业如何思考他们的数据库、数据仓库和智能系统。例如,沃尔玛最近表示,他们改变了其电子商务模式,通过将10个网站转移到一个,并从TrialSize系列十节点Hadoop簇转移到250节点Hadoop簇。同时,沃尔玛将建立若干工具从甲骨文、Netezza和EMCGreenplum系统来迁移数据。他们希望采用开放源码工具。沃尔玛还将使用一些现有的数据仓库技术,但程度要小得多。


    虽然这些公司是更好的Hadoop的发展的合作伙伴,但客户将只能选择一个给定的供应商合作伙伴进行部署。当然他们对于ApacheHadoop堆栈都做出了相同的贡献。这就是开源的美妙之处。大数据的技术复杂性是如此之大,你需要的是一个社会的共同努力,而不是仅仅靠单一的供应商来解决它。


    展望未来,我们将开始看到越来越多的“混合型”平台,企业之间共生的软件:甲骨文OracleExadata与Cloudera,或EMCGreenplum与MapR.开放源码运动将带来更大的创新,通过数据集成工具来处理开源和客户的遗留系统之间的鸿沟。


    企业期望利用大数据,不仅要了解像Hadoop这样的基础技术的复杂性,而且还需要有相关的基础设施,以帮助他们做出战略性决策的时代已经到来。没有这些配套能力,大数据将仍然是一个IT的特权,并仍然是业务线上的业务人员所无法企及的范围。


    如果你想减轻Hadoop的复杂性吗,你需要熟练的资源和互补的技术。随着企业Hadoop市场的不断成熟,企业为最苛刻的分析挑战部署集群,数据科学家们将继续利用开源为中心平台,以满足这些关键需求。
 


第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:zhangyexi

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。