首页 > 大数据 > 正文

Hadoop之父Doug Cutting眼中大数据技术的未来

2016-02-18 15:52:36  来源:云栖博客

摘要:2016,Hadoop走过第十个年头。Hadoop之父Doug Cutting1985年毕业于美国斯坦福大学,早期的他并不是一开始就决心投身IT行业的。他如何成为Hadoop之父?Hadoop的发展和未来期待又是如何的?
关键词: 大数据
 
  一年以后,在2009年,我开始意识到这种可能性。如果可以让世界500强企业开始采用Hadoop的话,那么很可能就会改变他们的业务模式。随着公司逐渐采取更多的技术,从网站和呼叫中心到现金出纳机和条码扫描器,他们的手指尖将会传递越来越多的关于他们企业的数据。如果企业机构能够采集和使用更多的数据,那么将可以更好地了解和改善他们的业务。传统的基于关系数据库管理系统(RDBMS)的技术存在以下弱点:在支持可变、凌乱的数据和快速实验方面显得太过死板;无法轻易扩展到支撑PB级数据;并且成本非常昂贵。与此相比,即使是很小的Hadoop集群也可以允许公司提出和回答比以前更复杂的问题,并且可以不断地学习和提高。最后,我加入了Cloudera公司。
 
  现况与展望

        现在,七年后,Hadoop及其开启的潮流已经在主流企业中发挥了非常有价值的作用。
 
  我们在多个方面正处于大变革的时代。目前,传统的企业式关系数据库管理系统(RDBMS)软件面临着开源的大数据软件这个竞争对手。出乎意料但是非常让人惊喜的是,黑客式和企业式软件传统之间的差异已不再明显,并且两者之间已经出现了融合。同时,软件的开发者和使用者之间也没有了有严格的划分。
 
  Hadoop生态系统中没有任何一个单一的软件组件占主导地位。Hadoop也许是最古老和最成功的组件,但是每年都会引入新的、改进的技术。新型的执行引擎(例如Apache Spark)和新型的存储系统(例如Apache Kudu(正在孵化中))表明,这种软件生态系统的发展非常迅速,且不存在任何中心控制点。用户也可以更快的获得更好的软件产品。
 
  该软件不仅更实惠,可扩展,而且提供了更好的风格。企业机构不仅可以探索混乱的、多样化的数据源,开展实验,而且可以迅速地开发和改进应用程序。我们可以综合利用源于传感器、社交媒体和生产过程的数据来进行更深入的分析,制定明智的决策以及推出新的产品。包括Cloudera在内的公司都在不断地推动该软件的完善,确保其满足各行业的需求,使之更稳定、更可靠、更易管理、更安全,并且可以与现有系统轻松地集成在一起。
 
  当前,政府和行业本身也正在转型。不仅是优步(Uber)和特斯拉(Tesla)之类的新兴公司正在使用数据来重新塑造自己的行业,卡特彼勒公司(Caterpillar)和雪佛龙公司(Chevron)等老字号品牌也正在通过数据技术极大地提升自身。我们将在本世纪获得的绝大部分的技术进步都将源于我们对所生成数据的深刻了解。
 
  回首过去,10年前我们决不会猜到Hadoop将会在这般的滔天巨变中发挥如此关键性的作用。对于今天所取得的一切成就,感到十分自豪和惊喜。随着数据世纪的到来,期待看到Hadoop继续发挥它的影响。

第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:pingxiaoli

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。