首页 > 大数据 > 正文

数据丰富-大数据环境中的力量倍增器

2018-01-26 10:20:19  来源:机房360

摘要:IBM公司最近发布的调查报告表明,“当今全球90%的数据都是在过去两年内创建的”。并且每天的数据正在以2 5ZB字节增长,这个数字将接下来的几年得到爆炸式增长。
关键词: 大数据
\
  IBM公司最近发布的调查报告表明,“当今全球90%的数据都是在过去两年内创建的”。并且每天的数据正在以2.5ZB字节增长,这个数字将接下来的几年得到爆炸式增长。

  这似乎令人印象深刻,但其中大部分仅仅是原始数据。但是,人们可能会指出,有了这些数据,人们正在推进技术,改进结果,丰富生活,做出更好的决策。这是事实。但是,如果所有这些数据都得到了丰富,那么这些结果有多大的改善呢?考虑一下丰富数据的概念,使数据真正成为组织、项目或研究的资产。它也显示了以多种方式积极使用数据的共同重要性。

  当然,数据丰富程度也不尽相同,能够以不同的方式工作。在这个过程中使用了大量的工具,其最终目标是数据的细化。这可能就像修正轻微的数据输入错误,使用算法的拼写错误或拼写错误一样简单。遵循这个基本原理,数据丰富工具可以将信息添加到基本数据表中。数据丰富的另一个例子是通过外推数据。这是通过使用诸如模糊逻辑等数据方法完成的,数据库管理员或数据科学家可以从给定的原始数据集中生成更多的数据。

  在大数据的世界里,数据丰富化已经实现,使集成数据的业务价值显着提高。正如人们最近注意到的有关ETL供应商和开发人员的工作,他们传统上只是将数据从源数据移动到目标数据。现在是使用数据浓缩过程和技术改进结果的时候了。但是,需要注意的是,企业应该领导和管理丰富数据的定义。

  人们可能会问,企业的业务或流程如何为其数据增加价值,并支持跨越数据丰富的更大决策。基本的数据丰富服务可以很容易地从一些提供商获得,如Lusha,Crunchbase,Trillium等获得。当企业选择一个数据丰富的合作伙伴时,重要的是清楚地将组织的业务目标传达给潜在合作伙伴。

  数据收集的好处

  那么现在企业可以丰富其正在收集的数据,但是是否了解收集所存储的这些数据的好处?企业可以做出正确的决定,确保尽可能高效地收集和存储数据。当然,这对企业的业务或项目至关重要。然而,真正的价值在于如何增加数据,并将最终获得它的好处。如果企业能够更好地理解和了解自己的业务,从而帮助企业改善决策,激发客户参与度,并提高盈利水平,那么数据丰富的程度将最为重要。

  最终,企业的目标是提高当前存储的数据。无论是在捕获点还是在数据积累之后,从全面的信息源中增加洞察力,这都是获得真正价值的地方。有了这个洞察力,企业将获得对自己的前景和目标市场更好、更完整的理解。从本质上讲,企业将通过将业务信息附加到自己捕获和存储的记录中,详细了解市场,找出业务前景的关键社会人群,或提高整个业务部门的效率。

  丰富到下一个层次-机器学习

  当然,使用精确算法是丰富数据的一种常用方法,但是如何使用机器学习来实现更高级别或更快速的数据丰富化过程呢?通常在谈论机器学习时,企业将构建预测模型关联起来,从而产生洞察力,直接帮助业务经理做出决策。使用机器学习作为数据丰富应用程序的一部分,通常用于向现有数据添加有用的标签或其他材料,以便更有效地使用该数据。在这些过程中,机器学习的功能发生在分析或丰富数据的早期阶段。在大数据环境下工作时,有时收集的数据量太大,人为地将这种分类信息添加到数据中是不切实际的。因此,机器学习对这些巨大任务将会有一定的依赖。
第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:zhangxuefeng

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。