首页 > 大数据 > 正文

大数据的关联性,预测的关键

2018-09-18 10:02:09  来源:大数据观察

摘要:在小数据世界中,相关关系也是有用的,但在大数据的背景下,相关关系大放异彩。通过应用相关关系,我们可以比以前更容易、更快捷、更清楚地分析事物。
关键词: 大数据
  在小数据世界中,相关关系也是有用的,但在大数据的背景下,相关关系大放异彩。

  通过应用相关关系,我们可以比以前更容易、更快捷、更清楚地分析事物。

\
  相关关系的核心是量化两个数据值之间的数理关系。相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加。

  我们已经看到过这种很强的相关关系,比如谷歌流感趋势:

  在一个特定的地理位置,越多的人通过谷歌搜索特定的词条,该地区就有更多的人患了流感。

  相反,相关关系弱就意味着当一个数据值增加时,另一个数据值几乎不会发生任何变化。

  例如,我们可以寻找关于个人的鞋码和幸福的相关关系,但会发现它们几乎完全没有任何联系。

  相关关系通过识别有用的关联物来帮助我们分析一个现象,而不是通过揭示其内部的运作机制。

  当然,即使是很强的相关关系也不一定能解释每一种情况,比如两个事物看上去行为相似,但很有可能只是巧合。

  我们可能只是被随机性所愚弄而已。

  相关关系没有绝对,只有可能性。

  也就是说,不是亚马逊推荐的每本书都是顾客想买的书。

  但是,如果相关关系强,一个相关链接成功的概率是很高的。

  这一点很多人都可以证明,他们的购物车里很多东西都是因为推荐而购买的。

\
  通过给我们找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现在和预测未来。

  如果A和B经常一起发生,我们只需要注意到B发生了,就可以预测A也发生了。

  这有助于我们捕捉可能和A一起发生的事情,即使我们不能直接测量或观察到A。

  更重要的是,它还可以帮助我们预测未来可能会发生什么。

  当然,相关关系是无法预知未来的,他们只能预测可能发生的事情。

  但是光是这点,就已经弥足珍贵了。
第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:zhangxuefeng

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。