首页 > 大数据 > 正文

大数据时代 不是所有数据都那么珍贵

2015-06-08 09:44:34  来源:网易科技

摘要:6月8日消息,数据中心不断地被大量数据们淹没,那么作为数据中心的管理员们,能不能就舍弃一部分不需要的数据呢?
关键词: 大数据

    6月8日消息,数据中心不断地被大量数据们淹没,那么作为数据中心的管理员们,能不能就舍弃一部分不需要的数据呢?


    最重要的担心就是怕错过任何可能的有用信息。你公司的营销副总裁很有可能会有朝一日让你提供一份公司过去20年的销售数据。而上面的领导一换,说不定新的数据要求在等着你。


    还有一个非常现实的原因,那就是有些公司会申明永久保留数据,尽管这些数据几年、几十年都没人用过。顾能咨询将其称之为“暗数据”,并将其定义为“在正常经营活动中的信息资产组织收集、处理和存储,但一般不能用于其他用途(例如,分析,业务关系和直接货币化)的数据。这类似于物理研究中的暗物质,暗数据是信息资产“宇宙”中的大部分组成结构。因此,组织或公司经常保持暗数据用作参考资料。”


    那么,到底你是否可以“减仓“暗数据的同时,并确保保留必要的数据? 这里有三个建议。


    1:筛选数据


    如果你使用的是机器或者是互联网产生的大数据,你在得到有用信息的同时也接受了许多无用的垃圾。数据过滤可以分离出你想要的信息。


    2:导出数据


    如果你希望为了将来做长期趋势分析而准备为数据保留个几十年,将这些数据导出到一个值得信赖并基于云计算的供应商是一个不错的选择。这样,在时机成熟时,你就可以自由地将存储的数据导回到你的数据中心进行分析。


    3:定义数据保留政策


    你可以在定义数据保留政策时表现得强势点。你作为一名数据管理人员,有理由来参与和指定数据保留的政策。这是具有优秀数据中心管理能力的一个标志。


    小结


    这会不会解决你所有的大数据存储管理和保管问题?没有,但它会给你的数据中心指明了正确的道路。它还将使你成为一名优秀的数据管理人员,能够宏观地预测数据方向和参与数据保留政策的制定。
 


第四十一届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:tqy

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。