首页 > 大数据 > 正文

数据仓库必须保障可访问性和可用性

2012-05-24 17:51:08  来源:TechTarget中国

摘要:大多数人都理解企业数据破坏造成的负面效果。在解决数据仓库的安全性方面,有两个特别重要的问题。数据仓库必须能够控制数据访问权限和提供业务持续性和灾难恢复。
关键词: 数据仓库

  大多数人都理解企业数据破坏造成的负面效果。在解决数据仓库的安全性方面,有两个特别重要的问题。第一是,数据仓库必须能够控制数据访问权限(数据权利)。第二是,提供业务持续性和灾难恢复(数据可用性)。


  在数据访问权限方面,系统需要给一些用户分配权限,同时拒绝其他用户访问。在大型数据仓库中,有大量的数据需要保护,并且通常还有大量不同的用户组。系统需要支持端到端作业方式--从分段表到运营数据存储、分析和报表结构。


  此外,敏感数据也存在问题,如个人身份信息(PII)、HR数据和企业敏感信息。相对于其他类型的信息而言,这些数据需要更严格的保护和更仔细的审核,并且会混合到数据仓库的数据结构中。它可能需要进行加密,才能实现足够的保护要求。


  将所有这些重要数据保存在一个位置是非常危险的,因为攻击者可以轻松收集到所有数据。然而,安全性是不固定的活动目标。人们可以来,也可以走。他们会改变工作职责。保持安全性一直是一个挑战。要在多个系统上实现安全性难度就更大。


  注:如果一个来源的信息都很难保证安全,那么想要保证多个来源的信息安全性,难度就更大了。例如,用户可能能够查看人力报告系统的信息,但是无法查看HR系统记录的员工计时工资。尽管如此,这些信息都存储在数据仓库中,所以可以对人力成本进行分析。


  如果一个数据仓库系统能够管理整个数据链,那么它就能够提供最容易管理的数据安全性。单个安全系统更容易维护和更新。保存唯一真实数据的大型数据仓库可以实现最安全的配置。PII可以进行加密或散列化,从而保护各个信息的保密性。此外,数据也可以进行汇总,使任意个体的信息都保持隐藏,且可以在分析过程中使用。


  数据可用性变得越来越重要,因为一旦数据仓库成为企业报表数据的主要来源,那么它就成为企业中不可或缺的组件。这会对几个方面造成影响。首先,它会影响数据备份和恢复。大型数据仓库系统在为用户保证性能时,还必须同时运行备份过程。虽然单个大型系统的备份难度要大于一组小型系统的备份,但是它在备份操作管理和数据保护方面更简单一些。


  注:如果可用时间较短,那么执行大型数据集合的备份和恢复是很困难的。在设计一个大型数据仓库系统时,这些操作所需要的时间必须仔细斟酌。


  其次是可用性。单独的内聚系统可能会成为单一故障点。然而,在大多数情况中,系统可以设计消除这个故障点。这是一个必须认真考虑的问题。首先,数据仓库系统本身要具备应付内部故障的能力。其次,如果远程位置灾难恢复机制适合这种数据仓库,那么系统必须支持远程站点操作。远程站点数据的同步是一个严重的问题,它会随数据仓库的数据量增加而加剧。为了支持大型数据仓库,必须认真对待这些问题。


  再次强调,单一系统的优点在于简化管理。如果一个系统设计良好,拥有清晰的可用性维护过程和流程,那么其24 × 7可用性保持难度会远远小于多个系统。从IT角度看,维护一个系统的难度通常会小于多个小型系统的维护。


第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:zhangyexi

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。