首页 > 大数据 > 正文

Cloudera:备份与安全,本质是AI经济学问题

2026-03-25 10:32:51  来源:CIO时代

摘要:真正的问题不在于企业是否备份了更多数据或增加了更多云安全控制措施,而在于这些投入能否以经济可持续的方式提升业务韧性。
关键词: Cloudera
Cloudera大中华区技术总监刘隶放
 
IDC《Global DataSphere Forecast》报告预计,到2028年,全球数据量将增长至393.9 ZB。其中,中国市场数据量到2029年将增长至136.12 ZB。这一增长趋势给业务连续性、数据保护与治理以及维护成本带来了更大压力,也使得“韧性”演变为一个AI经济学问题,每新增一个需要保留和保护的数据集,都会增加存储、备份运营、合规成本,以及下游 AI 质量与修复等方面的支出。
 
随着世界备份日(World Backup Day)和世界云安全日(World Cloud Security Day)的临近,真正的问题不在于企业是否备份了更多数据或增加了更多云安全控制措施,而在于这些投入能否以经济可持续的方式提升业务韧性。备份不能被视为一种可以无限扩容的保险。如果缺乏清晰的数据保留策略和有力的治理机制,数据韧性项目将耗费大量资金、增加运营负担,并且难以证明其合理性。当务之急是在业务中断发生时,企业首先应以适当的保护级别保护关键数据,从而实现预期的恢复结果。
 
有治理,韧性才能“有的放矢”
了解数据资产全貌是实现有效数据韧性的起点。企业需要清楚掌握现有数据的具体情况、使用方式以及对应的恢复要求。如果缺乏这种可视性,所有数据往往会视为同等重要,从而导致备份环境规模过大、恢复优先级不明确。
 
治理机制为企业提供了将数据保护列为优先事项的基础。企业根据业务影响对数据集进行分类后,便可以相应地分层设定保护级别。对于其他非关键数据,可以采用成本更低的保护方式,或缩短其保留期限。
 
界定关键数据并不仅仅是技术问题,还取决于业务承诺以及中断后可能带来的后果,例如监管处罚、合同义务、运营风险或声誉损失。当企业基于治理角度做出韧性决策时,数据保护与保留便不再是默认的IT配置,而是与业务风险精准匹配后的审慎选择。
 
别再为劣质数据买单
当数据治理优先级不清晰时,许多企业往往倾向于“以防万一”地保留并备份数据。随着时间推移,这种做法会积累大量几乎没有运营价值的信息。
 
根据《2025埃森哲中国企业数字化转型指数》报告,在中国,仅有29%的企业认为自身数据质量表现优异,反映出大多数企业仍面临数据过于分散、数据质量待提高等挑战。然而,企业仍在持续存储和保护这些低质量数据,导致备份规模不断扩大、恢复过程日益复杂。备份环境越大,在恢复可信业务运行前需要验证和恢复的数据就越多,其影响远不止基础设施成本。
 
在采用AI驱动工作流的企业中,这种影响可能会被放大。治理不善的数据往往直接流入分析管道和AI模型,从而引入噪声,降低洞察结果的可靠性。最终形成一个恶性循环,企业不仅需要投入资源存储和保护低价值数据,还需要再次投入更多资源来纠正这些数据在下游系统中引发的问题,从而“付出双重成本”。
 
恢复测试是检验治理决策在生产中是否有效的关键
只有在能够带来可靠恢复结果的前提下,治理策略才具有实际意义。定期进行数据恢复与灾难恢复测试,可以验证保护层级是否真正符合业务优先级。这些测试通常能揭示关键信息,例如某些已备份的数据在恢复中并未发挥作用,或某些系统需要比最初设想更高等级的保护。测试还可以揭示数据管道之间隐藏的依赖关系,通过数据血缘关系帮助团队按正确顺序进行恢复,从而在无需恢复全部数据的情况下,尽快恢复可信的运营。
 
企业领导可以通过跟踪一组指标即可抓住工作重点。这些指标包括灾难恢复计划是否定期测试、恢复时间目标是否明确设定、测试结果是否持续达标,以及每一轮测试后是否落实改进措施。
 
随着时间推移,这将形成一个强化治理的反馈闭环。恢复测试所获得的洞察为指导清理工作、策略更新和运营改进提供了依据,帮助企业保持备份环境的高效性,并与业务需求持续保持一致。
 
减少数据蔓延,避免累计韧性成本
在混合云和多云环境中,缺乏控制的数据复制会增加需要进行安全保护、治理和备份的数据量。当数据分散在过多的系统、副本及未受管控的路径中时,也会提高 AI 应用的整体成本。
 
因此,将数据迁移至第三方SaaS平台或外部服务应被视为一项深思熟虑的治理决策,而非权宜之计。一旦数据离开受控环境,其可见性将下降,控制措施更难执行,恢复工作也更难协调。
 
跨环境的一致性同样重要。本地部署与云平台需要采用统一的治理方式,避免因碎片化管理和保护而导致的数据集重复、备份环境臃肿。如 Iceberg REST Catalog 协议等开放标准,可以通过提升引擎和数据目录之间的互操作性,减少仅为实现跨平台使用而额外复制数据的需求。
 
其结果是重复数据减少、数据所有权和保留策略更加清晰,备份占用空间更小、更整洁,维护成本也更低。
 
企业领导的关注要点
世界备份日与世界云安全日应该提醒我们,现代企业的韧性并不意味着对数据不断复制或堆砌控制措施,而在于通过有针对性、受管控的决策,帮助企业避免为冗余、过时、琐碎甚至根本未知的数据支付不断增长的费用。
 
治理机制能够优化备份支出、缩短恢复时间并提升 AI 的可靠性。借助这一机制,企业将不再为那些企业不了解、不需要、甚至一开始就不应该保留的数据支付高昂的保护成本。
 

第四十一届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:lijj

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。