首页 > 人工智能 > 正文

中国证券公司务连续性研究

2008-03-28 13:34:53  来源:CIO时代网

摘要:在证券行业,业务系统的宕机还可能导致无休止的法律纠纷。在当前国内证券行业纷纷进行“大集中”建设的情况下,所有关键性业务系统和数据集中在一个机房内,使灾难和事故对企业的
关键词: 风险


    据IDC统计,美国在2000年以前的10年间,发生过灾难的公司中,有55%当时倒闭,剩下的45%中,因为数据丢失,有29%也在一年之内倒闭,生存下来的仅占16%。即使是企业不倒闭,所造成的影响也让大多数企业难以接受。美国统计的每小时系统下线(系统不能正常运转)所造成的损失中,股票交易系统高居榜首,达600多万美元,是第二位的三倍多。

    在证券行业,业务系统的宕机还可能导致无休止的法律纠纷。在当前国内证券行业纷纷进行“大集中”建设的情况下,所有关键性业务系统和数据集中在一个机房内,使灾难和事故对企业的杀伤力更大。证券行业建设业务连续性系统,实现信息系统的高在线保障势在必行!

    何谓业务连续性

    所谓的业务连续性是一种预防性机制,它明确一个机构的关键职能以及可能对这些职能构成的威胁,并据此采取相应的技术手段,制定计划和流程,确保这些关键职能在任何环境下都能持续发挥作用。而这并不意味着是100%无回报的投入,等待在百年一遇的灾难中发挥关键性的作用,它是一个系统的资源利用计划。

    从实际预防的角度着眼,并考虑到人员、技术、流程等方面的因素,业务连续性应该是一个包含多层次的结构,如图1所示。这个模型表示出定义业务连续性系统必需的层次。在完整的业务连续性系统中,每个层次都不可或缺。另外,这个模型还有一个特点,即每个层次都为上一个层次提供了基础。

    业务连续性系统的技术要求

    从目前国内证券行业的建设情况来看,多数企业都采用了多套电力,网络等保障系统,所有的数据存储阵列都使用RAID容错技术,对于关键性业务系统大都采用了双机集群。因此,在平台完整性方面不存在太大的问题。本文将主要讨论证券业业务连续性系统在存储完整性、数据完整性和信息完整性方面的技术要求。

    灾备一体化 本地的快速备份恢复能保证业务系统出现小故障时快速恢复;而异地的容灾,可以防范大面积的灾难,如房屋坍塌,火灾,大面积停电,地震等情况下的系统崩溃。

    业务连续性系统对本地备份系统的要求是速度快,可靠性高。目前的备份技术主要有磁带备份和磁盘备份两大类。对于证券行业来说,由于数据量相对而言不是很大,因此一般采用磁盘备份技术。对于异地容灾,考虑到证券企业通常有全国性网点和网络支撑,因此,可以根据实际情况选择建设同城异地或者异城异地的容灾中心。

    灾备一体化的关键点是业务连续性系统能整合本地备份系统和异地容灾系统,当出现计划内下线时,备份系统和容灾系统能很好地协调工作,将下线时间降到最短。

    热容灾 从数据完整性的角度来讲,实时热容灾技术是最好的选择。热容灾技术是按照交易来进行复制的,不会产生数据不一致的情况。另外,精确恢复和业务稽查要求采用热容灾技术。因为对于磁带备份系统,数据备份到磁带后,是无法进行“即时”业务稽查或者精确恢复的。因此,对于信息完整性相当重要的证券企业来说,必须采用实时热容灾技术,确保能够通过业务连续性系统进行有效的业务稽查,当发现信息不一致时,可以进行快速的精确恢复。

    合理的资源利用 在业务连续性系统中,可以利用的资源包括两个部分:软硬件设备和业务数据。从投资来看,业务连续性系统的投资比较大,设备较多,但不会创造营业收入。因此,需要对冗余设备加以合理地利用。从业务上讲,在各项应用系统逐渐完善的情况下,今后的业务发展对决策支持系统(DSS)、客户关系管理(CRM)等分析性系统的依赖性会逐渐增加。而CRM/DSS系统乃至报表系统等都需要从业务系统中采集数据。在“生产”条件下,数据采集对业务系统的影响可能非常大,密集的采集和查询可能导致业务系统服务中断。因此,业务连续性系统可以将业务系统的数据备份/复制多份保存,这些备份/复制的数据应该能被分析系统利用,从而实现企业内部的数据共享。

    业务连续性系统的管理要求

    业务连续性系统不仅仅是一套设备加软件的组合,还必须有相应的管理机制与之相配合。这种管理机制可称之为业务连续性计划(Business Continuity Plan,简称BCP)。BCP至少要包含以下内容:

    风险分析 构建业务连续性系统,首先要对企业信息系统所面临的风险进行评估。这些风险可能包括:自然灾难,人为事故、设备故障,软件缺陷等。

    具体就企业的业务系统而言,应该进行业务影响分析,以确定不同的业务系统丧失功能后的可能损失和后果以及需要进行的保护措施。分析的结果应该形成一份目标系统图,根据目标系统图,可以定义出业务连续性系统的各项具体指标,指导业务连续性系统的规划和设计。

    组建执行团队 在业务连续性系统建设的各要素中,人员是最关键的因素,必须根据项目进展的情况适时地组建执行团队,并进行必要的培训。根据职责的不同,执行团队可分为以下几类:管理团队,技术团队,风险评估团队,运营团队。

    制订应急计划 BCP的重要内容是制订应急计划。应针对不同业务系统可能遇到的灾难,制订相应的应急计划,并通过经常性的演习来检验和完善应急计划。一旦发生灾难,运营团队将能迅速启动相应的应急方案,在最短的时间内恢复系统,达到业务连续的目的。

    银河证券业务连续性系统建设经验

    中国银河证券有限责任公司(简称中国银河证券)十分重视证券交易业务系统的安全和可靠性问题,在建设高可靠性证券网络和应用系统的同时,一直在深入研究证券行业业务连续性系统的建设思路,并积极为此付诸实践。

    1.业务连续性从集中存储开始

    中国银河证券近年来一直在进行证券交易集中系统和中央监控系统的建设,分散在各营业部的业务数据被陆续采集到北京总部。由于各种系统之间存在数据孤立、结构分散、接口不规范等问题,这些问题对业务连续性系统建设非常不利。为此,启动了EAI(企业应用整合)计划,进行业务连续性系统的建设。整合存储系统是第一步,银行证券采用SAN(存储区域网络)来建立统一的存储平台。

    通过建立上图所示的统一存储平台,各业务系统的平台完整性得到很大提升,数据管理、系统管理及各种业务管理更加方便,为业务连续性系统的进一步建设打下了坚实的基础。

    2. 利用LANFREE集中备份全面提升各指标

    在进行SAN整合的同时,还采用SnapAssure软件对所有业务系统进行集中备份。SnapAssure使用磁盘作为备份介质,使用磁带库作为归档存储设备,它支持LANFREE的备份方式,并且通过压缩技术缩短备份时间,减少存储空间。通过LANFREE的备份以及利用SnapAssure的优异性能,各项指标得到全面提升,具体如下。

    (1)在RTO(Recovery Time Object)指标上,各系统的恢复时间缩短到原来的1/10或者更短,关键的业务系统如开放式基金系统能在3分钟内恢复。

    (2)在RPO(Recovery Point Object)指标上,开放式基金系统原有的应用级备份在恢复时会丢失1天的数据,而SnapAssure可以恢复到最新状态。

    (3)在RRO(Recovery Reliability Object)指标上,SnapAssure的恢复可靠性在迁移中达到100%通过验证,而以前的备份系统在迁移过程中进行备份恢复时会出现失败的情况。

    (4)在RIO(Recovery Integrity Object)指标上,SnapAssure恢复后的系统可直接投入使用,没有任何数据丢失。

    (5)在投资回报指标上,所有旧的磁盘阵列、磁带库等都被充分利用起来,资源得到了合理的利用。备份的数据也可以随时被抽取使用。

    3. 异地热容灾是最后的防线
 
    关键业务异地热容灾系统的建设,将能最大限度地保护中国银河证券的信息系统资源的完整性、可用性,全面提升信息系统的健壮性,从而构筑起信息系统的最后防线,确保在遇到大的自然灾害或者人为事故的情况下保持业务系统持续运行,提升交易服务的水平,增强公司的核心竞争力。在灾备中心,容灾系统将同时为其他的分析处理系统(如CRM、BI、DSS)提供软硬件平台,实现软硬件设备和业务数据的充分共享和复用。

 


第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。