首页 > 基础设施 > 正文

数据中心“瘦身”记

2008-08-22 08:43:38  来源:网界网

摘要: 提高数据中心能效的办法有很多种,其中IT人员对自己企业业务的深刻理解、对IT技术的深度把握,以及创新的勇气是不能依赖外部力量来实现的。GE医疗集团北京数据中心的IT人员通过其在
关键词: 数据中心 存储

    提高数据中心能效的办法有很多种,其中IT人员对自己企业业务的深刻理解、对IT技术的深度把握,以及创新的勇气是不能依赖外部力量来实现的。GE医疗集团北京数据中心的IT人员通过其在建设绿色数据中心过程中的能力和勇气,向我们展现了他们的核心价值所在,也展现了企业的IT竞争力所在。

    在GE医疗集团北京数据中心的30个机架里,共运行着40多台x86服务器和近20台Sun SPARC服务器。而这个服务着7000名GE亚太区员工的数据中心平时的运维人员却只有区区3个人!

    是什么帮助GE医疗集团北京数据中心实现了数据中心的高效管理和高效运营呢?答案是:对虚拟化等新技术、新理念的大胆的创新性应用。

    据GE医疗集团亚太区服务器运维经理马国超介绍,去年,他们在数据中心内部署了虚拟化技术,而今年,又在利用SOI(Service Oriented Infrastructure,面向服务的基础设施)实现生产系统和开发测试系统的整合。新措施帮助他们大幅度地提高了数据中心的利用率和新应用的部署效率,并节约了大量的电费。

    虚拟化将服务器利用率提升50%

    目前,在GE医疗集团北京数据中心的十几个物理服务器上共运行着40多个虚拟机。

    谈到当初部署虚拟化技术的动因,马国超介绍说,主要是希望通过虚拟化能够实现快速的基础设施服务和灵活的资源调配。每到季度末和年末,GE医疗集团的生产环境(如订单系统)都会出现一个高峰值。此前为了应付这样的峰值,不得不为服务器预留出大量的计算能力,而这些计算能力在平时利用率很低,是极大的浪费。

    马国超说,“尽管我们的数据中心空间并不紧张,也有足够的资金来购买服务器,但是我们需要通过虚拟化来实现更好的可管理能力,实现灵活的资源调配。同时可以降低所需要的硬件数量、提升服务器资源的利用率。”

    GE医疗集团北京数据中心的具体做法是,将三台HP DL585构筑成了一个Server Farm,然后在后端连接了SAN存储系统,将所建立的四十多台VMware虚拟机都存储在SAN上面,其中包括了DHCP/DNS、文件服务器、打印服务器、应用开发和测试系统,以及订单配置系统。

    通过Virtual Center管理系统,GE医疗集团可以在这三台DL585之间自由迁移虚拟机,以实现资源调配的需要。平时,三台服务器上均衡运行着各个虚拟机。

    马国超表示,使用虚拟机减少了硬件服务器的管理数量,而且远程操作起来也比较方便。更重要的是,资源调配上会比较方便。“如果是虚拟机的话,很容易增加资源,比如增加内存,增加CPU能力。但是如果是物理机的话,就很难加上这些资源,而且还需要考虑原来的那些配件现在是不是还有,能够扩充多少等等一系列问题。”马国超说,“而现在已到了季度末,订单系统繁忙需要很多CPU资源的时候,就不用再去买机器,直接利用虚拟机迁移、调配资源就可以了。”

    根据马国超的介绍,虚拟化技术的采用使GE医疗集团北京数据中心的服务器利用率从原有的10%提升到了60%。马国超还表示,以往部署新应用,从提出申请到设备到货、安装、配置,大概需要3个月时间,而现在利用虚拟机模板开设一个新的服务器应用,只需要大概1个小时的时间。虚拟化的功效可见一斑。

    用SOI整合生产与开发系统

    根据中国惠普企业计算及专业服务集团首席技术顾问朱伟雄在2007年底的预测,随着SOA的不断发展,市场对IT底层架构的需求已经非常强烈,因为它可以支持各种服务间的通信和集成。2008年, SOI将成为企业优化数据中心、建设新一代数据中心的必要基础。

    那么,SOI究竟是怎样一种概念呢?根据维基百科上的解释,SOI是把IT基础设施作为服务的一种框架体系,它使得IT为业务带来的好处变得可以衡量。这一概念最早是由英特尔提出来的,它的两个关键点在于工业标准化和虚拟化,以便为IT基础设施服务提供资源池。随着网格、服务器和存储虚拟化等技术的迅速发展,SOI解决方案变得切实可行。

    SOI的概念吸引着马国超所在的GE医疗集团北京数据中心,他们从中看到了其实用价值,以及所昭示的未来数据中心的发展方向:站在业务角度看数据中心能够提供什么样的服务,即从用户的角度看数据中心该怎么去做。“我理解的SOI概念是:对于一个企业数据中心来说,不再对用户谈有多少服务器和存储,或者网络的性能如何,而是告诉他们可以提供什么样的服务,以及服务级别是什么样的。”马国超说,他们最初的想法,就是本着贴近用户端感受的思路来理顺IT架构。

    于是,继虚拟化之后,他们开始考虑用SOI整合数据中心。因为,和GE医疗集团生产系统季度末和年底忙碌的特点相反,开发测试系统则是平时比较忙碌。对于开发人员来说,升级、开发、测试工作都是在平时做的,由于季度末和年底要全力保证生产系统的运行,届时将不允许改变系统。

    鉴于两个系统使用的高峰期明显不同,但二者的架构、平台、操作系统乃至补丁都是一样的,所以马国超他们想,如果对二者进行整合的话,不仅可以为公司节省一套系统,还可以省下维护的人力并节约电费。

    但由于SOI是一个比较新的概念,他们在开始准备工作和测试的时候非常地小心。他说,每个供应商都有实现SOI的产品,但并没有现成的一套解决方案,因为SOI本身就是一个大的概念,包含着很多方面的东西。比如,在应用系统前端要有设备监控用户的使用体验,后端则通过管理工具、虚拟化技术等等去保证实现,从而让数据中心变得“透明”起来。也就是说,用户不再感觉到后台的任何变化。而要实现这一点,每个用户必须根据数据中心的实际环境,根据自己的实际需要去做。

    马国超说,对于GE医疗集团北京数据中心而言,如果把两套系统并成一套系统,就需要将其数据库、中间件、存储、应用系统等通通整合起来。由于数据中心原来环境中使用的是Sun的服务器和Oracle的数据库,因此,GE医疗集团在数据库整合时使用了Oracle VM虚拟机,在对中间件和应用系统整合用了Sun 的虚拟化产品Solaris Zone。

    为了保证整合后系统的稳定性,同时不会降低实用性,他们进行了严格的测试,测试的压力达到了年底高峰时流量的4~5倍。

    此外,GE医疗集团北京数据中心决定把存储从SAN转到NAS上。原因当然是因为NAS的成本比较便宜,而且与SAN的价格差别很大。“光纤交换机和模块都太昂贵了,现在NAS技术已经比较成熟,而且我们数据中心里的环境都已是千兆,NAS的使用已没有问题。”马国超说。

    GE医疗集团北京数据中心的可用性是99.6%,而不同地区和级别的用户享受到的服务标准也不尽相同。为了保证整合后系统的性能,数据中心还通过使用应用系统最前端的一些监控工具,实时模拟用户访问速度。当访问速度达不到预设的目标时,系统就会自动报警,维护人员可以立刻去检查。此外,后端还会监控服务器内存、硬盘的使用状况,以及CPU的压力状况,超过预设的值时系统同样会报警。“整个过程中最终用户不会感觉到网络后台的变化,而体验到的整合后系统性能比原来要好,至少不能比原来差。”马国超表示。

    大胆选择  小心实施

    在测试中,马国超他们发现了一些问题,并有针对性地调整了整合方案。比如,实施虚拟化后,发现数据库性能没有单机的好,由于不能完全断定问题出在哪里,他们决定不再用原来拟定的iSCSI而转向NFS解决方案。马国超说,他们使用的是Oracle 11G数据库,考虑到同一品牌产品的相互支持度和优化程度会好于不同品牌,他们决定改成通过 Oracle VM NFS访问NAS存储系统。同时,为了确保稳定性,他们延长了测试时间,决定比原计划上线时间推迟三四个月。

    整合两个系统,要做的事情很多,也会出现很多没有预料到的问题。对此,马国超表示要“慢慢来”,不断积累经验。他的一个重要经验就是,小心谨慎地测试,然后先把不太重要的系统放上去,运行三四个月后看稳定性、兼容性没有问题后再放关键系统。此外,还要和原厂商的技术人员多沟通。

    在记者的采访经历里,许多企业的IT人员都曾表示,由于IT技术变化得太快,他们通常都不会采用最新的技术,因为系统的稳定性会受影响。但是在GE医疗集团北京数据中心,记者发现他们并没有忌讳使用新技术,接受新理念。马国超把这一点归结为企业文化,因为GE鼓励创新。“新技术通常是不稳定的,带来好处的同时很可能对应用的稳定性产生影响。那么,是保持老平台还是大胆采用新技术?我们选择了后者。”马国超说。“当然,这不意味着单纯为了创新而采用新技术,而是要选择企业所需要的新技术,我们会非常小心地测试,非常小心地实施。”

    当然,不断采用新技术和新产品需要IT人员有很强的学习能力。马国超说,他们平时都很关注相关领域的新东西,定期还会邀请厂商来讲新技术和新理念,所以常常是主动采用新技术,而不会犹疑和畏惧。此次使用SOI整合系统对GE集团来说都是新尝试,如果实施得很成功,对美国总部会提供宝贵的借鉴经验。(更多新一代数据中心内容请访问ndc.cnw.com.cn)


第三十四届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。