首页 > IT业界 > 正文

加速应用 天河二号采用微异构架构

2013-08-09 13:43:54  来源:ZDNet

摘要:在41届世界超级计算机500强排名榜单上,中国超算力量再次重归全球视野,国防科技大学研制的天河二号超级计算机摘得榜首,成为全球最快的超级计算机。
关键词: 天河二号 超级计算机

    在41届世界超级计算机500强排名榜单上,中国超算力量再次重归全球视野,国防科技大学研制的天河二号超级计算机摘得榜首,成为全球最快的超级计算机,这也是继2009年天河1A登上TOP 500榜首,中国超算系统再次登上榜首位置。


    随着天河二号成为关注的焦点,在近期举办的英特尔集成众核技术峰会上,天河高性能计算机系统副总设计师卢凯、天河高性能计算机系统副总设计师朱小谦、英特尔公司软件与服务集团客户响应团队经理乔楠详细介绍了天河二号设计和技术的细节。


    强化自主研发设计


    跟很多超算系统单纯追求计算峰值不同,卢凯表示,“天河二号”整个系统不仅仅是为了传统的高性能的科学计算来进行构建的,在很大程度上也兼顾了对信息处理、数据分析等需求来进行构建的。“所以天河二号是一个多面手,整个机器从体系结构设计、具体的技术方案设计方面都做了很多的定制化的设计。”卢凯如是说。

\

    天河高性能计算机系统副总设计师卢凯


    具体而言,在体系结构方面,天河二号改变了原来传统面向高性能计算的技术特点来设计的架构,设计了“异构多态”的架构,可以说不仅能够满足高性能科学计算等以计算为核心的业务,因为I/O采用大平台,面向带宽的模式,还面向信息处理等以事物处理为核心的业务,以I/O为核心,异构多态体系结构不仅体现在系统架构上,还体现在I/O和处理器的选择上。


    和天河1A一样,在天河二号的设计上同样在继续尝试自主研发的工作,卢凯举例说明:“比如在国家重大专项核高基的支持下,系统部分使用了自主的微处理器。此外,我们在互连网络方面也继续针对于天河的规模和计算需求做了优化,在软硬件联合优化方面做了很多工作,充分满足未来更大规模的网络系统构建需求。”


    作为整体架构设计的一部分,因为考虑到对于大数据信息处理,卢凯介绍,在存储方面,大数据处理以及科学计算的支持都有很好的兼顾和适配,在软件和系统管理方面,采用了多层次的容错设计,以及机器管理机器的自治故障管理技术等,“这样使我们系统能够及时的发现故障,及时诊断故障和及时处理故障,这比原来有很大的提升。”卢凯如是说。


    除了系统设计和维护做了优化和提升,在新型的编程模型方面,已经将基于“MapReduce”的面向于大数据、信息处理的应用也移到了天河二号上,不仅能够像传统一样支持科学计算,在信息处理,在数据服务方面也使得天河二号具有自身的技术特色。


    注重应用是关键


    高性能计算机大家都知道它最初就像刚才介绍的是越来做顶尖的科学问题的解决的工具,原来在我们宇宙的发现,很多科学计算机理方面做了很多工作。现在来说高性能计算机已经渐渐地走入寻常百姓家,已经不再是王侯家的东西。实际上跟我们生活密切相关的东西都在用,比如说大飞机的研制,石油勘探,还有基因工程、大型装备的设计制造等等都在用。


    从最初作为顶尖的科学问题计算工具,如今高性能计算机已经渐渐地走入寻常百姓家,并且与人们的生活密切相关,比如飞机研制、石油勘探、基因工程、大型装备的设计制造等。“从天河一号开始,通过天津超算中心、长沙超算中心,到目前正在建设的广州超算中心,通过几年工作经验的积累,已经和很多用户都建立了良好的合作关系,从应用来说,天河二号将作为广州超算中心的业务主机,今年年底安装到广州超算中心,主要用于科学计算、工程计算以及信息化的服务等多个领域。”卢凯总结道。


    作为服务广州以及我们国家南方的信息化的建设的计算支撑,天河高性能计算机系统副总设计师朱小谦表示,目前广州的电子政务、地理信息系统都在逐渐往机器上迁移,“此外,我们和广州超算中心正联手在国家的南部发掘各种应用,并积极利用我们的力量来帮助他们,把他们的应用移植到机器上来。”朱小谦补充道。

\

    天河高性能计算机系统副总设计师朱小谦


    同时,朱小谦也强调,目前在国内的技术积累和基础相对还是偏薄弱,对于并行计算课程讲授的大学老师、大学课程以及学校屈指可数,培养出的学生也很难以直接理解和用好如此大的机器,“这样需要我们超算中心的工作人员和我们系统的研制方和英特尔的技术人员联手起来,才能够把机器让用户应用好。”


    微异构架构提升可编程性


    在高性能计算系统的配置中,如果同一个超算系统安装不同的加速器,卢凯表示这样的系统使用非常困难,“实际上编程模型是一种编程的方式,一旦你用这种编程模型编程以后,我们希望能够在最大限度不改动的情况下适用于不同的机器。”


    随着英特尔产品的不断升级换代,但不管安装到任何一个机器上,卢凯表示,程序无需大的改动,这也是编程模型设计的目的和意义,对于使用的用户而言,必须要在机器硬件抽象的程度上和性能损失之间做一个折中,这也是并行编程模型设计中一个很重要的原则。

\

    英特尔公司软件与服务集团客户响应团队经理乔楠


    对于编程模型的担心,英特尔微异构已经是比较方便的结构,所谓微异构是整个系统指令集都是x86的指令集,所以Phi和至强处理器基本上是类似的,两者的指令集是完全兼容的,这也意味着可以把Phi本身当成一个众核的至强处理单元,因此对于一些其他的异构编程模型来说,微异构架构编程开发环境是非常简单有效。


    “不管是计算机相关还是应用本身,两方面都需要提升,英特尔会继续帮助在IT技术的发展,希望系统工具能加速整个生态系统的的应用,这也正是微异构在生态系统的优势,因为不管是传统的编译器、传统的数学库以及传统的性能分析器,对于一些开发人员来说,非常熟悉至强处理器,可以方便地把这些经验在微异构上得到充分的使用。”英特尔公司软件与服务集团客户响应团队经理乔楠总结道。


第三十六届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:fanwei

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。