首页 > 方案案例 > 正文

中科院王伟:中科院信息化情况及规划思考

2015-04-17 11:45:16  来源:CIO时代网

摘要:“新一代IT与教育科研信息化研讨会”在北京中科院计算机网络信息中心顺利举行,来自教育行业的专家学者共同探讨“十三五”信息化规划与新IT时代的教育信息化发展趋势。
关键词: 信息规划

    2015年月11日,由北京大学信息化与信息管理研究中心、中国新一代IT产业推进联盟、北大CIO同学会教育科研分会主办,CIO时代网、北龙泽达承办的“新一代IT与教育科研信息化研讨会”在北京中科院计算机网络信息中心顺利举行,来自教育行业的专家学者共同探讨“十三五”信息化规划与新IT时代的教育信息化发展趋势。


    中科院网络信息中心研究员王伟在研讨会现场为大家带来题为《中科院信息化情况及规划思考》的主题报告,他首先与大家分享了中科院信息化发展历程,主要工作内容是根据“十二五”信息化工作规划:围绕一个目标、抓住两条主线、形成三类云集、提升四种能力、实现五大转变、实施六项工程。从国际形式来看,IT技术架构对科研信息化有很大的启示,围绕云和大数据进行IT资源组织以及围绕移动互联网整合用户应用的混合型技术架构。他还分享了国际科研组织的信息化实践工作以及目前科学院信息化工作的难点与痛点,而“十三五”信息化规划工作给予了更多的启示,为科学院未来的信息化发展规划给予了很好的指导。以下为演讲实录。

\
中科院网络信息中心研究员 王伟

    谢谢各位,第一次参加类似的活动,也是应秘书长的邀请。刚好这个时间点比较合适,因为刚刚进入2015年,我们从去年下半年开始,已经在启动关于“十三五”中科院信息化工作的预研工作,正式的“十三五”规划工作也是在今年春节前后启动了。从去年下半年到现在,一直在回顾中科院很多信息化工作的得失,并且对未来五年如何去做更好的规划,一直在思考这个事情。今天有很多素材是很现成的,包括一些数据,拿出来跟大家分享一下。今天既然是一个研讨会,可能会有一些超出我们预研工作的个人观点,我想今天是一个比较开放的研讨环境,所以有一些观点就抛出来。


    历史回顾。我们把中科院的信息化工作分成三个阶段,中科院还是在信息化,尤其是信息化和科研的结合方面起步是比较早的,我想这也是有一些历史客观背景在里面的。早期来说,除了中科院,还有清华、北大,三家一起共建的NCFC,到后来在1994年能接入互联网,去年是中国接入互联网20周年,这也是中科院早期的贡献。另外,我们院有一些研究所,特别是和国外的联系很紧密,尤其以高能所为代表,87年的时候,咱们的电子和国外的电子通信,据我所知,咱们国家最早的www的网站也是建在高能所,到后来全国能接入互联网之后,陆续建立了中科院建立了中国互联网络信息中心。


    第二阶段,快速发展阶段,从98年到2005年,这个阶段,英国人2000年前后提出了e-science的概念,中科院也是很早的就跟进了这个概念,目前我们把它翻译成科研信息化。另外也提出来ARP,也是意识到信息化对整个组织内部资源配置和流程管理的重要性,仿造企业的ERP的概念提了一个ARP。从“九五”开始,单独把信息化的规划作为一个单独的专项开展,“九五”到“十二五”,连续四个五年一直在做这方面的工作推进。


    第三阶段,全方位的推进阶段,大概就是从2006年开始,提出数字化的中国科学院的目标,到目前为止这个目标仍然存在。从“十一五”规划提出353的目标,到“十二五”提出了123456的目标,一直到现在。现在“十二五”还没有过去,就看看“十二五”我们在做什么,总目标叫123456,建成信息化的科学院,其中有两个重要的主线,一个叫科研信息化,一个叫管理信息化,管理信息化是围绕着科学院内部院所两级的管理体系,也就是院层面和130多个研究所,院所两级。科研信息化确实是想发挥信息化的手段对科学研究本身的成果创新,成果发现的支撑。因为“十二五”规划,应该是在2011年开始,当时提出了三朵云,现在往回看的话,这个概念跟得还是比较紧的,分别是管理云、教育云和科技云,提出了四种能力、五个转变的要求,最终是通过六个工程来落地的,第一个是科研信息化应用的推进工程,包括一些重大基础设施的建设,并且强调重大基础设施和科研活动的结合。第二个是科技数据资源整合和共享工程。虽然当时是大数据的概念,但是仍然是把这个数据,或者跟科研相关的数据资源单独的独立出来。第三个是信息化管理与决策支持工程,这个就是管理信息化,或者叫ARP。第四个是信息化继续教育与科教融合工程,因为我们科学院讲科教融合,我们目前有三所大学,除了原来的中科大,还有国科大,还有上科大,除此之外,关于员工的继续教育,内容都涵盖在这个工程里面。第五个是网络化的工程传播,这个其实是科学院的职能之一,所谓的公众科学传播,其实就是科普。最后一个是把网络安全保障和服务工程单独拿出来,作为另外一个维度的工程。


    除了六个工程来建设三朵云之外,还有一个很重要的工作,关于科研信息化战略研究,信息化和科研的结合很早在英国,2000年前后就提出来了,我们很早就介入了关于e-science的跟踪研究,这两年我们内部研讨经常说,科研信息化,在国内它的地位或者说重要性一直没有得到很好的彰显,一直没有叫响,国内没有一个叫响的信息化工作,除了科研信息化有它自身的特点之外,关于这方面的研究或者声音,我们也试图把它提到更高的理论高度,并且能够把这方面的研究推送给国家的相关部门和国家领导那边去。这几年也是先后承担了很多关于信息化专家咨询委的课题,关于信息化科学战略的课题。


    关于科研信息化,我们也是想开放去做这件事情,所以我们每两年会举办一个全国性的科研信息化的会议,最早是在2009年,当时第一届叫科研信息化论坛,第二届和第三届,从2011年开始把它叫做科研信息化发展研讨会,每一届也是很感谢,除了咱们院之外,还有教育部、科技部、工程院和信息委一起来做这个事情。


    以上的工作,会有系列的信息化专题报告出来,包括每年出版的中科院的信息化评估报告,这是我们对内的,自身院里面130多个研究所做得怎么样,每两年会出一个中国科学院信息化发展报告,这是对于院外的,介绍中科院信息化发展的进展。也是每两年出一个中国科研信息化的蓝皮书,是专题反映咱们整个国家科研信息化的情况,前两个都是中科院的。最后还有一个不定期专题报告。


    首先看一下中科院信息化发展报告,刚才说的每两年对外展示的一个窗口。涵盖从整个国际科研信息化和咱们国家科研信息化发展的态势,接下来分别从科研活动的信息化、管理的信息化、教育的信息化这三个层面,去把我们认为有特色的东西展示出来。接下来围绕网络安全会有专题,最后会围绕一些重大应用,我们觉得有特色的案例拿出来。


    对于内部评估上,我们每年在做,这项工作连续很多年以来,我们觉得这项工作对于信息化工作还是有相当促进的,从最近一次的中科院整体信息化评估报告来看,2014年的。从最早2010年到2014年,还是有明显进步的,同时它的标准差也是在逐步缩小的,虽然发展不平衡的现象永远存在,总是有的所做得好,有的所不管是由于历史原因,还是学科本身的特点,可能不太需要信息化,总是有差距,但是这个标准差在缩小。从各个研究所信息化得分的情况来看,分布来看,低分段,60分以下的研究所数量较“十一五”期间有明显的减少,中分段,60到80分的分布逐渐的往高分段,80分以上在迁移,高分段的研究所数量从原来的“十一五”期间的5家,增加到13家,低分段从26家减少到16家,也说明不仅是总分在提升,它的分布也是更加的合理,或者说更加的优化。


    从研究所在分线上平均得分的分布来看,各个研究所,因为信息化有很多工作方向,在教育信息化应用,ARP,数字文献以及网络与IT设备环境方面,一直是处于较高的发展水平。在信息化管理,信息化安全保障,数据应用环境,协同平台和科研信息化典型应用方面,相对来讲比较低,但是也是有所提升的。各个单位在各个所的网站,网络科普,融合通讯,以及管理信息化典型应用方面有比较大的波动,这方面我们会继续加以注重。


    接下来我们给大家介绍一下我们从去年开始对下一步整个科学院信息规划的思考。首先,仍然是看看外界的IT技术架构对科研信息化的启示。我们觉得整个通用的,现在业界的IT技术架构可能有三个层次的特点值得注重。一个是基础设施云端化的架构,另外一个是大数据驱动的智能化的业务,三是泛载接入的移动化场景和个性化应用。以谷歌为例,我们认真的把谷歌的服务梳理了一遍,发现基本上都是可以割裂的。主流IT商业技术架构有一个趋势,围绕云和大数据进行IT资源组织,围绕移动互联网整合用户应用,这种混合的架构,应该是一个主流的方向。回过头来看,我们在“十二五”初期提出三朵云,方向是对的,但是在实际操作过程当中,存在一些或多或少的偏差,或者说没有达到我们一开始的理想效果,这个我们往后再去分析。从国际上来看,我们一般会把美国的Cyberinfrastructure拿过来作为我们的参照系,从最初2002年提出Cyberinfrastructure这个概念,到最近2014年对Cyberinfrastructure我新的课题发放,或者说它的指南来看,整个里面的内涵也是在变化的。从最早Cyberinfrastructure聚焦在网络化,计算,数字化这方面的基础设施,到中间提出来关于一些工具,软件工具,数据分析,虚拟组织。再到最后,强调所谓的数据驱动性,再到最后,强调所谓的再投资,我觉得这是一个螺旋上升的过程,刚才很多专家说云大物移,也是从CI,从Cyberinfrastructure的角度来说,都涵盖了。这个是坚定了我们继续沿着云和数据这个方向,计算密集型的驱动科研和数据密集型驱动科研这两个属性去走的信心。


    从国外的一些实践来看,我们找了一些比较有趣的案例,第一个是美国国立卫生院,当时我们研究他,拿他当科研机构CIO的案例去分析。首先,它有CIO机制,它的CIO在它的决策层里面。我记得前一阵我看了教育部信息中心有一本教育信息化的杂志,里面有一篇文章是关于美国高校CIO制度的探讨,里面也提到了,美国高校的CIO一定是在他们学校的决策层里面,不仅仅是做一个信息方面的管理者,更多的也是在整个机构的高层的决策层里面。同时职责也比较有趣,CIO一方面是在研究院的决策层里面,另外一方面,他同时兼着CIT的主任,换句话说,像科研院内部的信息化,除了网络中心,还有国科大,打一个不恰当的比方,好比网络中心的主任,在院的院长办公会里,这个差距跨度有点大,这个确实是跟咱们国家不太一样的结构。


    另外工作内容也比较有趣,就管四个方面,一是技术采购,二是安全与信息意识,三是技术政策和检查,四是技术架构,传统上相对来说,把技术采购这一点看得更明白了,他并不是冲到第一线,去像我们一样,去发放项目,通过项目管理来做这个事情,他是通过技术采购。对技术政策,另外是检查这方面,他强调的是比较多的,有政策必然是有相应的检查。我们现在,刚刚说了我们有评估,每年都做评估,但是评估更多的像是参考的指标,而没有一个强力的对政策执行度,和把握度的反馈。他同时兼CIT的主任,保证战略实施的一致性和执行力,具体的就不展开了。


    第二类的研究机构就是马普学会,它和NIH特别不一样,它没有设立统领马普全系统信息化的独立机构,没有一个所谓的大而全的,像刚才的CIT。有四个部门来负责这个事,马普有图书馆,信息结算服务工作组,计算中心,以及数据处理协会,分别就信息化基础设施、高速连(音)计算,信息检索,数据处理来设立,来提供服务。我觉得这个和马普本身的特点也是相符的,为什么呢?不像NIH,马普就是围绕着前端领域去做这个工作,这些领域的科学家对信息化的需求更多集中在基础服务,包括设施,包括技术应用,数据文献的检索。可以想像,如果一个研究物理,做一些天文的科学家,他可能不太希望信息人员三天两头跑过来打扰他,只要把基础服务提供好了,剩下的事情他会自己去处理和研究。


    接下来是BOE,美国的能源部,他是建了ESNet,美国能源部构建的世界领先的,他的定位是世界领先的网络基础设施能力和工具,由劳伦斯伯克利国家公开实验室进行管理,也是投了很多钱,2009年投了6300万进行骨干网的计划,2012年又投了3400万,2013年的运维费用就是3200万。它不仅仅是一个高速全能网络,通过这个高速全能网络把DOE下属的十大国家功能实验室超算和数据处理大规模的,信息化的承载装置全部连接了起来,通过他们完成前端重大的任务,这儿列了一下,核、清洁能源、光源这方面的研究,这是另外一种不同类型的科研信息化的实践。他很简单,就是聚焦重大的工程研究,就是大规模的超算,大规模的超算必然涉及海量的数据传输,就需要这种一流的基础设施来建设,投钱去建这个事情。


    最后还有一个案例,美国的SSA,他有一个特点,就是双跨,学校的教授一定要跨到SSA里面某一个计算组里面,薪水都跨,大概学校发八个月,剩下四个月是计算中心来发,通过这种方式,迫使教授必须要交叉,必须要跨,把研究团队和信息化团队紧密的结合在一起做这个事情。


    看完国外之后,我们就发现林林总总,这说明什么呢?信息化仍然要以应用导向,它的业务需求为驱动的工作。从刚才的四类不同的科研机构来说,他们实践的方式完全不一样,对于科学院应该怎么搞?科学院本身的模式又和他们不一样,我们是一个庞大的,换句话说,刚才四类的科研工作我们都会涉及的机构,我们应该怎么做呢?先看一看我们都有什么问题,我这里节省了一些问题,很多问题没敢今天拿出来,有一些太过尖锐的问题就内部消化了,有一些可以跟大家分享的就拿出来了。


    管理信息化,我们做ARP做了超过十多年了,但是对于管理信息化,ARP系统,其实各方面的反馈,首先领导会肯定我们的工作,但实际上各方面反馈并不是特别满意。我们分析了一下,未来应对架构过于紧耦合,一旦发生什么调整,比如说科学院要面向“四个率先”要做体制机制改革,发现这个系统结构很难去改变。支撑职责部门,院里机关,支撑各所,支撑大学,这方面的数据支撑是没有打通的,操作复杂,用户体验有待提升。这方面我想再提一下,刚才奉总说的用户和客户的关系,确实我们也存在这个问题。你把信息化纯粹的当成项目去做的话,这个项目的甲方,院领导,院里的主管机构,他就是我们的客户。但是最后的使用者,其实是所有的一线普通科研人员,院领导在他实际办公的时候,他的身份就是一线科研人员了。他的体验,和项目对工程的要求,和用户体验的时候,他的诉求是不一样的,这是一个。另外,反过来说,ARP里面,也有一些功能是围绕着ARP用户去定制的,比如说院里面有一些主管的司局,他有一些一线的需求,直接会把我们拉过去做一些专项开发,但反过来说,你完全满足他们的需求,对业务可能也仍然有差,为什么?每一个机构用户,他的诉求和全院总的管理,比如说我们说到了数据开放是老问题,流程之间要打通,这中间也是有矛盾的,完全满足用户可能和业务之间仍然会有差,这个也是困扰我们科研信息化,我觉得是困扰科研管理信息化的一个问题。


    从院里的信息化评估,会有一些数据抽上来,各个研究所,分院,学校,国科大,执行机构,仍然反映融合通讯应用,安全,还有典型应用是不够的,换句话说,我们投钱建了很多基础设施,网,大机器,存储,也开发了一系列的工具。但是,首先是觉得没有融在一起,总觉得有很多小工具,每个都能解决一部分的问题,这个可能还没做好。在安全方面,实际对应用的驱动方面,这是不够的。


    带宽是一个老问题了,永远跟不上,对于数据中心,全院建了院里的大数据中心,规模很大,从实际应用来看,各个课题组或者研究所仍然倾向于把数据放到自己的自留地里,不会放到院里统一的公共服务平台,这里可能会有技术上,应用体验上的问题,或许也要在政策和机制上,数据孤岛的问题才是后面的核心问题。


    从需求来说,我们目前应用的比较多的27个信息服务做了一个排名,发现都有人在用,虽然应用率有高有低。说明,科学院内部的研究人员,他们的需求确实是比较多样性的,27个服务都有人用。用得最多的接近100%的依然是网络接入,管理信息化,ARP和邮箱,这给我们一个启示,以网络接入为物理入口,以ARP,管理信息化,谁也逃不过,为应用入口,以邮箱为身份入口,或许可以以这个思路,把现在这么多几十项的应用服务能统一起来。


    每年从各个研究所都采购了非常多的机器,这个机器,不能说它是浪费,大家也都知道,很多时候采购是因为课题说我要买机器,一定要把这个钱花出去,买掉。问题是买完之后,怎么借助虚拟化和云端化的技术,让这个资源形成有偿的流转,这个事情是后面的核心问题,而不是虚拟化技术本身。我们也调研了,未来科学院要做“四个率先”的机构改革,几个比较有代表性的大机构,他们也提出来,我们经常说云,之前说要建管理云、科技云、教育云,实际上对很多具体的云的机构来说,需要的是他的私有云,出于种种原因,保密的原因,或者说是机构之间合作,内网沟通的原因,他们需要对私有云的模式,或者说一个公有云,在给定环境下的快速部署的变形,这个是他们最需要的。


    最后讲一下我们在做学术咨询研究项目里,课题组里做的,对科学院内部不同学科的信息化融合程度的分析。刚才说了,我们举了国外的很多案例,科学院可能都有,通过我们的一些分析,把他们分成四类,高度融合性,这个学科和这个信息化,信息技术是完全合在一起的,适度融合,应用结合,松散耦合,这四类对信息化的需求差异非常明显。高度融合型,对信息技术,是适合公共平台的需求对象,硬件需求最热。适度融合型,要求获取更多的文献资料,数据获取方式,对研发自主的知识产权的转变工具比较低,例如马普。第三是应用结合型,技术支撑和数据共享机制,他自己做不了很多事情,需要我们做具体信息化应用开发的去支撑他,此外对数据共享也是有需求的。最后一个是松散耦合,各方的需求都很多样,相对来说执行的是开发软件工具。


    种种,给了我们在做“十三五”信息化规划的时候有一些启示。首先,国际经验与我国实践相结合的先进IT治理体系,奉总讲得很多了,我们的EA架构等等,不管怎么样,仍然相信传统的惯性,咱们国家传统的科研管理体制的惯性是存在的。需要有一个相对适度的结合,完全变成NIH那种很强力的CIO,可能不太现实,但是至少这是一个方向,值得我们去努力。


    第二个,与时俱进的信息化的技术路线和服务架构,这个不多讲了,这是对于信息技术人员来说的。


    第三个,资源投入和科学合理的政策保障,这里面通过稳定的资源投入,我在这里要解释一下,并不是说院里要不停的投钱,而是说既然我们现在已经进入了互联网+的时代,一方面我们是内部去做,另外一方面,让很多社会资本,他其实也是在寻找和我们的合作。因为现实已经是这样了,很多科学家,包括很多院士都说,不是说我们的数据不好,有的院士说百度的云存储很好,云盘很好,我就用它,反过来说,我也可以从科学院的数据管理,或者安全的角度来说,完全商业化的运作也存在问题。但是我们完全可以和他们合作,他们免费的或者低成本的推他们的工作,从我们用户的角度,可以把外部资本引进。


    第四个,分类改革和一线需求双重导向的产品设计和应用创新。整个“十三五”科学院所谓的“四个率先”分类改革是重中之重,相应来说会引起很多研究所组织结构和业务逻辑的大调整,针对他们可能要做一些重点的产品设计。另外一个,仍然是一线,这个可能和咱们整个国家的信息化发展都有关系,经过这么多五年的持续投入,其实在纯粹的硬件基础上,我们觉得水准和国际相比已经到了一定阶段了,接下来就是怎么和一线的,不管是管理人员还是科研人员应用的结合,这个结合不见得要开发一些所谓的高精尖的设备,或者是软件,有时候很多应用,可能就是轻量级的应用,但是他就是能解决一线人员的需求,这也是我们应该去倡导的。


    最后,提出了方式有度,推进有序,迭代改进,重点落在迭代改进这儿。信息化的技术和服务模式,真的是太快了,以目前“十二五”为例,“十二五”初期云还是一个新概念,中间移动互联网发展的这么快,大数据又出来了,“十二五”初期做的规划执行两年之后,发现它已经不太跟得上时代发展了,在做“十三五”的时候,这一点可以在执行的节奏上、方式上应该是加以借鉴。  谢谢!
 


第三十四届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:董光帅

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。