首页 > 云计算 > 正文

罗铁坚:云计算带来的新应用范式

2017-01-11 15:04:36  来源:

摘要:2014年1月12日,由北京大学信息化与信息管理研究中心主办、CIO时代承办、北达软协办的“第四届中国云计算应用论坛”在北京大学英杰交流中心隆重召开。
关键词: 云计算 信息化
  2014年1月12日,由北京大学信息化与信息管理研究中心主办、CIO时代承办、北达软协办的“第四届中国云计算应用论坛”在北京大学英杰交流中心隆重召开,来自业界二百余位专家学者、各行业CIO代表和媒体同仁们参加了本次论坛活动,本次活动的主题为“云时代的商业与管理”,到场的专家学者也纷纷与大家分享了云计算时代的崭新话题。

  在下午的论坛上,中国科学院大学教授、博士生导师罗铁坚教授首先为大家带来了《云计算带来的新应用范式》的主题演讲,在演讲中与大家分享了云计算的五类技术与应用服务模式:云虚拟化技术、信息基础设施服务、应用平台为服务、应用软件为服务、云优化服务。特别与大家分享了云计算带来的新的应用范式,并对中国云计算发展现状的调查结果一一作了分析解释,同时分析了云计算的十大机遇与困难。以下为演讲实录:
 
  \
  中国科学院大学教授、博士生导师 罗铁坚
 
  首先感谢北大提供这么一个平台,让我有机会与各位交流一些我对云计算的学习、研究、思考和认识。今天下午将从信息技术发展、云计算的应用、技术应用的特征以及云计算应用与新模式这四个方面与大家分享。
 
  60年的计算机发展历史可以从这个片子给大家一个非常清晰的景象和趋势。从早期的终端模式、单机操作系统,窗体用户界面的系统、互联网再到今天移动互联网终端、云计算和大数据,给我们带来不仅是简单的计算能力和办公工具,而且让我们带来新的生活方式,获取知识的新手段、解决问题的新方法,甚至是新的科研探索的新范式。值得大家注意的是,构建一个现代大系统,绝对不是一个个简单部件的叠加,它是各种部件的有机组织和丰富的表达。这也是云计算给我们带来丰富体验的一个重要原因。
 
  如果从信息媒介的角度观察人类交流和知识传播的方式,回顾历史,我们也发现,从最早的面对面交流到今天有这么强大互联网交流平台和技术体系,给我们带来的不只是简单缩短距离问题,更重要的是使我们能更有效组织人类收集的数据和产生的信息、知识,并更快地激发我们的想象力和新思想。新思想和群体智慧的交互激荡,帮助我们创造更加美好的未来。今天的云计算、互联网、大数据的到来,不是简单IT技术的演化结果,而是人类各个学科发展的集大成的重要成果,而且也将不断的完善和提升。
 
  信息技术发展有其独特的演化过程,媒体的报道多数关注IT技术的市场占有和及其经济价值,但很少谈论另外的两个力量:大量的工程实践和长期知识资产积累。如果没有坚持不懈的研发活动,不可能有相应的经济价值的产生。所以,我想提醒大家,今天我们所讲的云计算等IT技术的成就,实际是我们的前人,特别是计算机科学家们在过去60年不断的耕耘才的结果,并不是一夜之间突然产生的。
 
  互联网可以让我们随时随地获取数据、信息和知识。特别体现在2005年一个重要事件的发生。维基百科创始人经过5年的坚守和努力,终于有了一个互联网上的百科全书,这种动态实时大众更新知识的模式,根本的颠覆了以大英百科为代表的传统积累和评价知识的方法。信息技术发展首先通过工程、科学研究来产生知识资产,这些知识资产被市场采纳以后,会产生了强大的经济价值和社会影响。
 
  我们经常质疑的一件事,今天我们做的IT的学科本质到底是什么?回顾一下前天的科学技术大奖,大家看到获最高奖人机会是“80后”,即80岁以上,而只有唯一特例,北大王选先生获奖时年为65岁。另外一个唯一是只有他是做IT的。那为什么我们国家目前还没有出现获奖人员发明的技术超过王选的IT技术呢?是否IT技术本身就没有传统的数学、科学、工程等学科那样的令人接受的科学范式呢?这就促使人们回顾和比较传统科学研究范式和计算技术范式。从5个维度来看这些学科范式,即问题提出、形成概念、解决问题、验证结果到实际应用。它们的本质区别在哪里?
 
  从数学这个学科看,首先要给研究对象一个定义,然后提出研究对象之间存在某种关系的定理。比如四色定理,这个定理也要经过证明、解释和应用这些环节。四色定理的典型应用就是任何地图中所有国家边界划分都能用不超过四种颜色来划分。科学学科,如物理、化学的研究范式与数学有所不同,这些学科的研究不是说不需要数学,而是与数学学科的要求和评价标准不一样。我们首先要观察现象,发现某个可能的规律后,就归纳假设。比如说,月球绕着地球转的,有了这个假设,就要提出相关模型,接下来,我们收集数据和进行验证。至于工程学学科的范式,首先要有需求,即要构建什么物理系统或产品种类,提出系统或产品的规格说明书(什么特性和指标),比如我们建大楼,会说到这个大楼是商住的还是报告厅等。再来构建原型,最后构建具体的物理系统或产品。
 
  众所周知,数学、科学和工程学科的范式得到人类认可和遵守,也就是对它们的价值和贡献,有比较一致的认同。每个人从小学到研究生毕业,对这三种学科范式无人质疑。从我的观察、研究和经历的事件来看,大多数人不认可信息化有其自己的范式,但计算机学科的确有其范式。计算机科学家们提出了自己的观点,分享这些观点对大家理解信息化和云应用模式有帮助。
 
  如果刚才讲的5个维度去看了计算、信息化、云计算及应用范式,到底与数学、科学、工程学科有什么区别。这些区别就是不同价值定位和评价指标。从问题提出角度看,我们研究对象是观察或设计系统的信息处理过程的表达。我们设计什么呢?比如相关计算模型或算法,这些模型或算法是刻画要设计系统的信息处理的过程和系统行为。
 
  从一个大家所熟悉的例子看一看,信息系统的行为模型和信息处理的算法是如何重要。如果我们把在火车站售票员的购票系统界面和流程用简单地用到互联网上,那肯定就会失败了。我们暂且不考虑系统架构的合理性问题和火车运力资源的有限问题。这个售票系统的模型应该对用户购票行为进行建模,也就是说,他们的使用模式或过程是什么?特别是抢票软件的信息处理行为。如果不能比较科学刻画这些行为和处理过程,你设计将有漏洞。这个可以解释为什么现在的12306失败了几次的重要原因之一。这一点看起来很抽象,但确实有别与其他学科的范式。我们应该按这一准则寻找价值点、努力方向和评价指标,就是在计算学科的独特范式。
 
  因为有了这些独特的范式和评价指标,我们就可以对该学科的贡献有一个大家认可的标准。这是我在ACM里收集的1983到2012年获奖软件集合。这个计算学科领域里到底有什么值得大家骄傲的贡献?这些智力贡献中,大家比较熟悉的是操作系统,如UNIX,数据库和若干应用软件。我介绍一个大家不熟悉的例子,如果没有它的智力贡献,就没有今天的云计算和丰富的互联网应用。即第18个是远程过程调用的创新发明,这个是在1982年一个博士生想出来的,他的想法就是如何去让两台计算机资源和运算任务互相能够调用使用。这些贡献中也有大家看到比较熟悉的WWW服务器,浏览器等。
 
  在这个获奖的列表中,标红字的是大家都熟悉的软件系统。我们可以肯定地说,如果没有这些发明创造,是没有今天的互联网,云计算和大数据的工具软件。计算学科经过60年的演化和发展,已经积累了很多大系统的基本模块或子系统,我们不仅仅是关注这些基本系统的扩充和创新,我们更应该用它们作为基础构建块,来创造更大更有意义的系统;这就是为什么出现云计算技术的原因。如果仅仅盯着单个系统的研发,是没有发展前途的。我们并不是说,不要改进单个系统质量,但是更应用其研究和建立一些有意义的大平台和大系统。
 
  从上面的历史分析可以看出,云计算技术的出现不是偶然的,同时,学科的评测指标也发生了变化。计算学科的成就有两个根本的判断标准。第一条,我们需要设计和验证有用的系统,即是否有用;第二条,我们可不可以用最低成本最高效率实现这些系统。
 
  从这个图表,我们还可以看到计算学科的成果评价指标的变化。从摩尔定律到页面点击、算法分析再到每页用户数;还有其他指标的变化,希望大家认清这些变化。如果我们今天还说考核云计算中心的时候,只报告有多少CPU,有多少个带宽,有多少存储容量的时候,实际是用过时指标评测,我们应该用右侧的指标,到底提供多少有意义实体,提供是不是发现网络关系,是不是提供用户的贡献内容等等这样的一种指标来衡量云计算平台的好坏。另外一个数据,可以看到很重要的趋势,就是我们的全球财富100强企业80%属于这一列,意味着大家已经认识到它的重要性。另外比例不断提高,北美、欧洲比我们快速,有60%,而我们3%。可以看出中国市场潜力很大。2012年云计算白皮书中有一个关键句子:云计算塑造了信息资源的集聚和掌控优势,将成为国家竞争战略的制高点。如果我们利用云计算把大量的经济运行、社会服务等方面信息汇集起来,那么这个时候我们的信息资源掌控程度就高,也就间接地提升了国家竞争力。所以说,云计算已经不是企业挣钱的事,也是一个国家的战略。特别是斯诺登事件出现以后,我们如果在这方面不占有一席之地的话,我们的信息将被别人掌控。
 
  这是一些云计算的应用和厂商情况。大家非常熟悉这个云计算的参考模型图,很多教科书都会讲到这个图。这里我希望大家认清两个事情。第一点,我们讨论云计算的时候实际上有几个角色是常常被忽略的。一般来说只知道有消费者的角色和云服务提供角色,却忘记了或者容易忽略了审计角色和云的代理角色,因为这两个角色一个是守护神,一个是创新的催化剂。这里看到的是,大家已经耳熟能详的是IaaS、PaaS、SaaS。大家都知道,云计算的一个流行观点:即云计算三国模型。我不同意这种观点,不是分久必合,合久必分问题,实际是基于人类应用、计算机和应用技术成就的一个集大成。现在已经不是终端时代,但是终端不等于没用,只是在构造云计算含量占的成分是降低的,但是不等于没有。所以大家可以利用系统规模、服务模式这两个维度指标,去检验一下某种系统或服务是不是属于云计算。我很遗憾地看到有些企业把自己的产品带上云计算的帽子,带着移动互联网的帽子去销售他的产品,希望你们能辨别与区分。
 
  我碰到一个做抄表器的厂家,我问他干什么?他说在做物联网。如果没有云端的支持和相关应用,一个抄表器是构不成一个真正的物联网。大家一定注意在云计算的新应用模式中,如果还是用过去指标体系来度量这个应用,那么我们又回到原点,或者回到以前单机时代。
 
  从规模角度看,如果我们在云数据中心里面,没有万级以上的机器,没有百级以上计算机机群,没有多数据中心,没有支持上万G记录,没有分布式系统,没有面向数据中心编程模式或API。我们可以判断,它们基本上没有用到云技术。从服务的角度看,还有一些基本特征,比如说可不可以自服务,可不可以按需服务或服务可测量等等。
 
  比较典型的五类云计算服务包括:虚拟化、基础设施、平台服务、应用软件、优化服务。大家比较容易忽略的是最后一个。最后一个是云优化服务,大家觉得这个太抽象,其实并不抽象。举例子,如果说一个云现在只支持10万用户,那如果要增加至2千万用户时,我是不是还能继续支持?如果说不能,就说明你没有真正的去用云优化服务。再举个例子,现在订票系统是没有真正做到云的优化,如果做到的话无论多少个人访问,只要增加一个更多硬件设备就可以了。如果他做得好的话,我们现在100台机器,每增加一台机器就可以让它支持我们10万个人,那安装10台就是100万人,按照峰值进行调整硬件设施或网络通道的设置。
 
  大家比较有共识的云计算核心技术有6个。其中包括编程模式、海量数据分布存储技术、海量数据管理技术、虚拟化、云计算管理平台管理技术以及信息安全管理技术等。云计算中有三个重要的学术思想。第一个是在2000年时谷歌创新出来的。Google当时两件事情:由于当时没有钱买大型机,促成了第一个创新,即如何用低成本单节点,构建机群来完成大型机才能够做的事情。由于没有钱买Oracle数据库,促成了第二个创新,另外通过多个单节点廉价服务器,构造一个分布式系统完成传统数据库不能完成的大规模数据分析处理的事情。第三是有一条经济学原理起作用。这条经济原理说,如果设备自购拥有,独享使用,会贬值快且维护费用高;如果按需购买租赁使用,这点很好,但有一个前提,要依赖于服务者提供可信度和技术实力,你要租用但要相信它,同时还能支持技术实力升级。比如我们看到很多政府放了一个云在那里,如果他没有队伍,没有技术维护,仅仅是放了一堆硬件在里面,这就是他们所说的云,你租它,崩溃了没人管,这个时候是很麻烦的。这两条是有前提,不是说云做好了就没有事了,他还需要后续的一些技术作为支撑。
 
  我们剖析两个经典案例,大家看到两大云领导厂商,就是云计算的领导公司,他们打法不一样,但是不管怎么样,他们的线路很清晰,比如说亚马逊做的是给人家提供基础设施服务。她们有多余的设备可以租出去,不提供应用系统,只给API。而谷歌也给API,但同时也给应用系统。这里就是两个不同技术体系,但是同样是按照自服务的方式和提供基础环境服务。
 
  从应用模式来说大家很关注一点,如果从应用模式来说,我们总结起来是从传统开源、业务外包、服务形势软件、互联网。美国斯坦福大学教授,写了一个7种清晰商业模式的云,他分析了现在云计算的7种模式,不管哪一种模式,大家可以看到无非是成本与服务模式以及他们之间的平衡关系。你想使用哪一种,你需要怎么支付,最后给用户提供什么样的服务,有什么样的费用发生,你都要做权衡。
 
  另外云计算有两个重要特点:第一个,云计算更新频率,大家知道谷歌每年360次更新,他的更新频率是很大的;另一个是云使用规模,从原来的少用户到现在的多用户。我想给大家分享一件事,在研究过程中,云计算不是免费的午餐,有很多问题需要克服。我们很多人说云一来什么时候就可以下雨了,其实不然。当然这些问题是对于计算机服务商,或者说计算研究单位来说的,用户看不到。但是你要有一个警觉,哪些事情解决了,哪些没有解决,不要受忽悠,我们要理性思维。比如数据丢失问题,被云平台锁定问题是不是帮你解决。
 
  我举最简单例子,假设我有原先的邮箱是在163,我要进单位邮箱,或者从雅虎迁移到谷歌,看能不能自动迁移,这里就需要保证我的数据不泄露,还有传输成本问题。信息发展实际有大数据大系统云时代,我给大家提示一个过程,我们很多一讲到大数据时候提出一个Hadoop和Map-Reduce,其实这两个只是在大数据云计算里选件,不是只要有这些东西就是云。另外,Map-Reduce 也有其本身局限性,比如全局状态变量的维护失效问题。不要认为只要装上Hadoop就是云平台。 还应该看它能处理什么交易数据,处理什么交互数据或实时数据,能多快完等。
 
  新应用模式是另一个重要判断标准,从今天开始,每一个人要认真记住一件事,就是在做工作的时候,我们到底是在收集数据还是数据打上标签以后形成我们相关信息,通过信息构思出应用场景和应用环境用来形成知识点,然后在这个知识里我做出正确决策才是我们的智慧。希望现在的云计算或者是信息化,如果这些概念都不清楚基本就影响我们的判断。跟应用系统随便贴标签实际是不行的,数据反应的是一个事实,数据不等于信息。所以希望大家在这个过程中认真理清数据、信息、知识和智慧之间的关系。
 
  我们看一个云计算的杰作,他给我们带来什么启示?大家每天看到这个杰作时有没有思考背后隐藏着什么重要的启示。一个点击,后面的云里用到500以上处理器,要查500T以上,反应时间0.1秒。同时点一次,就能给百度给Google贡献5个美分,就这个应用模式,Google足足花了5年时间找出来。如果想到第一年挣不到钱第二年挣不到要关门,他花了5年才发现原来可以不用像雅虎、新浪那样放第一板面的广告,而是可以用搜索引擎做广告。这点是在云计算模式里给大家的重要启示。我们在策划和构思应用模式的时候,一定要有耐心,一定要比较,一定要分析,而不简单说一放机器就自动产生钱,这是不可能的。包括FACEBOOK,人家一般上市公司用5年辛苦,他积累了8年,也就是最后8年才知道可以去提供服务挣钱。另外一个我们看Google的云计算的例子。我们看到很光鲜的结果,可是我们就没有看到每天做的技术。希望大家每天积累技术能力,从基础设施到大数据,再到海量数据,产生新的广告模式、业务模型、服务质量和提供一些公益性的社会服务。
 
  另外看云计算的可能方向,以前我们看到一个例子就是门户雅虎,通过人工收集网址,类似电话薄,到搜索引擎,用户构造关键字。现在大家一个方向,如果用户不需要输入东西,是不是可以预测用户意图来给用户推送合适内容?在这个过程中我们的商业智能和现在云计算有哪些区别呢?传统的架构应用模式不同,云服务之间结构不同。另外云计算分析时代实际是批级数据,数据量多样性,价值不同,流程不同,和关注数据不同。这个过程中还有四个关键技术有待大家去考虑。一个是数据展现,第二数据分析以及数据管理和数据采集。这张图可以看出云计算对微软冲击很大,因为原来都是卖OFFICE,原来装Windows,现在已经饱和,大家装到平板在手机上,所以要做升级,升级的办法就是在基础服务上面,给你把原来的变了,你别买我装Windows的版本就给你网上,这个是它的一厢情愿,能不能成功不知道。用户用不用不知道,但是他还是很努力去工作。另外一个IBM也工作非常努力,他构思一种新想法,平台从应用级层,开发平台、计算服务和管理服务。这是愿景,不要被误导,他现在什么都做,不一定都能做好。他现在跑马圈地划好,我们往这边努力,悄悄把原来那些系统打一个包变成这个工具,所以要擅于识别。
 
  最后总结一下,一是我们要理解和认清云计算的本质,一定要注意区别数据信息和智慧要素。我们特别要注意的是,云计算广义信息资源,新资源以服务形式来转变。我的信息资源要变成一个服务的形式,然后为广大的用户服务。大家注意云的时候不是简单把单机应用移到云端以后会自动变成云,这是错误的观点,而是必须要重新构思一个应用的范式。另外一个复杂度,不在于用户而在于后端,在云端。我们不要忽略复杂度,但是这个复杂度在软件行业,不在用户身上。用户看到越来越容易,后面那些软件人员越来越累,为什么?因为要了解的知识面更广,他要就动态性能调优,要做很多方面的研究。这个过程中如何服务好用户、优化资源利用率,使我们用理性思维实验验证归纳进行技术创新,我认为现在是时机,有一个清醒的头脑认识我们现在站在哪里,我们怎么样往前走。现在的云计算和应用模式还没有定局,还有很多工作要做。谢谢大家。

第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:罗铁坚

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。