【北大CIO班十周年】阳学仕:闪存在数据中心中的应用及趋势

2015-12-07 11:49:24  来源:CIO时代网

摘要:2015年11月28-29日,备受关注的“北大CIO班十周年年会暨首届中国行业互联网大会”在北京大学与宽沟会议中心隆重举行。宝存科技CEO阳学仕,就主题“闪存在数据中心中的应用及趋势“发表演讲。
关键词: 北大CIO班
  2015年11月28-29日,备受关注的“北大CIO班十周年年会暨首届中国行业互联网大会”在北京大学与宽沟会议中心隆重举行。29日,互联网+金融分论坛在宽沟会议中心也如期召开,来自金融行业的资深专家、企业代表和CIO优秀学员们出席了此次论坛,人才济济,共聚一堂。就金融行业在互联网大背景和新时代信息技术的影响下,进行了最新的技术交锋和很有价值的业内经验交流。宝存科技CEO阳学仕,就主题“闪存在数据中心中的应用及趋势“发表演讲,以下为演讲实录:
\
  各位同学早上上午好,今天很高兴有这个机会跟大家汇报一下我们在闪存这个行业,在数据中心底层一个技术方案的一些我们观察到的一些趋势。并且就是在闪存技术在过去最近一两年发展的趋势。我先简单介绍一下宝存科技,宝存科技是我们在2011年创办的一家公司,我们最主要的核心的业务是给企业,特别是数据中心提供企业级的固态存储的解决方案,固态存储的产品和解决方案,我们也有几款核心的产品,包括高性能的PCIe Flash的闪存卡,还有我们的即将推出的全闪存的阵列,还有全闪存的一体机等等。
 
  我们下面的客户也在各行各业都有,在互联网、金融,能源行业交通等等。我自己是在2011年创办了宝存科技,创办宝存之前,我在别的公司工作了十几年,一直在数据存储这个行业,奋斗,摸爬滚打。那我想今天给大家分享两个方面的议题。一个是为什么我们讨论一下为什么在闪存在今天在数据中心里面,我们不说像百度、腾讯、阿里这些比较超大规模的数据中心,其实在现在的这个企业级里面,包含我们看到我们在客户群里边有很多金融行业的客户,都开始部署这个闪存。它为什么这个最关键的一点是什么,在介绍这个目的之前我想给大家介绍一个,这位长者。
 
  他名字叫Gene Amdahl,他可能在这个电池制造行业里面,如果有比较丰富的经验的,可能知道这位可谓是泰斗,他是在IBM从事主任架构师,可以说他一手创办了我们叫大型机的整个的体系架构。他在IBM三进三出,最后在IBM,离开IBM又创办了三家公司。很不幸的是他在今年11月份刚刚过世,他92岁。他对并行计算这个行业做出了非常非常,我们叫基础性的贡献。所以,以他的名字命名的叫阿姆达尔定律,这个是一个比较简单的公式。实际上它讲的是这么一个事情,就是说如果我们有一个工作的负载,一个工作的负载,你如果要提升它的性能,你提升它的性能,实际上就是说我们之前各位同学在那分享也是说我们可以通过拆分,通过大变形的规模性的定型化来提升整体的性能。实际上这里它这个定律说的是说提出了一个理论,就是说你能够通过变形化,能够达到的一个理论提升的极限。它带来一个公式就是你并行提升的倍数受限于两个因子,一个是说你的这个因子,这个P这个因子实际上就是说你能够被优化,或者说你通过变形化来拆分这个工作。能够优化这个工作所占总负载的百分比例。
 
  比如说你一个负载50%,你可以通过优化来减少它的处理时间,这个P就是0.5。S是什么意思呢?就是说你通过变形化以后,你能够提升这个速度。其实这个推导非常简单,其实这个原理非常简单,那我大概花20秒钟给大家表述一下,比如说你之前需要完成这个时间是一个T,分成可优化和不可优化的。所以就是1减P乘以T,加上P乘以T,那就是整个所需要完成的时间。如果你可以优化的那部分,你可以通过变形化,通过大规模的变形,来优化它的处理时间,你提升了S倍,这部分时间你就减少了一个因子S对不对。所以你所完成的时间就成了这个数字。最后你提升的实际上就是T比上TS,所以就是等于之前的比例。这个实际上得到一个非常,在并行计算领域得到了一个非常关键的一点,就是这个体现这个图里面。
 
  这个图是什么意思呢?这个图表达的就是说,这个图有点小,大家你看这个横坐标,就是你的CPU的处理能力,纵坐标是你能够提升的业务提升的一个性能的一个倍数。所以这里面几条曲线,这里有不同的曲线,实际上代表了说你在这个业务里面你可以通过并行化处理一个优化的百分比。很简单,比方说你这个业务你有50%的工作是可以通过拆分,通过大规模的并行计算来优化的。
 
  那你最终你的极限,不管你用多少个CPU来处理,你的极限实际上你能提升的只有两倍,就是你的性能提升只有两倍,对不对,这个很容易理解。另一个方面就是说如果你的可以优化的地方非常多,比如这个图里面,就是95%的,也就是95%的业务是可以通过并行来优化的话,你可以最终你的理论极限就是基本上接近20倍,就是你可以通过一个并行化来实现。实际上这里面所有讲这些数据的话就是说,它里面有一个非常关键的一点就是说,你最终系统的瓶颈是来源于你的不能被并行化,优化的时间。
 
  最终的一点,你需要创新的处理这个任务。归根到底,我们强调这个熊总提到的发红包里面,实际上发红包的过程也有一个创新的过程,就是你不能优化,你永远有可以查,查你的红包数字被曝光了,你总有一个一致性的数据需要查的,这实际上是一个创新过程,在这个创新过程中,你处理这个创新,这个检查,这个动作的时间,实际上决定了你这个规模的一个,这项任务最终被优化的事情。所以,在这个时间,实际上在我们的这个计算我们叫做时延,你处理一个IO的最终时延性,实际上所以在现今就是说我们在大部分的计算体系里面,最终最根本上解决的问题是你的一个时延性,就是你处理一个IO。你最终所需要的完成的一个时间,其他所有的工作你可以通过拆分来优化。但是这个情况还是需要从底层,从硬件层面,通过硬件的方式来解决这个优化的问题。
 

第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:pingxiaoli

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。