【专家分享】梁红凤:中国数据库产业发展与信创的最佳实践

2021-04-07 16:27:55

来源:CIO时代学院

       随着互联网技术的不断发展,数据量正迎来井喷式增长,数据库作为关键基础设施,它的安全可控正逐渐被企业重视。国内自助创新能力的提升,使国产数据库市场迎来极大的增长空间。在这个过程当中,国产数据库经历了什么?又是怎么发展到现在的规模?有哪些创新技术及经典的应用创新案例?

       人大金仓副总裁在2021年3月28日由CIO时代学院、新基建创新研究院共同主办的“中国信息技术应用创新高峰论坛”上,发表题为《中国数据库产业发展与信创的最佳实践》的主题演讲,对以上问题进行了系统讲述,以下是演讲实录:

 
梁红凤:

       很荣幸代表人大金仓给大家分享我们这次的CIO时代学院组织的自主创新产业之光的峰会演讲。我演讲的题目是“中国数据库产业发展与信创的最佳实践”。

       说起中国数据库,昨天我在准备PPT的时候,原来的题目是国产数据库.后来我翻了一下王珊老师在2018年给人大金仓做中国数据库40年回顾的内容时,发现我应该用中国这个词,尤其是在近期中美双方这么激烈公开的对话环境下,中国数据库这个词是比较适合的。
 
       中国数据库的起源与商业化发展

 

       (一)学术起源

       讲到中国数据库的起源,在座的各位是清楚的。我要说一下萨师煊老师,他是1922年生的福建人,但他是蒙古族;和1944年生的王珊是师生关系。中国的数据库引进最早在1978年,萨师煊老师在黑板上写下了“中国数据库”几个字,这意味着中国数据库才开始进入研究领域和教学领域。就任于人民大学的这两位老师是我们数据库方面的奠基人。王珊老师在七十年代末跟萨老师开展相关数据库的研究,并出版了数据库理论的专著,大家熟悉的是《数据库系统概论》,这是王老师和萨老师最早编著的书籍,并且成为了国内经典的教学材料。

       从1978到2018年,中国数据库走了40年的路。王老师回到人大金仓做报告的时候,做了一个40年回顾。1977年11月份在黄山会议,当时有50余人、7篇论文和报告,以此为基础做了一个国内最早的计算机领域的专业会议。这些是最明确的中国数据库的起源。在这之后王老师和萨老师共同编著了非常多教材,所有人民大学的相关内容教材都是王老师和萨老师一起整理而成。现在《数据库系统理论》已经发布到了第五版,并且仍然是各大高校的经典教材。

       (二)商业起源

       讲到学术的起源,我们得看一看中国数据库的商业起源。

       从七十年代末到九十年代末,发展了20年,这期间教授和老师们都在做学术研究。1999年人大金仓成立,武汉华工达梦在2000年的时候也成立了,还有2004年崔博士成立了南大通用,四年以后神舟通用成立。商业化的起源我们确实不早,国外有一个七十年代末成立的软件,而那个时候我们还在做理论研究和引进。中国数据库的起步研究其实也不晚,只是商业化比较晚。七十年代末的研究,跟我们产学研的结合度有关系。

       (三)商业化发展

       人大、华工、南大,这些以学术人才为核心的校企已经成为国产数据库的主力军。中国初创公司前十年的发展比较缓慢。因为中国进入WTO以后,国外的IBM、微软全部都进入了国内市场。这十年国内公司只是在一些军用领域发展,在国家的科研领域做一些课题和商业发展研究。真正获得商业化成长是2009年,国家电网考虑到国家自主可控的问题时选择了国产数据库,于是前两家获得了相关机会。至今为止,国家电网电力调度仍然在使用国产数据库,已经连续使用了十多年。其他的软件公司,在军用领域、金融、MPP领域得到了部分发展。真正大范围的发展是在信创开始的时候,也有2018年初直到去年,政府给了很多机会的原因。今年,面向企业市场和关键领域之后,我们会面临着国产数据库十年发展的高速期。我们认为我们站在这里是一个最好的年代。

 
 
        历史机遇,国产数据库市场迎来十倍空间

       引用民生证券在去年做的一个深度研究内容,即“历史机遇”——国产数据库市场即将迎来十倍空间。针对这个问题,我引用了一些公开的投研报告和数据来给大家具体讲述。在智研咨询发布的相关报告中显示,2021年国内数据库的市场规模可以达到150多亿,这个份额中,前些年肯定是IBM、微软的比例占大头,但是今后,中国数据库会慢慢增加份额。另外一个公开的数据,是去年IDC给的关于国内数据库领域的相关报告,这个数据会更乐观一点。报告显示,到2024年,数据库领域的市场规模能达到人民币200多亿,而且公有云市场的增量会多于私有化部署。我们认为这也比较符合目前的数据情况。中国数据库在这个饼图里的面积会逐渐增加,这也是他们的预测数据,当然我们业内人士也是这样认为的。

 
 
        信创实践 困难重重

       回到今天的主题,前几年人大金仓就一直在做数据库的相关服务,我们用了一个词叫“躬身服务”,去年我们做到了信创领域的市场第一,在数据库的市场份额达到了百分之五十四点几。

       分享一下我们信创领域的一些实践。

       一开始大家说国产化,政府的专家和老师都经过了这个阶段,不过一些企业或一些其他领域的同志们还没有经历过。有人会问国产化会遇到什么问题、我们遇到这些问题该如何解决、都有什么经验,我总结一下。

       (一)首先从数据库而言,我们最需要做的是跟计算力的结合、跟芯片的深度适配和性能优化,还要跟海量的应用做应用适配和数据迁移。

       从迁移工作来讲,大家都有非常多的应用。这些应用有比较老旧的一些架构,比如深度用了一些Oracle触发器的视图。2000年以后,一些新应用认为,需要用一些轻量级的、松耦合的解绑数据应用。因此,不同的应用我们都要应对,迁移只是我们数据库面临的第一关,尤其是如何去降低迁移的工作量和实现自动迁移。

 
       人大金仓和Oracle没有抄袭其他企业。那从存储、触发器、视图方面来看,语言不是太相同,这应该用什么办法解决?我们用了一款叫KDMS数据库的迁移评估工具做应用的迁移。这个工具能够把DB2、MSSQL、MySQL、Oracle、把我们的视图存储器翻译成KingbaseES的语言,从而实现很好的迁移。

       同时,用我们的KDT做数据的搬迁和迁移,过程中我们还要做结果的验证以及数据一致性和结果的测试。如果是异构数据的话,过程当中还可以使用大容量的数据迁移工作KFS解决。整套迁移的过程是自动化的工具,进行全流程覆盖,让我们的工作量能够急剧减少。

       某个部委的迁移,从ORACLE迁移到KINGBASE,这是一个重度的ORACLE应用开发商。他的存储过程51个、函数15个、视图705个、包10个、触发器541个,如果用传统的迁移模式需要62个人天,但是用了我们全套的自动化工具,12人天就解决了问题。我们的自动化成功转化率达到了98%,总工时降低了80%,成本降低了90%左右。这就是面临大规模的国产化替代问题,我们一定要用工具化、自动化解决问题。

 
       当然,我们既能迁ORACLE,也可以迁移DB2,包括其他国家的语言都可以翻,这些整体迁移时间是两周。我们跟国内著名的ERP厂商做ORACLE的迁移,整个迁移的时间也是可控的,把迁移适配工作做到了,大家去做国产化就很方便了。这是我们的迁移能力。

       (二)第二关面临的问题是什么?高可用的问题——如何把原来比较好的连续性高可用化的优势用国产化的架构部署去做代替支撑?我们有非常多的支撑方式——包括主备模式、多容灾的模式。这个支撑方法跟我们原来的业务应用有很大的关系,我们可以去做相关的方案。

 
       (三)第三关要考虑的我们原来的系统压力非常大,当时某个OA系统达到了30%的内存,原来我们用的是X86服务器,他说你们怎么可以做特带?后来我们做了迁移替代,性能反而提升了。我们用了非常多的测试,评估了各个芯片、各个应用系统,积累了非常多的经验。做国产化的过程当中,万一国产化的环境不行了怎么办?我们有没有回退机制、双轨机制。万一出现问题,除了很好的服务,我们还可以回退到原有环境。

 
       (四)运行中如何回退到可用环境

 
       光大银行2016年做了一个双轨并行,经过了一段时间的稳定运行。后来数据在很正常的情况下,就变成了国产数据。整个过程是可回退的,关键应用可以采取稳健的方式做双轨运行以及回退机制。
 
       (五)最后一点是用户非常关心的,如果国产化的替代过程当中出现了问题,我们能不能得到国产软硬件厂商很好的服务支持?这需要国产厂商有非常好的服务机制。人大金仓全国覆盖的服务领域当中,我们的研发以北京、成都为主,天津、福州、青岛也都有研发中心。我们的服务中心遍布全国各省,包括北京、西藏都有我们的服务团队。

       我们曾经在一个案例当中,半个小时就到了客户的现场,这需要很好的服务精神和服务的覆盖能力。
 
       典型应用案例分享

       下面分享一些典型的案例。

       我们去做的某个国家部委,他是全国二级部署的应用系统,本部人数只有2000人,但是下属有4、5万人的节点部署,所以是全国范围内二级部署的实施。我们做了一次性的替换,全国的团队都为他们做服务。他们选择鲲鹏和麒麟加上KINGBASE的组合做了替代。替代的效果还是不错的,尤其是客户对于我们迁移的快速性、迁移工具的自动化率非常认可。另外对于我们全国并行的服务还是非常赞赏的,这个案例做下来以后,今年他们就决定把他们核心的业务系统做进一步的迁移。

 
       还有某个信创主管核心的单位,他们把OA当做他们的核心系统。原来基于X86、oracle,他们的OA在早上8点时候是限流的;现在换成了一主三备。我们帮他们做了一些优化调整,后来早上就不用限流了,并且速度比他们原来快了67%。后来有一个用户跟我讲,很多的应用还远远不够调优数据库的层面,有的可能调优一些应用就可以解决问题,有些应用的优化远远还没有达到要调修数据库的程度。所以数据库的压力并没有那么大,我们认为双机也有点过度,只是说应该要把他们结合好。

       在国产化的过程当中,有一些数据和分发收集业务。比如一部分系统已经用了国产数据库,但是一部分系统还在用oracle。我们用异构数据迁移解决了这个问题,分发的时候用这个工具做异构信息库的过程,我们必须要支持它。讲到数据库,大家可能想的是数据库对于OA或者是办公系统的应用,但是它的压力没有那么大。

       真正压力大的是什么?是这些在我们工业化转型、工业互联网MES、ERP领域都有相关的应用。国家电网电力调度系统,我们的数据库替代了他们本身的数据库十几年,当然他们的替代是基于X86上的数据库和操作系统的替代,基层还没有替代。我们去年给承德做了一个底座的替代,整个服务能维持十多年的稳定运行。当时是因为20万个传感器的数据要到数据上都要存在到列宽上,每一分钟的实时入库1443列,这个事情Oracle是不做拓展的。

       截止到现在,我们每年都能接到客户的感谢信。

       西电是我们制造行业的一个案例,他们在MES层的生产信息化系统用了我们的国产数据库,用于支撑他们MES层面的数据集中的管理,从而支撑他们电动的装配智能物联网平台的一些业务的使用。

       金融领域,2016年我们完成了光大银行的A类系统对公负债系统,整个过程花了一年。去年我们中标了中国移动的网间结算系统,网电即移动、联通、运营商之间互相结算费用,每个月的数据条率可以达到四、五百亿。去年年底上线了之后,至今的表现还是不错的。我们是主备模式,这基本上就够用了。客户也觉得整个情况还是比较理想。所以国产化的替代过程中,我们非常有信心。下一步我们会组织中国移动的客户回访。在数据库转型和数字政府转型的过程当中,还有很多的数据利用工作。

       我们给大唐国际做了所有设备状态的诊断、数据的收集和分析系统支撑,支持它所有设备检测和电力运行数据的分析;当然我们还给一些银行,包括新疆做一些大数据的分析。
 
        创新驱动,走向数据库产业的自主可控的道路

       我借用了王珊老师的一些话。自主可控方面她说了坚持——坚持国家信息安全不受之于人的信念;执着——执著推进国产数据库技术与产业发展;自信——自信是我们能够成为国家数据安全的中坚。创新驱动,走向数据库产业的自主可控的道路,我们这一代人要传承我们前辈的认知,必须奋力向上不负邵华。谢谢大家。


相关资讯

到底要不要使用数据库即服务(DBaaS)?

2019-09-29

7大云计算数据仓库

2019-09-29

阿里云数据库跻身全球“强劲表现者”阵营,创...

2019-06-14

阿里云数据库跻身全球“强劲表现者”阵营,创...

2019-06-14