听云总裁赵宇辰:AI+业务运维成就数字新基建

2020-11-03 15:29:05

来源:CIO时代网

  2020年10月23-25日,“第六届中国行业互联网大会暨CIO班15周年年会”在北京隆重开幕,本次大会由CIO时代学院主办,新基建创新研究院协办,汇聚了数智时代的院士、顶尖行业专家、研究学者、优秀CIO群体和科技厂家,大家围绕大会主题“新基建引领新模式”纷纷发表重要观点。在24日下午举行的金融CIO论坛,听云总裁、首席科学家赵宇辰发表题为“AI+业务运维成就数字新基建”的主题演讲,以下为演讲实录:
\
 
  赵宇辰:“大家好,我是赵宇辰,很高兴有这样的机会和大家分享。也很感谢大家坚持到现在,其实我的职业生涯10年都是在美国从事很多数字化的研究和数字化的优化,服务了很多国外的比较优秀的银行,比如说美洲银行等等。后来回国加入听云,今天很高兴有这样一个机会跟大家分享一下我今天的主题,就是AI+业务运维成就数字新基建。
\
  我们想想,其实很多人可能还记得我们图上的这个场景,去银行我们拿一个泛黄的存折去柜台进行存钱、取钱,进行交易,刚刚很多领导说门店已经越来越少人真正去实体进行交互。我们发现很多信用卡都是用手机银行网上银行操作。各个银行都有数据中心,都是银行的私有云或者跟其它合作做公有云,甚至网管中心有网络,包括很多银行在对外提供一些服务,有混合运营。同时客服中心也在建立非常数字化的过程。我们看到很多银行正在引入一些AI的手段,做智能机器人,智能客服,服务更多的老百姓。
\
  整个数字化带来非常大的挑战,虽然给很多的客户带来了很多便捷,其实这个数字化并不是一蹴而就的,并不是一下能搞定的事。随着数字化进程,大家在网上可以畅所欲言,包括很多APP,在买基金或者进行转账的时候,可能经常看到转不出来,导致很多用户到网上抱怨。出现无法登录或者无法绑定银行卡等各种各样的问题。数字系统它的性能、体验、包括刚才讲的风险的控制,其实直接影响业务。以前业务是线下进行各种各样的操作,现在全部搬到线上。
 
  我们就会发现要使业务正常进行,就需要一定有好的监控手段,不管是用户角度,还是业务角度,还是刚刚讲的从风控、安全的角度,都需要做监控。以前传统的基建,盖各种高楼大厦有很多监控的手段,比如布各种摄像头,而数字领域如何做监控,则需要用数字化手段。
\
  数字化时代监控越来越重要,有四个比较大的数字化的变革。我们讲数字新基建,到底体现在什么地方?很多非常传统的行业都在进行变化,除去我们刚刚讲的银行,其它行业也是这样。比如买车票,买飞机票,很少去实体,都是通过手机购买。包括保险,可能做一次赔付很多都是APP做的。未来所有的企业被很多人称做金融科技。
 
  另外IT本身正在进行非常大的变革,传统的IT是成本中心,到我们企业内部很多东西放到了数据中心里边,本质上相当于是一个数据库,比如ERP是财务的数据,HR是企业内部员工的数据,其实IT系统体验好不好、有没有问题,一般都在内网,安全的不会出现太大问题,这个是支撑业务的成本中心。而这个非常大的变革就是,越来越多数字系统在前台,不单单在后台,可能跟用户之间的交互、跟客户之间的交流,直接代表业务的本身。同时直接代表了一些竞争优势,很多新一代的使用者,可能仅凭你的数字体验更好更方便,所以就选择你的服务。
 
  另外,应用复杂度也呈爆炸式的增长,很多时候我们为了让这个系统更加安全更加高效,会引入新的功能,新的工具,这样导致整个的IT系统,或者数字新基建系统非常复杂。可能在简单的购买基金过程中,经过几十个交付,这样中间出现比如客户说这个基金买不了,或者红包为什么没抢成功,中间是某一台服务器出问题,或者手机机型不适配,或者网络某一个地级市的移动宽带出现问题等等,如今这么高的应用系统怎么保障性能和安全,是一个非常重要的事情。
 
  同时很多人很关注开发,需要去招聘很好的工程师,招聘很好的研发人员做各种各样的开发,各个银行有自己的软件开发中心。Google也说到,开发和运营在水下,占很多成本。一个软件或者APP,任何一个数字化系统,搭建的时候需要半年、一年的时间,搭建完持续运营的时间会达到三到五年,甚至更长时间,运营的成本非常高。同时数字化体验也非常高。如果说用户一个网站超过5秒或者8秒打开不了就会放弃,又或者一个APP老崩溃,就会换另一个。同时福布斯报告说81%的买家单纯因为体验感好,就会选择一个体验更好的数字化服务。
\
  综合这四点,传统的很多监控是不能解决问题的,传统监控只监控最底层,比如看网络内存很基础的指标,实际上没有从上往下看,从上往下看是一个用户真正使用数字化系统的时候,比如使用网银,使用渠道系统的时候真正的体验如何?对业务造成收益是如何的?如果有一个故障,有一个BUG造成损失,整个数字化交易成功率是多少?同时监控各种各样的层面,为什么还有很多客户仍然在投诉?我的VIP客户怎么保证?
\
  同时有很多外包团队,有一些是自己的团队做的,有一些是外包团队做的。我们从四个角度观察,第一个角度从最底层的资源层面,怎么保证数字基建的性能;第二层面从系统层面,软件层,各种各样的软件,有可能是自己内部开发的,或者各种云开发;第三从人的角度,真人用户用得怎么样?流不流畅?第四个是从业务的角度,任何一个企业不单单是一个业务,内部是非常多的不同的业务,一个业务里有子业务,作为CEO关注每个业务表现怎么样,每个业务里子业务情况又如何。核心是这四点,中间是我们的数据,希望把各种各样的数据搜集下来服务这四点。
 
  听云有多元探针的手段,解决以前的困境。以前企业内部数据来自不同的部门,这些数据是相互打架的,那我们把小的探针放到不同的服务上,把数据回传回来。偏业务的比如说全局有交易流水号,这笔金额过来的时候,金额是多少?如果是跟用户,那么用户手机号是多少,这笔交易是成功还是失败,所以业务数据可以抓取下来,如此就形成端到端的数字基建性能感知了。
 
  比如前端的时候用的是网页端,小程序,甚至微信公众号的推送,包括APP,经过网络到了我们后台服务端,后台上千台服务器,各种各样软件应用,最后把结果返回。期望能不能构建全视图就知道交互关系怎么样。对于用户体验希望有整套指标管理体系,我们精确到什么程度?下载一个APP,把这个APP杀掉,再启动一次,或者把这个APP放在后台打开微信再切回来,都有非常完整的指标体系来衡量。很多时候关注的是业务的表现情况,比如今天有多少笔交易,这些交易来自全国哪些地方?我的环比、同比怎么样,每类业务日活分布如何,每一类交易重点用户分布怎么样?这些能不能同时也相应地制定一些监控,企业根据这些指标做监控,出现异常的时候,可以智能地进行软件的推送。
\
  比如整个银行,我想看除了IT系统之外,承载的IT系统上面有多少交易指标,每天这么多交易量,有多少错误,比如典型的业务错误--用户的今天区块金额导致上限了,导致失败;或者这个渠道满了,所以不能从这个渠道买了,所有的一切是不是关联到一起?具体看看交易类型的错误的分布情况。
 
  另外可以点击详情,看看每一笔错误交易,失败或者成功的原因是什么?目前因为数据最终都汇聚到中台也好,也能做很多不一样的事情。刚才有老师讲做一些转换,现在银行渠道也很多,这些可能很多用户通过互联网其他渠道过来,我们是不是可以把业务流转换刻画出来。如果一个用户从提交注册到实名认证,到人脸识别,再到银行卡提交,每个操作流失的用户数比例多少,流失大的原因是产品没设计好,还是有IT故障。比如人脸识别掉了一个第三方的KPI,这样可能会去换第三方人脸识别,要不然采用一些别的方式进行补救,这样清晰的刻画业务流转过程。因此可以让企业或者银行做到更加精细化的管理。
 
  同时其实我们数字化手段在于会把很多的客户的投诉聚合起来。以前的投诉会通过当地的支行门店进行解决,现在发现这些客户投诉会更加中心化,怎么处理很复杂的场景。比如支付就是不成功,但是实际上并不能复线,或者客户人员复线不了。发现经常走一些不一样的流程;比如老人家手比较抖,他不小心点到回馈,就导致程序崩溃了。碰到这种场景,数据全部输到系统里,到底这个用户进行了哪些操作,一系列操作真的确实出现问题。我们看经过哪些流程和步骤最后导致失误。可能在强的网络情况下,wifi不会出错,很弱的情况下会出现这样的错误。如果是这样的话我们会具体地分析,客户为什么去投诉,投诉的原因是什么,怎么解决这样的问题。
\
  总体来说由于现在数据化系统越来越多,希望各个银行各个数字化系统用一套系统说话,避免每个业务部门只说自己的数据,导致不再一个频道或者用一个标准、一个体系来进行沟通。我们希望可以构架这个IT和业务之间的桥梁。比如一个客户,他们的实施关联交易是多少,他们的趋势是怎么样?今年错误率提升了,到底有哪些影响,是否是前端或者后端的问题,出错的情况下,把出错的东西专发给产品。
\
  那我们结合下主话题,希望能跟AI结合起来,到底怎么结合?本质上AI不是目的,目的是帮助用户降本增效。以前几天几个小时做的事,现在是不是分钟能解决。同时以前主动地系统里看,现在是不是能自动推送?今天是不是就这两个问题需要解决,AI为什么认为这是一个问题。出现问题的时候,是否能够一键排查,可能数据库出现问题,可能这个前端的银行代码出现问题,或者就是对某个机型适配性出现问题。
 
  同时每天会有大量的告警,这么多的告警不能形成一个数据孤岛,分别散落在不同的地方,是不是合在一起智能地判断,这些告警是因为一个事故造成的。可能是因为某个数据出错了,导致出现一系列连锁反应。
 
  我们希望有一体化的解决方案,去智能监控,让这个数字世界更美好,核心就是希望有一个统一的数据采集的模式,不管数据来源于前端、后端、各种各样的数据,只有数据是整个平台的核心,这样可以打破生态和系统割裂,做成统一的平台。同时能结合各种各样的场景,不管是安全的、运维的、运营的场景,都能满足其场景需求。
 
  虽然内在的数据是一样,但表现形式是不一样的,以前是偏人工,现在是更加智能。所以最后总结一下,其实我们很多时候,最开始做的数字基建,关心的首先是这个系统可以用起来,最起码让用户的体验和性能可以理解的。再往前,企业每年这么多IT投入,上面到底有哪些业务,如果出现问题会影响哪些关键业务,怎么做业务分析,获客分析,渠道分析,是不是能够加入一些智能。这样更加为企业提质增效,降低成本。将人力释放出来,可做更多创造性的东西,很多重复性的劳动交给机器,对于未来对于风险管控是不是把智慧沉淀下来。只有结合了这四个阶段,我们才能帮企业帮银行做最好的决策的推荐,同时帮助我们达成这样的业务目标。这就是我今天分享的内容,谢谢大家!”
 
  目前,AI能够帮助企业解决很多繁琐的问题,听云注重提升AIOps能力,持续增加研发投入,结合大数据分析、机器学习和AI可解释性,通过使用基于算法的技术推进数字化的IT运营,让IT运维变得简单化和高效,为银行以及其它企业带来更优质的服务体验!


相关资讯

2024国际AIGC微专业认证知识体系正式发布

2024-03-30

【智话·数字安全免疫力】乐信集团CSO刘志诚:...

2024-03-12

第一期大模型与人工智能生成内容(AIGC)技术...

2023-06-02

CIO时代正式推出大模型与AIGC专题培训

2023-06-01