首页 > 大数据 > 正文

【干货分享】张艳:商业银行的大数据应用

2016-07-19 18:08:27  来源:CIO时代网

摘要:中国工商银行科技部副总经理、第3届北大CIO班学员张艳发表了题为《商业银行的大数据应用》的主题演讲。
关键词: 大数据 CIO
  2016年7月17日,以“大数据与人工智能”为主题的“第五届中国大数据应用论坛”在北京大学英杰交流中心成功举办。本次论坛由北京大学信息化与信息管理研究中心和中国新一代IT产业推进联盟主办,北达软、数美时代和章鱼大数据协办,CIO时代网承办。来自业界的相关专家学者、CIO、媒体朋友等近200人参与了此次的大数据盛会。中国工商银行科技部副总经理、第3届北大CIO班学员张艳发表了题为《商业银行的大数据应用》的主题演讲,以下为演讲实录:
 
\
  
       今天非常高兴到这个论坛与大家沟通交流!银行业大数据的应用对大家来讲既陌生但又熟悉。讲个例子,日常的只要是工商银行的客户,尤其是代发公司的客户,大家在商场购物或者在网上购物之后都会给大家发条短信,就是说你的购物消费了多少钱,这个钱你可以做分期支付等等。并不是给所有人都发,也不是所有场合都发,也不是所有购物的商场都发的,所以这里就涉及到大数据分析。我们对特定的用户和特定的商户和购买的特定产品,推出分期贷款的服务,这是大数据在银行应用的一个情况。
 
  如果想要贷款那怎么办?以前都认为银行的贷款非常麻烦,不止是要到银行跑很多手续,也要相关的证明。现在来讲,各家银行都在网上推出了相关的贷款功能,只要有相关的信息资料就能够很快的贷款。从商业银行来讲,我们的数据量是非常大的,工商银行每天的业务量就有将近3亿笔。全中国那么多的客户,大概每天在我们的工商银行的系统当中去办理业务的客户产生的交易,都是以亿的数量级来计算。所以数据应用怎么能够用好这些数据、充分发挥数据的作用,是非常重要的。从2013年开始银行的整个利润增长率在放缓,尤其是去年基本各家银行的增长都是在个位数甚至接近于零增长的情况。银行也需要做很多转型,靠以前存贷的利差来赚钱,这个情况已经不复存在了。
 
  那怎么办呢?银行重点要做好两件事情:一是怎么为客户提供更加贴身和有针对性的服务,怎么做好客户的精准服务和营销;二是风险控制。银行也是一个经营风险的行业,如果是我们辛辛苦苦赚的钱,出了笔信贷的风险,可能放多少贷款都是弥补不回来的。所以怎么能够实现更好的客户服务、怎么做好更好的风险管理,就需要用大数据。工行银行前董事长就专门提出来“我们要从银行信息化到信息化银行的转变”信息化银行的转变实际上就是充分利用数据的价值来给银行和客户创造更多的贡献。
 
  大数据体系里面分了五个层次:第一就是基础的设施,包括数据如何来存储、如何计算等等。我相信很多的IT业专家都有非常多的研究,里面各种的技术问题和技术的解决方案层出不穷。第二个层次就是数据的治理。数据的准确性、数据的可靠性对银行来讲是真正的银行利用数据的基础。第三层是数据放在哪里、数据到底是怎么来,有数据仓库、信息库和流数据等。第四层是数据怎么来用、谁来用。我们通过检索服务、数据分析服务、数据挖掘服务,把数据的价值能够用起来。第五层是数据到底用于银行经营的哪些方面。主要有客户服务、风险防控、经营管理和监测分析等,其中最重要的银行的大数据应用就是在客户应用和风险防控这两大范围。
 
  今天我就围绕着第三、四、五层给大家做个简要的分享。数据在哪里?银行数据以前主要就是三类数据:账户,交易和明细数据。随着业务发展,数据量越来越多、数据类型越来越多、外部数据也越来越多,所以从内部的数据来讲,除了账户数据、明细数据和交易数据外,现在更加了各种信用数据、社交数据、影像数据等等。银行除了自己内部数据之外,还有一些外部数据,我们跟相关部门一起联合,比如说人民银行的征信数据,包括个人和企业的所有征信数据。第二就是工商数据,我们现在跟工商局也做了联合。在我们行的所有系统当中都可以查到相关企业的工商注册的数据。所有司法的诉讼案件和各种案件的数据,我们现在都可以获得。各种的外部的资讯数据,比如说路透、蓬勃的等等。所以银行的数据从原有的只是账户交易类的数据变为内外部的数据是非常多,范围越来越广。
 
  那我们怎么存储这些数据呢?两类:一类是数据仓库,主要是结构化数据。我们的数据量现在是430T,每天报表都有五千多张报表,就是说数据不断的在增加。包括最基本的3亿多的交易数据,还包括了互联网金融的数据。互联网金融数据包括了两块:一块是我们行自己开采的数据,例如我们的电商平台“容e购”(电商平台),还有“容e联”(即时交付平台),此外还有证券、基金、保险等业务的数据全部放进来。因此我们的量是几百个T,现在增加的速度非常快。二是非结构化数据,我们也建立了一个信息库,用于对非结构化数据检索的服务和分析挖掘服务的基础平台。这个平台我们建立了一系列的文档、索引。其中包括2000多万个文档的索引,相关内容也非常多。而且这部分数据增加的也快。工商银行的电话银行的所有录音电话都连接到我们信息库当中,当然也包括各种视频。
 
  数据谁来用?怎么用?工商银行建立了两千多人的分析师团队。当然这两千多人不止是专门做数据分析的,我们还有很多兼职的业务分析师,利用数据仓库和信息仓库基础平台来开采分析。怎么给它做支撑?这里有非常多的工具。比如说给一般的员工都会提供一些灵活查询的工具、信息检索的工具,这些嵌套在各个应用系统当中,你只要输入相关关键字就都可以把信息找出来。除了这个之外,我们行业也建立一个类似百度的索引平台,把我们行的结构化数据、非结构化数据全部可以索引出来,这是给一般员工的。给分析师的,我们会有很多的工具,比如说有查询、数据分析、模型等工具。我们有47万人的人工,大家可以通过各种平台、工具获得数据,这就是数据应该谁来用、数据怎么用的问题。
 
  最后一个问题就是大数据真正应用的一些场景,现在银行到底是用到什么程度了。今天主要介绍四个方面:客户服务。风险防控。经营管理。监测分析。在客户服务方面,不管在哪个行业,都应该是从客户的收益周期分为潜在的阶段,就是获户阶段;第二就是客户成长期,这个时候怎么能够通过更多好的服务更好的产品来稳定客户;第三是倦怠衰退期,怎么样能挽留客户。所以每个阶段我们都利用大数据平台来做了一些相关的产品和应用系统,实现对客户的服务和挽留。
 
  第一是在拓扑期,通过对客户画像能够挖掘潜在的客户,实现精准营销。讲个例子,当时我们行做了一个所有用户信息的整合,在这个基础上根据客户贡献度做了分类。之后邀请了所有渠道当中对于高等级的客户做些营销,这个就达到了很好的效果。比如说有人当时在银行只是存款,但是他没有我们行的信用卡,也没有办各种业务。那我们就根据他在存款或者贷款的贡献度给他推销信用卡、网上银行、手机移行各种渠道的服务,这个拓扑率就非常高。这是五六年前,当时在业界也获得了非常好的评价。
 
  第二,在稳户阶段。主要是怎么样跟客户做精准营销和差异化定价及服务。我们的产品要推给哪些客户,这个是按照一定的规则就能做出模型,通过全行客户筛选出来就可以给各个客户做一些营销。刚才说到的分期贷款,也是一个例子。我们行里研究一个新产品出来之后,业务部门就会提出这个新产品适合哪些客户,在数据仓库和信息库当中就去找这些客户的符合度。对于符合的客户我们都会发一个单子,分给各个分行,由各个分行客户去做精准营销。我们通过客户分析和模型去做识别。
 
  在第三个阶段,这时候我们也用相关系统做监控。比如说有资金流向和流失客户预测。你从我们行一百万汇出到其他银行,那么我们会给营销人员有提示,告诉他说这个客户有一大笔钱转走了,需要营销人员关注,联系客户,到底是我们的服务问题还是其他。
 
  客户画像有基本的特征,包括基本信息、行为信息、家庭关系等等。我们还有标签,这个标签最主要是通过大的特征来得出判断,比如说通过标签判断他是男性高管还是一个普通的人员,他家庭收入情况大概会是什么样的程度,他喜欢什么样的产品、渠道、投资,这些都是标签。关于精准营销,现在更多的谈到用实时触发的流平台的相关的内容。你做一笔购物,系统当中就会抓取出来,直接给你推送很多的东西,这是应用的第一个方面。应用的第二个方面就是风险防控,我们原有的金融系统的风险防控特别关注在事后。这笔贷款不良了或者有违约了,这种情况下才追涨。现在风控应该是在事前、事中、事后三个阶段都必须要进行。为了做好风险防控,我们也研发了很多系统,包括事前的对于客户的尽职调查。事中,对于不同业务都有不同的提示和不同的处理方式。事后,就是发现了一些问题之后,事后管理也有相关的系统和相关的模型来支持。
 
  这里讲一个例子,交易反欺诈问题。大家经常遇到的就是手机中木马了或者有一个电信诈骗,通过某种渠道把银行帐户划走了,这是社会普遍关注的问题。有些可能是客户的手机、PC上中了木马,被黑客攻击了。有些可能是获取电信的验证码或者有一些通过第三方支付机构,在网上购买点卡方式把银行关联账户划走了。当然了,银行必须要对这种行为尽可能的防范和阻止。在所有客户交易当中我们都有一个流处理平台的处理。流处理平台就是及时的把数据放在交易反欺诈模型当中识别,一旦识别出来之后马上通过电话确认、短信确认或者直接跟客户联系,问你这笔交易是否是你做的、是否是真实的、是否是欺诈的行为。大家在国外购物时也会有出现刷了银行工商银行的卡之后如果是大额的就会有短信会提醒你。你只要联系确认我们就能把这笔钱给冻结住,我们更多是想往事前和事中进步。现在有很多假关联、假交易、假流水。对于每个阶段和每一个情况,我们也都做了相关的系统控制,最主要也是通过大数据、银行业务数据、政府部门数据,比说法院的数据、征信数据、工商数据,把这些数据都整合起来用于识别它是否欺诈,在各个环节当中进行控制,防范银行的风险。
 
  在经营管理方面,银行日常的很多经营管理也越来越多用到大数据的方法来做。比如说网点设置,以前就是考虑一下做个调研,这个地方人多不多、会不有效益,而且对于网点情况其实没有大量数据支撑。现在网点选型、优化全部靠大数据支撑,根据网点的效益、效率、客户等等方面,我们都有相关的模型和分析。比如网点是否需要优化,哪个网点出了问题,这极大的提高了网点管理的针对性和准确性。我们有一个电商平台“易e购”,交易分析的问题、方式的问题,都是利用大数据来做分析。包括在电商平台上,客户喜欢什么产品、偏向于什么样的方式等等,都有相关的专门的分析。
 
  在决策分析方面,就是宏观经济走势分析。我们采集了宏观经济指数及历史变化情况,选择我行交易数据和指标,采用时差相关分析法,分析二者之间的联动关系和历史规律。对于舆情的监控分析也可以用大数据的方法。前两年发生青岛港骗贷事件,当时我们立即把案件相关企业的关联信息全部找出来,分析之后判断我们行对于这些企业相关的贷款,由一条舆情触发我们对相关企业的调整。这是我们的舆情分析,用大数据的方法能够防止企业出现问题。
 
  我觉得大数据确实非常庞大,而且它能产生的价值也是非常巨大。从未来来讲大数据体系,银行就是“三个更”,数据将来会更全、各种技术平台会更多,服务实效性更快,更多样价值的利用。最后希望跟大共同探讨未来怎么样进一步做好大数据在银行的应用。感谢大家!

第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:张艳

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。