蔡春久:工业企业数据治理标杆案例

2018-07-23 14:34:16

来源:CIO时代网

  2018年7月22日,一年一度的“第七届中国大数据应用论坛”活动在北京大学隆重举行。本次活动由中国新一代IT产业推进联盟指导,CIO时代学院、北大软件工程研究所主办,全国高校大数据教育联盟、北达软、万山数据协办,北大CIO班学员、CIO时代学院学员、全国高校大数据教育联盟成员、其它大数据领域专家和管理者等近两百人参加了这次论坛活动,此次活动的主题为:大数据时代的数据保护与利用。石化盈科数据业务部总经理蔡春久在活动上做了题为《工业企业数据治理标杆案例》的主题演讲,以下为演讲实录:

\

  各位嘉宾、各位专家,下午好!我今天分享的题目是“工业企业数据治理标杆案例介绍”。我来自石化盈科,我简要的介绍一下石化盈科。石化盈科是中国石化下面的一个信息公司,主要是为中国石化的信息化提供建设和运维服务的一家公司。最近石化盈科也对外提供一些服务。中石化在央企的信息化,过去五年当中整个信息化连续五年排在A类第一名,信息化程度非常高,投入也非常多。我本人在信息化领域做了20年,前10年主要是ERP、MES;做项目实施和交付,最近10年主要在做数据治理的工作,最近这几年对外提供一些服务。因为中石化在数据治理领域投入的资金是非常多的,过去20年当中累计的直接项目投资累计超过5亿,沉淀了很多数据治理领域的模型、模板以及方法。
 
  我今天主要分享两部分,第一部分是数据治理管理现状和发展趋势。最近我们带着团队在中石化外部做了有80个世界500强、国内500强数据治理案例。看看国内数据管理的现状。第二部分主要是介绍中国石化的标杆,过去做的一些成果、思路、经验和挫折。
 
  我先讲两个案例。这是恒力集团,是江苏省最大的工业企业,也是一个私人企业。去年做到三千亿,500强排到238位。恒力主要是做石油化工、酒店、房地产等产业。2015年他们投入了数千万元的资金做ERP。ERP做了几年过后发现手工账和电脑账两层皮,第二他们也实施了数据治理的产品,发现没有效果。就是信息化投入很多钱,但是没有得到应有的效果,所以去年7月份重新启动数据治理的项目。他们总裁亲自为此事开了一上午会,启动这个项目,花半年时间做这个项目。最后成立了近20人团队专门做数据治理,专门做主数据、基础数据的管理。在私人企业,一个人恨不得变成两个人用,用人用的非常狠,这个项目他们最后成立专门部门做这个事。
 
  第二个案例是中国一重,这是一家央企,在齐齐哈尔。这个企业是老企业,大概有六七十年的历史,他们信息中心有50多个人,这50多个人水平非常高,而且他们企业信息系统也有40多套信息系统,那么这40多套信息系统,从理论上来讲应该说是开发的非常好,非常完美。比如他的成本核算、调度系统,做的非常完美。但是在前年启动这样一个项目,他们在2011年做了一些治理项目就发现没有效果。他们建了这么多系统,老板看这些报表,包括财务、销售的报表,不一样。有矛盾,不可信。所以启动这个项目。所以一方面投入那么多钱,建设那么多信息系统,那么多人力,发现没有效果。老板站在整个集团层面来看没有达到效果。最后发现我们发现他们整个物料编码有80万条,最后梳理了一下有30万是重复的,可见信息化在十一五、十二五期间,我们都是为了职能搭建一个信息系统,最后去年他们副总裁召集了上百人核心员工做企业级的数据标准,做数据清洗,跟核心的信息系统做对接。
 
  我们看看到底出现了什么问题?我们在十三五期间,数据是资产,数据对于管理者来讲,信息看不完、看不全、看不到,这是一个怪圈。我们看看到底是什么原因?第一数据多样化,缺乏统一标准。在工业企业集成比较困难。第二是分散。获取数据难,系统很多,看一个报表要在不同系统里面切换。第二是应用难。一重他们也搭建自己的大数据系统,发现数据都不准确,效率也很低,很难发挥数据资产的作用。第三是使用难,企业信息系统缺乏数据管理机制。还有管理难。这里缺乏相匹配的数据管理机制和数据管理部门。所以我们工业企业面临着这样的一个困境。
 
  我们再看看数据管理未来的趋势。首先做大数据或者数据分析首先要谈标准化。其实我们老祖宗在几千年前就已经开始做这样的工作了。车同轨、书同文。秦始皇做的最有贡献的就是统一文字、统一语言、统一标准。所以一个企业里也是需要做标准化的工作,要做命名的规范、口径的统一、定义的统一、来源统一、参照统一。这样做集团级的数据标准。
 
  在大数据环境下面,互联网+的时代,数据标准化的作用是什么?我们从数据的收集、存储、应用这几个环节当中,其实我们在收集的环节要做数据标准化的工作。标准化的数据进了数据仓库之后,存储才能减少数据的冗余,这样做分析应用就会比较好。所以大数据的核心价值体现不在数据量大,而在于数据质量的高。因此数据标准化是实现大数据价值的必经之地。过去的几十年当中大部分以建系统为主,而数据标准化、数据中心的建设往往是滞后的。
 
  未来的发展趋势,尤其是在金融、运营商、石油石化当中,数据是要引领业务的变革,其实数据的管理部门或者信息部门从成本中心转向利润中心,向业务提供产品服务。在过去的几十年里大部分是内部企业里面单一的数据源按需要采集,为业务部门提供应用。未来不一样了,未来是多数据源,内部、外部以及集中采集、集中处理,变成数据中心。再加上数据治理,对内对外提供产品服务。
 
  我们可以看看未来数据一定要大集中,我们系统很多,少就几十个,多就上百上千,那么由于不同类型的系统数据,我们这样把数据全部存在一个数据资源中心里面,对数据进行加工,对内对外提供生产运营,所以未来就是数据大集中+数据治理平台。
 
  这是数据共享的模型。未来要把企业外部数据通过采集、整合、存储变成一个大的数据资源池,通过分析模型,数据共享的主题,通过可视化展现,通过预警分析,通过创新应用,真正从数据中获得价值。我们要让数据支持我们的资源战略,要成为信息化建设的制高点。内外部数据要统一。要获取宏观的企业上下游的数据,要进企业大数据平台。实现用数据来说话、管理、决策、创新。这是我们未来的模型。
\
  (PPT)这张图也是我们十三五期间正在做的事情,我们大数据平台分了“一中心、两平台”。把数据做成集中存储的中心,这里面我们是通过数据集中、存储、处理、计算中心,这就是后平台保应用。平台是非常厚重的,通过技术来实现。业务人员不需要了解太多,更多是数据服务共享平台。另外就是数据分析服务平台,通过大数据分析、报表分析,后平台保应用,就是业务人员、分析人员,一个帐号、一个密码能够看到所有相关的数据,这是一中心、两平台、一体系。这都需要有治理体系来支撑。
\
  我们看这个图,中间是大数据平台的治理架构,分了几个区,具体技术细节我就不详细介绍了。我们是通过一个数据集中、存储、处理、计算中心,这是由IT部门负责完成。上面数据共享服务平台、数据分析服务平台、后面是数据服务门户。这里面有个数据治理平台,主要是源数据、主数据、数据质量、数据安全来支撑。这里面是跨整个的数据源、数据中心一个非常重要的系统。
 
  数据治理平台和数据中心之间的关系。数据治理平台主要是原数据、数据质量、主数据等等。这里我们要保证数据的唯一、准确。同时也需要要做转换。转换之后进数据仓库,主要是面向大数据的架构,是传统的数仓+大数据技术,允许Hadoop开源混搭结构构建数据中心。然后变成数据共享服务平台。
 
  对外,对监管机构、或作伙伴提供一些数据服务。同时我们还可以提供一些实时服务,比如设备预警、数据展现、挖掘分析、应用等等。数据治理平台一定要做的敏捷、轻巧,它是一个支撑平台所以不能太厚重了。这是数据治理平台和数据中心的关系。我前面介绍了数据管理相关定义和一些大的企业做的方法。下面再介绍一下中国石化在过去20年当中做的一些成果和经验。
 
  在工业企业一般分了五层,最下面是现场层,再就是控制层、操作层、生产层、经营管理层。这是按照SA95架构来的。这五个层面要贯穿,数据治理在这五个层面要打通才能真正实现工业企业数据的治理、数据的分析展现作用。
 
  (PPT)这是中石化十二五期间的架构图。中石化是一个非常大的庞然大物,法人单位有10万个,120万员工,去年是2.7万亿,非常庞大的。我们的系统有1000多个系统,总部大集中大概有300多个大集中系统,企业层面也有很多专业的系统。系统分了三大平台:一是以ERP为核心的经营管理平台,还有生产运营平台、基础设施运维平台,其中包括:基础设施、安全、运维、信息标准化。我们可以看看基础设施主要是机房数据中心。安全如果是红线,可以一票否决。信息标准化是底线,不能逾越。它支撑着最底层的基础。所以我们领导非常重视这块。还有我们的大数据中心,我们把数据都汇聚到其中做一些预测、分析展现。这是我们十二五期间的三大平台。十三五我们是四大平台,跟客户供应商联系这块的有一个客户平台。
 
  我们数据治理框架是三横四纵。三横是数据治理基础,数据架构,里面有数据资产目录、数据标准管理、数据模型管理。数据资产最核心的东西就是数据指标,数据指标主要是原数据、主数据两块最核心的,从2000年到现在一直有50人在做这个工作。另外也要保证数据质量,三分技术、七分管理。还有数据隐私,今天我们一直在谈这个主题。上面就是数据字典,把数据做成服务。四纵就是政策,我们在总部层面有数据管理办法,有50个人的运维团队,有流程,还有数据平台的支撑。我们再看看这个架构,底层是原系统有上千个,几十个核心的大集中系统。数据治理平台主要是以原数据、数据质量为核心的,保证数据原系统一致和唯一,同时也是一个支撑,这是基础数据的汇聚地,确保数据唯一和准确。这个平台处在非常核心的定位,打通各个链条,统一标准,实现共享,使数据资产达到最大化。
 
  取得的效果。基本上是业务驱动效果来推动。我们通过十多年的建设,数据仓库建设取得了非常好的经济效果和管理效益。举个例子,集采的例子。刚刚华能朱总也讲过,其实我们也帮华能做了集采的项目。中石化在做这个系统以前,我们有上千万条的物料编码,通过十多年的努力我们现在是300多万,每年节约资金3%。效果非常可观。所以通过信息化真正的推动信息化建设。
 
  后这是中石化标准化架构,分了技术标准、数据标准、应用标准。技术标准主要是基础设施安全相关的,数据标准主要分主数据和数据指标,1万多个数据指标项,15大类主数据。三类标准两个支撑。所有跟信息化相关的标准就在这个平台落地。
 
  管控体系从建制度、定标准、设组织、引流程,这是我们来做的,还有数据清洗、贯标等等,保证基础数据能够准确。这是我们的平台,我就不详细介绍了,有十大功能模块保证数据唯一和准确。
 
  总结一下,为什么要启动数据治理的项目?有六个观点。一是数据比功能更重要。二是常态化运维需要有数据管理团队在企业里面做运维管理。三是制度建设,相匹配的制度建设落实是基础。再一个数据治理是体系化的工程,涉及的部门很多,业务部门牵头,IT部门做管理,咨询公司做技术支撑,这样才能把项目做好。另外,数据治理不止是IT部门的事。一定是业务部门的事,由业务部门牵头。后面把基础数据做成基础共享平台,为所有用户提供支撑。