首页 > 电子政务 > 正文

穆勇:政务大数据应用解析

2017-01-12 14:32:00  来源:企业网

摘要:政务大数据应用解析
关键词: 电子政务
  以下为:北京市信息资源管理中心副主任穆勇在2016全国CIO大会的演讲。
 
  \
 
  北京市信息资源管理中心副主任穆勇
 
  各位同行、各位领导、各位朋友上午好,今天很高兴和大家在一起交流一下大数据在政务领域中的应用。去年应该是大数据应用的高潮,现在应用逐步从去年的概念开始走向落地和实用,在这方面我们是在政务领域,在政府部门如何开展大数据应用,做了一些简单的探讨和思考,今天非常高兴和大家在一起进行交流。
 
  我想和大家交流的内容主要有四个部分,第一个还是概述。主要是和大家探讨一下关于大数据在政务领域中应用的一些概念和理解,主要是想和大家统一一下认识和思想。第二部分说一下大数据在政务领域应用中的一些相关机制、政策和相关基础设施这方面的需求,还有如果要做好大数据应用,在政务领域中的应用,需要做好基础工作和顶层设计,这个是具体的怎么来做。还有就是我们举几个正在做的案例,大家一起来分享。
 
  首先大数据在政务领域的应用,一个很重要的问题,就是说和我们以前的信息化工作,和我们以前的信息资源开发利用工作有什么区别?可能不管是我们还是企业、社会以及各个部门人都要思考的问题。我们这里面把政务大数据和政务大数据应用作了一个简单的概括,主要是区别于以前我们的工作。对于以前来说,我们处理的数据主要集中在前两位上,大多是结构化的。对于大数据来说,我们如果只盯住以前的数据显然是不符合要求的,所以我们大数据处理包括了这三类数据,特别是包括了后一类数据,来自于物联网的,来自于非结构化,文档的这一类数据处理,这是我们以前做的比较少的。
 
  另外我们的大数据应用,我们以前的信息资源开发应用和政府应用,更多是关注政府内部的,所以在思维方式上和以前有很大不同。还有一个就是大数据在政务领域的应用,要比电子商务、互联网企业等等要复杂得多。现在很多互联网企业和电商就说了,你政府大数据我这个做的很好,我都可以帮你做。实际上我们仔细分析一下会发现,基本上是不可能的,很多是做不好的。所以我们认为它的大数据应用,在政务领域应用要比其他行业复杂、需求多,难度也要大得多。
 
  另外我们再看一下电子商务这几年的发展,首先一个观点。就是大数据应用是属于电子政务的一个范畴,刚才高主任也说了我们推动一个阶段或者它的一个方面。互联网+还有大数据的发展战略为电子政务发展提供了一个契机,使我们进入了一个新的阶段,互联网+和新的信息资源开发利用新阶段。我们比较一下这几年电子政务、电子商务、互联网、企业信息化各自的发展,我们会发现以前有一些专家提出,要加大政府的信息化投入,推动电子政务来带动社会信息化,来带动企业信息化。十多年过去了我们看一下结果,现在可能是反过来了。是在电子商务、互联网企业的信息化在倒逼政府信息化,为什么?其实很重要的原因我觉得是两个,一个是思维方式,另外一个存在着很难解决的体制机制障碍。这个我觉得在大数据应用中是必须要解决的问题。
 
  不管是大数据应用、信息化、智慧城市,一定是需求导向,统筹规划、应用为先、业务驱动。现在有很多信息化建设项目,不管是企业、社会、政府都是技术导向比较严重。去年大数据应用是高潮,今年开始了智能计算这些,过几天又有个新的技术,但是如果需求摆在那技术没有做好的话,开展这项工作其实是有一定风险。所以我们这里面提出要想做好政务大数据的应用,一定是我们既要学习借鉴互联网企业的思维,商业模式和经验,还有很重要的一项工作,就是要做好我们信息化的基础工作和统筹工作、顶层设计工作。我们把这一部分工作,我们觉得要用工匠精神来做好,要用钉钉子的精神做好,这个是十分重要的。如果是炒概念跟时髦,如果没有后面这些基础工作,那么一切也都是无从谈起。
 
  我们看一下在政务大数据应用的时候,我们希望改变的哪些思维方式?我觉得第一个应该有借鉴它、学习它的互联网思维,包括它的九大思维。对于我们来说,政府来说,做电子政务可能比较注重的应该是开放服务、服务外包、自助、服务引导。原来很多政府的信息化建设,特别是公共服务方面,我们都是自己做,自己采集数据,自己规划、自己建设,自己组织队伍来运行。其实按照互联网思维,政府肯定是特别是对公共服务类这些项目,应该是你开放你的数据,让企业来做各种各样的服务。这样我们既可以节约成本,又可以拉动推动信息消费和信息产业。有时候政府做多了反而得不偿失。
 
  举个例子比如说打车软件,原来北京市交通委也做过一个,花了一百多万,我就不说它的效果和运维了,最后滴滴、快的出来这些就没有用了。所以你就根本不应该做,应该开放、外包出去。
 
  还有电子政务的建设模式要有一个彻底的转变,包括很多工作都可以让社会企业来做。我们可以举一下我们的一个例子,我们政府建的数据中心,这个数据中心的建设我们政府是零投资,是通过招标采购了两个云服务商来建设云,政府采购给它提相关的要求让它来提供各种服务,包括安全服务都是采用第三方的,最后我用你多少给你付多少钱。包括后续很多信息化项目都应该是这种模式。
 
  还有互联网思维很重要的第二个是要数据共享,这个可能大家说的很多。近期国务院又发布了信息共享的暂行办法,进一步加强和要求了,提出了政府部门数据共享的这种原则,是以共享为原则不共享为例外这个要求。还有数据开放,还有我们电子政务可能后续更多关注的除了自己发展之外,更多的是培育和促进创业创新,特别是数据开放这一部分更是这样,包括我们服务模式的变化。
 
  这是第一部分,主要是想和大家统一一下思想,为我们后面的交流打下基础。另外我们觉得要开展大数据应用,肯定是以数据为核心进行开发管理。对于数据来说应该有一个管理体系和治理机制,我们大致把这个机制叫做数据管理框架。数据和业务是紧密绑定在一起的,所以它的数据框架应该和业务框架是紧密绑定在一起的,而且数据管理应该是一个生命周期,跟采集、开发、共享、更新、加工、处理、开放、销毁,是一个生命周期的管理。另外支撑大数据应用的应该是和它配套有相关的技术,比如说我们现在的云技术,专用的数据关联技术,它的体系架构技术,还有预测分析挖掘等等这方面的技术。不同时期它的技术体系是不一样的,这是我们说的第二部分。
 
  第三部分,数据管理一定要有一个很好的载体,这个载体就是一个和它配套的组织体系。原来我们的数据信息中心更多承担的是信息化规划,信息系统建设、运维,更多的是技术工作。后续不管是企业和政府,要转向数据管理,因为很多都外包了。这个转变是非常关键的,还有我们配套的相关政策法规一定要完善,如果不完善还是不行的。
 
  还有我们的这个数据开发利用,归根结底一定是应用,包括行业的应用,部门的应用,公众的应用,还有企业、社会的应用。这方面我们有一些自己的政策,包括现在正在出台和制定的政策,具体不展开了,这对于政府来说是必须要有的。体制这块刚才已经说了,不详细说了。
 
  还有一个,我们信息化建设、大数据应用这个阶段来说,并不一定是从头开始,我们有很多以前的工作,我们有大量信息化建设的系统,基础设施、信息中心等等这些方面的工作。所以在大数据这个环境下,新的技术架构下我们要对它进行一个整合,这个整合一定要有好的方法、理念,否则可能就会出现很大的失误。对于北京来说,恰逢有这样一个很好的机遇,因为大家知道有一个城市副中心正在通州建设,明年开始很多都要搬到通州,而且新的信息化大楼正在建设之中。其中很重要的就是有一个统一建设全市政务云的环境,原来所有的全部打碎搬到新的环境中,就会涉及到一个迁云的问题。怎么迁?
 
  是我们简单地把原来的系统放到云上,只是在云的层上,用它的存储和计算功能?还是我们效果统一地进行一下规划,然后按照一个新的顶层设计,像美国FEA那种架构,我不要担负起,还要把所有该集中的集中在一起,而不是简单的物理地集中在一起。而且时间要求很紧就是一年。所以说这方面的工作是十分巨大的,前两年我觉得有些,包括阿里他们都在谈去IOE,最后你要通过仔细分析会发现这是完全不科学的,也是不可取的。我不是说IBM老总在我说这话,我们是一直坚持这个理论。
 
  对于我们信息化的基础设施来说,我们实际上已经建了很多,包括共享交换平台,2005年就开始建,已经开始使用。包括全市的物理设施系统数据采集,通过物联网平台来采集。我们为什么说政府数据掌握的比原来多?原来我们处理的只是一小部分,结构化的,政府的那些。现在大量的非结构化的,包括音视频,包括来自物联网的,社会的这些数据都要采集过来进行加工整理。所以我们的大数据应用,这些基础设施是必须有的,包括移动平台的建设,包括相关的设施、交通卡、市民卡,包括它的服务入口,还有就是几大基础数据库,就是数据资源的建设必须完成。我们北京在2005年基本上建成了四大基础数据库,加上各自领域专业数据库350多个,各个领域的市级大型数据库。业务信息化的比例已经达到97%以上,基本上原来有的业务都实行了信息化,数据资源也基本上存储进库。
 
  第三部分,我们觉得有一些技术和理念还不行,最后一定要落在实处,就是要做好相关的基础工作。就是这次国务院发的那个文件里面,再三强调的信息资源目录的梳理编制。如果你这个单位,连你自己这个部门有哪些数据,哪些数据在哪些库,有哪些业务都说不清楚,你就谈不上再用大数据,外面的数据、别的数据来做一些新的应用,所以这项工作其实是非常艰苦的,而且很多人是不愿意做的,也可以说有些人也是不会做的。
 
  还有一个就是说顶层设计现在确实需要。十年前大家开始炒顶层设计,炒美国的FEA,现在十年后到了应用的时候又没人说了,确实原来很多的数据、很多的系统,我现在要统一迁到云上,而且不是一个政府,大企业的,不是简单搬过来就可以,而是要进行整体规划,从业务上、资源上、基础设施上、技术上等等重新规划设计它的架构,而且要考虑它的实时路径,这方面信息的工作我就不说了。现在当前的状态有这样的,当前有很多系统大家可以看到是这样的,特别是对于政府部门来说。现在有很多也到了过渡阶段,平台建设者,建设各种各样的平台。其实最后应该是扁平化、一体化的等等。
 
  现在大家看到很多方案,一说我要建设云平台,那不用看你现在处于第二阶段。最后阶段有点像企业ERP,而且在新的环境下把这个放在里面,而且是一级政府一个整体的。
 
  要真正做好这些工作,确实是要做顶层设计,这不是简单概念性的、逻辑性的,一定要实实在在的,要有我们自己的实践案例等等。这几年我们做了一些东西,包括它的业务架构怎么设计,业务架构怎么变成结构化的。比如说原来的是段文字,我们通过文字变成业务模型,首先是有个结构化的。我们这边通过四表两图把它变成了结构化、半结构化的,而且这样就可以进行建模、分析、统计,而且他们是关联在一起的。包括对已建系统如何进行分析和整理都有专门的方法和理论,包括新的顶层设计规划一定要借鉴和学习互联网电商的一些经验,包括它的基本原则,去中心化、数据化运行包括这些东西,包括它的平台建设。
 
  对于政府来说这个平台到底什么样?确实要认真研究。包括它的微应用、大平台、开放性,还有就是政务云的发展趋势。大家可以看到对于电商来说,它经历的几个阶段现在和我们政务部门经历的基本差不多。第一阶段各自系统,第二阶段把系统迁到云上,只是用到它的IaaS层,计算和存储。
 
  另外就是数据所有权,对于政府部门来说我们的数据所有权是有明确规定的,这是网信办发的文件。政府用在公有云、企业云里面,这个数据所有权,包括这个数据产生的衍生产品,就是说这个人是我们的,这个人在这个云里面留下的脚印也是我的,是非常明确的,而且是强制性的。企业在招标的时候如果你不认同这一点,你就根本不可能进入我这个门槛。你进入之后如果触犯了这一条,那对你的处罚是很严厉的,政府如果收拾一个企业是很容易的。但是如果是企业对企业,那就很难说了。比如一个企业它到了公有云里面,它能不能遵守这套规则那就很难说了,而且企业都有自己的政策。这个政策什么样那你必须要接受,如果你要不接受人家不给你提供服务,包括这些方面的案例就不说了,下午可能要讨论这些东西。
 
  另外对于云来说,我们通过这几年的使用还是觉得有一些问题,一个是系统上存在的问题,另外一个就是数据安全上存在的问题。虽然它现在有很多措施,但是这些措施能不能保证我这个系统不发生死机、不发生问题、不中断,我们的观点这是不可避免的。不管是谁来说都是不可避免的,因为云系统的建设,它的体制机制就决定了它不可能不发生错误,还有一些网络环境是不可控制的。
 
  所以对于这个工作来说,发生故障发生问题是正常的,那么对于这个来说,还是应该有相关的解决措施,包括它的备份,传统的备份机制,包括一些其他方面的工作来弥补,如果没有这个是不安全的。我们这个数据比如说财政数据在云上是丢过数据,而且死机也是经常发生的。
 
  下面和大家一起分享一下大数据应用的几个案例。第一个在政务领域来说最重要的就是领导决策,这个领导决策我们觉得转变观念是最关键的。2006年开始,建立一个领导决策系统,是王岐山当市长的时候建的。在前几年领导用的很少,特别是市领导这一级用的很少。大数据应用这个决策,如果领导没有这个意识,而且这个决策过程要公开公众参与,这个意识如果不进来,这个大数据在领导决策中应用是很难起到很好的效果。是这样的,所以我们的系统现在是这么一个状况。当然了也有一些是可以发挥作用的,比如说我们正在做的北京整个城市进行新的规划,缓解城市的非首都核心功能疏解,这里面我们就用到了大量的数据进行分析计算,来分析所有的人住在哪里在哪工作是如何出行的。根据这些东西,这些新的方案,来对我们的疏解方案进行规划、论证和分析。包括我们要把一些医院、学校迁出去,迁出去之后我们会模拟,如果迁到别处去对我们整个交通环境的影响发生什么样的变化?来最后确定我们的规划方案,这就是我们大数据在城市规划中的应用。
 
  还有是在医药卫生,刚才高主任已经讲了很多,这个例子实际上是百度给中央领导汇报的时候讲的一个例子。说我们以前做的很多医药卫生的统计,都是通过我们自己的渠道来统计的。但是通过互联网也可以获得一些数据,比如说艾滋病病人,有些人可能不去医院看病或者不去注册,就很难掌握他的信息,但是他可能上网会查一些东西,药物或者症状,这些东西如果突发很可能是对我们的统计数据是一个补充,所以这两个数据融合在一起,对我们医药卫生来说它的统计数据会更加准确一些。这主要是为了解决重要时期、重要地区人流密度过于多,防止上海的踩踏事件出现所以我们做了这么一个系统。
 
  还有我们原来很多数据,包括音视频的数据基本上都不怎么用。我们在开展政务大数据应用的时候,这些东西又变成我们新的一些原料来进行分析整理,现在技术也比较成熟了,包括音视频的我们来分析,对老百姓提供更好的个性化服务。
 
  还有就是舆情应对,这个是每个政府必须重视的,而且这个重视力度非常大。这是《人民日报》做的一个案例,现在自媒体包括主流媒体之间有很多不一样的情况,大家可以看到这是主流媒体,同样报道一件事情是这么一个情况,如果是有些互联网媒体就变成这么一个情况。还有就是说网络传播这个现象很严重,各式各样的都要应该有一些应对,包括我们的一些系统,舆情应对系统,采集的、预报的、处置的、反应的,还有怎么来积极表达?表达的好,就是这边这种情况,表达的不好,隐瞒的可能就是这么一个情况。可以看出来这里面都有很多技巧,同样是大数据应用,做的好做的不好差别很大。我的汇报就是这样,谢谢大家。
责编:穆勇
分享到: