【第二届中国行业互联网大会暨CIO班十一周年年会】邱建中:“智慧城市”数据平台建设与应用

2016-08-30 15:10:37  来源:CIO时代网

摘要:深圳市坪山新区信息办主任、第五届北大政府CIO班学员邱建中发表了题为《“智慧城市”大数据平台建设与应用》的主题演讲。
关键词: 互联网 智慧城市
  2016年8月13日,由北大信息化与信息管理研究中心、中国新一代IT产业推进联盟主办,CIO时代网、阿拉善盟旅游局、阿拉善盟文旅投公司承办,北达软、网加时代网、转型家、《金融电子化》协办的“第二届中国行业互联网大会暨CIO班十一周年年会&首届阿拉善峰会”在苍天圣地阿拉善成功举办。与此同时,互联网+公共服务分论坛在阿拉善隆重举行。
 
\
 
  深圳市坪山新区信息办主任、第五届北大政府CIO班学员邱建中发表了题为《“智慧城市”大数据平台建设与应用》的主题演讲。以下为演讲实录:
 
  很荣幸今天下午跟大家一起探讨一下数据在智慧城市建设里面的一些应用。应该讲,坪山新区的实践也仅仅是起了个头。按照我们的观念,数据在政府里面运行大致未来会有三个阶段:技术引领阶段、数据拼资源的阶段、业务应用和业务创新的阶段。我们现在仅仅是从技术的方向收集了一些数据,然后在一些需要急用先行的领域做了些探索。今天我会分三部分讲一下:第一简单介绍一下我们区里推行这个事情的背景;第二在大数据这块怎么样把数据运转起来为智慧城市服务,有自己的愿景;第三是实践,我们是怎么建的和在哪些领域有些应用。
 
  一、引言
 
  我原来是深圳市信息办的,然后到了2009年深圳市在原来龙岗的基础上划出了两个新区,新区按照大部制架构重新构建的政府部门。这个时候智慧城市也提出来了,智慧城市其实是信息化发展过程中到了跨部门数据融合阶段的这么一个信息化建设的集成,它的显着特征就是部门之间的数据要打通。深圳市里面各个业务板块的应用系统已经做的很完备了,这个恰恰成为智慧城市推进里面的一个障碍,要打通这个已经形成很好的分割的各个条块反而成为障碍,所以我就主动要求到坪山新区从零开始,在一张白纸上来汇集这么一个模式。转眼之间6年过去了,我们6年做这么一个实验。
 
  1.对数据的观点
 
  我个人有几点基本观点:第一,我非常看重数据。我认为原来我们做IT注重网络、服务器这些硬件资产,逐步又向软件资产转移,我觉得到了现在的时代数据很有可能成为IT下一代里面最核心的资产,往更远的领域考虑,我甚至认为数据很有可能是继土地资源、资本资源之后第三代的社会核心资源。我们经历了农业社会、工业社会,现在是不是在进入一个信息社会,这个数据很有可能是新的扭结社会各个阶层一个非常重要的资源。第二,我认为智慧城市的基本手段还是靠数据融合来达成。智慧的产生还是靠多部门数据融合之后产生一些创新的应用。从本质上来讲,对政府的运作会城市的运转会是升级换代的要求,可以推动这个城市的升级换代的变化,认为从本质上讲,数据推动的智慧城市它的核心点还是在改革创新上。第三,信息化不仅仅是提速增效这么简单,我认为它的落脚点有两个点,一个是治理能力现代化里面重要的触角,还有一个是经济发展里面新的强大的引擎。
 
  2、坪山新区概况
 
  回到坪山新区的基本情况,坪山在深圳十个区里面处于东北角的角落,整体经济体量和发展阶段都是偏落后的。整体来讲,土地资源在深圳比较发达的地区来讲,土地资源算是比较多一点的,人口大概是60万人左右。它有几个显着特点逼着它要用信息化手段、技术手段、改革手段提升这个区域的发展。因为它跟龙岗、宝安、南山比,所有积累性资源都没办法,2009年建区,所以它的经济体量和发展模式也不可能再去抄袭南山、龙岗的发展模式。所以我们区里面比较早就确定下来,认为信息化这块是大家可以站在一个起点上,甚至可能还没有传统区那么多包袱,比较早就把信息化这块的发展作为区里面实现弯道超车的支点,这个很重要。因为如果没有这样一个战略定位的话,作为一个区里面的信息化部门不可能有很大的话语权。这是一个大的背景。
 
  二、大数据建设愿景
 
  在这种情况下,我们规划了智慧城市的发展或者基于数据为核心的智慧城市发展有这么一个愿景。核心的两个目标:一是建立集约化政府。集约化政府的前提条件是要把政府所有部门连接起来,与数据串联起来,通过统一的平台来为老百姓提供不区分政府内部部门的这么一个集约的政府。简单讲,未来老百姓针对政府部门来讲,他有很多渠道跟政府连接,不再需要对接政府的某个部门,不再需要对接公安部门、各个方向部门。政府内部之间的运作完全通过信息化、数据手段把它解决掉,这是近期的目标。稍远一点的目标,要通过政府的能力把数据资源汇聚起来,把平台搭建好,管理好秩序,把政府能掌控的比较有效的数据资源开放给社会,当然是在保证安全的情况下开放给社会,然后带动社会各个点上的创新能力,做进去之后,来形成公共服务或者是政府服务,形成运转的升级,主要是这么一个逻辑。
 
  其实数据在里面起到非常关键的作用。具体的实现途径我们是这样考量的,基本上传统的每一个行业领域的信息化建设都会分这么些层级架构去做。通过这么多年的累积,在每一个部门都形成了单一体系烟囱式的建设的系统,那么新的形式下这样的系统未来做系统之间的对接是非常困难的,每一个系统之间要做一次握手。我们想哪一个政府都有少则几十个多则上百个系统,去做接口式对接基本上就废掉了。所以坪山新区有这个条件,他可以从整体上做架构设计,我们就把层级全部打破,按照横向切的模式把基础设施、数据层统一起来做,然后各个领域只做他的业务应用、业务创新,这样形成两个平台,一个是坪山新区的基础数据平台、一个是业务协同平台。这两个平台做成之后,我们就在这个基础上由政府作为引领做一些示范应用。因为有一个逻辑摆在里面,政府发展的高级阶段是服务型政府。拿深圳来讲,深圳三到四万的公务员,要给两千万人做服务,这是个没解的题。我们认为政府不要提供终端产品,他只能构建平台提供数据资源,所以就形成这么一个思路。好了,政府搭建了平台,汇聚了数据之后,政府可以自己做一些标杆应用,做启发、做引领用,最重要的是开放给社会,让社会力量参与进来在各个应用里面做你的app、微观小点子上的民生服务,最后返回来又为老百姓、为整个社会服务。这叫政府搭台、汇集数据、管理秩序、引导社会为社会服务。我想这可能才是服务型政府真正解题的点。
 
  三、建设实践
 
  下面就具体讲一下我们做了哪些实践。三个点:第一,城市级数据平台是怎么做的。第二,基于这些数据的基础上我们是怎么来实现业务部门的协同。第三,基于数据的应用案例。
 
  1、城市级数据平台
 
  按照传统的模式只是数据库搭上应用就这样跑起来的。其实如果是一个城市级别的数据资源,不太可能按照传统的模式做。这里也有很多做技术的。其实技术这块不是我特别强调的部分,这个都是依赖于一些做大数据的公司给我们搭建的。主要是有四个板块,一是数据采集层,通过已有的数据渠道,做数据汇聚和融合的工作。汇聚回来之后,因为Hadoop这套体系就到了第二部分,就是大数据处理平台,它要做一些分门别类的处理,清晰比对,数据质量管控的工作,使庞杂的各种各样的数据能够为政务所用、能为城市运转所用。第三个层次才是到应用的层面,这种应用跟原来行业具体的应用就有差别了,这种应用可能涉及到业务体系里面的预警预报、决策研判。
 
  我想强调的是,政府的运转或者是城市的运转除了大数据还有小数据。特别是政府业务体系提供的这些更精准的数据,它和大数据之间是互补关系,并不是说我要大数据就不需要那种操作模式。特别是大量关系型数据库,仍然是要用的。第四个板块就是数据安全保障。我们数据内部处理框架,左端数据源更多是承接原来传统业务体系里面的各个板块的业务数据库,通过大数据里面的交换平台分结构化和非结构化的数据归拢到平台里面,在数据仓库里面做些处理,然后后端再提供应用再走向应用板块里面按照各种主题提供服务。大体是这样的。我们已经构建的大数据体系里面的运作模式,大体有四大板块:数据集成、数据质量管控、数据安全管理、大数据归集和留存。总结一下,我们区在数据建设这块大概从业务上来讲有几个渠道来汇集数据,一个是区内部所有政府组成部门,从原来系统架构上就确定了,他所有的业务数据,数据库由我们统一帮他们建设,在一个体系上保证我从能力上可以拿到所有部门的数据,这是第一。第二,根据深圳市数据共享条件要求,深圳市里面建立了一个跟市直部门数据交换的渠道,就是下面这一块。还有左边这一块。这是我们传统的政府内部比较准确的数据体系这一块。
 
  上面这一部分我们也非常注重通过自己的,比如说公共wifi的数据还有智慧城市设备体系里面各个板块里面或者各个设备里面提供的数据,这些数据有很强的分析价值。除此之外我们还注重从互联网上爬取一些跟我们相关的数据,比如大量的舆情的数据。还有一块,我们认为打问号的这块,我认为未来会成为非常重要的渠道,就是和社会其他的大数据体系之间的数据交换,这块过了若干年之后,我们会发现可能很多大数据体系之间数据交换和数据交易可能会成为大家获取数据的一个主要的渠道。我们在这块已经在推进,跟运营商、征信公司已经有一些数据应用了。总体来讲,我们有能力获取到5亿多条的数据。
 
  2、城市级应用协同平台
 
  这些数据来了之后怎么为客户们提供服务。原来的运作模式是什么?政府的各个板块里面是独立运作的,如果按照信息体系来讲的话,数据采集、处理和利用都是独立的。现在我们把整个过程做了调整,就把所有的业务部门,数据的分发、处理工作集中在一个平台上处理,然后对象就是政府部门的各个层级,这么一张政府内部的运作模式,基本上可以涵盖政府所有部门。就这么一个图,做到部门之间协同,不再需要部门之间互相过多的沟通和协调的交易成本,主要通过这个图来实现。
 
  在应用领域我们现在尝试的有几个案例,第一个就是社会建设领域里面。我们做了一个织网工程的系统。这个系统是采取国家比较倡导的网格化管理模式,我们把区域里划分了三四百个网格,每个网格里面有个具体的人。看起来这是一个比较笨的办法,但是大家可能不太知道现在事实上大多数的政府部门在每一个基层的社区点上有非常多的人,但是它不属于整体,只属于单个业务板块,有计划生育、安全生产专干等等,我们把这些人捏笼来作为数据采集员的角色,那么他的数据采集的元素和品类就打通的比较多,不再区分哪个业务板块的需要。这是一个基本的思想。他回来的信息就会到我的数据体系里面为各个部门提供服务。四个最基本的数据:人口、楼栋、城市事件、社会组织。这四个体系的数据,在坪山新区每一时刻这四个数据是非常精准的,就依赖于网格化管理这套体系。我不知道大家跟政府打交道多不多,其实就说人口这一个数据,并不是每个市长都能准确的了解这个市里面有多少人口,因为不同的口径,公安局人口办报上来的、统计局报上来的数据是不一致的,而我们这个是完全准确的。这是第一个。
 
  基于这些网格采集员采集回来的数据我们做了示范性应用。首先我们在劳资领域里实现了预警。为什么提出这个案例?很有意思的是很多政府部门都面临群访的问题,就是老百姓来堵门的事情,我们区里面有40%的事件由劳资纠纷引起的,所以我们把这个定为一个首要解决的问题。40%都是因为没拿到工资到政府来要钱的,到政府来协调这个工作的。通过采集数据我们可以预盼一些企业可能有欠薪倾向的,我们做了一个业务模型,给每一个企业打分,根据他的水电费、纳税其他、房租缴纳情况、劳动纠纷情况,我们做了一个模型。如果预盼这个企业分数比较高了,可能有这种倾向的时候,就通知劳动部门提前干预,这个确实起到了一定效果。就是这个企业还没有到劳资纠纷矛盾很尖锐的情况下已经有人先去干预,避免了一些,已经明显取得了效果。来上访的比例,劳资纠纷这块明显下降。我们利用掌握的数据做了区内部经济运行景气度的研判,有点参考“克强指数”,不再按照统计体系提供的,因为大家发现统计体系提供的数据已经不太可靠。返回来我们通过区里面的各种类型企业注册数量还有各种类型工业型企业用水用电情况,按照这些指数然后做了一个模型,这是逐步的是分几个板块的,也做出了自己的经济形势走向的图。
 
  3、数据应用
 
  利用织网工程获取的数据在应急这块,我们都有自己的应急预案,但是往往执行时发现资源不在了,不知道资源在哪里,这样应急抢险时就浪费了时间,那我们把这些应急资源在GPS地图上跟事件做了关联,比如说现在坪山新区开始三级台风警告,这时候我们就会把所有可能出事的地方和所有可能提供资源的地方给它关联起来。比如说区里面有25个边坡,边坡在下大雨内涝的情况下有可能发生垮塌,那我们就把跟它相关联的清障车跟它关联起来,甚至要求清障车停到相应的位置,这样就对应急抢险有比较好的支撑。除此之外我们还上了128类资源给做了关联。
 
  第二个案例,就是安全生产的这块。大家都知道深圳出了一件大事,就是光明新区滑坡事件,影响非常大。我们的书记主任都通报批评了,而且处理了很多人、抓了很多人。这件事情影响很大,所以整个深圳各区政府体系里面大概大半年的时间都在干这个事。我们也是利用我们掌握的一些数据,把不同类型的安全生产的企业隐患点也让它标出来,利用专家资源对所有隐患点做评级评估,把所有对这些点位上的评估巡查记录,每一天巡查记录全部在图上做呈现,每一个点上可以一直挖下去。
 
  第三个,关于人群流动的案例。人群流动的案例非常有意义。我们这个是通过跟运营商的合作取得的数据,大量人的位置信息,这个有什么作用?主要是在规划和交通路线设置方面。我们知道现在非常多的大城市病,我经常说,北京交通不好,环境污染,其实光靠北京的环保部门解不解决的了?恐怕很难。所以现在很多后端出现的事情都是因为最前端的规划做得不够到位,而且规划做的很有限,大多数做了很多空间规划。一个城市人口有没有规划、产业规划有没有做到超前?从我了解的情况来看,缺失非常大。而这些规划大部分拍脑袋的成分其实不小。所以我认为首先大数据如果在政府里面应用最好先在规划领域里面去切,因为这个规划要管很多年,影响也非常大。所以我们现在对我们区里面的人群移动的情况做了一些分析,比如说我们总共有多少人,这些人通勤情况是什么样的,住在哪里,八九点上午移动是什么样的到了下午五六点钟移动又是什么样的,根据这个来规划新的交通路线和公交站点的设计,甚至包括公共交通设施的提供。这就是人群从深圳的其他各区流向坪山新区的情况,其中龙岗、龙华、宝安比较多,其他几个比较少。我们在交通规划线路安排上就会考虑到这个因素。这个是从坪山新区流出的情况。
 
  第四个案例,我们在拓展数据采集的渠道。除了刚才说的大数据平台对接之外,现在还有一个非常重要的渠道,就是我们已经给区内老百姓提供免费wifi服务,我们把这个看作一个非常重要的数据来源,因为老百姓上网时是有他的行为的,比如说访问哪些网站,这个可以做一些用户案例分析。分析出来的结果直接跟业务部门对接,比如说这个上网的人他大概是个20多岁的年轻人或者家里有没有小孩等情况,我会跟相应的业务对接起来,当然这个还正在进行中。这个点就是我们在这个城市感知的这一块已经把数据采集的感知从原来的传统体系里面抽离出来,把它当做重要的基础设施来建设。
 
  再一个就是职住分析,上班和住的地方是什么样的关系,也是考虑进一步的通行安排。
 
  最后讲一点,除此之外,我们现在也开始尝试远期一点的目标,在网上挂出坪山新区数据开放的平台。目前有几个城市,第一个是基于政务信息公开的需要,安排的有一些。除此之外会陆续的把我们认为已经去密去隐私化的数据逐渐往这个平台上放,接下来还会召开一些创新大赛的东西,提供一些开发工具,提供一些这样的平台,把数据资源放过去,封闭个十天八天,大家做出一些好东西出来,或者有一些好的构想,我们可以把你们这些构想在平安新区呈现下来,甚至跟我们的经济服务部门对接,我们可以提供给你一些就在我们区里面的一些创新创业的环境,你甚至可以在我们这里落一个企业下来,我想这响应国家的“双创”,会有一个比较好的结合点。这个工作现在还没有做,但是基于这个开放平台我们还有很多文章可以做。所以如果大家有这方面的能力或者有兴趣的话未来可以关注我们!
 
  谢谢大家!

第三十届CIO班招生
法国布雷斯特商学院硕士班招生
北达软EXIN网络空间与IT安全基础认证培训
北达软EXIN DevOps Professional认证培训
责编:邱建中