【2017CIO时代中国行苏州站】汪卫:工业大数据与智能制造

2017-09-20 16:37:37

来源:CIO时代网

  2017年9月16日,由中国新一代IT产业推进联盟、江苏省企业信息化协会指导,CIO时代学院、苏州工业园区人工智能产业协会、江苏省企业信息化协会苏州代表处联合主办,CIO时代APP、苏州IT人俱乐部协办的“第四届互联网+高峰论坛暨大数据应用峰会CIO时代中国行苏州站”在苏州金陵观园国际酒店成功举行。复旦大学计算机科学与技术学院副院长、中国新一代IT产业推进联盟常务副理事长汪卫分享了题为《工业大数据与智能制造》的主题演讲。以下为演讲实录:

\
复旦大学计算机科学与技术学院副院长、中国新一代IT产业推进联盟常务副理事长  汪卫
 
  很高兴有机会跟大家交流一下我们做的对工业物联网大数据的一些想法。我大概讲三个方面,先是技术挑战,然后是主要技术,最后通过应用案例,来看在工业物联网大数据里面什么样的问题需要解决。
 
  工业物联网大数据的技术挑战
 
  大家平时这些反映过来的大数据,更多的是和互联网相关的很多内容。的确,现在电商、互联网领域里面,大数据的应用非常的广泛。但是实际上在很多的制造业领域里面,也有大量的数据,产生的数据规模,可能不比互联网的数据量小,不管是在离散制造业还是在流程制造业里面。
 
  这几年对于工业的转型,不仅仅是我们国家,而且从国际上来说也是非常重要的方向,我们国家叫中国制造2025,这些计划推出以后,都是希望用新技术的互联发展,提升制造业的能力或者制造业服务的水平。不管是德国的工业4.0、美国的GE的工业互联网白皮书里面,都把数据的处理和分析的能力作为整个体系非常重要的一个部分。甚至于GE突然间变成了一个软件和数据的公司,在工业互联网领域,GE发挥了非常重要的作用,像他开发的产品已经成为工业互联网里面标杆的产品。
 
  大数据和智能分析是关键支撑手段
 
  在工业制造业里面,信息化实际上是一个持久性的工作。在此之前也做了非常多的系统,比如说CAD、CRM这些在企业大量的使用,随着大数据的热潮,或者大家对数据的重视,除了企业内部的数据以外,也大量考虑很多跨界的数据,包括互联网上对产品的评价等等一些信息。我们主要是集中在机器设备的数据里面,因为前些年物联网的热潮,感知能力比原来提升了很多,而且这些传感器随着成本的下降,在很多企业里面,特别是设备里面的大量使用。在此之前买一个产品,不管什么样的产品,这个设备出了厂之后,基本上和工厂没有什么关系了,除了设备坏了以后你再回来维修。但是今天情况不一样了,有很多大型的装备,离开厂之后,还装了大量的传感器,生产企业不停地监控设备的运行情况,就好像大家开车,可能会有这样的经历,你车辆运行的情况,有的时候去4S店,实时传送给生产厂商,生产厂商拿到数据之后可以提供更好的维修服务,还可以知道商品真正出问题是出在什么地方。对于机器设备数据的采集和利用,是一个非常重要的部分。
 
  工业大数据的数据特点
 
  对于工业物联网的特点,第一就是数据模态很多,在不同的装备上,所产生的传感器的设备,采集的量都是不一样的,所以数据模态很多;第二是数据通量很大,传感器可以布很多,而且是7×24小时不停地工作;第三是协作专业多,在一个机器里面,有电,有机械其他各种各样不同的装备在里面,所以需要各种不同装备的数据合在一起进行分析;第四就是结构关系复杂,传感器和传感器之间具有紧密的联系。
 
  工业物联网大数据的挑战一:数据语义鸿沟

\
 
  不同的传感器采集的是不同点的数据,一方面需要利用整个的设计原理,去构造一个上层的情况,把这些信息合在一起,可以对一个设备有一个比较整体的认识,这里面存在着一个点到面的问题,根据生产的原理把很多数据进行整合。产生了大量传感器形成波形的数据,这种数据会发现单个的点,单个时间点的数据并不代表太多的语义含义,往往表现在一个事件和连续的变化趋势,这个所蕴含的语义含义更加广泛。对于单个数据来讲,还有一个问题就是在于事件语义的提升上面,需要把采集到的数据所表现的虚拟世界的概念,和工业物联网的真实情况要建立语义上的关联,这是我们要解决的一个问题。
 
  工业物联网大数据的挑战二:分析方法鸿沟

\
 
  在做整个系统或者项目的时候,不同的人思考的方式是不一样的,比如说这个领域专家,会更多的从设备的形成机理、原理进行判断,分析人员由于掌握了大量具体的分析手段,他们更希望利用分析模型,现代分析挖掘模型进行处理。这两者之间还是存在着一定的差别,当然实现的人员更多的是从实现的角度考虑这件事情怎么做。我们在做实验的时候,碰到另外一个问题就是分析方法的问题,怎么把领域里面的现有的专家的知识或者分析的手段,和数据挖掘和机器挖掘的领域里面,它的分析模型把两者做一个有机的结合,这个是我们面临的一个问题。既包括对领域知识的理解,同时也包括现有的分析方法的改造,这是分析方法上面我们所面临的一个问题。
 
  工业物联网大数据的挑战三:数据规模和处理效率
 
  主要是因为对于传感器数据规模很好算,到底有多少个传感器,采集频率是什么样的,剩下就是7*24不停地生成数据,这个生成数据的速度非常快,速度物联网应用的普及,传感器的规模不断地增加,而且生成传感器技术的提升,使得采集频率也提升很快,在某些特定的行业,采集频率可以达到GHz的规模,所以形成的数据量非常庞大。
 
  工业物联网大数据的主要技术

\
 
  在科技部的支持下,我们在做工业大数据的平台,大致分成了两层,一层是下面数据处理的平台,这个平台更多解决的问题是数据的管理,包括了对于在工业大数据里面会经常用到的结构化的数据,包括大量的时间序列的数据还有图的数据,还有BIM和BOM这样的部分。在上面实际上是各种分析的方法,包括领域的知识图谱、生产过程的分析、事件的分析、维修的分析等等。
 
  工业物联网大数据平台的建设意义
 
  工业物联网大数据的建设对企业来说,是一个能力很大的提升。物联网本身的构建可以提升企业的感知能力、生产感知能力、产品感知能力。随着大数据的管理平台,可以提升语义的管理能力,再往上就是智能分析的能力,最终提升整个企业智能水平,这对企业的发展非常重要,在此之前,像三一重工大型企业有接触,他们在核心竞争力里面的一个部分,实际上就是对于它企业内部各种装备数据的分析能力,实际上已经成为很多企业的核心的竞争力的部分。
 
  工业物联网大数据系统的关键技术
 
  时序数据管理技术。在云上面有很多分布式开源的系统,像Hbase、Hive、Spark、Impala都有一定的数据管理能力,我们正确应用的时候,除了数据能够存得下来,能够根据时间找得出来以外,还要做基于语义内容的分析,比如说是不是可以找出时间序列变化当中出现特定的形状,出现特定的突起形状的数据,在大量的时间数据里面怎么找出来,这个是我们发现现在的技术还是很难做到的,当然这只是一个例子,还有很多其他语义统计的特征。
 
  工业物联网大数据分析技术。我们真正得到时间序列的数据的话,一个单纯时间点序列并不代表有什么含义,要把他们之间的关系找出来,给我一个时间序列是不是可以建模,不同的数据是不是可以找到不同之间操作的关联,这是我们获得的关于电压和电流两个传感器,这是卫星上两个传感器产生的值,通过事件分析可以找出电压和电流在某些操作情况下变化规律到底是什么样的。
 
  工业物联网大数据融合技术。京风风电的风级,这个风机有很多故障单的信息,同时我们还可以得到很多序列的数据,对故障的信息和下面的序列数据进行一定的关联,有点像前面讲到的日志的信息和采集量变化之间的关联。汽车企业里面,有大量的关于每一辆汽车不同传感器采集的信息和故障的信息,更多的说是不是可以找到我们的故障和各种设备的状态之间的关联,这个实际上是当时在做的事情。

\
  工业大数据智能分析系统架构
 
  我们构建的工业大数据只能分析系统架构,这个是分析角度上面来做的,下面实际上更多的是做一些特征工程的事情,包括了时间序列数据的处理,包括一些特征和构建,在这上面实际上有各种各样的分析模型,以及融合之后的各种应用的场景。
 
  案例:桥梁健康监测数据管理平台
 
  通过例子让大家了解一下在工业大数据物联网数据可以做什么事情。以桥梁的健康监控为例,在上海有很多的桥,有一个黄浦江从上海中央经过所以有很多桥,而且有很多高架桥,桥梁的安全是很重要的事,是不是在所有的桥上都装上传感器,然后我们对于传感器的数据实时采集到城建管理部门,在这里面可以进行分析,一方面监控到桥梁的状态,对桥梁的养护能够提供依据。每座桥上面要做很多的传感器,数据规模非常大,像加速度传感器,数据采集速度就会比较快,其他的温度传感器采集的频率就会低一点,总体来讲还是很多,这只是一座桥,上海有很多座桥。我们碰到的问题,第一关于海量的数据怎么管理,第二就是对历史的查询,能不能有流行的查询方式,现在就是你告诉我哪天哪月的拿给我看一看,很难说我发生了什么事情以后,或者这个传感器的波形呈现某种形态的查询是很难做到的还有就是实时的监控处理能力也还比较弱。

\
 
  我们针对需求做的系统,利用云的技术作为底层技术的支撑,在上面做了大量的数据的挖掘,以及异常的监测和预警,来帮助他们进行桥梁的管理。

\
 
  关于流数据的处理架构,我们利用了Kafka把数据梳理出来,后面用了Storm进行处理,后面Hbase是对历史数据的存储。我们围绕它做了几件事,一是事件的分从加速度传感器,当桥梁面临不同事件的时候,表现出来的状态会有很大的差别。比如说桥墩被撞,地震、旁边发生爆破,传感器都有不同的形态,我们根据表现出来的不同形态,对它所经历的事件进行分析。对于桥梁的监控来说,虽然说有很多视频的探讨,这里列出来的事件实际上很难进行捕捉,像地震、爆破,实际上是周围环境的变化,像桥墩被撞,我们也不可能有这么多探头是朝向江面的,最多的是朝向桥面。还有过的重车,现在都是集装箱的卡车,你不知道集装箱装了多少东西,这都是我们视频手段没有办法解决的。但是我们通过对它产生的持续数据的分析,可以找到这里面的事件。其中像重车的经过,在这里不仅仅用到了一个传感器的信息,实际上用了多个传感器的信息合在一起进行分析。

\
 
  以上是重车的图谱,不同颜色的线代表不同的传感器,车过的时候就会经过不同的传感器,所以波形上有一定的差异,我们根据差异就可以找到车辆重车经过的情况。

\
 
  这个实际上是我们做的时候做的事件的分析,通过对波形进行一些处理,找到剧烈变化的特征,通过这些特征的组合,找到发生事件的情况。我们对Storm做了一些改造,传感器多了以后,数据过来的渠道太多,我们可能在向系统里面可能有上千个传感器,每一个传感器都要写出判断的函数,而像Storm这样的平台本身的编程比较复杂,对程序员的要求比较高。所以我们在这里,就像数据库一样,做了一层查询语言,用户不需要说真正懂Storm,只要把他想要的东西表达出来就可以,系统可以自动的把Storm上的程序生成出来。我们的程序员或者管理人员把预警的规则写出来就可以了,就不需要写后面具体的程序。
 
  实际上对于工业物联网应用里面有很多独特的地方,而且这里面有大量的问题需要去解决。
 
  谢谢大家!


相关资讯

工业大数据:构建制造型企业新型能力

2018-11-13

张洪斌:智能制造与工业大数据应用

2018-07-24

工业大数据如何改变制造业?

2017-08-10

工业大数据正用七大方式改变制造业

2017-08-04