西门子研究院叶昱冬:基于工业云架构的大数据分析

2018-01-04 09:48:15

来源:CIO时代网

  2017年12月22日-23日,由新一代IT产业推进联盟指导,CIO时代学院和CIO时代研究会主办,CIO时代APP承办的2017CIO践学活动于南京成功举行。12月22日下午,西门子数控业务拓展经理叶昱冬发表了《基于工业云架构的大数据分析》的主题演讲,以下为演讲实录:
 
  \
叶昱冬
西门子数控业务拓展经理 
 
  首先非常欢迎各位领导、专家今天下午参观西门子。下面就由我们西门子研究院的叶工给大家介绍一下西门子数字化工厂,以及数字化工厂前期,西门子每家工厂正在做的数据云这块的工作。因为国家也在大力提倡每家企业的私有云,那么私有云、大数据这块也是数字化工厂的前提条件。由于时间有限,了解一下西门子的数字化工厂,之后由叶工介绍一下西门子在大数据这块的工作,这些都为企业智能化、数字化工厂做项目的一些前提。
 
  以成都数字化工厂为例,简称SEWC。成都工厂是目前中国最接近于工业4.0的一个工厂,主要概念是西门子提出来的,称为“数字双胞胎”。我们讲一下大数据和云计算方面的工作,作为SEWC我们最接近于中国工业4.0的工厂,这个概念其实是指在生产每一件产品的时候都生产出两件产品,一件是虚拟化产品,另一件是看得见摸得着的真实生产的产品。而这个“数字双胞胎”指的是虚拟化的产品和真实世界的产品,这两件产品叫做“双胞胎”。这个“双胞胎”的意义在哪里?即本身虚拟是什么,生产出来的实体就是什么,因此这是“双胞胎”的一个概念。经过西门子这一套系统生产出两件产品,也就是说每次我们都可以先通过计算机先生产一套,生产过程再应用到实际过程中让机器真正生产出一套,因此提高了效率、提高了质量,各方面达到了工业4.0要达到的目的。
 
  今天我们要讲基于工业云架构的大数据分析,包括以下有四个方面的话题:一个是目标价值,这其实是我们要做的工业大数据,以及我们的目标;接着是产品的特点;在工业领域的应用;以及后面的案例。
 
  一、目标价值
 
  我们说工业4.0、中国制造2025、两化融合,它的核心叫做CPS。工业4.0的定义就是以CPS为核心的第四代工业革命。那CPS其实就叫做Cyber-Physical Systems。Cyber-Physical Systems翻译成中文即信息物理系统。信息物理系统这里的物理就是现实世界看得见摸得着的东西,比如说今天我们看SNC的厂房、SNC的产线,这些都是看得见摸得着的东西,这就是物理。那么信息是什么?信息其实是处在虚拟世界里针对物理系统而进行的一个数字化描述。也就是说,信息系统与物理系统是一一对应的。我们要做的其实就是把看得见摸得着的物理世界,与它在虚拟世界里做数字化的描述高度统一起来。
 
  那么可能会有疑问,建一条产线为什么还搞这个?有产线就可以直接生产了,为什么还要搞一个虚拟世界?其实是有用处的。我们说不识庐山真面目,只缘身在此山中,因为我们的视野范围是有限的,我们看不到整个工厂,看不到整个流程,我们只能看到局部,而我们看到的这个局部,因为我们本身没有X光透视能力,只能看到表面,但里面发生什么都不知道,这是人的局限性。人需要通过虚拟世界给你呈现的这些虚拟指标、数字,进而控制现实世界。这是为什么要去建这个信息系统,要去建这个虚拟世界的原因,为了更方便的让你掌握和控制产线、工厂,这是我们的目的。现实世界其实就是有,虚拟世界就是无,这便是有和无的关系。有和无的关系不是舶来品,早在老子的《道德经》中就讲述了有和无的关系,有之以为利、无之以为用。有就是看得见的有形东西,无就是看不见摸不着的东西。有之以为利就是看得见摸得着的东西,这是我们可以利用的基础,但无才是真正起作用的地方。因此,有和无的关系就体现在这里,这也是我们目前建虚拟世界、建信息化的初衷,我们通过这个让人能更方便的操控整个现实世界。这也是很重要的一点,因为下面要说的东西都是要来建它的,只有建好了它才能完完全全的控制现实世界中的物理实体。
 
  1.工厂现状
 
  其实很多工厂在10-20年内,他们也为信息化建设投入了大量的资金和人力。但这些投入其实是针对一个特定的项目或一个特定的目的在各自的部门里做的一些信息化的建设。比如财务部门、办公自动化或其他方面、销售系统等等。这些其实在信息化建设上也有一定的进步,但同时也带来一个问题,即各部门的信息化相对独立,形成了信息孤岛,也就是说每一个部门的信息很难传到其他部门。以销售为例,销售在拿到订单时也许不知道目前生产车间里有一台重要的设备坏掉了,他不知道这个订单是否能准确的按时交付,这种情况下是信息不通畅的一种表现。
 
  2.解决办法
 
  我们就要有一个解决的办法。当然了这是一个概念性的解决办法。我们要把这些系统融合起来,比如我们将现有的ERP系统、MES系统、过程控制等这些已经做好的,当然这里面可能也有一些系统还没有的,各个工厂或各个企业发展的层次也不同,但我们要将这些系统融合起来,形成一个统一的基于云平台的大数据分析系统。这是我们的目的。
 
  3.大数据云平台系统的价值
 
  我们建设的大数据云平台系统未来会给企业带来哪些效益和价值?我们看到,从总的方面来讲其实效率可以得到提升,也就是说我在信息的获取上,不再是只有我这个部门的信息,同时可以得到相关部门的其他信息。另外就是可以降低成本。其次也可以提高整个产品的质量。
 
  提升效率。当我们知晓这个设备很可能会失效时,生产和维修的主管能审慎安排相关的活动,从而最大限度提高设备的可用性和正常的运行时间。也就是我们在提取这些设备数据时分析这些设备是否处于一个健康的状况,还是说处于亚健康的状况。
 
  降低成本。通过虚拟环境了解到生产资料的实际情况,维护工作可以在更合适的条件下施行。我们现在做产线的维护,像4S店维修车一样,过三个月或五个月我们把车开到4S店进行保养,但这个车是否应该进行保养,其实也就是人家说要保养,保养好了,买个心安理得。但我们产线的设备是否应该去换这个零部件呢?如果换早了成本就浪费了,如果换晚了它要是一宕生产就无法生产了,这都是有问题的。
 
  提高质量。衰退模式和近乎实时的设备状态是可实时的,因为一条产线不可能在每一个工位上都做一个质量检测点,可能SNC、SMT线只有一个检测点,有些线可能有两个检测点,但不可能每一个上面都有检测点。我们在采集这些过程数据时便可以看这些过程数据是否正常,如果过程数据不正常我们就可以给你一个报警,目前这个数据可能有问题,但产品是否有问题需要看一下。但我们可以把整个生产的过程数据都采集上来进行分析。
 
  4.基于云平台的大数据分析系统架构
 
  接下来看一下基于云平台的大数据分析系统,物理上的架构即产品的布放情况。云平台是一个服务器节点,通过云平台有一个大数据分析系统。除服务器节点外,它有数据监控的节点,这个数据监控节点主要是采集产线的数据。通过采集产线的数据可以将这些数据源源不断的送到服务器上。有了数据采集节点,我们还有驾驶舱大屏的节点,这其实是大数据应用的一个体现,我们可以将不同大数据的模块集中在一个屏幕上进行展示对比。我们还有客户端的节点,客户可以在需要的地方可布设客户端,在身份认证后就可以通过客户端节点来访问整个系统。为了更方便客户的应用我们还有移动客户端的节点。基本上就分了以下五个部分:服务端节点、数据监控节点、大屏幕界定、客户端节点及移动客户端节点。也就是说它的物理架构大概是由这五个部分来组成的。
 
  服务端节点主要是基于私有云平台的大数据分析系统。数据监控节点主要是做数据采集。目前来看,所有西门子硬件的数据采集都是支持的。大屏幕节点对实时数据和历史数据都可以进行展现和分析,这个模块是可以自由组合的。客户端节点主要是通过认证,客户可以通过客户端节点进行远程监视和控制,实时和历史数据的查看报警记录。移动客户端目前支持在手机、pad上的展示。这是系统的物理上的组成。
 
  这个系统从逻辑上讲分为以下四层:一层是数据采集与监控。第二层是协议转换与服务总线。第三层是大数据分析。最上面是应用层。数据采集与监控都很好理解,目前采集手段也非常多,我们主要采集产线上的数据。
 
  数据采集监控之后,协议转换与服务总线是做什么的?有些企业MES系统不止一个,他可能有一个老的MES系统,又有一个新的MES系统。但新的MES系统不能完全替代老的MES系统,这时两个MES系统是要共存的。我们采集上来的数据,除了MES系统还有仓库管理系统等其他系统,都存在一个采集上来的数据到底应该送到哪里去的问题。如果不知道采集上来的数据路由情况,便搞不清数据的目的地了。在这种情况下我们需要协议转换与服务总线,它可以标识每条消息的路由,把这个消息送到该送的地方去。
 
  大数据分析是我们产品的一个最大亮点。大数据的应用已经越来越多,但目前很多工业企业还没有用到大数据。我们也与一些客户接触时,有些客户提到很多IT系统都没有用大数据。其实它的反应速度上是有问题的。比如我们在百度上查一个东西,如果让你等5分钟你才能看到结果,你可能很难接受。因此,我们用Oracle也好、用MySQL、用关系数据库可以把数据存进去是没有问题的,但当你要读出来的时候它的效率非常慢,这就体现出它的一个弊端。
 
  再上面就是应用层,基于不同行业,它的应用也是不同的。
 
  二、大数据分析系统的亮点
 
  总结一下,这个系统的几个亮点,具体有以下六条:一条是工业大数据的平台;然后是基于原生态的云平台的架构;再一个就是数据多维呈现;其次是多设备的驱动支持,指采集产线数据时,我们支持多种驱动,目前可以支持西门子全系列硬件产品的数据采集;然后我们有辅助专家系统,其实辅助专家系统是基于大数据,因为没有大数据我们想做辅助专家系统是很困难的。因为我们现在所说的深度学习、机器学习,都是基于大数据来做的,辅助专家系统其实就是深度学习的例子;最后就是系统的高可用性、稳定性。这是六大功能亮点。
 
  1.工业大数据平台
 
  我们刚才说了速度,因为普通的关系型数据库在存储数据时是没有问题的,但当你取这个数据的时候可能速度上会有很多的限制。其实还有量上的问题。成都工厂SEWC,我们也合作做了产线数据的采集及产线效益的分析项目,我们在PRC200组装线上试着采集了设备状态的数据,一天采了5G的数据,而这只是半条线的数据量。在这种情况下,我们如果用关系型数据库,那我们可能采集的很多数据在一定程度上都得抛弃掉。
 
  同时,我们目前的工业数据其实已经不仅仅是结构化的数据了,它其实包括非结构化的数据、半结构化数据。什么是非结构化数据?比如我们有一个项目是设备一报警之后,这个信息立刻会传递给摄像头,摄像头会针对于报警的位置拍一张照片,那这张照片就传到系统上去。那么这张照片的数据就是非结构化的数据。机器如果用关系型数据库是很难做的,因为关系型数据库存照片基本上是以文件形式存在的。但作为大数据而言,它可以完全从非结构化数据,甚至这种照片数据可以用机器学习等方式通过机器识别画面里面到底有什么问题。这是数据多元向的问题。
 
  还有一个就是真实性的问题。从不同源头采集的数据,对数据的清洗,相当于我们一条产线采集整条产线不同点位的数据,某些点位的数据意义可能相同,但我们从不同源头采集意义一样的数据时,就要对数据进行甄别。哪些数据可用、哪些数据不可用,或者说这两个数据要通过一定的算法算出一个结果才可以使用,这时候就有真实性的问题。
 
  我们不是因为有大数据技术要用,而是因为有下面的这两个目的才要用。一个是可见性,我们可以将机器里不可见的因素拿出来。比如我们今天参观的SNC产线,大家能清楚看到SNC产线目前的效率,大家肯定看不出来。因为不通过计算怎么能够看得出来呢。所以我们要通过数据的方式把一些隐性特征、属性展现出来,告诉你目前我们的产线效率。然后就是价值,当我们拿到这些数据后,作为大数据而言,采集的数据价值密度性比较低,但你拿到这些数据后你可以分析出来,通过你的产品数据可以分析出来我是否还可以有改进的地方,是否从原始数据中发现新的价值为企业决策提供依据。
 
  2.基于原生态的云平台架构
 
  就云平台而言。我们将软件装在硬件上就好了。但是其实你在做私有云平台时不是这样的。我们会把这个软件部署在云平台上。云平台是在硬件和现有的应用之间又搭了一层。搭这一层的目的,从硬件角度讲,我们可以随时分开硬件。原先服务器必须是一样型号的服务器加进去。但现在云平台可以不同型号的设备、硬件作为硬件资源加到云平台中。作为应用层也可以快速部署,因为它看到的不是操作系统,而看到的是云平台。有的应用部署在云平台,其部署时间会大大缩短。这是云平台的意义。
 
  目前,大数据和云平台两个技术其实是“一个硬币的正反两面”。也就是说云平台可以对大数据提供丰富的硬件资源,基于云平台做大数据的应用是相得益彰的。
 
  3.数据的多维呈现
 
  数据的展现方式是多种多样的,除了PC外还有手机、pad、大屏都可以进行展示。
 
  4.多设备的驱动支持
 
  这其实是数据采集方面。目前,我们支持西门子所有硬件设备的数据采集。
 
  5.专家辅助系统
 
  其关键是建模,用数据来训练它。通过数据的训练来进行模型,这个模型的好坏决定于机器给定结果的准确性,它有一个建模、数据训练的过程。
 
  6.系统高可用性
 
  即我们可以有备份,支持备份。
 
  三、应用
 
  效能分析,其实我们目前也在SNC在做效能分析,作为一个工厂而言,比如工厂的老板雇了员工,员工在上班。很长一段时间,是老板雇了员工要给员工发工资的时间,成本都会发生在这么一段时间内。但其实这么一段时间并不是员工都在工作的,包括有计划工作的时间和非计划工作的时间,这些都是为了更好的生产。因此分为两段时间:计划的不工作时间和计划的工作时间。即便有了这个计划的工作时间,也不是机器真正在开动的。因为机器有可能宕掉了,无法生产。这时会有一个机器真正开动的时间。这个时间会越来越小。那么真正机器开动的时间其实也不是真正在生产的,真正生产的是这段时间。像SNC一条产线可能生产多种产品,从这种产品换掉另外一种产品时,时间是要损失的,而且在速度上也可能有损失。在这种情况下,属于净生产的时间。但净生产的时间还不行,因为你在净生产时还可能生产次品,最后要将生产次品的时间去掉,也就是说你真正生产合格品的时间就这么一块,这一块才是老板最关心的。
 
  而且一个车间、一个工厂,将OE计算作为信息化建设的入手点。因为OE出来后你会发现设备的维修、保养、维护是否需要提高,人员的管理是否需要提高,各方面的计划是否需提高。
 
  下面设备健康管理。有了刚才的介绍,我们当然不希望设备宕掉,我们希望设备宕的时间越少越好,因为宕的时间越少产线工作的时间越长,产生效益越高。因此有设备健康方面的管理。然后是产线的监控,同样我希望我能监控到产线实时运行状况,而不是走到车间里才能看到。有了设备健康,可以有运维方面的管理,如何保养这条产线,做产线的运维,这些应用都是可以做的。其他应用包括物料、人员等等这些应用。
 
  四、场景案例
 
  可以做到工厂信息化、智慧园区等,以喜力啤酒为例,它在奥地利。啤酒这块,每生产一瓶啤酒主要的成本在在罐装。在罐装这块如何提高罐装的效率是很关键的问题。因此,通过这块来提升罐装环节的效率达到提升整个产线效率的目的。