【2017CIO时代中国行苏州站】许剑锋:制造业大数据应用思路

2017-09-20 15:57:46

来源:CIO时代网

 2017年9月16日,由中国新一代IT产业推进联盟、江苏省企业信息化协会指导,CIO时代学院、苏州工业园区人工智能产业协会、江苏省企业信息化协会苏州代表处联合主办,CIO时代APP、苏州IT人俱乐部协办的“第四届互联网+高峰论坛暨大数据应用峰会CIO时代中国行苏州站”在苏州金陵观园国际酒店成功举行。上海洪朴信息科技有限公司总经理许剑锋在活动上作了题为《制造业大数据应用思路》的主题分享。以下为演讲实录:

\
上海洪朴信息科技有限公司总经理  许剑锋
 
  今天跟大家分享的是数据分析驱动智能制造,刚才汪院长,讲了不同的专业在理解在智能制造老师有不同的倾向和方式,可以分为三个模块,有一个是数据分析的模块,我更多的是从数据分析的角度怎么来理解智能制造,因为智能制造是个热门话题,智能制造到底怎么做,怎么个方向,怎么实现,怎么实现大家都在摸索,今天主要从数据分析的角度进行切入跟大家进行探讨。
 
  什么是数据分析?英文有两个单词,一个叫Analysis,一个叫Analytics,Analysis更多的是简单的数据分析,包括报表的分析。Analytics说的是什么呢?包括机器学习、深度学习、回归算法,特征提取,这个就是我说的数据分析。
 
  前几天我跟资本圈的人交流,他们说前两年是大数据的年代,今年开始变成了AI的年代,其实我听到这个话题有些惊讶,因为这个说法有点外行。大数据和人工智能,从某种角度来说是高度交叉的概念,但是角度不一样。大数据更多是数据的角度理解这个问题,人工智能是从效果的角度理解这个问题,这两者高度交叉,两者交叉的中间的点就是数据分析,无论是大数据还是人工智能,最核心的还是数据分析。有人说数据分析很简单,无非就是通用的算法,机器学习、深度学习,像这两年比较火的人脸识别,是因为深度学习技术的改进。现在我们讨论数据分析驱动智能制造,这个数据分析不是现在两三年才出现了,而是因为硬件技术和数据分析技术的发展让很多问题变成了现实。
 
  数据分析是不是就是通用型的算法呢?比如说一些机器学习的算法确实是很通用,在金融行业,想进行风险控制,识别这个账户有没有风险,这是一个典型的0和1的问题。机器学习里面是分类问题,只要用支持向量机、逻辑回归就可以完成了。我们换一个场景,在医疗行业,现在要识别某个疾病,要识别某个片子有没有疾病,也是0和1的问题。
 
  但在实际应用中,尤其是智能制造中,有时候通用算法有时候效果不是特别好。有一个非常经典的例子,就是跟电力相关的行业中,大家要预测,这个客户未来一段时间会不会欠费,大家一听又是支持向量机的问题,他们找很多人在做,出来的精度只有86%。我想说什么呢?数据分析通用的方法虽然可以用,如果想要做好,是要有一定的定制化程度。在数据收集过程当中,你把数据量大大的缩小了,丢失了很多数据,真实的数据中,这个客户有什么不收费的,被你强行的看成0和1,换一个思路是不是更好呢?survive model我们试了一下,效果会很好。我们给另外一个工厂来做了一个测试,每年的电话量是几百万之巨,美国人雇人是按小时来付的,人员波动量非常之大,这个时候,如果你精准的预测出有多少人打电话可以很好的降低费用,常规的算法就是时间序列的问题,最后误差是17%。可是我们用数据分析进行仔细的分析过之后,发现这里面呈现是非常好的pattern,比如说这一周周一是21号,你往前找前面那个周也是21号,你会发现数字是完全一样的,这个是统计吗?不是统计,是计算机里的Analysis加上统计的模型加上来的,误差从17%降到了5.02%,好的数据分析并不是通用的数据分析方法,就可以出现好结果的,要理解问题本身,理解数据,更重要的是理解行业。通过数据分析驱动智能制造,就是对行业进行更加深入的理解。
 
  制造行业的痛点:生产成本高、生产效率低、质量控制难,针对这些痛点,我们能通过数据分析提供什么方案,能帮助制造企业做什么呢?智能制造这个是国家政策,是一个风口。我们定义为数据驱动智能制造。
 
  产品应用场景——缺陷识别
 
  这个是Intel的场景,关于Intel场景,数据分析不仅仅是文本数据,不仅仅是ERP里面的数据,可能涉及到图像数据、声音也是数据。大数据年代也好,人工智能也好,数据分析是融合的数据分析。比如说人脸识别,很多公司的算法更多的是基于图像的算法在做,但是其实在生产过程当中,数据绝对不是单元的,往往是多元的,所以就给数据分析带来了挑战。这是Intel的图像问题,也比较通用,芯片里面有各种各样的缺陷,不光是芯片,生产过程当中,原料、生产、检测、仓储,检测变成非常重要的环节,通过机器的算法,这个算法并不是那么复杂,最后的效果是什么?精确度提高到1.5%,生产效率提升6.7%。
 
  以数据分析作为切入点,你是做算法还是做软件,还是做什么呢?我们是做整体的解决方案。Intel是有自己的光学设备、光学采集,X光采集,有些工厂可能是手机的Display,这个时候,我们提供就开始延伸一整套的解决方案,但核心还是数据分析,现在市面上很多创业公司都在做检测这一块。很多公司还是偏硬件这一端,我们的切入点有点差异,为什么从这个点切入?大家发现机器检测中,有一些亮点,通过图像的方法解决,可以通过直径如果超过某个阈值,我认为就是一个缺陷,但是有一些缺陷你很难量化、刻画它,我们称之为Notwelldefined,但是现在机器学习出来,现在这些问题都是要迎刃而解的,这是一个比较常用的场景。
 
  产品应用场景——仓储物流
 
  生产区往仓储区发送订单,每个订单包括一系列的零件、配件,那个仓储都非常大,一个订单有时候走几公里的距离,半年下来,行动距离就是1890万米,现在他们实际情况是什么,把产品变成快区和慢区,这个产品经常用就快区,少用的就在慢区。可是问题来了,虽然放在快区,一波产品不只是一个,可能要跑到慢区兜一圈,那能不能经过一些相关性的分析达到这种效果呢?后来通过分析,给整个物流距离降低30%。其实现在大家都有仓储管理系统,但是都没有充分利用好现在最新的科学技术和算法。
 
  产品应用场景——质量控制
 
  最后一个是良品率,现在我们通过ERP、MES,还有各种传感器采集的数据等,通过大量的数据,这些参数有的是可调的,有的是不可调的,有的是每一秒采集一次,有的是每一天采集一次,能不能把这些数据融合在一块,通过特征提取的方式,把良品率相关的提出来呢,作为参数推荐?比如说有一些铸件公司,他们涉及到金属微量的参数,他们规格中会有各种范围,根据具体的来料怎样调参数,从而达到良品率最高。
 
  这是涉及到数据分析的三个典型场景,当然我们也有其他的场景,比如排产、订单预测之类的。
 
  数据分析的作用越来越大,越来越关键。现在有个问题很难解决,我们80年代出生的人,在2000年,国家做过一个事情,开办了一百所软件学院,通过这种方式实现了软件人才的积累。可是现在发现虽然很多人都做大数据学院,数据分析的人才极其缺乏,这就是很大的问题,想做数据分析又有几个问题,一个是要懂计算机,懂统计,更重要是要懂行业。所以说,数据分析的人才会比软件的人才积累更慢,这就是将来某种程度上,会制造会产生重要的因素,不一定所有人都能意识到这个重要性,包括我们自己招人过程当中都意识到这块人才非常缺乏。
 
  谢谢大家!


相关资讯

“第37届CIO班”开学典礼成功举办

2024-03-16

2024版中国CIO知识体系正式发布

2024-03-14

2024版中国CIO知识体系即将发布

2024-02-23

“第九届金融CIO班”和“第十届互联网CIO-CTO...

2024-01-22