杨学山:谈谈信息流引领

2019-07-15 17:17:15

来源:CIO时代学院

  2019年7月14日,由中国新一代IT产业推进联盟指导,CIO时代学院、中国电子科技集团公司第十五研究所计算机质检中心主办,全国高校大数据教育联盟、章鱼大数据、万山数据协办的“第八届中国大数据应用论坛暨中国电科15所大数据应用论坛”在京隆重开幕。北京大学兼职教授、工业和信息化部原副部长杨学山在论坛上发表了题为《谈谈信息流引领》的主题演讲,以下为演讲实录:
 
\
北京大学兼职教授
工业和信息化部原副部长   杨学山
 
  数据驱动和信息引领原则上不是同样的事情,总书记在网络安全和信息化工作座谈会上对信息流引领也有一个精确论述。信息流引领技术流、资金流、人才流、物资流,来实现资源配置的优化,使宏观经济形势面临的一系列困难能够得到缓解,这是信息流引领的作用。
 
  其实我们在走向数字经济,使数字在经济社会发展的各个领域要能够发挥作用,有很多的问题需要回答、需要解决。到现在为止,应该说我们从工业经济转向数字经济,用好数字现在最困难的事情是对数字本身的认识,或者说对信息本身的认识。我可以十分负责任说:现在在全世界范围内没有解决“数字是什么”这个问题,这是我们今天走向明天最大的困惑。
 
  信息流和具体的数字之间是有区分的。一个数据在一个分析判断和行为控制中发生作用,和一个跟这件事相关的一个完整的数据结合或者叫数据链,它来引领物流、人流、资金流,是不同的。尽管理论上没有解决,实践上要围绕着事情解决问题、取得价值,实践就没有错。具体的数据结合和一个信息流引领的数据结合,这是两个不同的角度。
 
  一、如何理解信息流引领
 
  关于数据流引领,讲三个例子:
 
  第二个例子是地图,大家在用地图的时候是什么感受?地图已经从原来不怎么好用,到了今天十分好用,几乎司机都用地图作为开车的帮手。为什么能做到?首先它必须要有基础信息,地图信息上没有或者错了就不行。导航这几年因为地图数据错误产生的困惑,有一次最严重的是走了冤枉路2小时。名字一样,但实际上地点不一样。在北京前门导到了后门,而后门是进不去的,你得绕过去。我的位置,也是目的地位置,也是路径的基础。那么我的位置基于什么?基于基站。因为我们走路、骑车,什么时候都可以找到我的位置,所以载体是手机,基础是基站。而且在这个地方不是说你在导航时才会有你的位置信息,而是手机只要在工作,就会有这些信息,跟你是否导航根本没有关系。还有计算,要计算首先要知道这条路上路况如何、路是什么、走哪条路。从哪来?也是从基站来。因为你的手机给基站提供了信息,手机和基站是定时连接。计算是十分复杂的,是对每一个人在进行计算。你一打开它就马上计算,没用的人也在随时计算,所以有很强的计算能力的要求,这些是实现导航的基础。
 
  所以信息流必须是有基础信息,有算法、模型、平台,还得有商业模式。因为没有商业模式,车载导航为什么都玩完了?因为模式不行。那么价值在什么地方?今天真正互联网用的多的,导航、支付、购物,这是真正用的多的。再往后,比如说搜索、游戏。真正用的多的就是这些,所以价值十分清晰。
 
  第二个例子是电商物流。从我们手中一个订单出去,到完成所有的事务处理过程,然后再通过物流把东西送到手里。它必须有一个完整的基础信息,缺一个环节都不行。第二,它依然要有算法模型。为什么?因为并发太多。固定的事物流不要算了,因为路径都已经确定好了,完完全全就在它已经确定的路上走。对于平台本身是需要算法的,因为它并发处理的太多。当然,还得有模式,模式不对,就生存不下去,所以电商平台生生死死年年都在上演。
 
  第三个例子是自动控制。在控制过程中,有一个具体的情况发生变化,变量发生变化,控制就要做出调整。这是具体的一个数字在发挥作用,但是对于信息流使得一个控制过程实现,它同样是跟这个控制一致的完整的数据流,所以这个控制过程才能实现。这两边一个是工业的,一个是农业的,其实都一样。抽象到模式完全一样,所以还是事情有价值,这是根。对这个事情要有完整的,让这件事情能够实现得到价值的数据链、数据结合,是数据+信息流。
 
  二、信息流引领的一般框架
 
  归纳起来说信息流引领,第一是在一个事情里面是该由它引领的,如果这件事不该它引领,那它也引领不了。第二要有价值,因为做这个事情要付出成本,付出成本就要得到回报,产出大于投入,这是核心。后面才是信息、流程、模型、算法,还有相应的物流、资金流。不是说有了信息流就必然能够引领的,因为中间还有很多环节,要有能力、环境支持,如果没有环境制度的支撑也是做不到的。
 
  从一般模式再回到实践,尽管我们对信息流为什么引领、如何引领,在理论上还有很多不清晰。但是实践上很简单,就是做什么事情解决什么问题,然后做这件事情通过一个完整的数据结合或者数据链,能够对这个事情的解决和创造价值带来什么作用。
 
  三、信息流引领的实践特征
 
  车里面的车控系统,控制动力和传动的是动力传统相关的系统,控制车窗车门的那是车窗车门的系统,控制椅子的那是椅子的系统,一个车里面十几个控制系统在工作,那么信息流引领,只要我做的这个事情数据链是完整的,它就能够实现控制的目标。比如,飞机MH370,四年了依然在发酵,这个事情究竟怎么回事?因为数据链断掉。如果万一飞机数据链没有断掉的话,到今天哪会有那么多悬疑?而这个“断掉”好奇怪。尤其是GE的发动机本来是可追踪的,但为什么偏偏就没有了?因为马航没有买这个服务,所以信息流是对应着具体事物的。为什么GE对MH370的发动机回馈数据不收集或者不提供了?因为没收到钱,没价值。价值信息流可以得到,也会被断掉。
 
  在制造业,从手工到机械化、从单台数控设备到完整生产链,再到完整工业4.0,在企业里面端到端的数据无缝结合,都是在讲如何实现信息流使得我们的产业一步一步往上走。而不是一个数据针对一个具体动作或者判断有什么作用,而是完整信息流改造着原来的过程。
 
  在所有的这里面它的信息流都是具体的,而不是抽象的。而且在这样的过程中使用着无数个算法,各不相同的算法,深度神经网络在这里面几乎是作用是零。上周看了一下钱学森的《工程控制论》,再看看今天大数据的书和人工智能的书,确实是差别太大了。他的书都是针对着我们在工程控制领域什么问题、什么算法、怎么解决,而我们只有算法,没有问题、没有怎么解决。建议你们认真看,制造业领域,今天钱学森的《工程控制论》比所有其他的书都要有用的多。
 
  电子政务信息流如何引领?关键在什么地方?今天都有数据的框架图,这个东西能引领吗?根本不能引领。为什么?因为引领要回答的问题,这里面根本回答不了。引领是要有一个真正的目录,能够把做的过程以及这件事物本身,能够清晰地显示出来。这个目录不是分类的类名,不是文件的文件名,而是真正要用的那一个里面的内容。也就是目录是要标识它,是怎么来的,语义是什么。必须在前面所有的来源标识清楚,所有的使用也要说清楚,谁能用、为什么能用,用的时候又如何连接。
 
  最近一直说“互联互通”这个概念,把电子政务坑苦了。电子政务要的是互操作,而不是互联互通。所以真正使用时,从职责、事务、人和技术实现,安全、边界都标识清楚。使得所有资源、流程连接平稳实现,才可以对过程进行优化。农业也是这样。
 
  信息流引领确实可以使得我们在做一件事情的时候,它会完成的更好。通过数据可以使它优化,可以使企业一个具体的流程得到改观,宏观会使得整体效率得到提升,但是它怎么实现?要把这个问题想清楚。工具、模型、算法、平台十分重要,但是算法、模型、工具、平台不唯一。一定要知道,不唯一。网络平台不唯一,而模型就更多了,一个事物、一个事物中的局部都是模型。还有算法是局部的,一个工业过程、农业过程、政务过程,经常是几十个几百个才完成一个控制过程,所以不唯一。
 
  我们所要的就是能够真正把这个事物优化、实现,然后平台、算法这些都是工具,工具是围绕着事情服务的,而不是事情围绕着工具转。我们今天最大的错误就是事情围绕工具转,这是我们认识论的错误。谢谢大家。