【第六届中国大数据应用论坛】杨学山:大数据与人工智能

2017-07-17 16:08:38  来源:CIO时代网

摘要:2017年7月16日,“第六届中国大数据应用论坛”在北京大学中关新园隆重举行。北京大学兼职教授、工业和信息化部原副部长杨学山在活动上发表了题为《大数据与人工智能》的主题演讲。
关键词: 大数据 人工智能
  2017年7月16日,由中国新一代IT产业推进联盟指导,CIO时代学院主办,北大软件工程研究所、全国高校大数据教育联盟、北达软协办,CIO时代APP承办的“第六届中国大数据应用论坛”在北京大学中关新园隆重举行。北京大学兼职教授、工业和信息化部原副部长杨学山在活动上发表了题为《大数据与人工智能》的主题演讲。以下为演讲实录:

\
北京大学兼职教授、工业和信息化部原副部长  杨学山
 
  各位来宾、各位朋友,大家上午好!十分高兴参加第六届中国大数据应用论坛!我就按照大数据与人工智能这个主题谈一点自己的想法。
 
  大数据和人工智能与最近中国的天气一样,热翻天了。记得清华大学的张博院士在今年1月份谈到人工智能,冬天就在我们的面前,如何迎来春天?意思是如何通过扎实的工作使得人工智能在百花齐放时能有我们自己的位置。今天我想说的是,人工智能在夏天,但我们会走到秋天吗?还是从夏天直接到冬天?这个问题可能会使得在座的人有所疑惑,人工智能那么热结果会走到秋天吗?我谈一点想法,我们如果将张博院士在今年年初讲的这句话记住,那我们可能会走向秋天,如果没有记住可能会直接走向冬天。两者可能都存在,且从整体上来看,既有跨到冬天的,也有进到秋天的。那我们怎么做才能不跨到冬天?这是我想讲的主题。
 
  一、人工智能走向秋天的核心之一:把握人工智能的定义
 
  如果从夏天不走向冬天而走向秋天,核心问题是我们要真正把握住人工智能做什么?它的秋天是什么?这个问题是一个幼稚的问题,但我认为这确实是一个很大的问题。人工智能是什么?应该到今天为止也没有定论,各人有不同的定义。我对其的定义引自美国《人工智能》一书,有很多学校将其作为教材或参考教材,这本书上有一个定义:人工智能是计算机科学的一个分支;目标是使智能行为自动化。对于第一句话,很多人肯定不同意,因为人们认为人工智能是一堆科学。对于第二句话很多人也不同意,但我很赞成,人工智能就是要将原来由人或其他智能生物的智能行为自动化,由机器系统来实现。这样看的话,我们说人工智能怎么热起来的呢?第一是AlphaGo,第二是人工智能60年。但人工智能只讲60年行吗?肯定不行。我们要理解人工智能,就要理解人工智能如何真正收获其目标,必须往前走。从莱布尼茨开始,莱布尼茨有一个追求,就是有一个符号体系、逻辑体系,使得人类的思维活动能抽象地表述出来。但莱布尼茨提出的没能实现。后面有一些人沿着他的研究实现了一些,比如布尔将这样的符号体系,实现了基于人的逻辑推理规则。如果没有布尔,是没有今天的智能化、人工智能的,因为基础没有。但大家一定要知道,莱布尼茨到布尔,我们现在可将人的思维抽象,用它来编程序,实现计算机处理,但这样的过程,莱布尼茨、布尔的概念符号将逻辑表述出来了,再看目前的深度神经网络、深度学习,这两者相比谁在逻辑上的复杂性更大?谁在解释人的智能行为、思维行为上作出的贡献大?这个差距根本不在一个水平上。
 
  再往后看,我们经历了希尔布特的体系,他认为莱布尼茨、布尔的工作可以构成一个体系,思维、语言都可以通过一个体系来完成,但哥德尔否定了这一做法。确实,两人都有道理。我们可以做很多事,但其中确实有很多缺口。正是在这个时候我们走到图灵机。就人的计算过程而言,如果今天没有计算机,没有学过一系列计算机的相关课程,要求你将人的计算过程抽象成一个简单的模型,你有这个能力吗?就算在今天,你有这个能力吗?试想一下,图灵已经做出来了,你今天有这个能力。图灵其实极其简单,一个无限长的纸条,纸条上有一串一串、一个一个符号,五个五个可以叠加,5+3也可以。这样的一组编成一个行为,通过机器识别这样的符号、结构,五元组为标识的结构,进而进行操作得出结论。也就是将我们人类最复杂的、多年来不同的计算行为抽象为模型。图灵之所以被称为大师,就是形成了这种逻辑能力。
 
  今天人工智能哪一项工作可与图灵这个工作相比?AlphaGo可以吗?这里需要画个问号。以IT界的人都十分熟悉的芯片为例,芯片里最有代表性的是X86芯片,1978年8086、8088的诞生就预示着X86芯片的诞生,X86从4044起来,它是2300个晶体管,到8088时有29000个晶体管。到了今天,我们最新的一个芯片大概集成了300亿以上的晶体管。这是制造工艺,属于工业。但核心是什么东西使得这300亿的晶体管具备处理实际问题的能力?答案是逻辑的力量,怎么才能拥有逻辑的力量?首先是我们这些数学家对计算任务的理解和对我们拥有的芯片上晶体管的数量,如何使计算、存储等分配最有效,这是数学家的能力。但大家要知道,所有的芯片指令级是在这几十年的过程中不断完善和发展的。因此,X86基于是复杂指令级的,实际上从8086开始便持续地调整和变化。为什么调整?为什么变化?是应用的经验、使用的经验。它的主要力量来源于数据,我们说人工智能逻辑的力量和数据的力量在集成电路芯片上可以得到充分的展示。大家不要以为X86不是人工智能。可以比较一下集成电路芯片和AlphaGo,谁的智能更厉害。X86经历了40年实践、几万亿美元、无数个应用案例和数据,才到了今天的水平和能力,AlphaGo是没有的。因此我们在定义时,看人工智能是否与今天的这些内容比较之前有了重大的变化。
 
  二、人工智能走向秋天的核心之二:智能行为自动化
 
  如何让火热的夏天不进入冬天而进入秋天,核心就是定义的后半句话——目的是智能行为自动化,不进入冬天的话,这个智能行为必须要有几个最核心的判断:第一个判断是可以自动化,是可以做得到的,你不要做做不到的事情;第二个事情,你将智能行为自动后得到的回报是大于你的投入,这个回报可以分成两类,一类是经济和社会认可的,也就是你做了这个东西后有现金回流。社会认可也很简单,大家认为你做了这件事情使得我们的社会、人的生活更好了,社会很多复杂事情得以解决,有正面评价。第二是学术的方向,你所做的实行在科学这棵树上长出了新的东西,而这个东西又是可以得到认可的。
 
  今天做什么才能满足这样的条件?如果想清楚一定可以走入秋天。我认为一定会是有人直接进入冬天,有人进入秋天。
 
  从刚才最抽象的两个方向来看,我们如何才能进入秋天而不是进入冬天?我举一些具体的可能性。哪些可能会进入冬天?哪些可能会进入秋天?最有可能进入秋天的就是真正抓住今天经济和社会发展中必须要解决的问题,为解决这个问题作出了真正的贡献,你只要想清楚这件事情,一定会走向秋天,而不会走向冬天。为什么人工智能那么火?其中最核心的一个问题是如今我们经济社会发展中很多问题的解决是可以通过人工智能来解决的,有些问题甚至是必须通过人工智能来解决的。但我们是否抓住了?怎么才能抓住?2015年我去了一个小企业,它完全是用企业里的人、企业自己筹借的钱实现了生产线从全手工到全自动的转换。有人说这不是人工智能。如果你认为这不是人工智能,那么你成功的路已经少了90%。在经济社会中,你通过这样的技术、这样的方式来提高企业的劳动生产力、解决实际问题,如果这些都不算人工智能,你已经把自己的路堵掉了90%,甚至很可能是99%。因为今后一段时期真正成功的99%都会在这样的例子中产生。我们一定不要认为今天的自动化生产线、在自动化生产线上的离散制造数字车间,以及企业制造过程中的智能制造或数字的无缝对接,不叫人工智能,那你确实错了。
 
  上周,我与化工领域的一个总工聊天,目前大家知道炼油生产线和乙烯、聚乙烯这样的生产线全部是自动化的,这个自动化不仅是指买了设备、控制系统,自动化就有了。它是根据本地的实际情况来持续优化,把里面的参数、工艺的过程不断调整才有真正世界一流的自动化生产线。这里面融合了太多人的智能,而且这个智能不差于我们下围棋。因此,我们的眼睛确实不能只盯在一些人工智能科学家所说的地方,而是要真正盯在人工智能本意上,把智能行为自动化,且这个智能行为自动化是有经济和社会价值的。马云之前说AlphaGo没什么意思。为什么他会这样说?因为它解决不了我们经济社会发展中面临的问题。由于今天计算技术、各领域应用能力的发展,经济社会正面临着巨大的转型升级压力,如果不转型升级我们面临的困难很大。某位经济学家说,中国已进入中等收入陷阱,尽管后面有一系列经济学家对他进行了反驳,但中等收入陷阱的危险确实摆在我们的面前,你不能说这个危险已经排除了。如果我们真正抓住这些问题,沿着我们走的路,按照人工智能的思路把人的智能在原来的基础上进行叠加,使它变为更聪明、更有效率的系统,那么你一定能走向秋天,一定不会进入冬天。
 
  什么会走向冬天?我刚才提到,你抓住要做的事情,但你的路径不是建立在这件事情人或一组人、一个体系是的行为上,你没有把握住这个东西,没有在此基础上的数据和对于智能行为的抽象,而是盲目用今天人工智能最热的算法去做,你可能依然进不了秋天而进入冬天。我确实反复思考过,工业领域中几乎所有行业的生产线都去过,我总是有一个思考“这个生产线能否自动化?”,当然,几乎所有的生产线都可以自动化,但到今天我想不出哪条线要用深度神经网络、深度学习。换句话说,你不是把做这件事情的认知逻辑抽象出可自动化的计算逻辑,不是根据这条生产线积累的各种数据找到中间的模型和算法,而是把深度神经网络和深度学习往上套,本来进入秋天的也会进入到冬天。从我们今天看到的热里,80%或大部分会从本来该走入秋天结果由于路径的错误走向了冬天。因此大家一定要思考,你所解决的这个问题的对象、逻辑、行为是什么特征,然后你才能找到恰当的解决办法,一定不能先入为主。如果先入为主,可能图灵机出现不了,冯诺依曼机也出现不了。
 
  三、深度神经网络和人的神经网络没有任何关系
 
  我们今天的深度神经网络和人的神经网络没有任何关系,在本质上没有任何的相似之处。为什么呢?
 
  第一点,人的神经网络从感知到记忆,路径是确定的。你眼睛看到的屏幕,之后你脑袋里形成这个图象,这个路径是给定的,没有任何变化,这是人的神经网络。
 
  第二点,人的学习是交互的,纠错的。基于交互和纠错来学习,如果没有交互和纠错,学习就变得极其无效。试想小孩第一眼看到猫,脑袋形成猫的图像是完全结构化的,没有任何计算和处理。但他不知道,只知道这个图像。也许他还不会说话的时候就已经存在那个地方,第二次看到时的影响会加强。到了会说话的时候,他一定会问这是什么。如果影响较深,一次他就会记住。然后他会把猫的形象特征、声音,在识字后与文字连接在一起,这个连接是完全固定的,而且人先会愿意看什么图像的路径都是给定的,更不用说这个图像会到大脑的什么地方。因此,我们的深度神经网络和人的神经网络与学习过程有什么相像的地方?它只是用了神经网络、连接概念而已,我们确实需要真正地把智能行为在一个个智能如何自动化的过程中抽象出更加普遍化的逻辑路径,而不是认为这些说的都能达到智能的范式,这样人工智能整体会从学术上进入冬天。谢谢大家!
责编:houlimin
分享到: