【北大CIO班十周年】王海峰:“秘书化:连接人、信息与服务”

2015-12-04 10:06:25  来源:CIO时代网

摘要:2015年11月28日,“北大CIO班十周年年会暨首届中国行业互联网大会”在北京大学隆重拉开帷幕,来自全国各地的300多位“北大CIO班”学员们再次回到北大,与老师同学们重聚。
关键词: 北大CIO班
  2015年11月28日,“北大CIO班十周年年会暨首届中国行业互联网大会”在北京大学隆重拉开帷幕,来自全国各地的300多位“北大CIO班”学员们再次回到北大,与老师同学们重聚。与此同时,本次活动还得到了众多专家学者、合作伙伴、知名媒体的热切关注,专家大咖们在活动上分享了众多干货,精彩不断,惊喜连连!百度公司技术副总裁、北京大学教授王海峰在本次论坛上为大家带来的演讲主题为:秘书化:连接人、信息与服务。以下为演讲实录:
\
  各位北大CIO班的同学大家好。非常高兴有机会在这里和大家交流。首先祝贺北大CIO班十周年。大家也都听说过,百度公司和北大信管系有着非常多的渊源。以我们创始人CEO李彦宏先生为代表的很多信管系的优秀毕业生都在百度创立及发展过程中起到非常多的作用,非常至关重要的作用。我本人虽然不是信管系的,但跟北大也有一些渊源。今天要分享的题目是“秘书化:连接人、信息与服务”。大家知道,信管系一直研究信息,而百度做搜索引擎,一个基本的使命就是让人平等便捷的获取信息,找到所求。这里信息也是一个非常关键的词。前面杨部长和梅院士也都在讲信息相关的事情,搜索引擎就是为了把互联网上非常海量的信息。
 
  我会分几方面来讲。首先回顾一下互联网信息获取方式的演变。大家知道,互联网已经发展了20多年,从早期门户网站,包括雅虎、新浪、搜狐等等,有门户网站就够了,因为那个时候互联网有很少的网站、很少的信息。大家按目录方式找到自己所需要的东西就可以了。而随着信息量越来越多,逐渐地仅仅靠门户就不够了,这样搜索引擎就诞生了,就是帮助大家在海量互联网信息里找到自己真正所需要的。比如说百度发展到现在我们抓取的网页数量已经是上万亿规模。这个是不可想象的,上万亿规模,我们穷尽一生时间也无法都看到。当我们需要一条信息时怎么办呢?就在搜索引擎框里输入,表达自己的需求。然后搜索引擎在后面理解这个需求,并且将相关的网页、信息匹配上,之后把相关的信息呈现给用户。这就是现在的搜索引擎。
 
  进入移动互联网时代,尤其现在不仅仅是说像传统的网页承载的信息,比如说百度词条告诉你一个词是什么意思,或者百度知道回答你一个问题。而现在O2O的发展,网上不仅仅是找信息,同时会更多的寻找服务。比如说订餐馆、订电影票、打车等等,完成服务需求。而百度搜索引擎也是这样的发展路径,从早期的网页搜索。还有框计算。其实从提出这个框计算,我们一直在做,而今天讲的秘书化也是框计算的延伸。再到百度心、度秘。所有这些都是技术创新在驱动着搜索引擎。
 
  现在移动互联网到底是一种什么状态?我们看到在2013年,中国移动互联网的人均上网时长已经超过了PC。差不多20年的时间,主流一直是PC,到2013年移动互联网的时长已经超过了。2014年,百度移动搜索流量超过PC搜索。现在就是更大幅的超过了。而从设备保有量来说,因为不管用PC还是用移动设备,总之需要有一个设备,而现在智能手机保有量远超过PC保有量。而且这仅仅是数量的差别,而重要的是手机会随时随地跟着我们每一个人,而PC在一天中的很多时间并不是说随时随地有一个PC,这也意味着用手机上网,不仅仅是设备更多,同时时间也更长。
 
  同时百度提出了“连接3600行”这个概念。“互联网+”意味着什么?意味着人们社会生活和个人生活都会方方面面的会越来越多的接入互联网,包括教育、金融、医疗、交通等等。到底有多少行业能接入互联网?我们经常说360行,行行出状元。能进入咱们北大的也都是类似状元这样的优秀人才。而且现在社会分工越来越细,而且每个细分领域都会有一些人、公司为我们提供非常好的服务。所以说有3600行,甚至可能比3600行更多。所有这些都会接入互联网,接入O2O,让我们每个人更方便的使用。
 
  在这样的一个背景下,我们看看,我们每个人的手机上都会装很多App。到今年6月差不多有150万Apps,平均来讲,平均每个用户手机上会安装119个Apps,这么多App装在手机,对手机是一个负担,对我们每个人来说也是一个负担,也许装了就想不起来用它,所以超过80%的Apps是“僵尸App”(很长时间都不会打开一次)。这个时候我们需要什么呢?我们要连接人与信息,我们要连接人与服务。人记不住,那又回到用搜索。搜索模式会发生什么变化?我们先看一下传统的,现在在搜索引擎里搜北京天气怎么样。搜索引擎对语言理解还不错,这个非常口语话的一句话,我们会得到一个相应的结果,包括未来几天天气都有了。但是问明天呢,如果有上下文还好,但是没有上下文就会给出一个万年历。如果问,需要穿羽绒服吗,又会给出一个答案。而进入多轮对话时我们要基于对上下文的理解。这时问天气,就会告诉你明天的天气,然后会根据明天的天气怎么样来判断给你一些穿衣建议、是否适合洗车、户外活动等等。
 
  再有一种很大的差别,搜索引擎发展了十几年,绝大多数用户、需求都是同一种模式进来的,就是用文字在搜索框里输入进来,而现在发展到手机,手机其实天然的属性是打电话,任何一个手机都天然的会也麦克风、有扬声器,可以说、可以听。智能手机越来越普及的情况下,语音也变的越来越重要。所以我们有语音搜索。而且现在触屏敲字也很麻烦。比如说我要买电影票,这样就会出现看电影一条龙的服务都出来。如果问北京天气,他会把天气的信息搜索出来,提炼出来、朗读出来,问一句就可以听。当然还有很多需求,我们用语言、文字表达时都不那么容易。比如说拍药。我们日常家里都会有一些常备药,而且药名往往比较难写、难念、难输入。但是如果我们用手机摄像头拍一下,后面进行图像识别,百度自动就会把这个药找出来,然后告诉离你很近的可以送货上门的药店里,他一会儿就会给你送货上门。还有拍题,比如说孩子的作业题不会做怎么办呢?其实很多人在百度搜索引擎里找作业题。但比如一道题很复杂,不知道怎么输入,但是如果要是可以拍一下,后台自动图像识别匹配,这样就方便多了。
 
  我刚才讲了很多都是用户怎么表达需求的,然后搜索引擎去满足他。另一方面,即使他不表达需求,我们可以推荐。因为我们现在有度秘。比如说用户心情不好,那我们会自动跟他聊聊天,比如每个人都会有心情不好的时候,会很快过去的。比如说推荐他看部电影,也许心情会有所缓解。当然也可以引导,比如说用户问金毛怎么样?我们会猜用户到底需要什么,给他一些引导,比如说他是问健康、美容还是喂养等等。
 
  如果有一些现在满足不了的,比如说要找某一部电影,但是网上不能直接看。那我们等搜索引擎自动发现后再推送给他。
 
  传统的搜索引擎是没有差别的,所谓无差别,就是不管是谁,不管在什么地方搜都是同样的结果。而现在更多我们会把它“个性化、场景化”。比如说一个年轻的白领要约会,我们推荐什么样的用餐地点,再比如为老年人庆祝生日我们会推荐什么样的餐厅。会根据用户的不同,背后会对用户进行建模、画像,会得到不同的结果出来。
 
  回到我的题目,就是秘书化。我们正式发布“度秘”是今年9月8号。度秘主要包括三方面,用一句话概括就是索引真实世界,包括信息、物理世界、享受的服务等等。很重要的三个方面:首先是接入,把3600行都接入了,才能真正提供给用户。另外就是索引,把所有服务都能索引上来,这和传统的抓网页、对网页进行分析做索引不一样,这需要打上很多标签。比如说一个餐馆,什么价位、口味,是不是可以吸烟、是不是可以带宠物、装修是什么风格,我们也发现有很多用户关心这个,所以我们需要进行全网的数据挖掘,打上这些标签。最后一方面就是把服务交付给用户,这是一个智能交付的过程。前面我讲到的文字、语音、图像的交互以及对用户需求的理解、用户本身的理解、用户说的场景的理解。举个例子,用户要订餐,订餐之后还有一些需求,他希望这个餐馆可以带宠物,然后又要给宠物美容等等,这个时候我们看到几方面,一方面用户可以很方便的跟度秘说他自己的需求,所以自然交互的门槛非常低。我们内部开玩笑,其实搜索引擎并不是每个人都能用的,至少得有一个基本前提,他得识字、写字,能把他的需求告诉搜索引擎。而现在我们更自然的交互方式,即使是一个不识字的用户,不会输入文字的用户也可以对着手机来说,也可以完成这种需求。所以这种门槛会更低。同时我们不管是要订餐、宠物美容、订电影票等,所有这些事情都一站式完成了,用户非常方便、非常省心。那么最后的是度秘给他一个提醒,因为知道他订了电影票,然后到时间会给他一个提醒。整个过程下来,可能在座的咱们都是以CIO为主,都有秘书。但是社会上绝大多数普通用户来说并没有秘书,所以通过度秘希望每个用户都有秘书。总结下来就是平等、边界、贴心、尊贵。这是最核心的四个方面。
 
  百度毕竟是一家做了很多年搜索的公司,也有非常多的用户在用百度。度秘和搜索到底是什么关系呢?我们首先看一下搜索本身。用户表达一个需求在搜索框里,然后搜索引擎进行需求分析,后台会抓取海量网页,建索引,最后找到相关信息满足用户。这是我们每天在用的搜索引擎,是这么工作的。那么度秘是怎么工作的?大家看蓝色的部分,比如说我们要接入服务,我们有一个智能服务系统,通过跟用户智能交互,最后把服务提交给用户。当然也包括推荐、提醒等等。最右边有一块是人工,这和传统搜索引擎不一样。我们没有人能想象,过了很多年的搜索引擎,背后是有人在帮用户找一条一条信息。但是现在服务因为越来越复杂,同时系统有个不断学习的过程,是对用户需求的理解也有更复杂的需求理解,所以背后也会有人在后面,通过智能的调度系统把用户的需求发到相应的客服那里,人工系统和自动系统结合,但总得发展趋势是,人工系统,大家看到刚才比较胖现在变瘦了,人工系统会越来越薄、智能搜索系统(既包括信息也包括服务)会越来越大,在整个系统里占的比重越来越大。形成这样一个人机融合的系统。
 
  下面我给大家细细拆解一下度秘里面包含着什么。我们会一如既往的满足用户的信息需求,但同时会满足服务需求。服务会有闭环和半闭环之分。闭环,比如我要找一个服务,比如要订电影票,需要下单、支付、选座,这个服务完成了。如果不做这些,我可以根据他的需求,问你想看什么样的电影、在什么地方,最后完成支付选座。这对用户也是很有帮助,因为给他很多提示信息,帮他找到了相关的需求。所以三个方面:信息、半闭环服务、闭环服务。交互介质:文本、语音、图象。这是基本的交互方式。而最重要的是对用户需求的理解,秘书要满足老板需求,首先要理解需求,包括对语言语义的理解,另外一方面就是个性化的,对用户的理解。而过程中难免没那么清楚,这时候需要有一个意图澄清的过程,搞清楚需求以后会再进行一些引导,帮他最后确认需求。另外就是主动满足:智能推荐、贴心推送、辅助决策(这是非常重要的,因为很多人有一个需求的时候可能并没有最终下决心,有一些需求不完全清楚,所以就要有辅助决策的过程)。现在我们讲大数据,刚才梅院士也讲了很多大数据的问题。的确,数据是基础。我们这里会用到百度非常庞大的搜索数据,同时也会为海量的服务打标签,基于用户数据进行对用户的理解和建模,这些都是比较基本层次的。另外我们需要有一定知识,任何一件事来了,某个具体的领域都有很多知识在里面,我们把它做成知识图谱(这个概念不是今天才提出的,这个存在了一段时间,不管是学术公司还是大的机构也都比较重视),还有是我们针对服务的满足提出了一个新的,这是我们新做的一件事情就是:需求图谱。比如说刚才讲到金毛的例子,用户搜索金毛,背后可能是想去领养、美容等等。这些需求之间会构成一个图谱。这个意味着什么?我们用户一个泛需求来了以后,我们满足他一个需求以后,会知道他后面的需求,所以后面会建立非常大的图谱,是需求和需求之间的关联。而平台支撑,包括服务接入、支付平台、客服系统。整体会融合成强大的人机结合智能系统。现在我在很多场合都会有人问我,人工智能未来怎么样?会不会反噬人类?我认为最后这是一个结合的。而在结合里面,智能是人创造出来的,最终是帮助人类的而不是毁灭人类的。
 
  我们的系统和传统搜索引擎不一样,除了自动系统还有人工。我总结一下,当某一个需求来了以后,如果是后台人工满足的时候,当然我们不是仅仅满足这一次需求就完事了。因为整个客服做的完整的过程,系统会记录下来,系统会自动学习下来,这样自动系统它会变得越来越聪明、交付也会得到提升。自动系统学得越来越聪明以后,它自动完成或者辅助人工完成的能力就会越来越强,所以让人工客服变得越来越高效。总结下来就是,人机结合的过程,人会让机器更聪明,机器使人更高效。好,我今天讲的就是这些,谢谢大家!

第三十五届CIO班招生
国际CIO认证培训
首席数据官(CDO)认证培训
责编:fanwei

免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。