智能音箱真的就是人工智能的理想国吗？

2017-05-12 15:20:01 来源：亿欧网抢沙发

2017-05-12 15:20:01 来源：亿欧网

摘要：人工智能还处于“蠢”的状态。人工智能技术还处于简单的机械学习、智能推荐阶段，更多的功能依旧基于文字大数据信息完成。而日常生活、办公中，更多的图片音视频设计排版职能还难以完成，只能用在一些专业领域。
关键词：人工智能

　　如何为人工智能技术定制一套全新的人机交互方案？这被视为下个时代消费电子的核心服务，关系到人工智能应用的广度与深度。所以当亚马逊的智能音箱Echo爆火的时候，整个行业都好像迎来了曙光。

　　过去一年半的时间里，Google、苹果、微软、三星相继拿出了自己在智能音箱设备相关业务上的布局。Google WiFi、Google Home、AirPods，一个接一个大佬入局。昨天微软Build 2017开发者大会上，微软与三星旗下的哈曼又推出了植入Cortana的智能音箱Invoke，专门突出了Cortana的AI功能、office软件的机械学习新功能。

　　同一天，在加州圣何塞的NVIDIA GTC 开发者大会上，NVIDIA发布了全新架构的GPU：Tesla V100，这一款产品专门针对AI进行优化，整场大会还发布了Project Holodeck、Volta、英伟达 GPU 云、Xavier DLA以及 Isaac 机器人模拟机，五款基于NVIDIA GPU的AI产品应用。

　　跟着，Imagine也发布了采用全新furian架构的GPU——PowerVR GT8525，着重优化了VR/AR、AI领域的应用。

　　然后，苹果又公布了6月6日举办WWDC2017开发者大会，顺手炒了一把自家的Siri智能音箱。

　　亚马逊也很适时的发布了带有7英寸触屏的Echo Show新品。

　　……

　　两天的时间，AI领域好像发生了跨越式发展一样，信息多的令人目接不暇。但一个刚在大数据学习上获得突破的新技术，就想在全领域应用上开花结果，这显然有些不现实！

　　小新今天就帮大家降降火。

　　AI人工智能应用的先行者，应该算是苹果了。苹果2010年收购Siri语音助手，2011年便将Siri整合进了iOS5发布了iPhone 4s。这是一款通过语音输入，即可获得服务应用的半人工智能产品。与现在火热亚马逊Echo产品逻辑一致。

　　但自从苹果将Siri整合进iOS之后，近六年的时间里，就再也没有对Siri进行过像样的升级。一直未能开放Siri的接口给开发者，这跟苹果一贯的产品路线相左。

　　在过去，从多点触控技术到相机，从距离传感器到GPS，从指纹识别到压力传感、力度反馈等等技术，苹果对待每一项新技术的套路都是——自己先用一年，然后就在下一代iOS中开放接口供开发者调用。唯独Siri语音助手接口是一个例外。

　　当然有人说，2011年正值苹果灵魂人物乔布斯去世，苹果内部经历了长期的管理层换代混乱。随后，Siri的创始人达格·吉特罗斯带着Siri创始团队，从苹果离职，造成了苹果的语音助手一直停滞不前。

　　这或许是一个理由，但不是苹果长达6年时间里，在语音助手上毫无作为的借口。

　　而Siri语音助手这么多年没能发展起来的真实原因，其实完全是因为Siri不够智能也不够安全——这也是语音助手产品的通病。

　　在苹果未收购Siri之前，Siri一直是开放并持续加入全新功能的，就像今天的亚马逊Echo一样。那时Siri还不支持语音识别，完全是依靠人工输入，然后直接获取其他平台的服务，简单粗暴的帮你省去中间比对挑选的过程，直接给你一个结果或者是购买入口。当时的Siri看上去更像是一个自作主张的搜索引擎。

　　于是，用户在使用Siri的过程中，经常会被系统误导获取一个错误的结论，乃至于下单了一个贵的离谱的商品。根本就是一个傻子。

　　就算在被苹果整合进iOS中之后，由于Siri需要调用其他应用，所以他有着更高的管理权限，就极易发生莫名其妙下单付费的情况。而现实发生的案例有，用户在使用Siri的过程中绕过解锁机制，直接打开手机。

　　这一安全问题极难解决。

　　苹果在乔布斯的主导下收购Siri之后，引入Nuance公司的语音识别技术，将其打造成一个语音助手。当时更多的是希望利用这样的产品模式，解决全触屏手机的文字输入难题，同时将用户流量控制在苹果自己手中，打压一把Google和亚马逊。

　　然后以提供产品技术入口的名义，一边可以向搜索引擎们收取过路费，一方面可以推广自家的广告平台：iAd。前一段时间，苹果逼迫微信下架微信公众号赞赏功能，用的就是这一理由——你用了我的应用内付费技术就得掏钱，你绕过我的技术就是危害系统安全。

　　所以苹果的Siri出来之后，当时最为恐慌的公司是Google和亚马逊。随后Google力推自家的Google Now，还花大价钱收购了Nest智能家居公司；亚马逊在自家126实验室里疯狂研发Alexa语音助手，同时疯狂的研发下一代智能手机、智能硬件产品。

　　六年后，语音助手真的变得更聪明了吗？

　　显然没有。只不过智能家居产品丰富起来，语音助手可以通过网关功能控制这些“更蠢”的产品。

　　而用户敢于信任亚马逊家语音助手的原因，还跟亚马逊本身是做电商业务，在商家覆盖、比价、支付上有更大的优势有关。特别是在推出亚马逊Prime会员服务后，更加不用担心语音助手会犯蠢了。

　　这些是亚马逊Echo能够成功的前提。

　　而同样的事情放在苹果的Siri身上，咱还是趁早歇着。要不是智能家居要热起来，Siri能帮苹果卖点新玩意，恐怕苹果连提都不想提了。

　　现在打开苹果手机，对比所有的产品功能、使用逻辑，只有Siri是最为突兀的产品。无论是产品设计还是功能定义，都好像与iOS没有任何实质关联，使用率转化率极低，显得得极为多余与愚蠢。这看起来是苹果唯一一个为了占位而设计的产品，一点也不像苹果的产品风格。

　　不过，语音助手还有另一个功能，就是解决全触控智能手机的文字输入问题，补全多任务处理功能。

　　语音输入功能确实在改善，但至今为止没有哪个公司能够设计一套交互方案，能让用户主动使用语音输入功能。苹果的小插件功能原本就是为了解决多任务处理问题，同时还集成了全局搜索功能。同样的，小插件集合也是用户用到的最少的苹果功能。

　　现在，苹果已经收购了WorkFlow，未来将小插件、全局搜索、多任务、Siri功能整合在一起，用语音来实现快速操控、培养用户的语音操控习惯。这是下一代iOS的看点。

　　其实，互联网发展了这么多年，依旧是文字的天下。所有围绕互联网的交流、办公、娱乐，都是围绕着文字来完成。以图搜图这样的基础功能，至今都未被普及应用，使用率极低。面对图片、音视频等富媒体内容，我们依旧只能被动接受，无法挖掘更多关联价值。

　　从这一点，也能看出人工智能还处于“蠢”的状态。人工智能技术还处于简单的机械学习、智能推荐阶段，更多的功能依旧基于文字大数据信息完成。而日常生活、办公中，更多的图片音视频设计排版职能还难以完成，只能用在一些专业领域。

　　当然，微软利用人工智能、图片识别技术推出了自动打马赛克技术，Google则利用相同的技术做出了反马赛克技术。

　　但是，在诸多对精准度、创意要求极高的领域，人工智能还早着呢。

第三十五届CIO班招生
国际CIO认证培训
首席数据官（CDO）认证培训

责编：liuhan

免责声明：本网站（http://www.ciotimes.com/）内容主要来自原创、合作媒体供稿和第三方投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
本网站刊载的所有内容（包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等）版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时，请及时通知本站，予以删除。