马斯克发起的OpenAI开发了新算法，让机器人通过VR学习新技能

首页 > 人工智能 > 正文

2017-05-19 10:34:04 来源：36氪抢沙发

2017-05-19 10:34:04 来源：36氪

摘要：之前，我们报道了MIT的科学家用机器人“教育”其他机器人，这种方法简便快捷，无需编程，大大降低了训练门槛。现在，马斯克牵头投资的非盈利公司OpenAI，也提出了一种同样很简便的训练方法。
关键词：马斯克 VR AI

　　训练机器人的方法正在变得越来越丰富。

　　之前，我们报道了MIT的科学家用机器人“教育”其他机器人，这种方法简便快捷，无需编程，大大降低了训练门槛。现在，马斯克牵头投资的非盈利公司OpenAI，也提出了一种同样很简便的训练方法。

　　这种新方法就是通过VR来训练机器人。

　　OpenAI在一篇博文中介绍道：“我们已经开发了一种新的算法，人们通过在VR环境中演示，就可以教会机器人如何完成一项工作。”

　　这种算法被被称为单次模仿学习算法（one-shot imitation learning）。

　　它的特点在于，人可以通过VR向机器人传达指令。只要先由人在VR中演示一遍，它就可以学会完成某项具体任务的方法。

　　机器人通过VR学习

　　桌面上共有6个不同颜色的立方块，不管怎么摆放，最终机器人都会采用相同的顺序，摆成跟人类操作一样的结果。

　　这个算法是怎么让机器人做到这一切的呢？

　　据研究人员介绍，这种新算法是由两个神经网络支持的。

　　一个是视觉网络（vision network）。研究人员用不同的光线、纹理和对象的组合，生成成千上万张模拟图像，然后利用这些模拟图像来训练视觉网络。

　　另一个是模仿网络（imitation network），它可以观察展示的过程，分析每一个任务的目的，然后从另一个起始配置开始完成这个目的。

　　那么，模仿网络是如何搞明白问题的呢？

　　据介绍，模仿网络从几十个不同的任务中得到训练，每个任务又包括上千次演示。

　　每次训练，模仿网络都可以观察到两个演示案例。第一次演示，模仿网络可以全方位仔细观摩，第二次只会被展示一次。

　　然后，研究人员就会使用监督学习，让机器人预测演示者下一步会采取什么行动。显然，机器人必须要学习如何从第一次展示中，推测下一步的行动。

　　这个算法已经成功地教会了机器人如何叠方块，但是OpenAI表示，这种技术还可以应用于其他任务。

　　OpenAI的研究人员说，他们的目标是让机器人能够像人类一样学习。

　　除了这个新算法之外，本周，OpenAI还推出了一个开源的机器人模拟器Roboschool。

　　这款模拟器是基于增强学习研究平台OpenAI Gym而开发的，提供了十几个新的操作环境。用户可以在模拟环境中训练一个或多个机器人。

　　早在2016年12月，OpenAI还推出了开源平台Universe，在这个平台上，用户可以使用游戏、网络浏览器和各种软件来训练人工智能。

　　如今在AI的风潮之下，必定会有越来越多的算法或系统，让机器人学会各种不同的技能。机器人将变得越来越聪明的同时，也会降低训练的门槛，让更多的人可以参与进来，共同见证AI的成长。

第三十五届CIO班招生
国际CIO认证培训
首席数据官（CDO）认证培训

责编：liuhan

免责声明：本网站（http://www.ciotimes.com/）内容主要来自原创、合作媒体供稿和第三方投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
本网站刊载的所有内容（包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等）版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时，请及时通知本站，予以删除。