加州大学伯克利分校的研究人员已经开发出使机器人通过试错来学习运动任务的算法。通过试错这一过程使机器人学习更加接近人类学习的方式,是人工智能领域的一个重要里程碑。他们通过一个机器人强化类型的学习来展示这种深度学习算法,让机器人完成各种任务——把衣服放在架子上、组装一个玩具飞机、把水瓶的盖子拧紧等等——对其周围细节没有任何预定程序。
“我们在这里展示的是赋予机器人学习能力的新方法,”加州大学伯克利分校电气工程和计算机科学系教授Pieter Abbeel 说。“关键的是,当一个机器人面对新事物的时候,我们不需要重新编程。完全相同的软件编码会告诉机器人如何学习,让机器人学习我们给它的所有不同任务。”
最新的发展在周四(5月28日)的西雅图机器人与自动化国际会议上(ICRA)呈现了。Abbeel与伯克利视觉学习中心的主任特雷弗·达雷尔一起领导该项目,。研究团队的其他成员包括谢尔盖?莱文博士后研究员和切尔西芬恩博士生。该项工作是加州大学信息技术研究中心关于机器人主动技术研究的一部分。多方面,跨学科研究的初衷是想保持令人眼花缭乱的人工智能的发展,让机器人与自动化能满足人类的需求。
“大多数机器人应用程序是在受环境约束的,处理的对象物体是处于预先设置的地方,“达雷尔说。“让机器人进入现实环境(例如家庭或办公室)的挑战是这些环境是不断变化的,机器人必须能够感知并适应环境。”
神经的灵感
通过给机器人提前编程设计处理大量可能出现的场景的方法或创造机器人动作的模拟环境是传统的,但不切实际的方法。相反,加州大学伯克利分校的研究人员转向人工智能的一个新分支——深度学习,这个灵感来自于人类大脑与世界感知和交互神经回路。
“我们的多才多艺并不是人类与生俱来的行为,可以像瑞士军刀一样的展开。而且我们不需要编程,”莱文说。“相反,我们通过生活经验和其他人的言语行为学习新技能。这个学习的过程如此深深植根于我们的神经系统,我们甚至不需要确切地知道另一个人的技能应该如何去执行。所以我们很希望机器人能在指示和指导下自己去学习。”
在人工智能的世界,深度学习程序创建“神经网络”,在这个网络中人工神经元处理层重叠的感知数据,无论是声波或图像像素。这有助于机器人在它接受的数据中识别数据的模式和类别。人们iphone中使用的Siri,谷歌的语音文本程序以及Google街景可能已经受益于深度学习的重大进展所提供的语音和视觉识别能力。
将深入强化学习应用到行动任务还有很多挑战,因为任务超出了图像和声音被动识别技术的能力范围。“在一个非结构化的3 D环境中的移动是一个完全不同的概念,”切尔西芬恩说。“没有方向标签,事先没有如何解决问题的例子。没有正确解决问题的语音和视觉识别程序的例子。”
熟能生巧
在实验中,加州大学伯克利分校的研究人员使用一个绰号为布雷特的人形机器人。研究人员给布雷特提出了一系列的运动任务,比如将块放入匹配开口中或叠加乐高积木。该算法控制布雷特的学习,还包括奖励函数,这个函数会根据任务机器人完成任务的程度给出一个分数。
布雷特通过相机观察自己的胳膊和手的位置,算法通过机器人移动获得的分数提供实时反馈。使机器人更接近完成任务的动作比那些远离完成任务的动作得分更高。得分通过神经网络反馈,因此,机器人可以学习哪些运动更适合手头的任务。
这个端到端培训过程构成机器人的自主学习能力。当PR2移动它的关节和操纵对象的时候,该算法计算神经网络需要学习的92000个最优参数值。
使用这种方法,并给出开始和结束的相关协调任务的时候,PR2能在大约10分钟的时间里掌握典型的任务。当不给定场景中对象的位置并且需要学习视觉学习和控制学习的时候,学习过程大约需要三个小时。
Abbeel说由于处理大量数据的能力的提升,这一领域可能会看到显著、快速的发展。“使用更多的数据,您可以开始学习更复杂的事情,”他说。“在我们的机器人可以学习打扫房子或洗衣服之前,我们还有很长的路要走。但是我们的初步研究结果表明,这类深度学习技术可以对机器人完全从头开始学习复杂任务处理产生变革性影响。在未来5到10年,通过一些列的工作,我们可能会看到机器人学习能力显著的进步。”
- 小巧、快速且高效的比较器为 5.5V 模拟放大再生高达 3MHz 的时钟信号
- EVAL-ADUC7026QSP,用于评估 ADuC7026 ARM7 MCU 微转换器的 QuickStart Plus 开发系统
- AM1G-0505SZ 5V 1 瓦 DC/DC 转换器的典型应用
- LDK130C15R 1.5V、300mA 低静态电流极低噪声 LDO 的典型应用可调版本电路
- 有源桥式整流器可减少 PoE 安全摄像头内的散热,以改进电源架构,电源路径中没有二极管压降
- 使用 PIC16LF171x MCU 系列和 RN4020 蓝牙低功耗模块的计步器演示/可穿戴活动跟踪器开发板
- 【PCB】HDMI转MIPI开发板
- 机箱USB转接
- LTC3634HFE 降压型稳压器的设计示例电路
- 用于监控 +12V 和 -5V 的 ADM2914-2ARQZ 电压监控器的典型应用电路