【Mobile ALOHA】使用低成本全身遥操作学习双臂移动操作
简介
Mobile ALOHA是一款由斯坦福符博士领导的华人团队研发的通用机器人。
Mobile ALOHA基于ALOHA(一种低成本开源硬件)双手遥控系统构建,结合了移动底座的移动性和ALOHA系统的双手操纵能力。ALOHA即A Low-cost Open-source Hardware System for Bimanual Teleoperation,是一个低成本的开源双手遥控操作硬件系统,即开源机械臂。其算法Action Chunking with Transformers (ACT)采用了神经网络模型Transformers,因此具备模仿学习能力。只需要15分钟的演示,机械臂就可以学会一个动作——直接从真实演示中执行端到端模仿学习,并通过自定义远程操作界面收集。
视频演示、开源数据集和代码GitHub地址:
https://mobile-aloha.github.io/cn.html
摘要:
人类示范的模仿学习在机器人技术中表现出令人印象深刻的性能。然而,大多数成果专注于桌面操作,缺乏执行一般实用任务所需的移动性和灵巧性。 在这项工作中,我们开发了一个模仿移动操作任务的系统,这些任务是双手的,并且需要全身控制。
我们首先介绍Mobile ALOHA,这是一个低成本的全身远程操作系统,用于数据收集。它通过移动基座和全身远程操作界面增强了ALOHA系统。 使用Mobile ALOHA收集的数据,我们然后执行监督行为克隆,并发现与现有的静态ALOHA数据集共同训练可以提高移动操作任务的性能。
通过每项任务50次演示,共同训练可以将成功率提高到90%,使Mobile ALOHA能够自主完成复杂的移动操作任务,例如煎炒并上菜一片虾、 打开双门墙橱存放重型烹饪锅具、呼叫并进入电梯、 以及使用厨房水龙头轻轻冲洗使用过的平底锅。
新京报:这项研究的主要难点与突破有哪些?
符梓鹏:首先是硬件方面的难点。现在,大部分有“遥操作”系统的机器人,要么只能做简单的抓取、放下的动作;要么动作精细但不能移动,比如医疗机器人;要么能移动,但可进行的操作有限,比方说扫地机器人。我们想要打造一台多功能的机器人,可以涉及家务、办公室等场景的应用。但同时,又要控制成本。
另外是软件方面有突破,此次我们把“遥操作”产生收集的数据和AI算法结合,利用“协同训练”管道,进一步提高了机器人的学习效率,这是此前没有人尝试过的。
新京报:Mobile Aloha的未来研究与改良方向:
符梓鹏:首先是机器人的泛化能力。比方说,我教会它洗一个碗,它能不能够以此类推,直接学会洗盘子。以目前的研究水平来看,想一步到位地达成这个目标,这是比较难的。我们设想的方法是,我们教它洗碗,也教它洗杯子、洗锅具,洗尽可能多的不同的器皿。在这种情况下,它学会清洗一种从未见过的器皿的可能性会高很多。
也就是说,机器人做过的任务越多,它的泛化能力就越强。
另外,目前“遥操作”机器人,得有个人站在机器人后面。未来,我们希望实现通过视频等远程方式来“遥操作”机器人,这样训练起机器人来,会更方便。
新京报:机器人在未来能够自主地帮人类做所有家务吗?
符梓鹏:短期内很难。对于家务机器人来说,任务的变量太多了——不同款式的冰箱、不一样高度的桌面、不同材质的地毯,都需要机器人进行不同程度上的学习。所以说,要做一个能帮人类干一切家务、全自主的家务机器人是很难的。
反之,目前发展得比较成熟的自主机器人是自动驾驶机器人。有研究表明,自动驾驶机器人的水平基本高于人类普通驾驶员。因为交通实际是很固定的一个场景,机器人的任务只有一个——从A到B,不要发生碰撞。不管在什么地方开车,这个底层逻辑是一致的。机器人学习起来,就会相对容易。