ICRA2019热闹开幕 视觉自监督学习机器人获最佳论文 李飞飞组触感 (icra2024)
雷锋网 AI 科技评论按:机器人与自动化国际会议 ICRA 2019 近日正如火如荼地在加拿大蒙特利尔召开。作为展示机器人设计方案以及控制算法的顶级学术会议,ICRA 相比 ICML、ICLR 之类的机器学习会议要更加务实,一方面理论发现要有可用的实现,另一方面自然是「能够在真实机器人上发挥效果」是非常重要的评判标准。这也让 ICRA 会议的前前后后都非常热闹,不仅投稿阶段组委会会鼓励作者们在投稿论文时附上一个展示视频,大会现场也随处可见各种各样的机器人。
以及,2020 年的 ICRA 将于 5 月 31 到 6 月 4 日在法国巴黎举行。
卡耐基梅隆大学计算机科学及机器人学教授的主题演讲「拥抱失败」(embracing failure)让许多听众产生了共鸣,许多人都拍下了这张极富教育意义的 PPT:
除了全体演讲的大厅现场,展区内的机器人也带来了很多乐趣。比如下面几个。
MIT Cheetah(猎豹)机器人和波士顿动力 Spot Mini 机器人共同起舞。
Independent Robotics 的多地形机器人 Aqua。
传鸡蛋 —— 可以说是很高的运动控制水平了。
还有很多其它机器人,在现场的参会者一定看得玩得津津有味。
在当地时间 5 月 22 日下午的颁奖环节上,ICRA 组委会颁发了多项论文奖。
ICRA 会议的传统是有许多细分项目的论文奖,目前雷锋网 AI 科技评论了解到,今年获得最佳大会论文奖(Best Conference Paper Award)的是来自斯坦福大学李飞飞组的《Making Sense of Vision and Touch: Self-Supervised Learning of Multimodal Representations for Contact-Rich Tasks》(理解视觉和触觉:在具有丰富接触的任务中进行多模态表征的自监督学习,)。
论文摘要:在非结构化的环境中进行带有丰富触觉接触的控制任务一般都同时需要利用触觉反馈和视觉反馈。然而,想要得到一个可以同时利用触觉、视觉这两种具有完全不同特性的信号模态的机器人,为它手工设计一个控制器可不是一件容易的事情。虽然深度强化学习已经能够根据高维度输入成功地学习到控制策略,但这些方法通常都样本效率太低,难以部署在真实的机器人上。在这篇论文中,作者们使用了自监督学习方法为机器人传感器的输入学习紧凑且多模态的表征,学习到的表征也就可以用来提高控制策略学习的样本效率。作者们在多种钉子形状、配置、孔间隙的条件下测试了机器人执行摁钉子任务的表现,机器人不仅有良好的适应能力,而且对外部干扰具有鲁棒性。作者们也同时展示了模拟器中的机器人和真实机器人上的表现。
摁钉子任务中 z 轴(高度)方向的力传感器读数以及不同时刻对应的视觉观察画面如上图所示。整个过程在以下 6 个状态之间变化:(1) 机械臂在空间中自由运动;(2) 接触到盒子;(3)(4) 找准钉子的过程中在盒子表面滑动,传感器读数体现了不同的动态特性;(5) 对准后,机器人用力把钉子塞进洞里 (6) 成功送入后力量逐渐减小。
自监督多模态表征学习系统的神经网络架构框图。网络的输入来自三个不同的传感器:RGB 图像传感器,力-扭矩传感器读数(每 32ms 一次),以及机器人手臂末端位置和速度。网络会把数据编码并集成到一个多模态表征中,然后基于这个表征学习带有丰富的触觉能力的运动控制器。这个表征学习网络是通过自监督学习端到端地训练的。
项目主页:(有展示视频)
论文地址:
另外,获得最佳机械和设计奖(ICRA2019 Best Paper Award on Mechanisms and Design)的论文是《Development and Experimental Validation of Aerial Vehicle With Passive Rotating Shell on Each Rotor》(在每个驱动器上都有被动旋转翼的空中交通工具的开发和验证,)。其它的论文奖我们在持续了解中。
近期我们的其它报道文章中也介绍了多篇 ICRA 2019 接收论文,感兴趣的读者欢迎点击阅读。
更多后续报道请继续关注雷锋网 AI 科技评论。
版权文章,未经授权禁止转载。详情见 转载须知 。