最有意思的五篇文章 CoRL上 (最有意思的五十音图)
现在的各种学术会议多如牛毛,一个大会质量高不高,除了看大会后的组织者是谁之外,另一个重要因素的是看这个学术会议上出过哪些重要的论文。如伯克利 BAIR Blog 编委会成员、在读博士许华哲就和雷锋网记者开过玩笑,如果要组织一个新的会议,会议组织者不仅需要邀请重量级的演讲嘉宾,另一个任务是盯着自己的学生做出一两篇有影响力的论文来,这样就可以让大家知道这个会不是水会,第二年参加的人就多了。这固然是个玩笑,但对第一届举办的学术会议来说,论文质量一定是非常重要的。
近日在山景城召开的第一届CoLR大会上,雷锋网也重点了解了这届大会论文投递的情况。
从大会官方统计数据看,本次大会总共收到212篇论文,数量最大的三个论文类别分别为增强学习、模型学习和机器人视觉;
在现场Oral presentation环节,长论文的讲解时间为20分钟,短论文讲解时间为6分钟。
以下是雷锋网在现场发现的若干有意思的论文:
1. 《 One-Shot visual Imitation Learning via Meta-Learning 》
作者:Chelsea Finn , Tianhe Yu , Tianhao Zhang, Pieter Abbeel, Sergey Levine
摘要:为了让机器人成为可以广泛地执行通用工作,其必须能在复杂的非结构化环境中快速有效地获取各种各样的技能。 像深度神经网络这样的高容量模型可以使机器人展示出复杂的技能,但是从头开始学习每个技能就变得不可行。 在本论文中,我们提出了一种元模拟学习方法,使机器人学习如何更有效地学习,从而使其能够从单个展示中获得新的技能。 与先前的单次模拟方法不同,我们的方法可以扩展到原始像素输入,所需要前期任务数量也大大减少,从而更有效地学习新技能。 我们在模拟机器人和真实机器人平台上进行的实验均证明了从单个视觉展示中学习端到端的新任务的能力。
点评: 这篇论文是雷锋网很早就发现的一篇论文,详见《 BAIR论文:通过“元学习”和“一次性学习”算法,让机器人快速掌握新技能 》
2. 《 image2mass: Estimating the Mass of an Object from Its Image 》
作者:Trevor Standley, Ozan Sener, Dawn Chen, Silvio Savarese
摘要:机器人操纵真实世界中的物体需要理解这些对象的物理属性。 我们提出了一个从物体的图像中估计物体质量的模型, 我们收集了包含图像,大小和重量等信息的大型数据集,并比较了在这个数据集上训练的图像的质量的几个基准模型。同时,我们对比了也在这个问题上人的表现。 最后,我们提出了一个考虑到对象的3D形状的模型, 这个模型比上述基准和与人类的表现相比都要更好。
点评: 斯坦福Copmutational Vision & Geometry Lab的Silvio Savarese教授团队的一篇文章,看一张图片,预测物体的重量,这个应用很酷。据第一作者Trevor Standley介绍,他们使用Amazon的API接口获取大量商品信息作为数据集,除了估计体积和密度的两个模块,还有一个专门估计物体3D形状的神经网络模块,从而进一步保证物体估计的准确度。
3.《 Neural Task Programming: Learning to Generalize Across Hierarchical Tasks 》
作者:Danfei Xu,Suraj Nair,Yuke Zhu,Julian Gao,Animesh Garg,Li Fei-Fei,Silvio Savarese
摘要:在本论文中,我们提出了一种名为神经任务编程(NTP)的新型机器人学习框架,该方法可以通过较少的示范和神经程序引导进行学习。NTP可将输入的规范性任务(例如任务的视频展示)递归地将其分解成更精细的子任务规范, 这些规范被传递到分级神经程序,通过可调用的底层子程序是与环境进行交互。同时,我们在三个机器人操纵任务中验证了我们的方法,在试验中,NTP展示了在显示分层结构和组合结构的顺序任务的强泛化能力化。 实验结果表明,NTP在学习长度不定、可变拓扑和不断变化的未知任务的学习和拓展有较好的效果。
点评: 虽然李飞飞团队之前的研究更多是在计算机视觉领域,但正是如此,才有可能从机器人领域研究者习惯的视角外去思考问题,这篇论文提出的新思路也值得机器人研究者注意。
Intention-Net: Integrating Planning and Deep Learning for Goal-Directed Autonomous Navigation
作者: Wei Gao, Wee Sun Lee, Shengmei Shen,Karthikk Subramanian
摘要:如何将送货机器人可靠地导航到新办公大楼中的目的地,并提供最少的先验信息? 为了应对这一挑战,本文介绍了一种两层次的分级方法,它集成了无需模型的深度学习和基于模型的路径规划。 在低层次上,一个叫做意图网络的神经网络运动控制器被端对端地训练用于提供鲁棒的本地导航。 意图网络将来自单个单目照相机的图像和“意图”直接映射到机器人控制器。 在高层,路径规划者使用粗略地图(例如二维平面图)来计算从机器人当前位置到目标的路径, 计划的路径向意图网络提供意图。 初步的实验表明,学习的运动控制器是强大的,不受感知的不确定性的影响,并通过与路径规划器的整合,有效地推广到新的环境和目标。
点评: 未来的无人驾驶车辆能否像人类一样,凭借Google Maps就能自动驾驶?这显然是一个让无人驾驶更接近“人”的研究。
5. 《 Emergent Behaviors in Mixed-Autonomy Traffic 》
作者:Cathy Wu,Aboudy Kreidieh, Eugene Vinitsky, Alexandre M. Bayen
摘要:交通动态往往是一个复杂的动力系统建模,传统的分析工具可能难以提供由交通运输机构和规划者使用的易处理的策略。如果将自动车辆引入交通系统,需要了解自动化对交通网络的影响。本文阐述并采用增强学习(RL)的强大框架来处理混合交通控制问题(存在自动驾驶车辆和人类司机)中由此产生的政策和紧急行为,提供了通过混合车队的自动化和人类司机车辆实现交通自动化的潜力。无模式学习方法被证明自然选择之前由模型驱动的方法设计的政策和行为,例如稳定和排队,可以有效提高环路效率甚至超过理论速度极限。值得注意的是,RL通过有效地利用人类驾驶行为的结构来成功地使速度最大化,以形成交叉口网络的有效车辆间距。我们在稳定性分析和混合自治分析的现有控制理论结果的背景下描述我们的结果。
点评: 如果自动驾驶车辆达到5%,对我们的交通会产生什么影响?这一论文的试验中展示了在一个21辆人类司机和1辆无人驾驶车在环形路段的模拟情况,整个运行效率可提高60%。现实交通状况可能更为复杂,但如果无人车的加入可以更好地解决拥堵问题,毫无疑问对无人车是个大利好消息。
原创文章,未经授权禁止转载。详情见 转载须知 。