清华大学获X (清华大学获芯片领域重要突破!)

来自清华大学的高阳团队在最新一届机器人顶级会议 CoRL 2024(Conference on Robot Learning)中荣获 X-Embodiment Workshop 最佳论文奖。

CoRL 是全球机器人学习领域的顶级学术会议,每年汇聚来自全球顶尖学府的创新研究,评选出的最佳论文通常代表着前沿技术与重大突破。

清华团队此次获奖的论文标题为《Data Scaling Laws in Imitation Learning for Robotic Manipulation》,关注的是数据规模定律在机器人操作中的模仿学习中的应用,尤其是能否通过适当的数据规模来实现零样本泛化。

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

研究团队收集了超过 40,000 次展示,并进行了 15,000 多次机器人实测。结果表明,策略的泛化能力主要依赖于环境和对象的多样性,而非单纯的展示数量。

在此基础上,他们设计了一种高效的数据收集方案,仅需四个采集者花一下午便能获取足够数据,使两个任务在新环境和新对象上的成功率达到约 90%。

随后,团队将机器人部署在各种野外环境中,包括火锅店、咖啡馆、电梯、喷泉和其他以前未收集数据的地方。结果显示,模型在这些全新的环境中展现出极好的泛化能力,超出预期。

这篇论文的作者是来自清华大学交叉信息研究院的高阳和他的学生林凡淇、胡英东、盛平岳、Chuan Wen、游嘉诚,其中林凡淇、胡英东、Chuan Wen 同属于上海期智学院和上海人工智能实验室。

论文链接:

项目网址:

代码:

数据:

实验设计

研究团队选择使用手持夹持器(UMI)在不同环境中收集人类展示数据,并使用扩散策略(Diffusion Policy)对数据进行建模,主要研究了策略的泛化性能如何随着训练环境数量、物体数量和展示数量的变化而变化。

实验选择了 Pour Water(倒水)和 Mouse Arrangement(鼠标移动)作为案例研究任务,并在此基础上扩展到 Fold Towels(叠毛巾)和 Unplug Charger(拔掉充电器)任务,收集了超过 40,000 次展示,并在超过 15,000 次实际机器人操作中进行了评估。

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

具体的实验任务分为对象泛化、环境泛化以及跨环境和对象泛化三种类型,分别针对同一环境下的不同物体、不同环境下的同一物体和不同环境下的不同物体收集展示,随机选择部分展示进行训练,并评估策略在未知情况下的的表现。每个实验设置下,策略在 8 个未见过的环境中进行评估,每个环境有 5 次试验。

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

研究结果

实验结果表明,策略的泛化能力与训练物体数量、环境数量和训练环境-物体对数关系密切,符合幂律分布。

对象泛化

随着训练物体数量的增加,策略在未见过的物体上的表现显著提高。当训练物体数量达到 32 时,策略在未见过的物体上的表现超过了 0.9。

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

环境泛化

增加训练环境数量显著提高了策略在未见过的环境上的表现。即使展示数量保持不变,环境扩展仍然有效。

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

跨环境和对象泛化

同时增加环境和物体数量显著提高了策略的泛化能力。与单独扩展环境或物体相比,同时扩展两者的效果更好,且额外的展示对性能的提升更快饱和。

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

作者介绍

林凡淇

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

林凡淇,清华大学交叉信息研究院 (IIIS) 的一年级博士生,指导老师是高阳教授。此前在清华大学计算机科学与技术系获得学士学位。

他的研究重点是 Embodied AI(具身智能),这是一个集成机器人、计算机视觉和自然语言处理的跨学科领域。具体来说,他的目标是使机器人能够通过大规模数据实现人类水平的操作能力。同时,他还热衷于利用基础模型来增强机器人的能力。

胡英东

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

胡英东,清华大学交叉信息研究院 (IIIS) 的四年级博士生,指导老师是高阳教授。此前在北京邮电大学 (BUPT) 获得学士学位。

他的研究重点也是具身智能,他研究了开发通用机器人系统的基本挑战,这些系统可以在各种非结构化的现实世界环境中有效地适应和推广其学习行为。

盛平岳

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

盛平岳,清华大学交叉信息科学研究院 (IIIS) 姚班的一名本科生。他的研究兴趣集中在机器人技术、模仿学习和算法上。

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

Chuan Wen,清华大学交叉信息科学研究院 (IIIS) 的博士生,指导老师是高阳教授,同时与宾夕法尼亚大学 GRASP 实验室的 Dinesh Jayaraman 教授密切合作。此前在上海交通大学电子工程系获得学士学位,师从张亚教授和王新兵教授。他目前还是伯克利人工智能研究 (BAIR) 的访问学者,由 Pieter Abbeel 教授和林星宇博士指导。

游嘉诚

游嘉诚,清华大学交叉信息研究院 (IIIS) 的一年级博士生。

高阳

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

高阳,上海期智研究院 PI,清华大学交叉信息研究院助理教授。于美国加州大学伯克利分校获得博士学位,师从 Trevor Darrell 教授。在获得博士学位后,于加州伯克利大学与 Pieter Abbeel 等人合作完成了博士后研究。研究方向为强化学习与机器人。

高阳博士目前主持具身视觉与机器人实验室 (Embodied Vision and Robotics,简称EVAR Lab),专注于利用人工智能技术赋能机器人,致力于打造通用的具身智能框架。

最佳论文奖

本次 CoRL 2024 也已经宣布了最佳论文的获奖名单,分别为来自 Kuo-Hao Zeng 等人的《PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators》,和来自 Franck Djeumou 等人的《ONE Model to Drift Them All》。

PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators

论文作者: Kuo-Hao Zeng, Zichen Zhang, Kiana Ehsani, Rose Hendrix, Jordi Salvador, Alvaro Herrasti, Ross Girshick, Aniruddha Kembhavi, Luca Weihs

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

论文摘要: 研究团队提出了 POLIFORMER(Policy Transformer),这是一个仅使用 RGB 的室内导航代理,通过端到端的强化学习在规模上进行训练,并且能够在没有适应的情况下泛化到现实世界。

POLIFORMER 使用了一个基础的视频变压器编码器和因果变压器解码器,实现了长期记忆和推理能力。它经过数亿次交互,在各种环境中进行了训练,利用并行化和多机部署以实现高效训练和高吞吐量。

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

POLIFORMER 是一个精通的导航器,在两个不同的实施例中——LoCoBot 和 Stretch RE-1机 器人,以及四个导航基准测试中都产生了最先进的结果。它突破了以往工作的局限,实现了 CHORES-S 基准测试中前所未有的 85.5% 的成功率,绝对成功率提高了 28.5%。

POLIFORMER 还可以轻松扩展到多种下游应用,如物体跟踪、多对象导航和开放词汇导航,无需微调。

One Model to Drift Them All: Physics-Informed Conditional Diffusion Model for Driving at the Limits

论文作者: Franck Djeumou, Thomas Jonathan Lew, NAN DING, Michael Thompson, Makoto Suminaka, Marcus Greiff, John Subosits

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

论文摘要: 如果使自动驾驶车辆能够在轮胎力饱和的极限条件下可靠运行,将提高它们的安全性,特别是在紧急避障或恶劣天气等场景中。然而,解锁这一能力由于任务的动态本质和对道路、车辆及其动态相互作用的不确定属性的高敏感性而具有挑战性。

受到这些挑战的启发,研究团队提出了一个框架,利用包含不同环境中不同车辆轨迹的无标签数据集,学习用于高性能车辆控制的条件扩散模型。

研究团队设计的扩散模型能通过物理信息驱动的动力学模型的多模态参数分布来捕捉复杂数据集的轨迹分布。通过在生成过程中进行在线测量,将扩散模型集成到实时模型预测控制框架中,用于在极限条件下驾驶,并展示了它能够即时适应给定的车辆和环境。

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

在丰田Supra和Lexus LC 500上的广泛实验表明,单个扩散模型在操作时能够在不同轮胎和不同道路条件下可靠地实现自动驾驶漂移。

该模型在特定任务上的专家模型的性能匹配,同时在泛化到未见条件方面表现优于它们,为自动驾驶在处理极限下的通用、可靠方法铺平了道路。

版权文章,未经授权禁止转载。详情见 转载须知 。

清华大学获X-Embodiment论文奖,机器人顶会CoRL 2024获奖名单出炉

全局中部横幅
男士网

男士网是专门从事男士服装搭配、男士时尚街拍图片、男士配饰着装打扮的时尚男装搭配分享网,引领男人穿衣打扮时尚潮流,为男士提供实用的穿衣打扮技巧经验与潮流服装搭配指导,专注时尚男士服装搭配分享、服装配饰等与男人穿衣有关的形象塑造,打造知名的专业男士服装搭配网。

江西一米生物技术有限公司

一米生物至力打造《一站式实验耗材采购平台》的发展理念,深耕实验室用品的生产销售,目前形成以微生物培养系列、化学试剂系列、塑料.纸质系列、玻璃.陶瓷系列等9个产品系列距阵,涵盖200多种产品,1000多种规格。公司结合市场情况,线上线下同步推广,产品深得广大客户认可,应用领域有实验教学、科研单位、食品药品企业等。

业融易创业引擎

业融易以“我们更体贴创业者!”为品牌主张。山东业融易传媒有限公司积极打造一站式创业服务平台,为创业者提供从创业之初开始的系列化综合服务。打造“有梦想、敢融通、勤奋斗、促成功”的品牌形象,树立依托于互联网的创业创新服务品牌。

废气处理

东莞市美赢锋环保科技有限公司

宠物品种

重庆善绍宠物网是互联网上最全面的宠物平台,涵盖详细的宠物品种介绍、日常的宠物护理、可爱的宠物图片、宠物的日常用品以及宠物知识大全,专门为宠物爱好者提供咨询服务。

东网互联

东营市东网互联信息科技限公司,是一家专业从事东营网站建设、微信制作开发、网站优化、网络推广等互联网推广的网络公司,联系电话0546-7787222。

易心天下

易心天下帮助更多的企业建立自己的大数据平台,为更多的企业提供优质的大数据服务。

漯河电工考试报名网

漯河电工证考试报名网咨询电话:17703815740,电工证是电工上岗必备证书,分为低压电工证和高压电工证,是全国通用电工操作证,电工职业资格证,漯河电工考证,漯河电工证报名入口。

蚀刻加工,金属蚀刻,精密蚀刻,钛合金蚀刻,真空扩散焊

卓力达专注于提供一站式金属精密加工整体解决方案,主要从事蚀刻加工,金属蚀刻,精密蚀刻,钛合金蚀刻,真空扩散焊接的研发,生产和销售。咨询热线:0513-81601666

淘宝客是什么

淘宝客是什么,用淘宝优惠券怎么赚钱?推券客官网提供开源免费淘宝客软件是大淘客首选程序,自动采集淘宝内部优惠券商品,自动申请高佣金计划让你的收益飙升10倍。

295感恩句子网

好星座网帮你分析各星座性格、爱好、属性、性质、元素、星体等各方面因素知识,助你在合作、婚配、组合等如鱼得水。

全局底部横幅