华人学者再创佳绩！包揽CoRL2021最佳论文奖项 (海外华人学者)

文章编号：46634 资讯动态 2024-12-10 CoRL2021 华人学者最佳论文奖项

2021年11月12日凌晨，迟迟未公布的CoRL 2021论文奖名单终于揭晓。

备受关注的论文大奖全部被华人学者包揽。来自麻省理工大学的Tao Chen, Jie Xu, Pulkit Agrawal(导师)拿下最佳论文奖；来自哥伦比亚大学的Huy Ha, 宋舒然(导师)拿下最佳系统论文奖。

本次获提名奖的共有七篇论文，四篇最佳论文奖提名，三篇最佳系统论文提名。七篇佳作皆有华人学者参与。占比42.3%。

CoRL于11月8日——11日在伦敦举行。同时在网络上也开设了虚拟会场以飨诸位：PheedLoop主题演讲、指导性建议和论文演讲；gather.town 用于海报会议和交流。即使不能到现场的同学，也不用担心错过关注论文的演讲了。

荣获CoRL 2021最佳论文奖的是：

再创佳绩！包揽CoRL2021最佳论文奖项

由于高维驱动空间以及手指与物体之间接触状态的频繁变化，手持物体重新定向一直是机器人技术中难攻克的问题。Tao Chen等人提出一个简单的框架，框架的核心是无模型强化学习：可被称为“师生关系”的训练法、重力课程设置和物体稳定初始化。它可以解决复杂的问题，用机械手学习重新定向，让2000多个不同物体的系统面朝上和朝下。该系统不需要物体或机械手模型、接触动力学和任何特殊的感官观察预处理。

过去的一些方法，如使用强大轨迹优化法分析模型，虽然解决了重新定向问题，但结果主要是在模拟简单的几何形状，无法拓展到现实中推广到新对象，结果差强人意。

Tao Chen他们的研究首先在模拟中对“老师” 进行有关物体和机器人信息的训练，为了确保机器人可在现实中运作，模拟中缺失的信息如指间的位置，强化学习智能体接受的知识被转化为模拟外可用的数据，像摄像机捕获的深度图像等。为了提高性能，机器人先在零重力空间里学习，再在正常的重力环境中适应调控器。看似违反直觉，但单个控制器可以重新定向大量它以前从未见过的物体。

再创佳绩！包揽CoRL2021最佳论文奖项

Chen Tao, 麻省理工学院EECS & CSAIL 博士，师从Pulkit Agrawal教授。本科毕业于上海交通大学机械工程及自动化专业，期间在普渡大学机械工程学院交换。读研之前，Chen Tao曾是上海LX Robotics的研究工程师，从事目标检测、图像分割、机器人深度强化学习、SLAM等方面的研究。研究生毕业于卡内基梅隆大学机器人学院，师从Abhinav Gupta 教授。主要研究机器人学习、操作和导航的交叉领域。

再创佳绩！包揽CoRL2021最佳论文奖项

Jie Xu, 麻省理工学院CSAIL博士，师从计算设计和制造组(CDFG)的Wojciech Matusik教授。本科毕业于清华大学计算机科学与技术系。

研究主要方向机器人、仿真、机器学习的交叉领域。感兴趣的主题: 机器人控制、强化学习、基于可微分物理的仿真、机器人控制和设计协同优化、模拟现实。

Pulkit Agrawal, 麻省理工学院EECS助理教授。所在实验室是计算机科学和人工智能实验室(CSAIL)的一部分，隶属于信息和决策系统实验室(LIDS)，并与美国国家科学基金会人工智能和基本交互研究所(IAIFI)合作。

首要研究兴趣是构建能够自动且持续地了解其环境的机器。希望这种学习的最终结果将类似于人类所谓的常识的发展。Pulkit Agrawal将这方向的工作称为“计算感觉运动学习”，它包括计算机视觉、机器人技术、强化学习和其他基于学习的控制方法。

荣获CoRL 2021最佳系统论文奖的是：

高速动态动作(如，乱扔或用力抛掷)通过提高自身效率和有效扩展物理接触范围，在我们与可变形物体的日常互动中发挥着至关重要的作用。但之前的大多数工作都是使用单臂准静态动作处理布料操作，这需要大量的交互来挑战初始布料配置，并严格限制机器人可及范围的最大布料尺寸。Huy Ha等人使用自监督学习框架FlingBot展示了布料展开动态投掷动作的有效性。

这个方法从从视觉观察开始双臂设置，学习如何展开一块织物，从任意的初始配置使用拾取，拉伸，并投掷。最终系统在新布料上3个动作就能达到80%以上的覆盖范围，可以展开比系统覆盖范围更大的布料，虽然只在矩形布料上训练过，但可以推广到T恤上等。

研究者们还在真实世界的双臂机器人平台上对FlingBot进行了微调。FlingBot的布料覆盖面积比准静态基线增加了4倍以上。FlingBot的简单性和它优于准静态基线的性能证明了动态动作对可变形物体操作是十分有效的。

Huy Ha, 哥伦比亚大学计算机科学系博士。师从宋舒然教授，是哥伦比亚人大学工智能与机器人 (CAIR) 实验室的成员。

宋舒然, 目前是哥伦比亚大学计算机科学系的助理教授，本科就读于香港科技大学计算机工程专业，硕士和博士均毕业于普林斯顿大学计算机科学系。研究重点是计算机视觉和机器人技术的交叉领域，研究兴趣是开发能使智能系统在与物理世界的交互中学习、并自主获得执行复杂任务和协助人们的感知和操纵技能的算法。

获得CoRL 2021最佳论文提名的有：

许多实际问题，像安全、机械约束和磨损等，在机器人技术中运用强化学习十分具有挑战性。这些问题通常在机器人学习文献中没有被充分考虑到。在现实中应用强化学习的关键点在于安全探索，在整个学习过程中满足物理和安全约束至关重要。要在这样的安全环境中探索，利用诸如机器人模型和约束条件等已知信息，能更好地提供强有力的安全保障。Puze Liu等人提出了一种在模拟中能有效学习机器人任务的方法，能满足学习过程中需要的约束条件。

研究提出了作用于约束流形的切线空间新方法（ATACOM），智能体探索约束流形的切线空间，如图中所示。它可以将约束强化学习问题转化为典型的无约束强化学习问题。这个方法可以让我们利用任何无模型 RL算法，同时能让约束保持在容差以下。

ATACOM 的优点可以概括如下：(i) 它可以处理等式和不等式约束。每个时间步的所有约束都保持在容差以下。(ii) 不需要初始可行的策略，智能体可以从零开始学习。(iii) 不需要手动安全备份策略将系统移回安全区域。(iv)它可以应用于任何使用确定性和随机策略的无模型强化学习算法。(v) 探索可以集中在低维流形上，而不是探索原始动作空间中的等式约束。(vi) 它具有更好的学习性能，因为不等式约束仅限于较小的可行状态-动作空间。

低数据和风险敏感领域中的强化学习需要灵活高性能的部署策略，这些策略可以在部署过程中轻松整合约束。一类是半参数H步前瞻策略，它使用轨迹优化对具有终值函数的固定范围的动态模型进行轨迹优化选择动作。在这项工作中，Harshit Sikchi等人研究了一种新的 H步前瞻实例化，其中包含一个学习模型和一个由无模型离策略算法学习的终端值函数，名为 Learning Off-Policy with Online Planning (LOOP)。理论分析建议模型误差和值函数误差之间进行权衡，从经验而言这种权衡有利于深度强化学习。这篇论文还确定了该框架中的“Actor DIvergence”问题，提出Actor 正则化控制 (ARC)，这是一种改进的轨迹优化程序。研究人员在一组用于离线和在线强化学习机器人任务上评估LOOP。LOOP 在部署期间展示了将安全约束与导航环境结合起来的灵活性。由此证明 LOOP 是一个理想的机器人应用框架，基于它在各种重要的强化设置中的强大性能。

本文研究了视觉跨实体模仿设置，其中智能体从其他智能体（例如人类）的视频中学习策略，展示相同的任务，但他们在实施中存有明显差异——形状、动作、末端效应器动力学等。本文证明了从对差异具有鲁棒性的跨实体展示视频中自动发现和学习基于视觉的奖励函数。通过提出跨实体逆强化学习 (XIRL) 的自监督学习，利用时间周期一致性约束来学习深度视觉嵌入，这些嵌入可以从多个专家代理的离线展示视频中捕获任务进展，每个智能体执行相同的任务因具体化而不同。此前，从自监督嵌入产生奖励通常需要与参考轨迹对齐，在实施差异下可是很难获得的。如果嵌入了解任务进度，在学习的嵌入空间中简单地取当前状态和目标状态之间的负距离作为强化学习训练策略的奖励是有作用的。研究证明学习奖励函数不仅适用训练期间看到的实施例，更可以推广到全新的实施例。此外，当将真实世界的人类展示转移到模拟机器人时，研究发现XIRL比当前的最佳方法更有效果。

获得CoRL 2021最佳系统论文提名的有：

顺序操作任务要求机器人感知环境状态，并计划一系列行动以达到预期的目标状态，其中从原始传感器输入推断对象实体之间空间关系的能力至关重要。之前的工作依赖于明确的状态估测，对新任务和对象端到端地学习对抗。在这项工作中， Wentao Yuan等人提出了SORNet(空间对象中心表示网络)，它从以兴趣对象的规范视图为条件的RGB 图像中提取以对象为中心的表示。结果表明，在空间关系分类、技能前提分类和相对方向回归三种空间推理任务中，通过SORNet学习的对象嵌入方法可以将零样本扩展到未见的对象实体，并显著优于基线。此外，我们进行了真实世界的机器人实验，证明了学习对象嵌入在顺序操作任务规划中的使用。

本文主要研究四足机器人节能控制器的研制问题。动物可以用不同的速度主动切换步态，以降低能量消耗。在本文中， Yuxiang Yang等人设计了一个层次学习框架，在这个框架中，独特的运动步态和自然的步态转换以能量最小化奖励自动出现。研究人员使用进化策略(ES)训练高级步态策略，指定每只脚的步态模式，而低水平凸MPC控制器优化电机命令，使机器人可以用期望步态模式的速度行走。在一个四足机器人上测试了这个学习框架，展示了随着机器人速度的增加，从步行到小跑再到飞小跑的自动步态转换。结果表明，学习层次控制器消耗的能量远少于基线控制器在大范围的运动速度。

CoRL（Conference on Robot Learning/ 机器人学习大会），是一个以机器人和机器学习为主的学术会议。我们AI科技评论曾对CoRL会议做过详细的介绍：机器人学习大会CoRL 2020 最佳论文出炉！华为诺亚、上海交大获最佳系统论文奖

在CoRL官网，组委会这样描述举办CoRL的缘由：

大会的组织者包括来自UC Berkrley、Google、Microsoft、CMU、MIT、ETH、Deepmind等知名院校和知名企业的研究者和从业者，同时CoRL大会的举办还得到了机器人国际机构“三巨头”之一的国际机器人研究基金会（IFRR）和机器学习领域最好的期刊之一JMLR（Journal of Machine Learning Research）的支持。

机器人学习大会（CoRL）自2017年推出以来，已迅速成为机器人技术与机器学习交叉领域的全球顶级学术盛会之一：“针对机器人学习研究的大会，涵盖了机器人技术、机器学习和控制等广泛主题，包括理论和应用各方面。”

再创佳绩！包揽CoRL2021最佳论文奖项

版权文章，未经授权禁止转载。详情见转载须知。

再创佳绩！包揽CoRL2021最佳论文奖项

谷普下载提醒您

本文链接：http://www.gpxz.com/article/1a192fb5b33fa3c5452a.html

上一篇：CEO周伟专访松鼠AI联合创始人周伟几岁

下一篇：tokenEmu3预测智源证明多模态模型新范式只

亿方云企业网盘

亿方云网盘是360旗下一款专业的协同办公企业网盘（企业云盘），强大的在线文档编辑功能为企业提供文件管理、文件存储、共享文件、协同办公、移动办公等便捷服务，亿方云网盘满足企业团队协作和高效办公需求。

商业服务 2024-11-13 11:08:39

- 交通 - 航空公司网址大全--123网址之家

-交通-航空公司网址

网址导航 2024-11-13 11:12:24

厦门市中捷信息科技有限公司

厦门市中捷信息科技有限公司（简称中捷科技）总部位于美丽的花园城市厦门，是一家以技术为核心的互联网+综合型创投公司。目前，通过自主研发或深度定制为客户提供互联网系统以及项目运营指导，进而实现项目的创新发展，最终达成双赢。

互联资讯 2024-07-03 18:19:32

智能小程序平台

智能小程序，智能连接人与信息、人与服务、人与万物的开放生态，依托APP为代表的全域流量，通过百度AI开放式赋能，精准连接用户，无需下载安装便可享受智慧超前的使用体验。

下载资源 2024-08-17 00:48:32

嘉兴市建设工程造价管理协会

嘉兴市建设工程造价管理协会造价协会嘉兴造价协会

管理咨询 2024-07-11 13:32:24

拉卡拉POS机

拉卡拉POS机，作为A股上市企业拉卡拉旗下的明星产品，凭借其高效、安全、便捷的支付体验，赢得了广大商户和消费者的信赖。支持多种支付方式，包括有卡支付、无卡支付和NFC支付，全面满足您的支付需求。同时，拉卡拉POS机还提供一站式服务，包括商户认证、快速到账、账目明细清晰等，让您轻松管理支付事务，提升业务效率。

明星娱乐 2024-11-13 11:16:06

张建庆个人设计师网站

设计美化 2024-11-30 16:06:00

成都玛时特电子科技有限公司

行业信息 2024-12-04 13:21:25

《燕云十六声》官网

天生武侠，世界无羁！《燕云十六声》12.27正式公测，纪念时装、配饰免费送。游戏首次实现了“中国特色武功”与开放世界品类的融合,玩家将在充满迷题的无缝地图中,众揽天下风光,探秘海量地宫,同时偷师百家武学,身兼十八般武器,学遍太极、点穴、狮吼功、蛤蟆功等全新奇术,创造属于自己的武侠冒险。

游戏网游 2025-02-07 18:58:49

卓创资讯

卓创资讯坚持中立第三方立场，专业提供大宗商品行情、分析、数据以及咨询、会展等服务，专注产品领域涵盖能源、化工、农业、金属等大宗商品行业。热线电话：400-811-5599

新闻资讯 2025-02-14 01:54:03

DDNS官网

逸群信息提供：方寸自助打印机,花生壳,内网穿透,DDNS,自助打印系统,自助打印机柜,自助打印,共享打印机,DDNS服务热线:4008600217

商业服务 2025-02-15 18:45:37

全科界

全科界·智慧赋能平台是一个服务广大基层医疗机构，为基层医务人员持续赋能的综合性平台。平台依托全科场景，倾心打造了以“医-教”为核心的赋能架构，通过远程教学培训、全科医生职业发展、远程医疗协作等子系统建设，结合优质的专家资源，高效精准地进行专业能力的输出，同时灵活丰富的培训教学方式，真正实现基层医务人员的“个性化”学，促进基层医务人员能力提升，落实国家分级诊疗政策，让社区群众便捷接触到优质医疗资源，增进民生福祉。

下载资源 2025-02-21 00:41:48

智能混剪软件有哪几个智能混剪软件排行榜 (智能混剪软件哪个好)

无论是做小说短剧推广类的视频、还是做好物分享，混剪都是很重要的一个去重、丰富视频内容的环节，所以就有了智能混剪软件有哪几个这个话题，因为有这类软件的帮助，视频制作者可节省大量的时间与精力，因此小编接下来献上智能混剪软件排行榜，希望能帮助到各位需要混剪视频的网友，不管你是哪个平台的视频创作者，这都是你值得下载的创作类辅助工具，因为它不仅...。

2025-02-11 20:39:46

Alexa中文站关闭 (alexa中文怎么读)

刚收到确认消息，Alexa中文网站关闭，访问Alexa中文站，cn.alexa.com，会跳转到英文主站，www.alexa.com，上，而且也得到Alexa官方的确认，这意味着运营不到2年的Alexa中文站关闭，据我观察，目前国内大部分中小网站的Alexa都开始呈下滑状态，而自卢松松博客建立以来，博客Alexa一直处于上升阶段，近期...。

2025-02-01 21:52:01

奇迹之光皮肤管理的服务项目有哪些加盟好运营吗 (奇迹之光皮肤管理怎么样)

古人云，爱美之心，人皆有之，当今社会，人人都追求高颜值，在日常生活中，会到皮肤管理中心做皮肤护理，正是如此，美容护肤行业很热门，不仅消费市场庞大，而且服务产品营收高，在选择创业项目的时候，有些创业者想要加盟开皮肤护理店，奇迹之光皮肤管理品牌很有名气，值得推荐，那么，奇迹之光皮肤管理的服务项目有哪些，加盟好运营吗，奇迹之光皮肤管理品牌的...。

2025-01-31 20:47:46

苏州家政加盟哪家好 (苏州家政加盟不开店可以吗)

现如今人们大部分的时间都用于工作、学习等等，没有太多的时间照顾老人和小孩，也没有多余的时间整理自己的房子，这时候经常会寻找专业的家政公司来帮忙，苏州作为一个经济比较发达的城市，一直都有着很高的吸引力，让不少的创业者想要在苏州加盟一家家政品牌，实现自己的创业梦想，在选择加盟家政的时候可以选择一些名气比较高、影响力大的品牌，这样能够减少自...。

2024-12-21 16:07:23

2018年中美互联网巨头的AI芯片战 BAT能否挑战FANG (2018年中国好声音)

AI时代一个值得关注的新变化是科技巨头们都纷纷开始自主研发AI芯片，一方面可能是因为科技巨头们积累了大量数据价值待挖掘，另一方面是目前的芯片算力不足且十分昂贵，美国作为传统的科技强国，FANG中的谷歌正在领跑，中国互联网巨头也大力发展AI，其中阿里的AI芯片进展最受关注，那么，BTA能否在AI芯片领域挑战FANG，中国有BAT，百度、...。

2024-12-10 00:32:04

2023 UCloud季昕华百模大战下中立云服务如何助力AIGC发展 GAIR (2023uC浏览器App)

第七届GAIR全球人工智能与机器人大会，于8月14日，15日在新加坡乌节大酒店举办，论坛由GAIR研究院、、世界科技出版社、科特勒咨询集团联合主办，这是国内首个出海的AI顶级论坛，也是中国人工智能影响力的一次跨境溢出，GAIR创立于2016年，由鹏城实验室主任高文院士、香港中文大学，深圳，校长徐扬生院士、GAIR研究院创始人朱晓...。

2024-11-30 15:40:16

特朗普在躁动中俄给环球打了一针苏醒剂 (特朗普在躁动中说的话)

直资讯陈先生，中国外长王毅和俄罗斯安保会议秘书绍伊古独特掌管了新一轮策略安保商量，为何惹起环球各方关注，特约评论员陈冰美国大选结果揭晓后，特朗普就像地震波，惹起环球各地包括美国盟友的担忧、焦虑，在这种背景下，中俄新一轮策略安保商量，仿佛又让躁动的环球安静上去，发现这环球是多极的，并非美国一极，特朗普是美国的总统，而不是环球的总统，这就...。

2024-11-13 09:25:47

拜登我不会退选 (拜登不后悔)

据知情人士泄漏，外地期间7月3日，拜登与其竞选团队上班人员通话，通知他们他，哪儿也不会去，而在拜登的竞选团队收回的一份电子邮件中，拜登称，，没有人排挤我，我不会走的，我将在这场竞选中保持究竟，他还向其允许者继续募款，以助其在往年11月5日的大选中击败特朗普，外地期间7月3日黄昏，拜登还与24位独裁党籍州长和华盛顿特区市长举办面对面...。

2024-07-04 21:48:21

的人生选用迈巴赫少爷媒体高考学霸 (人生的选择可以用什么来比喻)

2024年高考时期，一则，迈巴赫送考，的视频引发了网友的热议，这名高三考生是中国工艺美术巨匠、国度级非遗铜雕技能代表性传承人朱炳仁的孙子朱也天，6月25日，该少年的高考效果出炉了，总分达700分，值得一提的是，朱也天还是奥林匹克化学金奖得主，朱也天接受记者采访时沉稳而虚心，他说，我如今确实挺激动的，，但700分，也不是很高的分数，我...。

2024-07-03 15:51:25

搜狗输入法下载 (搜狗输入法下载官方)

网络输入法下载，extended=true>，网络输入法下载，extended=true>，网络拼音输入法，简称网络输入法、网络拼音，是搜狐公司推出的一款汉字拼音输入法软件，是目前国际干流的拼音输入法之一，号称是以后网上最盛行、用户好评率最高、配置最弱小的拼音输入法，网络输入法与传统输入法不同的是，驳回了搜查引擎技术，是第...。

2024-06-30 15:46:30

文博日历丨“浙”幅会动的《富春山居图》，细节拉满！|沈周|董源|黄公望|山水画|警匪片|动作片|犯罪片|电影导演|书法作品|天机：富春山居图

文博日历丨“浙”幅会动的《富春山居图》，细节拉满！,沈周,董源,文博,黄公望,山水画,警匪片,动作片,犯罪片,电影导演,书法作品,天机：富春山居图

2023-09-19 01:00:14

2023年科幻动画《忍者神龟：变种大乱斗》HD英语中字

译名忍者神龟变种大乱斗忍者龟变异危机港忍者龟变种大乱斗台新忍者神龟忍者神龟重启版片名年代产地美国类别喜剧动作科幻动画奇幻冒险语言英语字幕中文上映日期中国大陆美国评分豆瓣评分片长分钟导演杰夫罗韦凯勒斯皮尔斯编剧塞斯罗根埃文戈德堡杰夫罗韦丹埃尔南德斯本吉萨米特布兰登奥布莱恩彼得拉尔德凯文伊斯特曼演员尼古拉斯坎图布雷迪诺恩小...

2023-09-15 23:10:18

文章推荐

职场关系如何高情商对待 (职场关系如何处理)

刚跟一个朋友聊天，她是大公司高管，过完年不出意外还会继续升职，年会上老板差不多算表态了，她跟我吐槽，身边几个平时关系好的平级马上态度就不一样了，虽然已经尽力克制，但是还是免不了要酸一酸，一个说，以后你就是我领导了，可得照顾照顾我呀，需要过年给你送礼不?一个说，怎么偷偷努力啊，闷声不响的就升职，真看不出啊，这些话都藏在玩笑下面，表面上看...。

2025-01-28 23:29:10

好文分享

硬创010 (硬创设平台)

文，丁丁停车CEO申奥在给题目中的智能硬件打标签的时候，除了，共享经济，，本来我还想打一个，O2O，的标签，但最近O2O着实被黑出了翔，并且自己思考了一下似乎共享经济基本都是O2O的玩法，那么就弃掉了这个鸡肋标签，重点来谈共享经济下的智能硬件玩起来有什么不同，我是芯片体系架构的专业出身，最近尘埃落定的Intel收购Altera的两家主...。

2024-12-04 00:24:14

资讯动态

开一个小型清吧怎么样 (开一个小型清吧多少钱)

清吧，不同于传统喧哗热闹，灯光闪烁的酒吧，清吧以播放轻音乐为主，比较安静，没有热舞女郎，比较适合个人放松休憩，或者和朋友谈天说地，是娱乐休闲的好去处，一些精明的创业者纷纷打算开店，那么，到底开一个小型清吧怎么样呢，不妨看看下面的分析，在这个快节奏时代，年轻人普遍承受着较大的压力，平时解压放松的办法不乏喝喝酒，和朋友聊聊天，传统酒吧太过...。

2024-12-02 20:47:39

创业加盟

起点社交广告营销站内互动数据分析 (起点社交广告怎么关闭)

文字链接认证代码普通联盟标志认证代码企业广告联盟标志认证代码广告联盟评测代码说明，本页面的认证代码为起点社交广告营销专用评测代码，站长需懂简单html知识，直接复制代码粘贴到联盟网站相应页面即可使用，本代码不适用于其他广告联盟网站请勿获取！文字认证，文字链接代码认证适用所有类型的广告联盟，复制代码后放在起点社交广告营销网站首页底部或友...。

2024-11-19 17:22:10

网络百科

24小时上汽公众售后客服电话 (24小时汽车服务)

上汽公众24小时售后客服电话是，上汽公众人工客服电话号码是，这个是上汽公众的官网电话，可提供24小时服务，且全年无休，上汽公众简介上汽公众汽车有限公司是由上汽个人和公众汽车个人合资运营，双方各占50%的股份，是国际历史最悠久的汽车合资企业之一，上汽公众原名叫上海公众，成立于1984年，公司总部位于上海西北郊安亭国际汽车城，并先后在南京...。

2024-07-06 23:09:49

游戏娱乐

华人学者再创佳绩！包揽CoRL2021最佳论文奖项 (海外华人学者)

相关文章

文章推荐