地面的大疆 四足机器人 如何成为 技术跃变 (大疆地面站4.0教学)
1950年,英国数学家艾伦·图灵提出,当一个测试者与一个计算机程序进行对话,如果测试者无法区分程序的回答是由人类还是计算机生成的,那么该计算机程序被认为具备与人类智能相当的能力。
这便是AI领域赫赫有名的图灵测试。在通用足式机器人领域,也有类似的测试: 如果机器人能够在任意情况下抓取任意的杯子,那么该机器人便具备了真正的运动智能。
要通过这个测试非常困难,其中,机器人必须具备极强的感知能力,与环境进行实时交互,不断调整运动控制,才有可能完成任务,整个“感知到控制”的闭环是完全实时、动态、无法预先设定的。
通用足式机器人公司逐际动力创始人张巍直言,机器人要通过类似测试,“比自动驾驶还难”。原因在于,自动驾驶仅解决移动(mobility)的问题,即从A点到B点,只需要位置关系的感知;足式机器人在此基础上,还增加了接触关系感知,比如地形感知、触觉感知。机器人必须要通过这两种感知做实时交互,实现移动,然后执行操作(manipulation),才能被称之为运动智能。
现阶段四足机器人的窘境在于,多数机器人处于「弱感知」阶段,只有微弱的感知或者用了少量数据,甚至是没有感知,行动能力十分受限,效率不高且通过复杂场景的鲁棒性较低。
张巍表示,机器人的核心是运动,包括“腿”的移动和“手”的操作。而运动智能化的核心来源于感知, 这类感知指的是基于复杂场景的实时感知。 机器人基于实时感知进行决策、控制,完成整个运动的闭环。
技术「跃变」:从被动输入数据到主动感知交互
移动机器人按照移动结构可大致分为两类:以底盘为重心的轮式,与动物和人类相似的足式(四足、双足)。
轮式机器人主要在结构化道路上进行运动,典型的如酒店配送机器人。这类机器人技术已经非常成熟,各大细分赛道已经出现了许多明星公司。但轮式机器人的不足之处在于, 地形的适应能力较差, 很难克服楼梯、凹凸不平的路面、野外等非结构化的场景;并且,轮式机器人有一个比较重的底盘,来支撑机身保持稳定,但这个底盘除了承重和搭载传感器以外,能够执行的任务比较有限。
张巍告诉,如果机器人要像“人”一样提供各种服务,腿的结构至关重要,因为“有腿的机器人末端自由度更高”。而且机器人必须具备实时调整重心的能力,保持平衡,提高负载自重比,才具备复杂场景运动的基本能力,这是轮式机器人没办法做到的。
基于此,张巍认为,未来的机器人会往两个方向发展。一个是「专用机器人」,即单一或者简单场景下,机器人能够根据人设定的流程代替人高效地执行任务,比如工厂的AGV/AMR、配送机器人等等。另一个则是「通(多)用机器人」,即机器人要满足复杂地形、场景,执行多种任务。
现阶段,「专用机器人」已经杀成一片红海,不论是送餐、酒店,还是工厂,都已经出现了许多机器人公司,从拼技术到卷价格,最终到渠道和服务,已经渐渐跑通商业闭环。而足式机器人才刚刚起步,即便四足、双足机器人已不是新鲜事物,但市面上还没有一款真正具备智能的足式机器人产品。
这一现象的本质原因,在于当前的足式机器人缺少「感知」。
“机器人本质上是理解用户指令,然后根据机器人收集的环境信息,让电机转起来,实现运动控制。”张巍表示,要实现精准高效的控制,这与环境感知密不可分。
举个例子,足式机器人要上下楼梯,需要知道楼梯与自身的相对位置(实时)、什么地形、踩哪儿、用多少力...在这些感知信息的基础上,自主规划路线、姿态等等,整个过程都是动态的,而非预先设定的运动控制。
机器人实际上是通过感知来理解环境,再通过关节来产生作用力,实现控制运动,所有的运动都会有环境反馈。这里面既有位置关系的感知,也有接触式感知,将二者完美融合起来的难度非常之大。并且,机器人与环境交互需求越大,根据实时感知环境来重新规划动作(而不是按照事先预设流程)就越难, 本身的控制和稳定性问题会更难。
简单而言,足式机器人必然要与环境产生感知交互,对应的任务不是提前设置好的动作流程,直接进行replay,而是根据现场情况进行动态感知,并实时规划动作。
张巍表示,机器人要“类人”,一定要跟环境交互,否则就没有智能而只是一个机器,很难产生真正的价值,实现商业闭环。但是, 从环境感知到运动控制,这又是一件非常难的事情。
当前四足机器人的两个瓶颈:效率、稳定性
相当一段时间里,足式机器人都默默无闻。直到来自MIT的 Patrick Wensing 和Benjamin Katz 分别开源了两套影响深远的方案之后,越来越多的玩家躬身入局,越来越多的机器狗从实验室走向公众视野,这个行业才渐渐被看到,接着有了资本助力,产品开始落地到具体场景。
虽然现在不少机器狗可以行走、爬楼梯甚至跳舞、翻跟斗,但从做一个demo展示到实际量产甚至落地到具体、复杂的业务场景,仍然会遇到两个问题:效率低,以及稳定性弱。
比如,机器狗在通过非结构化地面时,速度不高,而且缺乏稳定性,容易“趴窝”。
张巍认为,这一问题的本质,甚至是足式机器人还没有很好的商业化落地的原因之一就在于, 这些机器人缺少 Perceptive Locomotion(基于感知的运动控制)。 没有感知,意味着机器人的运动失去了“眼睛“,只能靠盲走,就像闭上眼睛的人直立行走,一定会走得歪歪斜斜,因为缺少感知来实时调整路线。
当前,机器人的控制主要有两种方法, 一种是基于模型(Model)的控制,一种是基于学习(Learning)的控制。 这两种方法都是为了解决同一个「最优控制」的问题,控制机器人的本体以最好的姿态高效、高质量地完成动作,却也有不同之处。
“Model是用解析模型做推演、设计控制;Learning是减少使用Model的显性表达,用仿真器来预测控制的效果。实际上,Learning本质上也是基于模型的,仿真器都是基于模型设计,但是更侧重于强化学习,需要机器人反复迭代、试错来改进其控制器。”
打个比方,在高空飞行的飞机,从A点到B点,可以用一个固定的模型来解决;但如果机器在低空环境中飞行,会遇到建筑物、动植物、飞行物等复杂场景,机器人需要自己辨别障碍物是什么、怎么避开、怎么实现控制等,就需要Learning。
换句话说,复杂场景的感知交互,一定要用到Learning。机器人需要把各种传感器(摄像头、IMU、雷达)的数据融合起来,先构建一个高精度地形图,然后定位、规划行走,行走过程中不断进行感知,实时调整运动控制。
现阶段,机器人行业专注于基于感知的运动控制的有Boston Dynamics、Anybotics、逐际动力LimX Dynamics等。Boston Dynamics 是业内最领先的足式机器人公司,而逐际动力也正在进行追赶,并走了一条差异化路线。
张巍告诉, 逐际动力既有Model-based的控制,也有Learning-based的控制,这两种方法有各自适合的任务,通过模型数据混合的方式来做迭代。
在足式机器人的功能方面,逐际动力的路线是,首先完成腿部的基本功能,例如高效稳定地上下楼梯、穿越复杂地形;然后攻克全身运动的问题,即运动+操作;最后将产品打磨足够稳定之后,针对细分场景进行作业。
目前,逐际动力已经可以实现带感知的运动控制,虽然成熟度上相对于Boston Dynamics还有待提高,但能力已经接近。在陡峭的、真实的镂空的工业场景下,逐际动力的机器人已经可以实现稳定的上下楼梯,以及克服草地石板路、斜坡等各类场景。
逐际动力:先打造全地形移动底盘,做“地面的大疆”
张巍本科毕业于中国科技大学自动化系, 2005年开始在美国普渡大学攻读博士学位,研究基于模型的混杂动态系统的控制(Hybrid Dynamical System)。
博士后期间,张巍加入了加州伯克利分校的Hybrid System 实验室,导师为美国工程院院士Claire Tomlin和Shanker Sastry ,该实验室的著名人物还包括李泽湘、马毅等。
2011年9月,张巍加入俄亥俄州立大学,在电气与计算机工程系先后担任助理教授和长聘教授,继续从事混杂动态系统控制的研究和教学。值得一提的是,MIT开源方案核心人物之一的Patrick Wensing,彼时也还在俄亥俄州立大学学习机器人与控制理论。直到2014年,Patrick Wensing才前往MIT仿生机器人实验室,负责足式机器人的控制算法。
张巍认为,机器人的足在踩踏地面时,是一个离散事件,并且速度和系统状态会发生跳变,本质上就是Hybrid Dynamical System。如何系统地控制这类运动,是张巍一直在研究的课题。
2019年5月,张巍回国加入南方科技大学,担任机械与能源工程系教授,创办了机器人控制与学习实验室(CLEAR Lab),并指导学生开始以强化学习的方式训练足式机器人,并于三年后下场创业,成立了逐际动力。
张巍告诉,逐际动力是通用足式机器人公司,先要解决机器人的核心痛点:全地形移动能力,即像人一样移动,人能去的地方,机器人都能去。
鉴于当前四足机器人欠缺复杂场景移动能力、效率低能耗高的等问题,逐际动力对机器人进行了「系统升级」,包含两方面, 一是以感知为核心的运动控制,二是将足式和轮式的优点结合,形成轮足式。
“逐际动力要解决的是复杂场景下,四足机器人从A点稳定快速地到B点。至于机器人的使用场景,是巡检、配送,还是装了机械臂做更复杂的工作,将结合客户本身的业务去做落地。”
就像大疆的无人机,在天空上飞来飞去,客户可以用来拍照、撒农药,也可以用来巡检、表演,而逐际动力打造的是“地面的大疆”——全地形移动底盘,并推出了首款四轮足产品W1。
W1 基于逐际动力「运动智能Motion Intelligence」研发,将腿式和轮式结构相结合,具备实时地形感知与全地形移动能力,在效率上比单纯的足式机器人更高效,适用场景也更加丰富、复杂,可以实现上下楼梯、斜坡、伏地穿越、过草地石板路等功能。
张巍表示, 四足机器人已经有足够的技术积累,基础研究与商业化的交集业已出现。 现阶段能落地并产生价值的,首先是封闭场景,例如危险、复杂的工业环境,代替人的工作,这类环境比较可控,机器人能很快适应;开放场景存在的不可控因素太多,比如人为干扰、突发事件等,不太容易落地。
因此,逐际动力计划首先将W1在固定路线上落地,如工业巡检、物流配送、特种作业等场景,并持续打磨产品;在固定路线跑通后,再逐步尝试开放场景,循序渐进,最终打通四足机器人的广泛应用。
机器人,大时代
从世界第一台机器人诞生至今,机器人的发展已接近百年历史。每一次技术革命都将给机器人的发展带来强大的助推力:能源、信息、大数据、芯片、人工智能...都推动了机器人持续进化,从简单的模仿到惟妙惟肖,从实验室走向生产生活,从不能行动到稳定行走,从轮式到四足再到双足。
如今,机器人已经以各种形态融入人们的生产生活,比如扫地机器人、工业机器人。虽然现阶段的机器人还比较“笨”,距离通过“图灵测试”还有很长一段距离。不过, 技术本身是「涌现」出的,谁也无法预测这个「奇点」。
但无可争议的是,正如人的进化史一样,机器人也在慢慢进化,且终将迎来一个新的时代。
长期关注机器人行业报道,即将推出 《中国足式机器人简史》 。读者若有一手信息、观点、故事、项目,欢迎添加作者微信 nanshu0126 交流。
原创文章,未经授权禁止转载。详情见 转载须知 。