人形机器人训练越来越依赖于一套简洁明了的流程:捕捉人类动作,将其重新定向到机器人,在仿真环境中进行大规模训练,部署到硬件上,然后迭代。波士顿动力公司在接受哥伦比亚广播公司《60分钟》节目采访时就展示了这一流程。CBS的《60 分钟》节目播出了关于在制造环境中实际部署人形机器人的开发工作的他们走进波士顿动力人工智能实验室,展示了人形机器人如何学习新的动作,在模拟环境中进行扩展,然后将这项技能带回真正的机器人。该片段跟踪报道了波士顿动力公司最新的 Atlas 人形机器人,它正在为在佐治亚州萨凡纳附近的现代汽车新工厂进行实际工作做准备:在这个工厂里,机器人和人类已经大规模地并肩工作。最引人注目的不仅仅是阿特拉斯的动作,更是他动作背后的训练循环。
整个管道,端到端
屏幕上显示的这种工作流程模式,正是越来越多的人形机器人团队正在趋同采用的模式:捕捉人体动作 → 将其重新定向到机器人 → 在仿真环境中进行大规模训练 → 部署到硬件 → 重复
以下是具体步骤:
步骤 1. 采集:将人体运动转化为训练数据
在这一片段中,比尔·惠特克穿上了Xsens动作捕捉服,记录他的全身动作。这些捕捉到的动作将作为参考行为。人形机器人学习始于优质数据。当你能够清晰地捕捉到动作(关节角度、时间、协调性)时,你就能获得一个可复现的参考模型,该模型可以被重复使用、迭代,并扩展到多种任务变体中。在这一片段中,比尔·惠特克穿上了Xsens动作捕捉服,记录他的全身动作。这些捕捉到的动作将作为参考行为。
这件事的重要性:
- 它将“人类如何做”压缩成机器人流水线可以复用的形式。
- 它为时间和协调工作提供了一个基准。
- 它为学习系统提供了一致的演示。
步骤 2. 重新定位:将人体运动学映射到机器人约束阿特拉斯机器人并非按照人类的构造设计。肢体比例不同,关节活动范围不同,驱动方式也不同。人类的运动无法完全复制。视频中,波士顿动力团队解释说,他们必须教会Atlas虚拟地匹配动作,因为它的身体与人类演示不同。重定向是指将运动转化为机器人可识别的目标:
- 调整框架和关节运动
- 强制执行关节限位和平衡约束
- 将人类意图转化为机器人轨迹
步骤 3. 在仿真环境中进行大规模训练:数千个机器人,快速迭代利用动作捕捉数据,波士顿动力公司通过对4000多个数字Atlas机器人进行并行训练 6 小时,在模拟环境中扩展了学习规模。然后,他们又增加了诸如湿滑的地板、倾斜的路面和僵硬的关节等变化,迫使学习到的行为进行适应,而不是记住单一的理想条件。这就是仿真技术的核心优势:
- 比实时学习速度更快
- 安全地探索极端情况
- 在接触硬件之前,先提高硬件的稳健性。
第四步:部署到硬件:一项训练技能,多个机器人一旦学会了这种行为,就可以将其转移到真正的机器人上,而且更重要的是,还可以重复使用。这就是类人机器人工作规模的运作方式:
- 一次捕获
- 在模拟环境中进行训练和改进
- 部署到整个机队
- 随着环境变化不断迭代
为什么这件事现在很重要:Atlas正在进军真正的工厂。故事围绕一个真实的制造环境展开:波士顿动力公司受邀在现代汽车位于萨凡纳附近的新工厂展示 Atlas 的首次真实世界测试。工厂本身已经高度自动化,拥有 1000 多个机器人和近 1500 名工人,而 Atlas 的定位是下一步:为那些不需要定制自动化的任务提供灵活的工人。这正是利用 Xsens 动作捕捉技术实现“捕捉→重定向→模拟→部署”循环,从而获得竞争优势的地方:
- 加快新工作流程的任务完成速度
- 减少脆弱的“一次性”机器人程序
- 在实际环境变化下表现更佳
这对使用动作捕捉的人形机器人团队意味着什么
如果您正在为工业环境构建人形机器人,动作捕捉技术是连接人类技能和可扩展机器人学习的桥梁。Xsens 正是通过这种方式助力人形机器人的开发:
-
演示机器学习系统可以从中学习
-
用于模拟的可重复运动参考
-
从想法到行为到部署的更快捷路径
-
一个反馈循环,其中每一次新的捕捉都可以成为一项新技能。
关于搜维尔科技
我们热衷于动作捕捉技术的研发与推广。我们热衷于推动技术发展,使其处于技术前沿甚至更前沿。在这个频道上,我们想分享我们基于动作捕捉技术的最新体验。搜维尔科技与Movella Xsens总部签署代理合作协议,成为其在中国大陆地区的授权代理经销商。搜维尔科技现支持相关产品购买、咨询与售后支持等服务,欢迎垂询。