上海人工智能实验室近日创建了一个以模拟器为中心的双臂灵巧遥操作基准测试,该测试并排比较了四个遥操作管道。在他们的评估中,使用Xsens Link和Manus的Xsens Metagloves的运动捕捉管道在短时间内实现了高精度的任务。
挑战
远程操作工具很难进行公平比较。不同的硬件、操作员和任务设置使得对比难以统一的数据表现出哪个界面能为双臂灵巧作业提供速度和精度组合。
解决方案
上海人工智能实验室团队在NVIDIA Isaac Sim中构建了TeleOpBench,涵盖三种商业机器人(Unitree Robotics H1-2,Fourier GR1-T2,Unitree G1)的30个操作任务。
关键成果
本研究对动作捕捉(Xsens Link和Manus Gloves)、VR、外骨骼及单目视觉四类远程操作管道进行了系统性对比。在报告的评估中,动作捕捉技术实现了高任务精度且完成时间短,展现出显著优势。
为构建可重复的基准测试体系,研究设计了跨任务、操作员和机器人平台的统一框架。该框架通过标准化环境配置与评估指标,旨在为遥操作决策提供更可靠的量化依据,减少因硬件差异、环境设置或任务变化导致的结果偏差。
在具身机器人双臂操作学习领域,远程操作被视为获取高质量演示数据的快速途径。然而,其挑战不仅在于数据收集本身,更在于如何选择值得信赖的遥操作界面并公平比较替代方案。TeleOpBench通过引入双臂灵巧遥操作模拟器中心基准,填补了这一空白,使不同遥操作管道间的严格、可重复比较成为可能。
TeleOpBench的测量维度与意义****
现实世界中比较远程操作系统常面临多重干扰因素。硬件差异、环境设置和任务变化易主导实验结果。为此,TeleOpBench基于NVIDIA Isaac Sim构建了固定环境与机器人实体,采用统一成功标准,以任务成功率和完成时间作为核心评估指标,实现跨平台的公平对比。
为验证模拟结果的实际有效性,研究在物理双臂平台复现了实验,观察到模拟与现实世界结果的高度一致性,证实了基准的实践指导价值。
基准设置概览
机器人平台:选用三款不同比例与手型的商用仿人机器人——Unitree H1-2、Fourier GR1-T2和Unitree G1,覆盖多样化硬件特性。
任务设计:包含30个双手操作环境,涵盖拾取放置、工具使用和协作操作三大类,按复杂度梯度设计,确保低/高保真界面均能进行有意义的性能对比。
接口方案:统一协议下实现四大代表性管道——动作捕捉(Xsens Link+Manus Gloves)、VR设备、手臂/手外骨骼及单目视觉跟踪,形成标准化对比条件。
评估方法:从完整任务库中精选10个代表性任务开展用户研究,邀请4名操作员参与,同步记录任务成功率与完成时间双指标。
四大管道特性解析
TeleOpBench的核心价值在于具象化技术权衡空间。视觉跟踪方案可降低硬件依赖,但对遮挡与帧率敏感;VR通过腕部/手部跟踪提升精度,性能常介于视觉与高精度系统之间;外骨骼凭借运动学对齐与直接映射优势,但移动限制受设计约束;惯性动作捕捉(如Xsens Link)则聚焦人体段运动精准捕捉,并实现稳健的机器人映射。
Xsens Link与Manus Gloves的突出表现****
TeleOpBench的动作捕捉管道基于Xsens Link与Manus Gloves构建。Xsens Link通过17个IMU(惯性测量单元)附着人体关键部位实现肢体运动追踪;Manus手套则提供每只手20个自由度测量,精准捕捉指关节细微运动。
实验结果表明,基于Xsens的方案在运动平滑性与精度上表现卓越,不仅能准确完成任务,还常以短时间达成目标。完成时间曲线分析显示,惯性运动捕捉管道速度快,且模拟/真实世界性能呈现强正相关,验证了其跨域一致性。
对工程与机器人团队的实践意义
对于需要扩展演示数据收集的团队,TeleOpBench提供了具体的技术选型分析工具。从吞吐量视角,更快的完成时间意味着单位时间内更多有效演示;从可靠性视角,更高的成功率可减少数据集构建中的无效运行与后期清理成本,整体提升研发效率与数据质量。