“Robin 面对的是一个万物皆在变化的世界”
一套先进的感知系统能够检测并学习自身错误,使 Robin 机器人能够在生产规模下从杂乱的包裹堆中选取单个物品。
作者:Alan S. Brown 2022年4月18日 阅读时间:9分钟
相关内容
某机构的机器人手臂在安全性和技术方面取得突破
虽然这些系统看起来与其他机械臂类似,但它们嵌入了先进技术,这些技术将在未来几年塑造某机构的机器人舰队。
2021年10月的模型1 — 该模型漏掉了两个黑色包裹和一个被遮挡的包裹。
过去,经典的计算机视觉算法会系统地将场景分割成单个元素,这是一种缓慢且计算量大的方法。监督式机器学习使这一过程更加高效。
2022年2月的模型3 — 所有包裹均被正确检测。
Robin 的感知系统从能够识别边缘、平面等物体元素的预训练模型开始。接下来,它被训练用于识别履约中心分拣区域内出现的包裹类型。
当提供大量样本图像时,机器学习模型学习效果最佳。然而,尽管每天运送数百万个包裹,Chandrashekhar 的团队最初发现很难找到足够的训练数据来捕捉传送带上不断滚动的盒子和包裹的巨大变化。
“所有东西都混杂在一起,大小形状各异,有的叠在其他上面,有的在阴影中,”Chandrashekhar 说。“在节假日期间,你可能会看到小黄人或 Billie Eilish 的图案混在我们通常的棕色和白色包裹中。胶带也可能会变化。”
“有时,一个包裹和另一个包裹之间的差异甚至人类都难以分辨。你可能有一个白色信封叠在另一个白色信封上,两者都皱巴巴的,你无法分辨一个在哪里结束,另一个从哪里开始,”她解释道。
为了训练 Robin 的模型理解其所见,研究人员收集了数千张图像,在盒子、黄色、棕色和白色邮件包装以及标签等特征周围绘制线条,并添加描述。然后,团队使用这些带注释的图像持续重新训练机器人。
训练在模拟生产环境中继续进行,机器人在实时传送带上使用测试包裹工作。每当 Robin 未能识别物体或完成抓取时,研究人员会注释这些错误并将其添加到训练集中。这种持续的训练方案显著提高了机器人的效率。
持续学习
在这些测试中,Robin 的成功率显著提高,但研究人员仍追求近乎完美的表现。“我们希望非常擅长处理这些随机边缘问题,它们在测试中只出现几次,但在大规模现场运行时会更频繁地发生,”Chandrashekhar 说。
由于 Robin 在测试中的高准确率,研究人员发现很难找到足够多的错误来创建用于进一步训练的数据集。“一开始,我们必须想象机器人会如何犯错,以便创造可用于改进模型的数据类型,”Chandrashekhar 解释道。
某机构团队还监控了 Robin 对其决策的置信度。例如,感知模型可能表明它对发现一个包裹很有信心,但对其归类为特定包裹类型则信心不足。Chandrashekhar 的团队开发了一个框架,确保那些低置信度的图像被自动发送给人工进行注释,然后再添加回训练集。
Robin 机械臂分拣包裹
这也有助于某机构提高效率。在 Robin 拿起一个包裹之前,它必须首先分割一个杂乱的场景,决定要抓取哪个包裹,计算如何接近该包裹,并选择使用其八个吸盘中的多少个来拾取它。选择太多可能会提起多个包裹;选择太少可能会掉落货物。
该决策所需的远不止计算机视觉。“关于抓取什么以及在哪里抓取的决策,是通过学习系统、优化、几何推理和三维理解的结合来完成的,”某机构机器人人工智能部门的首席应用科学家 Nick Hudson 解释道。“有许多相互作用的组件,它们都需要适应不同站点和地区所见的差异。”
“效率和良好决策之间总是存在权衡,”Swan 继续说。“这是一个重大的扩展挑战。我们在离线状态下做了大量实验,使用非常杂乱的场景和其他情况来减慢机器人的速度,以改进我们的算法。当我们满意时,会在机群的一小部分上运行。如果表现良好,就会推广到所有机器人。”
软件研发经理 Sicong Zhao 表示,这些推广之所以成为可能,还因为软件被重写以支持定期更新。“软件是模块化的。这样,我们可以升级一个组件而不影响其他组件。它还允许多个团队同时进行不同的改进。”这种模块化使得感知系统的关键部分能够每周自动重新训练两次。
这也并非易事。Robin 拥有数万行代码,因此 Zhao 的团队花了数月时间才充分理解这些代码行之间的交互,以便将其组件模块化。这项努力是值得的。它使 Robin 更易于升级,并将最终实现根据需要频繁地自动更新机群,同时减少运营中断。
下一代机器人感知
Swan 解释说,这些持续改进对于在某机构规模上部署 Robin 至关重要。团队的目标是每周自动更新 Robin 机器人机群数次。
“我们正在增加对 Robin 的使用,”Swan 说。“要做到这一点,我们必须继续提高 Robin 处理那些随机边缘情况的能力,使其永远不会分拣错误,拥有出色的运动规划,并以其手臂能承受的最快安全速度移动——所有这些都要有余力。”
这意味着更多的创新。以包裹识别为例。Robin 的感知系统需要能够发现一堆包裹,并知道从最上面的开始,以避免弄翻整堆。“Robin 也有如何做到这一点的感觉,但我们需要机器学习来加速 Robin 决定最有可能成功抓取哪一个的方式,因为我们不断添加新型包装,”Zhao 解释道。
Chandrashekhar 相信,基于机器人和包裹运动物理学的更强大的数字仿真将实现更快的创新。“当我们谈论可变形容器(如软质邮件包装中的水瓶)时,这非常困难,”她说。“但我们正在接近目标。”
更长远地,她希望看到能够自我学习的机器人,它们能自学减少错误并更快地从错误中恢复。自我学习也将使机器人更易于使用。“部署机器人不应需要博士学位,”Swan 说。
“让这个机群自动适应是一个独特的机会,”Hudson 同意道。“关于如何实现这一点,还有一些开放性问题,包括是否应该让单个机器人自行适应。机群已经使用全球收集的数据更新了其物体理解能力。我们如何也能让单个机器人适应它们在本地看到的问题——例如,如果一个吸盘被堵塞或撕裂?”
不过,Swan 最终希望利用某机构机器人研究人员所学到的知识来创造新型机器人。“我们仅仅触及了机器人可能性的表面,”他说。
关于作者
Alan S. Brown
Alan Brown 撰写关于工程、技术和科学领域的文章。FINISHED