在履约中心部署自主机器人的探索
某中心正在测试一类新型机器人,它们利用人工智能和计算机视觉技术在履约中心内自由移动。这些机器人旨在帮助处理超大和笨重物品的运输任务,使其能够在由人员、托盘和立柱构成的不断变化的环境中穿行,其覆盖面积可达数十个足球场大小。
“这是AI首次被用于某中心的自主移动应用,” 某中心机器人AI部门负责人表示。
核心技术:语义理解
这些新型机器人成功的关键在于科学家们所称的“语义理解”:机器人理解其所在三维世界结构的能力,能够区分其中的每个物体,并了解每个物体的行为方式。通过实时更新的语义理解,机器人可以在杂乱、动态的环境中安全导航。
目前,这些机器人部署在少数几个履约中心,执行有限的任务。研究人员正在探索如何将这些机器人无缝、安全地整合到现有的履约流程中。
“我们并非为技术而开发技术,”该负责人表示。“目标是开发能够赋能员工,使其工作更高效、更安全的技术。如果不能实现端到端的无缝集成,人们就不会使用我们的技术。”
当前挑战与技术方案
目前,约有10%的商品因尺寸过大或不规则而无法放入存储单元或输送带。通常,员工需要使用滑轮和叉车在履约中心内运输这些超大物品,同时要穿梭于不断变化的存储单元、托盘、机器人和人员构成的迷宫中。目标是由机器人来处理这项有时很棘手的任务。
机器人AI部门的感知负责人领导了这些新型机器人AI的研发。其团队已部署机器人进行初步测试,作为非可传送物品的自主运输工具。
要成功完成任务,机器人需要能够实时映射环境,理解什么是静止物体、什么不是,并利用这些信息即时决定行进路线,以及如何避免碰撞以安全地将超大物品送达目的地。
“在这些动态空间中导航是挑战的一方面,”他说。“另一方面是在近距离与人协作。这首先需要识别面前的物体是人,并且人可能会移动,可能需要保持更远的距离以确保安全,可能需要预测人的移动方向。”
技术实现:从感知到规划
科学家们使用机器学习来赋予机器人能力。该过程始于基于机器人摄像头和激光雷达收集数据的语义理解或场景理解。
“当机器人拍摄一张世界图像时,它会获得像素值和深度测量值,”一位机器学习应用科学家解释道。“因此,它知道在那个距离上存在空间中的点——某种障碍物。但如果没有语义理解,这就是机器人仅有的知识。”
语义理解是指教机器人定义那个空间点——判断它是属于一个人、一个存储单元,还是一根柱子。或者,它是否是地上的电缆、一辆叉车,或是另一个机器人。
当这些标签被叠加到三维视觉表示之上时,机器人就可以将空间中的点分类为稳定或移动的,并利用这些信息计算出到达目的地的最安全路径。
“导航系统执行我们所说的‘语义感知规划与导航’,”该负责人说。“直觉很简单:机器人绕过垃圾桶的方式可能与绕过人或珍贵资产的方式不同。机器人知道这一点的唯一方法是能够识别,‘哦,那是垃圾桶,那是人’。这正是我们的AI所能做到的。”
为了教机器人语义,科学家们收集了机器人在导航过程中拍摄的数千张图像。然后,团队在每张图像中勾勒出每个物体的形状并为其贴上标签。数据科学家使用这些标注数据来训练一个机器学习模型,该模型能够分割和标注摄像头视野中的每个物体,这个过程被称为语义分割。
在语义理解之上,还叠加了预测模型,以教导机器人如何对待检测到的每个物体。例如,当检测到柱子时,它知道柱子是静态的并且会一直存在。团队正在开发另一个模型来预测机器人遇到的人的行动路径,并相应地调整路线。
“我们的工作正在改进对当前静态障碍物的表示,并开始建模动态障碍物在不久的将来的位置,”科学家说。“这种表示以某种方式向下传递,使机器人能够相应地规划,一方面避开静态障碍物,另一方面避开动态障碍物。”
部署与未来展望
团队已经在少数几个履约中心部署了数十台机器人进行初步测试和改进。在那里,机器人搬运包裹,收集更多数据,并向科学团队提供如何改善其实际性能的见解。
“这非常令人兴奋,”感知负责人说。“我们可以看到我们希望达到的未来规模。我们看到了通往成功的清晰路径。”
一旦团队成功大规模部署能够运输珍贵、超大包裹的自主移动机器人车队,他们就可以将所学应用到其他机器人上。“我们现在针对的具体问题相当具体,但这项能力具有普遍性。”
未来挑战:人机交互与集成
在履约中心部署自由移动机器人的挑战之一是如何让员工接受它们,该负责人指出。
“如果机器人快速接近你,并在触碰前最后一毫米才刹车,这在功能上可能是安全的,但不一定是可接受的行为,”他说。“因此,存在一个有趣的问题:如何生成不仅安全、流畅,而且可接受、易理解的行为,即人类可以理解的行为。”
研究人机交互的科学家们正在开发技术,使机器人能够向他人指示其下一步行动,而无需使用明亮的灯光和响亮的声音。他们实现这一目标的方法之一是通过模仿学习,即机器人观察人们如何相互走动并学习模仿这种行为。
“我们正在书写某中心的机器人学篇章,”他说,并指出这是一个持续的过程。“在某中心这样的地方工作的乐趣之一是我们能直接接触到最终用户。我们可以与员工交谈,询问‘你们对此感觉如何?’这种内部客户反馈对我们的开发过程至关重要。”