刘兰涛团队助力机器人适应环境挑战

0 阅读11分钟

刘兰涛及其在印第安纳大学伯明顿分校车辆自主与智能实验室 (VAIL) 的团队,致力于帮助机器人更好地在复杂且不断变化的环境中导航,同时提升其评估和处理数据的能力。这项挑战在环境建模等领域具有重要应用。团队正在开发自主和机器学习方法以及开源库,以期惠及人工智能和机器人社区。

“机器学习算法越来越多地被应用于机器人任务。许多关键的自主组件都是数据驱动的,数据来自机载传感器,如激光雷达、声纳和摄像头,”刘兰涛表示,他同时也是该校卢迪信息、计算与工程学院智能系统工程系的助理教授。

“机器人通常由于尺寸和有效载荷有限而计算能力较弱,但它们需要利用实时处理的数据进行在线学习,”他补充道。“不幸的是,解决这些任务的许多方法都需要巨大的计算成本,这对机器人来说可能非常困难。关键挑战既源于随机建模复杂性增加所带来的计算理论问题,也源于将硬件和软件系统集成以及在机器人上定制算法所带来的实际挑战。”

刘兰涛获得的某机构机器学习研究奖,使 VAIL 能够访问和利用某机构的云计算工具和服务数千小时,从而推动其在机器学习和自主系统方面的研究工作。

“我的实验室研究不同类型的机器人(包括空中、地面和水上航行器)的各种决策问题。我们的目标是开发自主机器人的方法,以增强它们在环境感知与建模、搜索与救援以及其他具有社会重要性的应用中的自主性和智能性,”刘兰涛解释道。

环境感知、建模与监测

VAIL 研究人员正在进行的一个项目涉及通过从不同位置收集相应的测量样本来绘制感兴趣的环境属性(如水体或空气污染)地图,从而重建出“分布图”(环境模型)。

“这种地图构建机制也称为环境状态估计,是一个学习过程,其中底层环境模型的参数必须利用机器人收集的传入采样数据流来学习,”刘兰涛解释道。

“然而,环境可能是动态的,需要绘制的相关环境属性也是如此。使用机器人的一个缺点是,样本采集需要一系列有序的采样操作(因此数据可能无法很好地代表真实地图),而且整个采样过程非常耗时,因为样本通常分布在不同空间位置。”

“为了在任何时候都能提供良好的环境状态估计,机器人的信息采集感知必须是持续的,以跟上不断变化的环境动态,”刘兰涛解释道。“我们研究的一个重点是开发基于数据驱动的方法原理,引导机器人学习时空随机环境模型,并利用学习到的模型进行路径规划和决策。这反过来又有利于未来的环境探索和利用,以进行后续的建模和监测。”

VAIL 团队一直在开发方法和软件,通过设计基于高斯过程变体的非平稳建模框架,来准确表征时空环境。

“地图并非处处相同,”刘兰涛说。“地图上有些区域变化比其他区域更快,我们需要精确地对快速变化和缓慢变化的部分进行建模。当底层地图是动态的时,例如我们在绘制污染扩散图时,这更具挑战性。”

“此外,”他解释说,“模型计算必须快速,以便进行即时决策。然而,传感数据是连续接收的,积累的数据很快就会压垮机器人的计算资源。为了提高学习性能,我们的研究人员最近开发了一种自适应学习方法,其关键思想是一种稀疏近似机制,该机制利用‘总结’过的旧数据支持的已学习模型,逐步整合新的传入数据。”

机器人异常检测

在一个相关项目中,实验室一直在开发一个通用的机器人异常检测框架,其灵感来自于现场实验。

“机器人在现场通常会遇到感知和行为异常,”刘兰涛解释道。“例如,自主水面航行器的一个推进器可能在运行中发生故障,导致前进运动变成转弯运动。或者,自主水面航行器可能被水生植物或其他水下障碍物卡住,这些很难通过摄像头或激光雷达感知。惯性测量单元可能对外部干扰(如磁场)敏感,并提供漂移读数。周围的物体,例如岸边的树木,可能会阻挡 GPS 信号,导致定位不准确。声纳数据也可能受到动态水下物体或环境干扰的影响。”

“有弹性和适应性的机器人系统需要具备认知能力来避免异常,并在最少的人为干预下从故障中恢复和学习,”刘兰涛补充道。“赋予机器人自我检查能力以检测感知和行为故障是至关重要的一步。异常检测的直观想法是发展某种正常性概念,并将明显偏离该概念的观测值视为异常。”

“为不同应用中的不同类型机器人手工构建一个代表预期行为的模型是困难的,甚至是不可能的,”刘兰涛解释说。“该框架通过深度表示学习和图神经网络学习正常性的概念。我们使用对比学习以半监督方式训练该框架,利用大量未标记数据中的信息,并可选择性地使用少量标记数据。在该框架的开发过程中,某机构的弹性计算实例极大地加速了原型设计、训练和测试过程。我们目前正在完成这个框架,并将开源软件。”

“希望它也能惠及更广泛的机器人和机器学习社区,”他补充道。

越野自主性

某机构机器学习研究奖也支持了 VAIL 的越野自主性研究。

“一个重要的挑战是对意外机器人行为的随机建模,”他解释道。“基本上,在现实世界复杂环境中运行的机器人需要推理其与环境物理交互的长期结果,但由于现实世界的高度复杂性,通常不可能精确地预测未来事件。”

“例如,”刘兰涛说,“不平整路况或各种扰动对机器人运动的影响很难精确建模(或从数据中学习)。对机器人与环境之间的交互进行建模更具挑战性,尤其是当环境是动态的时候。其他代表性场景包括在强风中飞行的无人机或在洋流中移动的潜艇,其中空气和水流在空间和时间上都有显著变化。”

“因此,机器人在决策时需要考虑这些由缺乏精确环境建模引起的认知不确定性,”他解释道。“我们使用马尔可夫决策过程作为基础,对不确定性下的自主决策问题进行建模。这些问题的解决方案是一个闭环策略,它在机器人与环境之间的概率交互模型下,最大化长期目标并满足安全约束。原则上,得到的策略可以生成一系列电机命令,完成人类分配的任务,前提是概率模型能够很好地描述世界的不确定性,并且计算方法允许机器人在合理的时间内计算出该策略。”

“然而,”刘兰涛继续说道,“许多现实世界的问题非常复杂,获得所需的世界概率模型通常是不可能的。我们的研究重点是开发新颖的方法并利用图形处理器的强大计算能力来解决这两个挑战。我们目前的重点是解决挑战中的计算部分,通过开发两种规划算法,使机器人能够基于核方法和有限元方法推理其在复杂地形表面上的连续运动。这两种方法都利用一组离散元素来表示连续空间上的值函数。离散部分的计算可以并行化,这使得我们的机器人能够实时推理并计算出最优策略,从而安全高效地穿越复杂地形。”

VAIL 研究人员一直在研究使用采样方法来优化参数化策略类。

“为此,我们首先需要在当前策略下采样大量机器人轨迹,这可以通过 Nvidia GPU CUDA 核心的并行架构快速计算,”刘兰涛解释道。“他们使用基于梯度的方法进行策略参数优化:策略通过基于采样轨迹计算策略参数梯度来更新。梯度计算和策略更新涉及大型矩阵运算,也可以通过 GPU 并行化以实现实时解决方案。他们利用某机构的计算资源来完成这项任务。”

用于导航的可通行空间分割

刘兰涛指出,某机构的资源对于团队的视觉自主研究也非常有用。视觉信息对于机器人自主性变得越来越重要,因为它可以提供周围环境的丰富信息,并且由于深度神经网络的突破,VAIL 的视觉数据处理能力得到了显著提升。为了开发处理视觉感知的深度方法,团队需要开发具有复杂学习架构、大量数据以及各种训练策略的模型。

“移动机器人在未知环境中导航的一项关键能力是构建无碰撞的可通行空间,”刘兰涛解释道。“机器人专家一直在开发通过激光雷达光束的光线追踪来检测此类自由空间的方法,以在 2D 或 3D 空间中构建占用地图。使用激光雷达进行地图构建需要处理大量点云数据,尤其是在使用高分辨率激光雷达时。作为一种成本低得多的替代方案,摄像头也通过利用深度神经网络对图像进行多类或二类分割,被广泛用于可通行空间检测。”

“然而,”他补充道,“大多数现有的基于深度神经网络的方法都建立在有监督学习范式之上,并依赖于带注释的数据集。这些数据集通常包含大量像素级注释的分割图像,这对于户外环境中的机器人应用来说获取成本过高且耗时。为了克服完全监督学习的局限性,我们一直在开发一种基于变分自编码器的新深度模型。我们针对一个基于表示学习的框架,使机器人能够以无监督的方式学习可通行空间分割,旨在学习一种紧凑地勾勒出所需可通行空间边界的折线表示。这与普遍依赖监督学习策略且通常需要大量像素级注释图像的主流分割技术不同。”

“我们使用图形处理器上的公共数据集数据训练了我们的模型,”刘兰涛解释道。“某机构上的大量计算核心和内存空间使我们能够快速高效地训练模型。这至关重要,因为它允许我们快速测试和重新设计模型,并为将训练好的模型部署到机器人系统提供了极大的便利。”

“然后,我们在实际任务环境中使用一小部分收集的未标记图像训练我们的模型,”刘兰涛补充道。“早期测试表明,我们的模型能够以高精度实时检测可通行空间。”

“某机构提供的计算资源极大地加速了我们的设计过程。”FINISHED