学习排序算法提升包裹投递定位精度

3 阅读6分钟

利用学习排序精确定位包裹投递点

对于配送司机来说,找到正确的包裹投递点可能出乎意料地困难。门牌号可能被树叶遮挡,或者完全缺失;一些社区使用的编号系统杂乱无章,使得门牌号难以猜测;而由多栋建筑组成的建筑群有时共用一个街道地址。

在这张图中,深蓝色圆圈代表为同一地址记录的GPS坐标。红色圆圈是顾客门前的实际位置。取这些测量值的平均值(中心点)会得到一个位于街道中间的位置(浅蓝色圆圈),这会使司机感到困惑并造成延误。

拥有顾客门前的准确经纬度坐标将使配送更加高效,但这类信息很难获取。当司机确认投递时,应用程序会记录当前的GPS位置,这个位置可能介于顾客家门和停在路边的配送货车之间。此外,在城市“峡谷”中,由于GPS卫星的视线严重受限,GPS测量误差可能非常大。

在发表于欧洲机器学习大会(ECML)的一篇论文中,我将信息检索中的一个想法——学习排序——应用于根据历史GPS数据预测投递点坐标的问题。

在实验中,我将新方法与另外两种方法(质心计算和核密度估计)进行了比较,发现新方法的性能显著优于之前的方法。在来自纽约州的配送数据上,新方法的误差远低于表现最佳的基线方法——核密度估计。

学习排序

在信息检索的背景下,学习排序是一种从成对偏好数据中学习的方法。如果一个搜索引擎呈现一个排名结果列表,用户只点击了第三个搜索结果,这隐式地提供了两个成对偏好:用户更喜欢第三个搜索结果而不是第一个,并且用户也更喜欢第三个搜索结果而不是第二个。这就提供了两个标记的偏好对,可以帮助训练排序模型,以改进其他查询的未来搜索结果。

类似地,我训练一个排序模型来为特定地址从一组候选位置中选择最佳点。对最佳位置的一个标记点击,隐含了(几乎)所有候选位置对的偏好顺序;最接近被标记位置的候选位置被偏好。因此,每次标记点击产生的训练对数量远多于信息检索。基础的二分类模型将点的配对作为输入,并被训练为偏好更接近标记点的那个点。

然而,信息检索中流行的学习排序方法与我对其的改编之间存在一个区别。在搜索引擎场景中,算法可能需要对数万个文档或产品进行排序以产生排名。尽管模型是通过成对比较训练的,但在推理时,它没有足够的时间将每个候选文档与所有其他文档进行比较。相反,它作为一个回归模型来独立地对每个候选进行评分,最终的排名仅按分数排序。

然而,在地理空间案例中,我们通常离线计算,并且对于每个配送地址,我们通常需要考虑少于100个足够不同的候选位置。这使得在推理时可以将每个候选位置与所有其他位置进行比较:我们选择在最多成对比较中胜出的那个位置。实验表明,这比从成对数据训练的回归模型(如RankNet)产生了更好的结果。

使用的主要机器学习模型是随机森林——一个由从训练数据中学习到的、例如30棵决策树组成的集成模型。每棵决策树对一组选定的数据属性(特征)执行一系列评估,以产生一个分数。所有树分数的平均值是模型对给定输入项的整体分数,该分数指示了在两个候选点中偏好哪一个。

实验结果

为了生成候选位置,首先会精简过去报告的许多GPS投递位置:一个紧密的点簇只用一个或两个点来代表。然后,沿着附近建筑物的面添加潜在的候选点。

每个候选点的特征向量包括基于其附近历史GPS测量值密度的特征,以及基于附近地图数据的特征。这些特征包括诸如到最近街道的距离、到最近停车场的距离、到最近建筑物的距离等。这些类型的特征有助于模型不选择位于街道或停车场中间的位置,而质心或核密度估计模型则可能轻易地犯下这个错误(如上图所示)。还有一些上下文特征也有帮助,例如过去的投递数量和附近的建筑物轮廓数量。

利用各种信息特征的能力解释了排序模型相对于基线方法的优势。并非所有区域都有可靠的地图数据,但模型性能最强的许多地址可能拥有可靠数据。由于基线模型无法利用这些信息,因此性能差距更大。

从技术上讲,我考虑的第一个基线是中位数点方法,它选择最接近历史GPS测量值质心的候选位置。质心、中位数点和几何中位数方法都犯了选择多模态分布中间的低密度点这一错误。

核密度估计方法通过找到历史GPS点的密集簇来避免这个问题,但通常真实的门的位置在簇的边缘,而不是中间。因此,我们确实需要一种有监督的机器学习方法,能够利用许多不同的信号,包括来自在线地图的信息。该方法在一定程度上能够适应地图不完整的区域——例如,缺少建筑物轮廓甚至道路。

我还将新模型与一个“神谕”进行了比较,后者总是选择最接近真实门位置的候选位置;除非拥有一个全知的候选点生成器或生成所有点,否则不可能总是有一个非常接近真实标签的候选点。

下图显示了新颖的排序模型(GeoRank)相对于中位数点方法、核密度估计方法、“神谕”以及(作为上界)随机选择的性能表现。它们分别针对两组不同的数据集展示,一组来自纽约州,一组来自华盛顿州。Y轴是损失,因此越低越好;X轴显示了损失的整体分布(而不是每个方法的单个标量平均值)。

如图所示,GeoRank模型显著优于基线方法,并且与“神谕”相比表现良好。通过将此工作投入实践,配送效率得到了显著提高,这对顾客和最后一英里配送的司机都有益。更多详细信息请参阅论文。FINISHED