【轨迹压缩】TrajStore: An Adaptive Storage System for Very Large Trajectory Data Sets

2,644 阅读2分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

TITLE: TrajStore: An Adaptive Storage System for Very Large Trajectory Data Sets

KEY:[2010] [ICDE]

PDF: dspace.mit.edu/bitstream/1…

一、概述

TrajStore 是一种存储系统,它被设计用来分割轨迹和共同定位在地理和时间上相邻的轨迹段。它将轨迹分割成适合时空区域的子轨迹,并在磁盘上的一个块(或块的集合)中标记关于每个区域的数据。它在这些块上使用自适应的多层次网格来查找空间中的数据。通过这种方式,大多数查询可以通过从磁盘中读取几个块来回答,即使这些块包含来自数百或数千个轨迹的数据;

二、原理

2.1 多级网格划分

  • 将空间分割成一系列最优大小的矩形,以检索大量与空间相关的子轨迹;
  • 一种自适应的多级网格划分,提高查询效率,在轨迹密集的区域代价会昂贵些,因为要避免与访问多余区域相关的任何开销;大单元格不足以进行较小的查询,因为它们包含许多不与查询相交的段。
  • 另一方面,较小的单元格需要更多的磁盘来寻求检索给定的空间区域,并产生更多的分裂;

在这里插入图片描述

  • 每个单元格的信息被保存在一个动态四叉树中,其单元格指向存储数据的一系列页面;
  • 动态方法分割区域,以最小化包含片段的单元格中的空白空间

2.2 聚类+增量编码压缩

  • 一种有损压缩方案对在几乎相同路径上运行的轨迹进行聚类,并存储所有轨迹的单一代表性空间路径以及聚类中每个轨迹的时间偏移集合;

  • 一种无损的三角洲压缩方案来对轨迹内连续的时间和空间坐标进行编码;

  • 聚类机制在我们的路径轨迹数据集的背景下特别有效,其中不同的汽车一遍又一遍地驾驶相同的道路和路径,这导致了大量的冗余;

  • 这种方法不依赖于底层的道路几何地图来识别和聚集相关的轨迹,虽然世界上一些地区有这样的路线图,但随着道路的变化,它们必须及时更新,而且不能为行人或越野轨道工作,这限制了它们的用途。

三、总结

  • 作者的思路很有意思,根据网格来对轨迹进行存储和管理;
  • 通过时间映射+聚类来时间多轨迹压缩,但这个效率并不高,我在我的论文中对作者的方向进行了比较