MongoDB 5.3中时间序列数据的间隙填充介绍
在MongoDB,我们致力于让开发者利用数据进行创新。时间序列是增长最快的数据密集型工作负载,而我们的原生时间序列功能可以让你更快地构建应用程序,并从时间序列数据中获得更多的洞察力,同时减少认知负担。
时间序列数据有缺口是很常见的,比如物联网传感器离线时。但为了执行分析并确保正确的结果,时间序列数据需要是连续的。你可能还想创建直方图或关联数据集,以便在应用开发的背景下实现更复杂的运营分析。现在MongoDB 5.3快速版中提供的间隙填充,结合我们在MongoDB 5.1中引入的密集化,可以帮助你更好地处理缺失的数据,以轻松创建和浮现有价值的洞察力。
这两个新的聚合阶段创建了一个简单、精简的方式来处理跨时间序列和常规集合的缺失数据,为任何使用案例的分析提供动力。fill则在一个值为空或缺失时为字段设置值。填补缺失值可以用一个常数或使用线性插值,结转上一个观测值或向后结转下一个观测值。
输入文件:跟踪储藏室的温度、运动和库存情况

这个函数产生每个储存室的指标的小时视图。当温度数据缺失时,应进行线性内插,运动应默认为0,库存数量应从最后的已知点结转。

输出。第二个文件是根据周围的两个文件生成的。

以前,这些类型的复杂分析只可能在专门的系统中进行,如专门的时间序列数据库或数据仓库。从架构上看,技术从业者不得不在小众的、往往是不成熟的、专门用于时间序列工作负载的技术和与包含企业全部数据的记录系统脱节之间做出无奈的权衡,并将时间序列数据导出到数据仓库,从而使洞察力难以操作。两者都涉及到管理多个数据仓和脆弱的ETL管道,导致复杂性和成本上升。这些方法的变通方法往往涉及到开发人员建立复杂的数据管道来填补空白,可能是在应用层,导致查询性能不佳或将分析限制在小型数据集。有了MongoDB 5.3,开发人员可以在飞行中的时间序列数据上建立丰富的分析,并作为应用体验的一部分向他们的用户提供业务洞察力。
MongoDB 5.3现在已经上市。如果你正在运行Atlas无服务器实例或选择在你的专用Atlas集群中接收快速发布,那么你的部署将从今天开始自动更新到5.3。MongoDB 5.3也可以作为开发版本从MongoDB下载中心获得,仅供评估之用。与去年宣布的新的发布周期一致,5.3和随后的快速发布版中的功能将扩展到MongoDB 6.0,即我们计划在今年晚些时候交付的下一个主要版本。
安全港声明
我们的产品所描述的任何特性或功能的开发、发布和时间都由我们自行决定。这些信息仅仅是为了概述我们的总体产品方向,在做出购买决定时不应该依赖它。这也不是对提供任何材料、代码或功能的承诺、许诺或法律义务。