Chronos-2:从单变量到通用预测的统一时序模型

4 阅读7分钟

Chronos-2:从单变量到通用预测

上下文学习使模型能够以零样本方式解决任意维度的预测任务。

作者:Abdul Fatir Ansari, Oleksandr Shchur, Jaris Küken
2025年10月20日
预计阅读时长:4分钟

时间序列预测对于商业、科学和工程领域的众多应用至关重要。最近,基础模型引发了时间序列预测领域的范式转变。与从单个时间序列进行外推的统计模型,或针对特定任务训练的早期深度学习模型不同,时间序列基础模型在大型时间序列数据上进行一次性训练,然后可应用于各种预测问题。

自首次发布以来,某机构的时间序列基础模型 Chronos 和 Chronos-Bolt 在 Hugging Face 上的总下载量已超过 6 亿次,这证明了时间序列基础模型的普及性及其对任意预测场景的适用性。尽管取得了成功,但现有时间序列基础模型有一个关键限制:它们仅支持单变量预测,即一次预测一个时间序列。虽然单变量预测很重要,但许多场景需要额外的能力。现实世界的预测问题通常涉及同时预测多个共同演化的时间序列(多变量预测),或纳入影响结果的外部因素(协变量信息预测)。例如,云基础设施指标(如 CPU 使用率、内存消耗和存储 I/O)会共同演化,并且可以从联合建模中受益。同样,零售需求深受促销活动的影响,而能源消耗模式则受天气条件驱动。

为了解决这一限制,我们推出了 Chronos-2,这是一个基础模型,旨在以零样本方式处理任意预测任务——包括单变量、多变量和协变量信息预测。Chronos-2 利用上下文学习来实现这些能力,而无需额外训练。对于多变量预测,Chronos-2 可以联合预测多个共同演化的时间序列,捕捉有助于提高整体准确性的依赖关系。例如,云运维团队可以联合预测 CPU 使用率、内存消耗和存储 I/O,以便在资源瓶颈发生之前做出预判。对于协变量信息预测,Chronos-2 可以纳入影响预测的外部因素。该模型支持仅过去的协变量(例如,预示未来趋势的历史流量数据)和已知未来的协变量(例如,预定的促销活动或天气预报)。它还能处理分类协变量,如特定节假日或促销类型。例如,零售商可以在预测需求的同时考虑计划的促销活动和节假日安排,以优化库存水平。Chronos-2 增强的上下文学习能力还通过实现跨学习来改进单变量预测,即模型在多个单变量时间序列之间共享信息,从而做出更准确的预测。这在冷启动场景中尤其有价值:一家物流公司开设新的配送中心时,可以利用现有设施的模式来生成准确的预测,即使运营历史数据很少。

Chronos-2 完整流程

输入时间序列(目标变量和协变量)首先通过稳健的缩放方案进行归一化,然后添加时间索引和掩码元特征。得到的序列被分割成不重叠的补丁,并通过残差网络映射到高维嵌入。核心的 Transformer 堆栈在这些补丁嵌入上运行,并生成对应于输入中被掩码的未来补丁的多分位数输出。每个 Transformer 块交替使用时间注意力和组注意力层:时间注意力层聚合单个时间序列内不同补丁的信息,而组注意力层在每个补丁索引处聚合组内所有序列的信息。图示说明了两个多变量时间序列,每个都带有一个已知协变量,对应的组分别以蓝色和红色高亮显示。此示例仅用于说明;Chronos-2 支持任意数量的目标变量和可选的协变量。

构建像 Chronos-2 这样的通用时间序列基础模型需要在两个方向上进行创新:模型架构和训练数据。下游预测任务在维度数量和语义内容上各不相同。由于无法预先知道变量在未知任务中将如何交互,模型必须从可用上下文中推断这些交互。我们的分组注意力机制通过允许任意大小的时间序列组内进行信息交换来处理这种交互。例如,如果 Chronos-2 在预测云指标,CPU 使用模式可以为内存消耗预测提供信息。分组注意力还可以纳入协变量,例如,利用促销计划的信息来帮助预测需求。

训练语料与架构创新同样关键。一个通用的时间序列基础模型必须在异构时间序列任务上进行训练,但具有多变量依赖性和信息性协变量的高质量预训练数据十分稀缺。为了解决这个问题,我们依靠合成时间序列数据,方法是对从基础单变量生成器中采样的时间序列施加多变量结构。

实验结果

在 fev-bench 时间序列基准上的实验结果。平均胜率和技能得分是基于缩放分位数损失指标计算的,该指标用于评估概率预测性能。两者的数值越高越好。在这个包含单变量、多变量和协变量信息预测任务的综合基准测试中,Chronos-2 以显著优势优于所有现有的预训练模型。

Chronos-2 在单变量模式下的结果及其从上下文学习中获得的收益,以堆叠柱状图的形式显示在 fev-bench 的协变量子集上。上下文学习在涉及协变量的任务上带来了巨大的提升,展示了 Chronos-2 通过上下文学习有效利用协变量的能力。除了 Chronos-2,只有 TabPFN-TS 和 COSMIC 支持协变量,并且 Chronos-2 以较大优势优于所有基线模型。

在 GIFT-Eval 时间序列基准上的结果。平均胜率和技能得分基于 (a) 概率预测指标和 (b) 点预测指标。胜率和技能得分均越高越好。Chronos-2 优于之前表现最佳的模型 TimesFM-2.5 和 TiRex。

实证评估证实,Chronos-2 代表了时间序列基础模型能力的飞跃。在涵盖广泛预测任务(单变量、多变量和协变量信息预测)的综合时间序列基准 fev-bench 上,Chronos-2 大幅优于现有的时间序列基础模型。我们在协变量信息任务上看到了最大的提升,这展示了 Chronos-2 在此类重要实际场景中的强大能力。在 GIFT-Eval 基准上,Chronos-2 在预训练模型中排名第一。Chronos-2 显著优于其前身 Chronos-Bolt,在直接对比中胜率超过 90%。

Chronos-2 的上下文学习能力使其成为一个可行的通用预测模型,可以直接用于生产流程,极大地简化了这些流程。Chronos-2 现已开源。我们邀请研究人员和实践者使用 Chronos-2,并共同探索时间序列基础模型的前沿领域。

了解更多:

  • Chronos-2 模型卡
  • 在某云平台上部署 Chronos-2
  • Chronos-2 技术报告
  • Chronos GitHub 仓库

研究领域
机器学习

标签
时间序列,概率预测,深度科学系统与服务FINISHED