GitHub Daily · 第04期 — Kronos

0 阅读8分钟

GitHub Daily · 第04期 — Kronos:让AI读懂K线的语言

K线图,本质上也是一种“语言”——Kronos让AI学会这种语言。

项目速览

  • 项目名称: Kronos
  • GitHub: shiyu-coder/Kronos
  • 语言: Python
  • Stars: Trending
  • 论文: AAAI 2026
  • 标签: #金融AI #时序预测 #基础模型 #开源

一句话定位

首个专门为金融K线数据设计的开源基础模型,将“市场的语言”进行AI建模。

它能解决什么问题?

金融市场的预测是一个经典难题,传统方法面临三重困境。

传统量化模型依赖手工特征工程,策略开发周期长且容易过拟合。这些模型通常针对特定市场或时段优化,一旦市场环境发生变化(如从牛市转向熊市),泛化能力急剧下降,导致策略失效。

通用时序模型如ARIMA、LSTM或近年流行的时序基础模型(TSFM),虽然擅长处理连续数值序列,但无法理解金融市场的独特规律。它们将K线数据视为普通的时间序列,忽略了其作为市场“视觉语言”的本质——形态模式(如锤子线、吞没形态)承载着丰富的市场情绪和供需信息。

监管与合规需求日益严格,机构投资者需要可解释、可审计的预测方法。黑盒模型在回测中可能表现优异,但缺乏透明度,难以通过合规审查。金融应用需要能够量化不确定性的预测系统,为风险管理和头寸调整提供依据。

核心亮点

亮点1:K线即语言——将OHLCV数据转化为离散token

Kronos的核心创新在于其双阶段处理框架[11]。与传统模型直接将OHLCV(开盘、最高、最低、收盘、成交量)数值输入神经网络不同,Kronos首先通过专用的Binary Spherical Quantization分词器将连续、多维的金融数据转换为离散的token序列。

这种设计让模型学习的是“K线形态”的语义,而非具体的价格数值。就像语言模型学习单词在上下文中的含义一样,Kronos学习的是特定市场状态下可能出现的价格形态。该方法在实验中展现出22%的合成K线保真度提升

亮点2:45+交易所预训练——跨市场零样本泛化

模型在来自45个全球交易所的庞大数据集上进行预训练[12],涵盖股票、加密货币、外汇、期货等多个资产类别。这种广泛的预训练让Kronos具备了零样本预测能力——无需针对特定市场重新训练,即可直接预测任意市场的K线走势。

这种跨市场泛化能力打破了传统量化策略的局限性。一个在美股数据上训练的模型,可以不经调整直接应用于加密货币市场,为多资产策略开发提供了统一的基础设施。

亮点3:概率预测——告别点估计,拥抱不确定性

与输出单一预测值的传统模型不同,Kronos通过温度控制采样生成多条预测路径,形成概率分布[11]。用户可以通过调整temperaturetop_p参数控制预测的随机性,生成从保守到激进的不同预测场景。

这种概率预测能力对风险管理至关重要。交易员不仅可以获得最可能的价格路径,还能评估预测的不确定性,计算**Value at Risk(VaR)**等风险指标,为头寸管理和止损设置提供数据支持。

亮点4:模型家族——从边缘设备到机构级全覆盖

Kronos提供完整的模型家族,满足不同场景的需求:

模型

参数量

上下文长度

适用场景

开源状态

Kronos-mini

4.1M

2048

边缘设备、快速原型

Kronos-small

24.7M

512

平衡性能、中等规模应用

Kronos-base

102.3M

512

高精度预测、机构应用

Kronos-large

499.2M

512

研究用途、前沿探索

Kronos-small(24.7M参数)在普通笔记本电脑上即可运行,推理速度约50ms/次,是社区使用最广泛的版本[11]。Kronos-base则提供机构级的预测精度,在基准测试中比Chronos、TimesFM、Moirai等主流时序基础模型高出87-93%的预测精度[12]。

实战场景展示

场景1:加密货币动量交易(BTC/USDT 24小时预测)

加密货币市场24小时运作,波动剧烈。Kronos可以分析过去400个15分钟K线,预测未来120个时间点(24小时)的价格走势[12]。通过生成多条预测路径,交易员可以识别高概率的突破条件或均值回归机会,相比传统技术指标(如RSI、MACD)能更好地处理非平稳市场状态。

在线演示显示,在BTC/USDT 1小时数据上,模型预测未来24小时价格上涨的概率为20.0%,波动率放大的概率达96.7%[17],为趋势跟踪策略提供了量化依据。

场景2:股票配对交易与统计套利

对于统计套利策略,Kronos可以同时对两个高度相关的股票(如可口可乐与百事可乐)进行批量预测[12]。通过预测两者价差的变化路径,当实际价差偏离预测范围时,系统发出均值回归信号。其分层tokenization能够捕捉传统线性模型忽略的协整关系。

场景3:投资组合风险管理(VaR计算)

风险管理部门使用Kronos的概率预测能力进行压力测试和VaR计算[12]。通过生成数千条市场情景模拟,可以评估极端事件下的投资组合损失,满足巴塞尔协议III等监管要求。这种前瞻性方法比依赖历史数据的历史模拟法更能捕捉前所未有的尾部风险。

场景4:高频交易信号生成

在5分钟或1分钟级别,Kronos-mini可以在共置服务器上以低于100ms的延迟运行[12]。该模型能够识别隐藏在K线形态中的订单流不平衡和流动性模式,为做市商算法生成信号。其轻量级设计(4.1M参数)使其可以在不超出延迟预算的GPU实例上部署。

上手指南

安装与基础使用

# 安装Kronos
pip install kronos

# 加载预训练模型
from kronos import KronosModel
model = KronosModel.from_pretrained("NeoQuasar/Kronos-small")

# 准备数据(以Pandas DataFrame为例)
import pandas as pd
import numpy as np

# 假设数据包含OHLCV列
data = pd.read_csv("btc_usdt_15m.csv")

# 数据标准化:z-score,clip到[-5, 5]
def normalize_data(df):
    mean = df.mean()
    std = df.std()
    normalized = (df - mean) / std
    return normalized.clip(-5, 5), mean, std

normalized_data, data_mean, data_std = normalize_data(data[['open', 'high', 'low', 'close', 'volume']])

# 使用最近400个时间点预测未来120个
lookback = 400
horizon = 120

# 单次预测
predictions = model.predict(normalized_data[-lookback:], horizon=horizon)

# 多路径采样(概率预测)
ensemble_preds = model.predict(normalized_data[-lookback:], horizon=horizon, num_samples=10)

# 反标准化获取实际价格预测
def denormalize_predictions(preds, mean, std):
    return preds * std + mean

price_predictions = denormalize_predictions(predictions, data_mean, data_std)

批量处理与高级功能

# 批量预测多个资产
btc_data = pd.read_csv("btc_usdt.csv")
eth_data = pd.read_csv("eth_usdt.csv")

data_list = [btc_data, eth_data]
normalized_list = [normalize_data(df[['open', 'high', 'low', 'close', 'volume']])[0] for df in data_list]

# 批量预测
batch_predictions = model.predict_batch(normalized_list, horizon=24)

# 微调自定义数据集(以A股为例)
from kronos.finetune import FinetunePipeline

pipeline = FinetunePipeline(
    base_model="NeoQuasar/Kronos-small",
    train_data_path="a_share_data/train",
    val_data_path="a_share_data/val"
)

# 两阶段微调:先微调tokenizer,再微调predictor
pipeline.finetune_tokenizer(epochs=10)
pipeline.finetune_predictor(epochs=20)

# 保存微调后的模型
pipeline.save_model("kronos_a_share")

注意事项与资源链接

重要注意事项

  1. 数据标准化:输入数据必须进行z-score标准化并clip到[-5, 5]范围,使用与训练相同的预处理流程。
  2. 硬件需求
    • Kronos-mini:可在CPU笔记本运行(~10ms推理)
    • Kronos-small:推荐GPU(~50ms推理)
    • Kronos-base:需要GPU(~200ms推理)
  3. 模型限制:Kronos-large(499.2M)暂未开源,仅Kronos-mini支持2048上下文长度。
  4. 风险提示:预测结果仅供参考,金融市场的预测风险极高,实盘交易需结合严格的风险管理。

官方资源链接

今日总结与互动

核心洞察

Kronos代表了金融AI领域的范式转换——从手工特征工程到统一预训练模型,从单点预测到概率分布生成。它将金融市场的“语言”转化为AI可理解的形式,为量化策略开发提供了全新的基础设施。

Kronos的出现在多个层面具有标志性意义:技术上,证明了针对垂直领域设计专用基础模型的可行性;生态上,开源释放了机构级量化能力;应用上,概率预测为风险管理提供了更科学的工具。随着基础模型在金融领域的深入,我们可能正在见证量化交易2.0时代的开端。

互动话题

你认为基础模型会彻底改变量化交易的格局吗?欢迎在评论区分享你的观点:

  1. AI基础模型会成为未来量化策略的“标配”吗?
  2. 开源金融模型会如何影响传统量化基金的竞争优势?
  3. 概率预测相比传统点估计,在实际交易中的价值有多大?