AlphaAgent:基于大语言模型的智能体系统,用于挖掘具有抗衰减能力的阿尔法因子,附python代码包

130 阅读4分钟

AlphaAgent:基于大语言模型的智能体系统,用于挖掘具有抗衰减能力的阿尔法因子,附python代码包

【AI大模型教程】

继续咱们的论文分享:

今天这篇论文《AlphaAgent: LLM-Driven Alpha Mining with Regularized Exploration to Counteract Alpha Decay》提出了一个基于大语言模型的智能体系统,用于挖掘具有抗衰减能力的阿尔法因子。

论文与代码已在星球共享:

问题背景:传统阿尔法挖掘方法(如遗传编程、强化学习)容易过拟合,导致阿尔法衰减,即因子预测能力随时间下降。

LLM 的潜力与局限:LLM 具备金融知识与推理能力,但缺乏对因子原创性、复杂度和假设对齐的约束,容易生成同质化因子。

解决方案:提出 AlphaAgent,通过三个正则化机制对抗衰减:

  • 原创性约束:基于 AST 的相似性度量,避免与已有因子重复。
  • 假设对齐:使用 LLM 评估因子是否与市场假设一致。
  • 复杂度控制:限制因子表达式的复杂度,防止过拟合。

提出了一套完整的正则化框架,将金融假设、因子构建与评估融为一体。

  1. 构建了多智能体系统
  • Idea Agent:生成市场假设
  • Factor Agent:将假设转化为因子表达式
  • Eval Agent:评估因子性能并反馈
  1. 实验验证
  • 在 CSI 500 和 S&P 500 上均取得显著超额收益(年化 11.0% 和 8.74%)。

  • 因子表现出更强的抗衰减能力,IC 和 RankIC 保持稳定。

  • 相比基线方法(如 RD-Agent、AlphaForge),命中率提升 81%使用效率提升 23%

  • 量化投资机构:用于自动挖掘、验证和优化阿尔法因子。

  • 因子库构建与更新:动态生成适应市场变化的因子。

  • 金融研究与教育:作为因子挖掘与验证的实验平台。

  • 多市场适应性:适用于中美等不同市场环境。

复现路径

1. 环境与数据准备

  • 使用 Qlib 作为回测框架。
  • 数据源:
  • 中国 A 股:Baostock
  • 美股:Yahoo Finance
  • 数据字段:OHLCV(开盘、最高、最低、收盘、成交量)

2. 模型与工具

  • 基础 LLM
  • 预测模型:LightGBM(用于收益预测)
  • 因子解析:基于 AST 的符号组装与相似度计算

3. 实现步骤

  1. 初始化假设:由 Idea Agent 生成市场假设。
  2. 因子生成:Factor Agent 将假设转化为 AST 表达式。
  3. 因子评估:Eval Agent 进行回测、相似度检测、语义对齐评分。
  4. 反馈循环:根据评估结果迭代优化假设与因子。

4. 关键代码模块

  • operator_library.py:定义金融运算符(如 TS_MIN, SMA)
  • ast_similarity.py:计算因子 AST 相似度
  • consistency_scorer.py:LLM 评估假设与因子对齐度
  • backtest_engine.py:基于 Qlib 的回测系统

5. 实验与调参

  • 设置训练/验证/测试时间段(如 2015-2024)
  • 调整正则化权重(α₁, α₂, α₃)和阈值
  • 进行多轮迭代,记录因子性能与衰减情况

总结

AlphaAgent 通过引入结构化正则化 + 多智能体协作,显著提升了阿尔法因子的可持续性与原创性,为 LLM 在量化金融中的应用提供了新范式。其代码已开源,具备较高的可复现性与扩展性。

从因子构造,到因子筛选,因子评价,因子迭代,走因子逻辑的方式,基本是都是这个框架,论文使用lightGBM来合成,使用的是Qlib的框架,我们后续改造这个框架,使用咱们自己的因子表达式。

每天“不管”一点点,每天就变强一天天。

代码和数据下载:AI量化实验室——2025量化投资的星辰大海

AI量化实验室 星球,已经运行三年多,1900+会员。

aitrader代码,因子表达式引擎、遗传算法(Deap)因子挖掘引****擎等,支持vnpy,qlib,backtrader和bt引擎,内置多个年化30%+的策略,每周五迭代一次,代码和数据在星球全部开源。