AlphaAgent:基于大语言模型的智能体系统,用于挖掘具有抗衰减能力的阿尔法因子,附python代码包
继续咱们的论文分享:
今天这篇论文《AlphaAgent: LLM-Driven Alpha Mining with Regularized Exploration to Counteract Alpha Decay》提出了一个基于大语言模型的智能体系统,用于挖掘具有抗衰减能力的阿尔法因子。
论文与代码已在星球共享:
问题背景:传统阿尔法挖掘方法(如遗传编程、强化学习)容易过拟合,导致阿尔法衰减,即因子预测能力随时间下降。
LLM 的潜力与局限:LLM 具备金融知识与推理能力,但缺乏对因子原创性、复杂度和假设对齐的约束,容易生成同质化因子。
解决方案:提出 AlphaAgent,通过三个正则化机制对抗衰减:
- 原创性约束:基于 AST 的相似性度量,避免与已有因子重复。
- 假设对齐:使用 LLM 评估因子是否与市场假设一致。
- 复杂度控制:限制因子表达式的复杂度,防止过拟合。
提出了一套完整的正则化框架,将金融假设、因子构建与评估融为一体。
- 构建了多智能体系统:
- Idea Agent:生成市场假设
- Factor Agent:将假设转化为因子表达式
- Eval Agent:评估因子性能并反馈
- 实验验证:
-
在 CSI 500 和 S&P 500 上均取得显著超额收益(年化 11.0% 和 8.74%)。
-
因子表现出更强的抗衰减能力,IC 和 RankIC 保持稳定。
-
相比基线方法(如 RD-Agent、AlphaForge),命中率提升 81%,使用效率提升 23%。
-
量化投资机构:用于自动挖掘、验证和优化阿尔法因子。
-
因子库构建与更新:动态生成适应市场变化的因子。
-
金融研究与教育:作为因子挖掘与验证的实验平台。
-
多市场适应性:适用于中美等不同市场环境。
复现路径
1. 环境与数据准备
- 使用 Qlib 作为回测框架。
- 数据源:
- 中国 A 股:Baostock
- 美股:Yahoo Finance
- 数据字段:OHLCV(开盘、最高、最低、收盘、成交量)
2. 模型与工具
- 基础 LLM
- 预测模型:LightGBM(用于收益预测)
- 因子解析:基于 AST 的符号组装与相似度计算
3. 实现步骤
- 初始化假设:由 Idea Agent 生成市场假设。
- 因子生成:Factor Agent 将假设转化为 AST 表达式。
- 因子评估:Eval Agent 进行回测、相似度检测、语义对齐评分。
- 反馈循环:根据评估结果迭代优化假设与因子。
4. 关键代码模块
operator_library.py:定义金融运算符(如 TS_MIN, SMA)ast_similarity.py:计算因子 AST 相似度consistency_scorer.py:LLM 评估假设与因子对齐度backtest_engine.py:基于 Qlib 的回测系统
5. 实验与调参
- 设置训练/验证/测试时间段(如 2015-2024)
- 调整正则化权重(α₁, α₂, α₃)和阈值
- 进行多轮迭代,记录因子性能与衰减情况
总结
AlphaAgent 通过引入结构化正则化 + 多智能体协作,显著提升了阿尔法因子的可持续性与原创性,为 LLM 在量化金融中的应用提供了新范式。其代码已开源,具备较高的可复现性与扩展性。
从因子构造,到因子筛选,因子评价,因子迭代,走因子逻辑的方式,基本是都是这个框架,论文使用lightGBM来合成,使用的是Qlib的框架,我们后续改造这个框架,使用咱们自己的因子表达式。
每天“不管”一点点,每天就变强一天天。
代码和数据下载:AI量化实验室——2025量化投资的星辰大海
AI量化实验室 星球,已经运行三年多,1900+会员。
aitrader代码,因子表达式引擎、遗传算法(Deap)因子挖掘引****擎等,支持vnpy,qlib,backtrader和bt引擎,内置多个年化30%+的策略,每周五迭代一次,代码和数据在星球全部开源。