AlphaAgent：基于大语言模型的智能体系统，用于挖掘具有抗衰减能力的阿尔法因子，附python代码包

2025-11-21 130 阅读4分钟

AlphaAgent：基于大语言模型的智能体系统，用于挖掘具有抗衰减能力的阿尔法因子，附python代码包

【AI大模型教程】

继续咱们的论文分享：

今天这篇论文《AlphaAgent: LLM-Driven Alpha Mining with Regularized Exploration to Counteract Alpha Decay》提出了一个基于大语言模型的智能体系统，用于挖掘具有抗衰减能力的阿尔法因子。

论文与代码已在星球共享：

问题背景：传统阿尔法挖掘方法（如遗传编程、强化学习）容易过拟合，导致阿尔法衰减，即因子预测能力随时间下降。

LLM 的潜力与局限：LLM 具备金融知识与推理能力，但缺乏对因子原创性、复杂度和假设对齐的约束，容易生成同质化因子。

解决方案：提出 AlphaAgent，通过三个正则化机制对抗衰减：

原创性约束：基于 AST 的相似性度量，避免与已有因子重复。
假设对齐：使用 LLM 评估因子是否与市场假设一致。
复杂度控制：限制因子表达式的复杂度，防止过拟合。

提出了一套完整的正则化框架，将金融假设、因子构建与评估融为一体。

构建了多智能体系统：

Idea Agent：生成市场假设
Factor Agent：将假设转化为因子表达式
Eval Agent：评估因子性能并反馈

实验验证：

在 CSI 500 和 S&P 500 上均取得显著超额收益（年化 11.0% 和 8.74%）。
因子表现出更强的抗衰减能力，IC 和 RankIC 保持稳定。
相比基线方法（如 RD-Agent、AlphaForge），命中率提升 81%，使用效率提升 23%。
量化投资机构：用于自动挖掘、验证和优化阿尔法因子。
因子库构建与更新：动态生成适应市场变化的因子。
金融研究与教育：作为因子挖掘与验证的实验平台。
多市场适应性：适用于中美等不同市场环境。

复现路径

1. 环境与数据准备

使用 Qlib 作为回测框架。
数据源：

中国 A 股：Baostock
美股：Yahoo Finance
数据字段：OHLCV（开盘、最高、最低、收盘、成交量）

2. 模型与工具

基础 LLM
预测模型：LightGBM（用于收益预测）
因子解析：基于 AST 的符号组装与相似度计算

3. 实现步骤

初始化假设：由 Idea Agent 生成市场假设。
因子生成：Factor Agent 将假设转化为 AST 表达式。
因子评估：Eval Agent 进行回测、相似度检测、语义对齐评分。
反馈循环：根据评估结果迭代优化假设与因子。

4. 关键代码模块

operator_library.py：定义金融运算符（如 TS_MIN, SMA）
ast_similarity.py：计算因子 AST 相似度
consistency_scorer.py：LLM 评估假设与因子对齐度
backtest_engine.py：基于 Qlib 的回测系统

5. 实验与调参

设置训练/验证/测试时间段（如 2015-2024）
调整正则化权重（α₁, α₂, α₃）和阈值
进行多轮迭代，记录因子性能与衰减情况

总结

AlphaAgent 通过引入结构化正则化 + 多智能体协作，显著提升了阿尔法因子的可持续性与原创性，为 LLM 在量化金融中的应用提供了新范式。其代码已开源，具备较高的可复现性与扩展性。

从因子构造，到因子筛选，因子评价，因子迭代，走因子逻辑的方式，基本是都是这个框架，论文使用lightGBM来合成，使用的是Qlib的框架，我们后续改造这个框架，使用咱们自己的因子表达式。

每天“不管”一点点，每天就变强一天天。

代码和数据下载：AI量化实验室——2025量化投资的星辰大海

AI量化实验室星球，已经运行三年多，1900+会员。

aitrader代码，因子表达式引擎、遗传算法（Deap）因子挖掘引****擎等，支持vnpy，qlib，backtrader和bt引擎，内置多个年化30%+的策略，每周五迭代一次，代码和数据在星球全部开源。