ATLAS:把提示词当权重训练的AI交易系统

9 阅读4分钟

前两天刷GitHub看到一个项目——ATLAS。核心理念一行字:提示词即权重,夏普比率为损失函数,不需要GPU。

一开始我觉得这不就是个噱头?仔细看完代码和文档后,想法变了。

先说它做了什么

General Intelligence Capital搞了一套AI交易系统。但玩法跟平常见到的不太一样:他们没训练模型,而是让25个AI代理每天讨论市场,然后根据实际盈亏情况改写这些代理的提示词。

打个比方:传统做法是数据喂进去,训练,更新权重,模型变强。ATLAS的玩法是——代理表现不好?那就改它的"思考方式",改完跑几天看效果,好了就留着,不行就回滚。

这有点像带新人。你不会重新训练他的大脑,而是教他新的分析方法。有效就继续用,没效就换一套。

架构设计有点东西

ATLAS搞了四层代理,分工很明确:

宏观层10个人盯大局:央行、地缘政治、中国、美元、收益率曲线这些。每天早上给出市场环境的基调判断。

行业层7个人分赛道:半导体、能源、生物医药、消费、工业、金融。还有一个专门做关联分析的,类似Bloomberg那种关系映射。

超级投资者层4个人代表不同风格——Druckenmiller搞宏观动量,Aschenbrenner盯AI算力,Baker押深科技,Ackman找优质复利公司。这设计挺有意思,等于把不同流派的大佬请到一个群里。

决策层4个人收尾:CRO专门唱反调挑刺,Alpha发现找冷门机会,执行层转信号为交易,最后CIO综合拍板。

这25个代理每天会"吵架",CIO做最终决定。不是让一个AI硬想,而是模拟投资委员会的决策流程。

真正有意思的是进化机制

ATLAS的核心是这套达尔文式的提示词优化。

系统追踪每个代理的滚动夏普比率。表现最差的那个,会被改提示词——可能是加一个新的考量维度,可能是换一种分析框架。

改完跑5个交易日。表现好了就commit,不好就reset回滚。

这不是瞎改,是用git管理版本。每次修改都是一个commit,失败就reset。这设计很工程化,也很有画面感。

还有个"达尔文权重":每个代理权重在0.3到2.5之间。每天表现好的前25%权重+5%,差的-5%。时间久了,废物的声音会越来越小。

数据不会骗人

这套系统跑了18个月,结果:

54次提示词修改尝试,16次存活,37次回滚。存活率30%。

部署阶段173天,收益22%。最佳单票AVGO从152拿到涨128%。

70%的失败率看起来高?但市场本来就是不确定的。关键是系统知道自己会犯错,所以设计了回滚机制。

几个让我意外的点

代理能自己生。 系统会检测知识空白,然后创建新的专家代理。6个月里自己冒出来9个,3个被淘汰,6个活下来了。25个变31个,全程自动。

PRISM训练法。 不同市场环境下的代理独立进化。牛市的代理、熊市的代理、震荡市的代理,同样的起点,进化出完全不同的策略。像生物在隔离岛屿上分化。

成本低得离谱。 Azure虚拟机20刀一个月,完整18个月回测才花了50-80刀。主力模型是Claude Sonnet。不需要GPU,不需要训练,就是调API迭代提示词。

开源和闭源的边界

开源的是框架、方法论、架构设计、示例提示词。

闭源的是训练完的实际提示词——这才是真正的"模型权重",是他们的核心资产。CIO的决策规则、实盘持仓、达尔文权重数据都没公开。

这个分寸拿捏得挺对。方法论可以共享,吃饭的家伙得留着。

写在后面

ATLAS已经在跑实盘了。真金白银在验证这套方法论。

最打动我的是它的工程思路:不是一味追求更复杂的模型,而是回归到"怎么让系统真正有效"这个问题上。git管理策略迭代、达尔文权重淘汰废物、回滚机制承认错误——这些都是很朴素的工程实践,但放在一起就形成了独特的系统。

把提示词当权重优化,这个视角的转换,可能比堆算力有意义得多。


项目地址:github.com/chrisworsey…

代码结构很清晰,感兴趣的可以跑跑看。