先聊一个让我真正坐直了的数字
2026年5月5日,摩根大通 CEO Jamie Dimon,在 Anthropic 的邀请制金融服务峰会上, 从空白页面出发,用 Claude Code 拉数据、做可视化、写方法论文档, 搭了一个国债资产互换和买卖价差的分析看板。
全程:20分钟。
我在金融行业待过,知道这意味着什么。 一个分析师要完成同样的东西,通常需要半天到一天: Bloomberg 调数据,Excel 搭模板,Python 写可视化,Word 写说明,PPT 收尾。 然后发现数据口径不对,再来一遍。
Dimon 不是在表演。他是在现场给台下的银行家和基金经理们演示: 你们的 Analyst 每天做的那些"聪明的体力活",现在可以压缩到20分钟。
这不是 AI 会议室里的 PPT。这是在说,钱要怎么花了。
考虑到国内使用Claude Code确实有点困难,参考一下靠谱的网站:claudemax.shop
2026年5月5日发生了什么?
Anthropic 在纽约举办了一场邀请制金融服务发布会, 台上坐着 Dario Amodei、Jamie Dimon、Goldman Sachs CIO Marco Argenti、 JPMorgan CIO Lori Beer 和 AIG CEO Peter Zafino。
这阵容是金融圈对一家 AI 公司表达"我们认真了"的方式。
发布的内容:
10个预构建金融 Agent 模板,分两组:
研究 & 客户覆盖(5个):
- Pitch Builder:路演材料和交易 Pitchbook 自动生成
- Meeting Preparer:客户会议背景研究和议程
- Earnings Reviewer:季报和年报逐项财务拆解
- Model Builder:DCF、LBO、可比公司分析模型
- Market Researcher:行业研究、竞争格局、宏观数据
财务 & 运营(5个):
- Valuation Reviewer:估值合理性复核
- General Ledger Reconciler:总账自动对账
- Month-End Closer:月末关账和基金净值计算
- Statement Auditor:财务报表稽核
- KYC Screener:客户尽调和反洗钱初筛
每个模板封装了三件事:技能(领域知识)+ 连接器(数据接入)+ 子 Agent(专项执行) 。 可以部署在 Cowork 或 Claude Code 里,或者通过 Managed Agents 接口以编程方式调用。
同时宣布的还有:
- 8个新数据连接器:Dun & Bradstreet、Fiscal AI、Financial Modeling Prep、 Guidepoint、IBISWorld、SS&C IntraLinks、Third Bridge、Verisk
- Moody's MCP app:接入 6 亿多家公司数据
- Microsoft 365 集成:Excel、PowerPoint、Word 已上线,Outlook 即将支持
- $15亿联合风险投资(Blackstone + Hellman & Friedman + Goldman Sachs,5月4日宣布), 把 Claude 嵌入私募股权和房地产投资组合公司的日常运营
这不是一次功能更新。这是 Anthropic 宣布: 我要成为华尔街的操作系统。
基准测试:Claude Opus 4.7 在金融领域的真实成绩
Vals AI Finance Agent Benchmark 是目前金融 AI 领域最权威的测试之一, 由斯坦福研究人员联合 Goldman Sachs、Silver Lake 和 Citadel 的领域专家设计, 包含537道题,覆盖9个金融任务类别,核心聚焦于 SEC 文件研究—— 这是股票研究、信用分析和投资尽调的基础能力。
Claude Opus 4.7 得分:64.37%
对比:
- GPT-5.5:59.96%
- Gemini 3.1 Pro:59.72%
差距看起来不大,但在金融任务里,4个百分点的准确率差距可能意味着 一个错误的引用、一个偏差的估值、一份被返工的报告。
Anthropic 同时引用了 GDPval-AA 评估(经济价值性知识工作评估), Claude Opus 4.7 在这个维度也位列第一。
这些数字的背后含义是:在处理 SEC 10-K 文件、解析复杂财务注释、 从大量叙述性文字中提取关键数字这类任务上,Claude 目前是最可靠的工具。 而这些任务,恰恰是初级分析师最容易出错、最耗时的部分。
真实案例:那些真的在用的人说了什么
Walleye Capital:400人对冲基金,100% 员工用 Claude Code
这是整个发布里我觉得最值得反复看的一个数据。
Walleye Capital 是一家规模约400人的对冲基金,CEO Will England 说:
"100% of employees at Walleye Capital use Claude Code. This level of adoption across our 400-person hedge fund reflects our AI-first mindset."
400人,100%,不是试点,不是"部分团队"。 是从研究员到运营到后台,全员日常使用。
在量化行业,这种覆盖率意味着 Claude Code 已经被嵌入了工作流的基础设施层, 而不是"有空就用一用"的辅助工具。
Bridgewater:Ray Dalio 的基金,用 Claude 搭投研助手
桥水的 CTO Aaron Linsky 描述了他们构建的 Investment Analyst Assistant:
Claude 帮助他们"生成 Python 代码,构建数据可视化, 以初级分析师的精度迭代完成复杂金融分析任务"。
"以初级分析师的精度"——这不是夸奖,这是一个精确的技术描述。 桥水用的是"助手"定位,目的是提升现有分析师的产出,而不是替代。
作为一个写过量化回测代码的人,我知道"生成正确的 Python 金融分析代码" 有多难搞:数据对齐、时区处理、滚动窗口计算、因子归因…… 每一步都有坑。桥水说 Claude 能"以初级分析师精度"做这件事, 我选择相信,因为他们没有理由撒谎。
AIG:承保准确率从75%提升到90%
保险承保是一个极其依赖文档分析的领域: 政策条款、历史索赔数据、风险评估报告……海量文字,少量数字,很多判断。
AIG 引入 Claude 之后:
- 内部审核时间压缩了5倍
- 承保任务准确率从 75% 提升至 90% ,上升了整整15个百分点
90% 的准确率意味着 10% 的错误率,这个数字在承保里仍然需要人工核查。 但从75% 到90%,已经把人工复查的工作量从"每4件查1件"降到了"每10件查1件"。 规模效应下,这是实实在在的成本节约。
FIS:AML 调查从"数天"到"数分钟"
FIS(全球最大金融科技公司之一)和 Anthropic 联合开发了反洗钱(AML)调查 Agent。 CEO Stephanie Ferris 的原话:
「Together we're building an agent that compresses AML investigations from days to minutes.」
反洗钱调查是一个高度依赖信息关联的任务: 要在海量交易记录、客户背景数据、制裁名单之间做交叉比对, 传统上需要分析师花几天时间手动排查。
从"数天"到"数分钟"这个跨度,不是效率优化,是范式改变。
基金经理具体怎么用?逐场景拆解
用法一:季报财务分析——Earnings Reviewer Agent
一家上市公司发季报,通常同时附带: 10-Q 文件(几十页),Management Discussion,Press Release, Earnings Call Transcript,以及你自己的历史模型。
传统做法:分析师逐段读,逐项更新模型,然后写投资摘要,通常要半天。
Earnings Reviewer 的做法:
- 把所有文件接入(支持 Daloopa 直接拉 SEC 数据)
- Agent 自动提取营收、利润率、费用变动、管理层指引变化
- 与你上一季的模型对比,标注偏差
- 生成分析摘要草稿,你来判断重不重要
Claude 的1M Token 上下文窗口在这里是真实优势—— 整个 10-Q 加上 Transcript 整包送进去,不截断,不遗漏。
用法二:Pitchbook 生成——Pitch Builder Agent
Pitchbook(路演材料)是投行分析师的"命", 一份好的 Pitchbook 通常需要:市场数据、可比交易、管理层背景、 财务预测、估值页、风险因素……组合起来40页起步。
以前:一个 Associate 花3-5天,中间反复打磨。
Pitch Builder 的做法: 把交易背景、目标公司信息、你的论点方向喂进去, Agent 生成 PowerPoint 初版(直接通过 Microsoft 365 集成输出), 包含数据引用和可比分析,你在上面修改和精炼。
我在 Anthropic 的官方页面看到了一个具体的示例提示词:
Generate the Q1 2026 performance summary for Pinnacle Growth Equity Fund
using our holdings data and benchmark returns.
Use Brinson-Fachler sector attribution.
Include portfolio return vs. benchmark with active return and information ratio,
sector contribution to active return in bps,
and risk metrics: Sharpe, beta, max drawdown, and active share.
Format as a PowerPoint slide for institutional investors.
这一段提示词里包含了:业绩归因方法(Brinson-Fachler)、 具体指标(信息比率、主动份额)、输出格式(PowerPoint)。 这已经是专业金融语言,不是通用 AI 提示词了。
用法三:Model Builder——DCF 建模,量化分析师的日常
对于基金经理和量化分析师,Model Builder Agent 的价值在于:
- 自然语言→模型框架:描述你的假设,Agent 生成 Excel 模型骨架
- 历史数据接入:通过 FactSet / Financial Modeling Prep 直接拉财务数据填入
- 敏感性分析:自动生成增长率 / 利率 / 折现率的多情景压力测试
- Python 代码生成:需要更复杂的量化分析时,直接生成可运行脚本
在我的经验里,建一个 DCF 模型最耗时的不是公式设计, 而是数据清洗和格式统一。Claude 把这部分接管了,剩下的是判断假设合不合理。
用法四:Claude Code 写量化策略代码
这是我作为码农最感兴趣的部分。
给 Claude Code 一个用自然语言描述的策略逻辑:
实现一个基于动量因子的选股策略:
- 宇宙:S&P 500 成分股
- 信号:过去12个月收益率(跳过最近1个月)
- 持仓:每月再平衡,做多前10%,做空后10%
- 风控:行业中性,Beta 不超过 0.2
- 输出:Sharpe ratio、最大回撤、信息比率
Claude Code 会:
- 生成完整 Python 代码(pandas / vectorbt / zipline 都能)
- 处理数据对齐、去极值、回测时间序列
- 生成可视化结果
- 指出潜在的回测偏差(前视偏差检查)
这对一个没有系统量化开发背景的基本面研究员来说, 价值不可估量——他终于可以把自己的投资逻辑变成可测试的东西, 而不必先花6个月学 Python。
数据连接器:Claude 如何拿到"真实的钱"
纯文本推理没有用,金融分析需要实时数据。 Anthropic 目前接入的金融数据连接器:
市场数据: FactSet、Morningstar、Daloopa(3500+上市公司SEC数据)、S&P Global
信用与风险: Moody's(MCP,600M+公司数据)、Dun & Bradstreet、Verisk、IBISWorld
专家网络: Third Bridge、Guidepoint(访谈摘要直接接入分析)
交易数据: SS&C IntraLinks(VDR数据室)、Financial Modeling Prep
另类数据: Fiscal AI
这个连接器矩阵的意义是:Claude 不只是"理解财务概念", 而是能直接从这些权威数据源拿到数字,带进分析里, 每个数据点都有来源可追溯——这在金融合规里至关重要。
每次 Agent 运行都生成完整的审计日志, 没有任何输出在人工审批之前会自动发送给客户或提交监管。
和传统量化工作台的对比
做量化十几年,见过太多工具宣称要"革命"分析师的工作流。 Bloomberg 当年也是,Wind 当年也是,各种 BI 工具也是。
Claude Code 和这些前辈的本质区别在哪里?
传统工具:你告诉它"拉这个字段、套这个公式、画这张图",它执行。 Claude Code:你告诉它"我想分析这家公司的定价权是否在恶化", 它帮你拆解成需要什么数据、用什么分析框架、最终输出什么结论,然后执行。
这是从"工具"到"思考伙伴"的跨越。
当然,思考伙伴也会犯错。金融里的错误有代价。 所以每个 Agent 的设计里都保留了"人工在环": 草稿给你,决策是你的,签字是你的,合规是你的。
我的判断:应该用、不应该用、必须注意
应该用的地方:
- 研究文档密集的任务:10-K、招股书、尽调报告——长文档、多文件交叉比对, Claude 的1M Token 上下文让它比任何传统工具都有优势
- Pitchbook 和 IC Memo 初稿:把"从空白开始"变成"从50%开始", 节省的时间是真实的,用在更高价值的判断上
- 代码生成和量化策略原型:没有开发背景的研究员, Claude Code 让你能把想法变成可测试的模型
- KYC 和 AML 初筛:规则明确、文档密集、合规要求高——恰好是 Claude 的甜区
不应该用来替代的:
- 最终投资决策:Vals AI 64.37% 的分数意味着 35.63% 的任务它会出错或不够精确。 市场判断的最终责任在你
- 监管申报的最终版本:草稿可以,但没有CFA持牌人或法务审核前, 不要让 Agent 的输出直接提交监管
- 非结构化的市场洞见:Claude 擅长从文档中提取信息, 不擅长告诉你"市场情绪在拐点"——那还是要靠你在市场里跌打滚爬的直觉
- 私密数据处理:了解清楚你的企业 Claude 部署是否满足数据隔离要求, 机密客户数据不能随意接入任何云端 AI 服务
最后说一句
金融行业向来是两件事同时成立:
第一,这个行业的很多工作是"聪明的体力活"—— 读文件、提数字、建模板、写报告,这些重复性高、可结构化的任务, 最适合被自动化。
第二,这个行业的核心价值是判断—— 哪个信号是 alpha,哪个是噪音;哪家公司的管理层在说真话,哪家在粉饰; 这个估值区间我愿意接受,那个我不愿意。 这一层没有工具能替代,也不应该被替代。
Claude Code 的价值,是把第一类工作的成本压下来, 让基金经理把时间花在第二类事上。
Walleye Capital 的400人100%覆盖,不是因为他们觉得 Claude 比人聪明, 而是因为他们知道:在同等判断力的情况下,处理信息更快的人会赢。
这不是 AI 的逻辑,这是市场的逻辑。市场的逻辑从来不等人。