我在华尔街见过最贵的分析师,现在他的工作被 Claude Code 接管了三分之一

0 阅读12分钟

先聊一个让我真正坐直了的数字

2026年5月5日,摩根大通 CEO Jamie Dimon,在 Anthropic 的邀请制金融服务峰会上, 从空白页面出发,用 Claude Code 拉数据、做可视化、写方法论文档, 搭了一个国债资产互换和买卖价差的分析看板。

全程:20分钟。

我在金融行业待过,知道这意味着什么。 一个分析师要完成同样的东西,通常需要半天到一天: Bloomberg 调数据,Excel 搭模板,Python 写可视化,Word 写说明,PPT 收尾。 然后发现数据口径不对,再来一遍。

Dimon 不是在表演。他是在现场给台下的银行家和基金经理们演示: 你们的 Analyst 每天做的那些"聪明的体力活",现在可以压缩到20分钟。

这不是 AI 会议室里的 PPT。这是在说,钱要怎么花了。

考虑到国内使用Claude Code确实有点困难,参考一下靠谱的网站:claudemax.shop

5.18.1.png

2026年5月5日发生了什么?

Anthropic 在纽约举办了一场邀请制金融服务发布会, 台上坐着 Dario Amodei、Jamie Dimon、Goldman Sachs CIO Marco Argenti、 JPMorgan CIO Lori Beer 和 AIG CEO Peter Zafino。

这阵容是金融圈对一家 AI 公司表达"我们认真了"的方式。

发布的内容:

10个预构建金融 Agent 模板,分两组:

研究 & 客户覆盖(5个):

  • Pitch Builder:路演材料和交易 Pitchbook 自动生成
  • Meeting Preparer:客户会议背景研究和议程
  • Earnings Reviewer:季报和年报逐项财务拆解
  • Model Builder:DCF、LBO、可比公司分析模型
  • Market Researcher:行业研究、竞争格局、宏观数据

财务 & 运营(5个):

  • Valuation Reviewer:估值合理性复核
  • General Ledger Reconciler:总账自动对账
  • Month-End Closer:月末关账和基金净值计算
  • Statement Auditor:财务报表稽核
  • KYC Screener:客户尽调和反洗钱初筛

每个模板封装了三件事:技能(领域知识)+ 连接器(数据接入)+ 子 Agent(专项执行) 。 可以部署在 Cowork 或 Claude Code 里,或者通过 Managed Agents 接口以编程方式调用。

同时宣布的还有:

  • 8个新数据连接器:Dun & Bradstreet、Fiscal AI、Financial Modeling Prep、 Guidepoint、IBISWorld、SS&C IntraLinks、Third Bridge、Verisk
  • Moody's MCP app:接入 6 亿多家公司数据
  • Microsoft 365 集成:Excel、PowerPoint、Word 已上线,Outlook 即将支持
  • $15亿联合风险投资(Blackstone + Hellman & Friedman + Goldman Sachs,5月4日宣布), 把 Claude 嵌入私募股权和房地产投资组合公司的日常运营

这不是一次功能更新。这是 Anthropic 宣布: 我要成为华尔街的操作系统。


5.18.2.png

基准测试:Claude Opus 4.7 在金融领域的真实成绩

Vals AI Finance Agent Benchmark 是目前金融 AI 领域最权威的测试之一, 由斯坦福研究人员联合 Goldman Sachs、Silver Lake 和 Citadel 的领域专家设计, 包含537道题,覆盖9个金融任务类别,核心聚焦于 SEC 文件研究—— 这是股票研究、信用分析和投资尽调的基础能力。

Claude Opus 4.7 得分:64.37%

对比:

  • GPT-5.5:59.96%
  • Gemini 3.1 Pro:59.72%

差距看起来不大,但在金融任务里,4个百分点的准确率差距可能意味着 一个错误的引用、一个偏差的估值、一份被返工的报告

Anthropic 同时引用了 GDPval-AA 评估(经济价值性知识工作评估), Claude Opus 4.7 在这个维度也位列第一。

这些数字的背后含义是:在处理 SEC 10-K 文件、解析复杂财务注释、 从大量叙述性文字中提取关键数字这类任务上,Claude 目前是最可靠的工具。 而这些任务,恰恰是初级分析师最容易出错、最耗时的部分。


5.18.3.png

真实案例:那些真的在用的人说了什么

Walleye Capital:400人对冲基金,100% 员工用 Claude Code

这是整个发布里我觉得最值得反复看的一个数据。

Walleye Capital 是一家规模约400人的对冲基金,CEO Will England 说:

"100% of employees at Walleye Capital use Claude Code. This level of adoption across our 400-person hedge fund reflects our AI-first mindset."

400人,100%,不是试点,不是"部分团队"。 是从研究员到运营到后台,全员日常使用。

在量化行业,这种覆盖率意味着 Claude Code 已经被嵌入了工作流的基础设施层, 而不是"有空就用一用"的辅助工具。

Bridgewater:Ray Dalio 的基金,用 Claude 搭投研助手

桥水的 CTO Aaron Linsky 描述了他们构建的 Investment Analyst Assistant:

Claude 帮助他们"生成 Python 代码,构建数据可视化, 以初级分析师的精度迭代完成复杂金融分析任务"。

"以初级分析师的精度"——这不是夸奖,这是一个精确的技术描述。 桥水用的是"助手"定位,目的是提升现有分析师的产出,而不是替代。

作为一个写过量化回测代码的人,我知道"生成正确的 Python 金融分析代码" 有多难搞:数据对齐、时区处理、滚动窗口计算、因子归因…… 每一步都有坑。桥水说 Claude 能"以初级分析师精度"做这件事, 我选择相信,因为他们没有理由撒谎。

AIG:承保准确率从75%提升到90%

保险承保是一个极其依赖文档分析的领域: 政策条款、历史索赔数据、风险评估报告……海量文字,少量数字,很多判断。

AIG 引入 Claude 之后:

  • 内部审核时间压缩了5倍
  • 承保任务准确率从 75% 提升至 90% ,上升了整整15个百分点

90% 的准确率意味着 10% 的错误率,这个数字在承保里仍然需要人工核查。 但从75% 到90%,已经把人工复查的工作量从"每4件查1件"降到了"每10件查1件"。 规模效应下,这是实实在在的成本节约。

FIS:AML 调查从"数天"到"数分钟"

FIS(全球最大金融科技公司之一)和 Anthropic 联合开发了反洗钱(AML)调查 Agent。 CEO Stephanie Ferris 的原话:

「Together we're building an agent that compresses AML investigations from days to minutes.」

反洗钱调查是一个高度依赖信息关联的任务: 要在海量交易记录、客户背景数据、制裁名单之间做交叉比对, 传统上需要分析师花几天时间手动排查。

从"数天"到"数分钟"这个跨度,不是效率优化,是范式改变。


5.18.4.png

基金经理具体怎么用?逐场景拆解

用法一:季报财务分析——Earnings Reviewer Agent

一家上市公司发季报,通常同时附带: 10-Q 文件(几十页),Management Discussion,Press Release, Earnings Call Transcript,以及你自己的历史模型。

传统做法:分析师逐段读,逐项更新模型,然后写投资摘要,通常要半天。

Earnings Reviewer 的做法:

  1. 把所有文件接入(支持 Daloopa 直接拉 SEC 数据)
  2. Agent 自动提取营收、利润率、费用变动、管理层指引变化
  3. 与你上一季的模型对比,标注偏差
  4. 生成分析摘要草稿,你来判断重不重要

Claude 的1M Token 上下文窗口在这里是真实优势—— 整个 10-Q 加上 Transcript 整包送进去,不截断,不遗漏。

用法二:Pitchbook 生成——Pitch Builder Agent

Pitchbook(路演材料)是投行分析师的"命", 一份好的 Pitchbook 通常需要:市场数据、可比交易、管理层背景、 财务预测、估值页、风险因素……组合起来40页起步。

以前:一个 Associate 花3-5天,中间反复打磨。

Pitch Builder 的做法:  把交易背景、目标公司信息、你的论点方向喂进去, Agent 生成 PowerPoint 初版(直接通过 Microsoft 365 集成输出), 包含数据引用和可比分析,你在上面修改和精炼。

我在 Anthropic 的官方页面看到了一个具体的示例提示词:

Generate the Q1 2026 performance summary for Pinnacle Growth Equity Fund 
using our holdings data and benchmark returns. 
Use Brinson-Fachler sector attribution. 
Include portfolio return vs. benchmark with active return and information ratio, 
sector contribution to active return in bps, 
and risk metrics: Sharpe, beta, max drawdown, and active share. 
Format as a PowerPoint slide for institutional investors.

这一段提示词里包含了:业绩归因方法(Brinson-Fachler)、 具体指标(信息比率、主动份额)、输出格式(PowerPoint)。 这已经是专业金融语言,不是通用 AI 提示词了。

用法三:Model Builder——DCF 建模,量化分析师的日常

对于基金经理和量化分析师,Model Builder Agent 的价值在于:

  1. 自然语言→模型框架:描述你的假设,Agent 生成 Excel 模型骨架
  2. 历史数据接入:通过 FactSet / Financial Modeling Prep 直接拉财务数据填入
  3. 敏感性分析:自动生成增长率 / 利率 / 折现率的多情景压力测试
  4. Python 代码生成:需要更复杂的量化分析时,直接生成可运行脚本

在我的经验里,建一个 DCF 模型最耗时的不是公式设计, 而是数据清洗和格式统一。Claude 把这部分接管了,剩下的是判断假设合不合理。

用法四:Claude Code 写量化策略代码

这是我作为码农最感兴趣的部分。

给 Claude Code 一个用自然语言描述的策略逻辑:

实现一个基于动量因子的选股策略:
- 宇宙:S&P 500 成分股
- 信号:过去12个月收益率(跳过最近1个月)
- 持仓:每月再平衡,做多前10%,做空后10%
- 风控:行业中性,Beta 不超过 0.2
- 输出:Sharpe ratio、最大回撤、信息比率

Claude Code 会:

  1. 生成完整 Python 代码(pandas / vectorbt / zipline 都能)
  2. 处理数据对齐、去极值、回测时间序列
  3. 生成可视化结果
  4. 指出潜在的回测偏差(前视偏差检查)

这对一个没有系统量化开发背景的基本面研究员来说, 价值不可估量——他终于可以把自己的投资逻辑变成可测试的东西, 而不必先花6个月学 Python。


数据连接器:Claude 如何拿到"真实的钱"

纯文本推理没有用,金融分析需要实时数据。 Anthropic 目前接入的金融数据连接器:

市场数据:  FactSet、Morningstar、Daloopa(3500+上市公司SEC数据)、S&P Global

信用与风险:  Moody's(MCP,600M+公司数据)、Dun & Bradstreet、Verisk、IBISWorld

专家网络:  Third Bridge、Guidepoint(访谈摘要直接接入分析)

交易数据:  SS&C IntraLinks(VDR数据室)、Financial Modeling Prep

另类数据:  Fiscal AI

这个连接器矩阵的意义是:Claude 不只是"理解财务概念", 而是能直接从这些权威数据源拿到数字,带进分析里, 每个数据点都有来源可追溯——这在金融合规里至关重要。

每次 Agent 运行都生成完整的审计日志, 没有任何输出在人工审批之前会自动发送给客户或提交监管。


和传统量化工作台的对比

做量化十几年,见过太多工具宣称要"革命"分析师的工作流。 Bloomberg 当年也是,Wind 当年也是,各种 BI 工具也是。

Claude Code 和这些前辈的本质区别在哪里?

传统工具:你告诉它"拉这个字段、套这个公式、画这张图",它执行。 Claude Code:你告诉它"我想分析这家公司的定价权是否在恶化", 它帮你拆解成需要什么数据、用什么分析框架、最终输出什么结论,然后执行。

这是从"工具"到"思考伙伴"的跨越。

当然,思考伙伴也会犯错。金融里的错误有代价。 所以每个 Agent 的设计里都保留了"人工在环": 草稿给你,决策是你的,签字是你的,合规是你的。


我的判断:应该用、不应该用、必须注意

应该用的地方:

  1. 研究文档密集的任务:10-K、招股书、尽调报告——长文档、多文件交叉比对, Claude 的1M Token 上下文让它比任何传统工具都有优势
  2. Pitchbook 和 IC Memo 初稿:把"从空白开始"变成"从50%开始", 节省的时间是真实的,用在更高价值的判断上
  3. 代码生成和量化策略原型:没有开发背景的研究员, Claude Code 让你能把想法变成可测试的模型
  4. KYC 和 AML 初筛:规则明确、文档密集、合规要求高——恰好是 Claude 的甜区

不应该用来替代的:

  1. 最终投资决策:Vals AI 64.37% 的分数意味着 35.63% 的任务它会出错或不够精确。 市场判断的最终责任在你
  2. 监管申报的最终版本:草稿可以,但没有CFA持牌人或法务审核前, 不要让 Agent 的输出直接提交监管
  3. 非结构化的市场洞见:Claude 擅长从文档中提取信息, 不擅长告诉你"市场情绪在拐点"——那还是要靠你在市场里跌打滚爬的直觉
  4. 私密数据处理:了解清楚你的企业 Claude 部署是否满足数据隔离要求, 机密客户数据不能随意接入任何云端 AI 服务

最后说一句

金融行业向来是两件事同时成立:

第一,这个行业的很多工作是"聪明的体力活"—— 读文件、提数字、建模板、写报告,这些重复性高、可结构化的任务, 最适合被自动化。

第二,这个行业的核心价值是判断—— 哪个信号是 alpha,哪个是噪音;哪家公司的管理层在说真话,哪家在粉饰; 这个估值区间我愿意接受,那个我不愿意。 这一层没有工具能替代,也不应该被替代。

Claude Code 的价值,是把第一类工作的成本压下来, 让基金经理把时间花在第二类事上。

Walleye Capital 的400人100%覆盖,不是因为他们觉得 Claude 比人聪明, 而是因为他们知道:在同等判断力的情况下,处理信息更快的人会赢。

这不是 AI 的逻辑,这是市场的逻辑。市场的逻辑从来不等人。