为什么这本"菜谱"值得单独写一篇文章
我们测评过不少Claude相关的开源项目——有民间大神凝聚半年经验开源的配置体系,有解决Claude失忆症的内存插件,有从0造Agent引擎的教学课程。
今天这个完全不同。
这是Anthropic自己写的。
仓库名叫 claude-cookbooks,挂在 anthropics 官方组织下,副标题是:
"A collection of notebooks/recipes showcasing some fun and effective ways of using Claude."
截至2026年5月1日的数据:
| 指标 | 数值 |
|---|---|
| ⭐ Stars | 37,900 |
| 🍴 Forks | 4,200 |
| 📝 Commits | 541 |
| 👁️ Watching | 510 |
| 📓 主要语言 | Jupyter Notebook(95.7%)+ Python(4.3%) |
| 📄 License | MIT |
| 🔄 PR | 95个 |
看到 Jupyter Notebook 占了 95.7%,我忍不住笑了。
Anthropic的工程师大概是:能用 Notebook 就不写 README,能跑起来就不解释原理——直接给你代码,运行,看结果,自己悟。
说实话,我很欣赏这种风格。
国内的用户订阅claude确实有点困难,而且容易踩很多坑,这里推荐一个靠谱的网站可以参考一下:claudemax.shop
在我们聊内容之前,先说一件让我印象深刻的事:这个仓库的 Watching 数(510)比同期很多更高 Star 的民间项目更高——比如 learn-claude-code 的 249、mattpocock/skills 的更少。这通常意味着订阅者在认真跟踪更新,而不只是收藏就走。Anthropic 每次发新 API 功能,这里会第一时间跟进配套示例。
这是官方内部的节奏,不是民间维护者的节奏。
这本菜谱里有什么菜?
我把仓库的目录结构扒了一遍,整理成一张"目录导览":
📁 主要目录
claude-cookbooks/
├── capabilities/ # Claude核心能力示例
│ ├── classification/ # 文本分类技术
│ ├── retrieval_augmented_generation/ # RAG增强检索
│ └── summarization/ # 文本摘要技术
│
├── tool_use/ # 工具调用与函数集成
│ ├── customer_service_agent.ipynb # 客服Agent
│ ├── calculator_tool.ipynb # 计算器工具集成
│ └── memory_cookbook.ipynb # 记忆与上下文管理
│
├── claude_agent_sdk/ # Claude Agent SDK示例(重点!)
│ └── 00_The_one_liner_research_agent.ipynb # 一行代码研究Agent
│
├── extended_thinking/ # 扩展思维/深度推理
├── finetuning/ # 微调技术
├── multimodal/ # 多模态(视觉)能力
│ ├── getting_started_with_vision.ipynb
│ ├── reading_charts_graphs_powerpoints.ipynb
│ └── how_to_transcribe_text.ipynb
│
├── patterns/agents/ # Agent设计模式
├── managed_agents/ # 托管Agent
├── observability/ # 可观测性监控
├── third_party/ # 第三方集成
│ ├── Pinecone/ # Pinecone向量数据库
│ ├── Wikipedia/ # Wikipedia知识检索
│ └── VoyageAI/ # Voyage AI嵌入
│
├── skills/ # Skills功能(重点!)
├── coding/ # 编码辅助示例
└── misc/ # 杂项技巧
├── prompt_caching.ipynb # 提示词缓存
├── building_evals.ipynb # 自动化评估
├── how_to_enable_json_mode.ipynb # JSON模式
└── building_moderation_filter.ipynb # 内容审核过滤
覆盖面很广,从基础API调用到生产级Agent模式,都有对应的可运行示例。
我按自己的使用频率,重点说几个最有价值的部分。
重点一:Extended Thinking,Claude的"慢思考"模式
这是我在2026年用得最多的一个功能,在 Cookbooks 里有专门的目录。
背景知识:Extended Thinking 是 Anthropic 在 API 层面实现的"思维链推理"——在给出最终回答之前,模型会有一个"思考阶段",在这个阶段进行内部推理,然后才输出结论。
Cookbooks 里演示了:
- 如何使用 Think 工具创建结构化思考空间
- 如何管理"思维预算"(thinking budget)
- 如何把深度思考整合进 Agent 工作流
2026年的重要更新(Cookbooks 跟进速度很快):在最新的 claude-opus-4.6 和 claude-sonnet-4.6 上,budget_tokens 参数已经被废弃,取而代之的是自适应思维(Adaptive Thinking) :
# 旧的方式(claude-3-7-sonnet, claude-opus-4上仍适用)
response = client.messages.create(
model="claude-opus-4",
thinking={
"type": "enabled",
"budget_tokens": 10000 # 手动设置思维预算
},
...
)
# 新的方式(claude-opus-4.6, claude-sonnet-4.6推荐)
response = client.messages.create(
model="claude-sonnet-4-6",
thinking={
"type": "adaptive" # Claude自己决定何时思考、思考多久
},
...
)
自适应思维的好处是让模型自己判断什么任务值得"慢慢想",什么任务直接答就行,不需要开发者手动设置预算——降低了误用成本。
我在量化策略里的实际应用:当我需要Claude帮我分析一个复杂的多因子模型逻辑,或者审查一段牵涉多个边界条件的风控规则时,开启 Extended Thinking 的效果明显好于默认模式。错误率更低,遗漏的边界情况更少。
当然代价也很清晰:token消耗更多,延迟更高,价格更贵。Cookbooks 里有测量和对比数据,帮你判断什么场景值得开。
重点二:Claude Agent SDK —— 一行代码的研究 Agent
claude_agent_sdk/00_The_one_liner_research_agent.ipynb 这个 Notebook 的标题带着一点小小的玩笑性——"一行代码研究 Agent"。
当然不是真的一行,但它确实展示了用 Claude Agent SDK 搭建一个能自主搜索、研究、汇总报告的 Agent,复杂度比你想象的低很多。
Notebook 里有实际的运行结果,我截取了关键输出数据:
✅ Complete
Turns: 5
Tokens: 2,152
Cost: $0.76
Duration: 73.0s
73秒,5轮对话,花了0.76美元(API费用),产出了一份有源链接的研究报告。
这个成本效益比值得仔细想一下。作为对比,找个实习生查资料写报告……不,这个比较太残忍了,我就不说了(手动狗头)。
claude_agent_sdk/ 目录里还有更多 Agent 模式示例,涵盖:
- 工作流编排(Workflow Orchestration)
- 可观测性集成(Observability)
- Skills 动态加载
- 并行 Agent 协作
这些都是 Anthropic 自己在生产环境验证过的设计模式,拿来参考的价值远超民间猜测。
重点三:Skills 目录,金融行业的人会特别感兴趣
这个我必须重点说,因为涉及我的老本行——金融数据分析。
skills/README.md 的定义是:
"Skills are organized packages of instructions, executable code, and resources that give Claude specialized capabilities for specific tasks. Think of them as 'expertise packages' that Claude can discover and load dynamically."
Skills 是结构化的"专业能力包",可以动态发现和加载,让 Claude 获得特定任务的专业能力。
Cookbooks 里的 Skills 示例分三层:
入门层:Skills 基础介绍,快速上手示例
业务层(这里是我最兴奋的部分):
"Explore powerful business use cases with real financial data."
是的,官方示例里有真实金融数据集:
sample_data/
├── financial_statements.csv # 季度P&L、资产负债表、现金流数据
└── portfolio_holdings.json # 投资组合持仓与绩效数据
示例任务包括:
- 用 Excel Skill 构建金融仪表盘(含图表和数据透视表)
- 用 PowerPoint Skill 生成投资报告幻灯片
- 用 PDF Skill 处理财务文件
代码也给到位了:
from anthropic import Anthropic
client = Anthropic(api_key="your-api-key")
# 使用Skills生成Excel文件
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=4096,
container={
"skills": [
{"type": "anthropic", "skill_id": "xlsx", "version": "latest"}
]
},
tools=[{"type": "code_execution_20250825", "name": "code_execution"}],
messages=[{
"role": "user",
"content": "Create an Excel file with a simple budget spreadsheet"
}]
)
# 下载生成的文件
file_content = client.beta.files.download(file_id=file_id)
with open("outputs/budget.xlsx", "wb") as f:
f.write(file_content.read())
这对我的意义是:以前我要生成一个带格式的财务分析Excel,要么手动操作,要么写一大堆 openpyxl 代码。现在告诉 Claude 一句话,Skills 自己调用代码执行工具,生成文件,我用 Files API 下载。
整个流程代码量缩减 80%,时间缩减更多。
进阶层:教你设计自己的 Skill,并最终贡献进 Cookbooks(后面会说投稿标准)。
重点四:Memory Cookbook,官方视角的记忆管理
在上篇文章我们聊了 claude-mem(70k星的第三方记忆插件)。Cookbooks 里有一个 tool_use/memory_cookbook.ipynb,这是 Anthropic 官方视角的记忆管理实现。
两者不是竞争关系,是不同层次的参考:
- claude-mem:一个完整的开箱即用插件,SQLite + ChromaDB,5个生命周期钩子,自动运行
- memory_cookbook:教你用 Memory Tool 原语自己实现记忆机制,理解底层逻辑
Memory Cookbook 里描述的几个核心用例:
| 场景 | 说明 |
|---|---|
| 代码审查助手 | 从历史审查中学习 Debug 模式,复用到新 PR |
| 研究助手 | 跨会话积累知识,连接不同研究线索 |
| 客服机器人 | 记住用户偏好和沟通风格 |
| 数据分析助手 | 记住数据集的规律和有效的分析技术 |
关键的技术细节也在里面:
Context Editing 两种策略:
- clear_tool_uses_20250919:上下文增长时清除旧的工具调用结果
- clear_thinking_20251015:管理扩展思维块(需开启 thinking)
可配置的触发条件和保留策略
这是你自己动手造记忆系统前应该先读的文档。
重点五:RAG + 第三方集成,最务实的部分
third_party/ 目录里的集成示例是我认为对初学者最有即时使用价值的部分。
- Pinecone 向量数据库:
rag_using_pinecone.ipynb— 完整的 RAG 管道示例 - Wikipedia:
wikipedia-search-cookbook.ipynb— 如何把维基百科变成 Claude 的知识源 - Voyage AI 嵌入:
how_to_create_embeddings.md— 高质量向量嵌入的最佳实践
这三个如果你一起跑完,基本就掌握了构建一个"知识问答系统"的完整技能栈。
misc/ 目录里的 Prompt Caching Notebook 也值得重点提一下。
Prompt Caching 是 Anthropic 提供的一个可以大幅降低 API 成本的功能——对频繁复用的提示词前缀进行缓存,避免重复计费。Cookbook 里给了结构化提示词以获得最大缓存命中率的示例,以及监控缓存性能的代码。
对于我这种 API 调用量大的用户来说,这个功能配置好了能省出一杯咖啡钱(实际上是很多杯咖啡钱)。
入门和运行:这本菜谱到底怎么用
# 克隆仓库
git clone https://github.com/anthropics/claude-cookbooks
cd claude-cookbooks
# 推荐用 uv 管理依赖(官方推荐方式)
uv sync --all-extras
uv run pre-commit install
# 配置 API Key
cp .env.example .env
# 编辑 .env,填入 ANTHROPIC_API_KEY
# 快速结构测试(不需要实际 API 调用)
make check
make test
# 完整运行测试(需要 API Key,会产生实际费用)
make test-notebooks-exec
# 或者直接打开你感兴趣的 Notebook
jupyter notebook capabilities/classification/
推荐学习路径(按我的亲测体验排序):
- 新手入门:
misc/目录 → 先把 JSON 模式、Prompt Caching 跑通 - 工具调用:
tool_use/→customer_service_agent.ipynb+calculator_tool.ipynb - 知识增强:
third_party/Pinecone/rag_using_pinecone.ipynb - 多模态:
multimodal/getting_started_with_vision.ipynb - 进阶:
claude_agent_sdk/+extended_thinking/ - 生产化:
observability/+patterns/agents/
真实测评:亮点与槽点,认真说
🌟 让我真正满意的地方
1. 官方出品,权威性无可替代
这不是民间猜测 Anthropic 想让你怎么用 API,这是 Anthropic 直接告诉你。
每个设计决策背后的意图、每个参数的推荐设置、每个功能的最佳实践——都是从构建 Claude 的工程师那里直出来的。
这种权威性,任何第三方项目都给不了。
2. 每个 Notebook 都能直接运行
这是 Cookbooks 最大的工程价值:不是伪代码,不是概念图,是可以运行的完整代码。
你不用花时间翻译文档,不用猜"这段示例代码里省略了什么"——复制环境,填入 API Key,直接跑,直接看结果。
这对快速原型开发者(比如我)来说,节省的时间是非常真实的。
3. 跟随新功能的速度很快
2026年 Anthropic 发布了 claude-opus-4.6 和 claude-sonnet-4.6,带来了 Adaptive Thinking、新的 Skills 功能、1M token 上下文窗口等重大更新——Cookbooks 里很快就有了对应示例。
这是官方维护的核心优势:你永远知道最新功能该怎么用。
4. CI/CD 把关代码质量
仓库有完整的 CI 测试(GitHub Actions + pre-commit),Notebook 结构测试和实际执行测试分开。
95个 PR(截至2026年5月1日),有规范的贡献流程,代码质量有保障。
这不是随手扔几个 ipynb 文件的散漫项目,这是认真工程化维护的官方资源。
5. Skills 目录的金融数据集是意外惊喜
官方提供了真实的季度财务报表数据集和投资组合持仓数据,配合 Skills 示例,让"AI 辅助金融分析"的学习曲线降低了很多。
这让我想推给我们团队的每一个金融分析师看。
⚠️ 需要诚实说的槽点
1. Python / Jupyter 优先,其他语言开发者需要翻译
95.7% 是 Jupyter Notebook,4.3% 是 Python。
如果你是 TypeScript 开发者、Go 开发者、Java 后端工程师——你面对的是大量需要"翻译"的工作量。官方倒是有 TypeScript SDK,但 Cookbooks 里对应的示例少得可怜。
这是 Cookbooks 目前最明显的覆盖盲区。
2. 目录结构不够直观
初次进入这个仓库,你可能要花一些时间才能找到自己需要的东西。
misc/(杂项)目录里藏了不少重要的 Notebook(比如 Prompt Caching、JSON Mode),这种分类方式让发现成本变高了。如果有一个按"用途/任务"而不是"功能模块"组织的索引页,体验会好很多。
3. 不是入门教程,有一定基础门槛
Cookbooks 假设你已经大体了解 API 的基础调用方式。如果你完全没有基础,官方推荐先去读 Claude API Fundamentals 课程,再回来看 Cookbooks。
这个分级是合理的,但要提醒完全新手注意:直接来这里可能会有些懵。
4. 有些 Notebook 的更新速度跟不上 API 变化
虽然整体跟进速度不错,但还是会出现某些老 Notebook 里的 API 调用方式已经是旧版写法的情况。建议每次使用前对照 Anthropic 最新文档确认参数是否仍然有效。
5. 37.9k Star 低于同期民间项目
相对于 everything-claude-code(167k)、claude-mem(70k)这些民间项目,官方 Cookbooks 的 37.9k Star 看起来少了些。
但我认为这其实是正常现象——Cookbook 是工具书,不是话题热点。你用的时候查,不是刷热度。510 的 Watching 数和 95 个 PR 才是真正的活跃度指标。
横向对比:在Claude生态里,它扮演什么角色?
| 项目 | 定位 | 适合场景 |
|---|---|---|
| claude-cookbooks(官方) | 官方API使用示例库 | 学新功能、找生产模式参考 |
| everything-claude-code | 生产级Agent操作系统 | 重度Claude Code用户 |
| claude-mem | 跨会话记忆插件 | 需要持久化记忆的开发者 |
| learn-claude-code | Harness工程教学课程 | 想深入理解Agent原理 |
| mattpocock/skills | TS工程师Skills分享 | TypeScript生态用户 |
这五个项目的关系是互补的,不是替代的。
你可以同时用所有五个:用 Cookbooks 学会某个功能的基础用法,用 learn-claude-code 理解背后的架构原理,用 everything-claude-code 把这些组装成生产环境的工作流,用 claude-mem 解决跨会话记忆问题。
Cookbooks 是起点,是地基,是你遇到"这个功能到底该怎么用?"时第一个应该查的地方。
特别说一下:如何向Cookbooks投稿
官方欢迎社区贡献(95个PR里有大量社区贡献),但有严格的质量把控:
# 贡献流程
1. 查看 Issues 页面,避免重复贡献
2. Fork 仓库,创建特性分支
3. 写 Notebook,确保可以完整运行
4. 在 registry.yaml 注册你的 Notebook
5. 通过 CI:make check + make test
6. 提交 PR,描述清楚用途和创新点
CONTRIBUTING.md 里有详细规范,包括:
- Notebook 命名约定
- 代码风格要求
- 文档格式标准
- 作者信息登记(
authors.yaml)
这个投稿门槛比很多民间项目高,但代价是你的 Notebook 会被全球开发者使用和引用。
总评打分
| 维度 | 评分 | 说明 |
|---|---|---|
| 权威性 | ⭐⭐⭐⭐⭐ | Anthropic 官方出品,无可替代 |
| 代码可用性 | ⭐⭐⭐⭐⭐ | 全部可运行,测试有 CI 保障 |
| 覆盖广度 | ⭐⭐⭐⭐⭐ | 从基础到生产,核心功能全覆盖 |
| 更新速度 | ⭐⭐⭐⭐⭐ | 新功能快速跟进,510人持续关注 |
| 语言多样性 | ⭐⭐☆☆☆ | Python/Jupyter 独大,TS等弱势 |
| 导航体验 | ⭐⭐⭐☆☆ | 目录组织可以更直观 |
| 新手友好度 | ⭐⭐⭐☆☆ | 有基础门槛,需配合基础课程 |
| 综合 | ⭐⭐⭐⭐½ | Claude API 开发者的必备参考库 |
我的最终建议
如果你只用 Claude 聊天,这个仓库和你无关,跳过。
如果你在用 Claude API 开发任何东西,这个仓库应该是你的书签第一位。
不是因为它最酷,不是因为它 Star 最多,而是因为这是 Anthropic 告诉你"我们设计这个功能的目的和正确用法"的唯一官方渠道。
民间项目可以比它更有创意,更有工程深度,更有使用规模——但官方菜谱的权威性是独一无二的。
你学炒菜,可以看美食博主的创意菜,但厨艺基础,还是得从作者本人的菜谱学起。
这个道理,在 Claude API 的世界里也一样。