OpenClaw爆火背后：一个9.7k Star的极简Agent如何击败大厂SDK？一个9.7k Star的极简Agen

一个9.7k Star的极简Agent，如何成为OpenClaw的底层引擎

如果你最近有上网，就一定注意到了一个现象级的项目：OpenClaw。这个项目在社交媒体上病毒式传播，你可能在新闻里见过它的各种名字——ClawdBot、MoltBot，或者最近统一叫的OpenClaw。

但很少有人知道：OpenClaw底层运行的，并不是大家熟悉的Claude Agent SDK或其他主流框架，而是一个叫**"Pi"**的小型编码助手（GitHub只有9.7k Star）。

为什么OpenClaw的创始人Peter不选择大厂的官方SDK，而是选择这个看起来很"极客"的小工具？Pi和Claude Agent SDK到底有什么区别？

文章结构图

> Step_01.先说答案：为什么OpenClaw选择Pi？

在解释Pi是什么之前，我们先直接回答这个核心问题——因为这能帮你更好地理解Pi的设计哲学。

分工明确：引擎与车身

OpenClaw的架构有个很棒的比喻：

**Pi提供"引擎"：**模型抽象、推理循环、工具执行这些底层机制

**OpenClaw提供"车身和交通规则"：**会话管理、实例发现、多平台连接

这种分工让两个项目各司其职，又能完美配合。如果用Claude Agent SDK，就像是用一辆完整的汽车去改装——很多你不需要的功能也得背着，想改造就得大动干戈。而Pi就像一个纯粹的引擎——你想怎么装车身就怎么装。

深度集成而非外部调用

这是关键的技术决策。OpenClaw并不是把Pi当作外部进程去调用（RPC方式），而是以SDK方式直接嵌入到自己的代码里。代码里直接导入Pi的包，通过createAgentSession()实例化会话，让Pi在进程内承担推理与工具循环。

PRO TIP:

这样做的好处

• OpenClaw可以对会话生命周期做系统级掌控
• 可以精确控制事件流、权限边界
• 可以整套替换Pi的工具链
• 不用依赖黑盒外部进程，出问题能定位

如果是RPC调用，就像是雇了个黑盒外包团队——你不知道他们内部怎么运作，出了问题也难排查。

核心越小越稳定

Pi的设计哲学是：核心极小，但能生长。这让OpenClaw可以：

1. 清空Pi的内置工具
2. 注入自己的完整工具链
3. 保持系统的稳定性和可审计性

在长时间运行的任务中（比如在WhatsApp上24小时待命的AI助手），这种设计不容易"自燃"——不会出现不可预测的行为。

看到这里你可能更好奇了：Pi到底是个什么样的框架，能让OpenClaw如此青睐？

> Step_02.Pi Agent：极简主义的编程助手

Pi是由开发者Mario Zechner创建的一个轻量级AI编程助手。如果用一句话概括它的设计哲学，那就是：少即是多。

只有4个工具的"极简引擎"

Pi最大的特点是它的核心极其简单。它只提供4个基础工具：

•Read// 读取文件
•Write// 写入文件
•Edit// 编辑文件
•Bash// 执行命令

就这4个！相比其他AI助手动辄几十个内置工具，Pi的系统提示词（system prompt）可能是业界最短的。你可能会问：**这么少的工具够用吗？**这就是Pi设计的巧妙之处。

通过代码自我扩展

Pi的核心理念是：AI擅长写代码，那就让它通过写代码来扩展自己的能力。举个例子：

• 你不需要一个"查询数据库"的内置工具
• 你只需要让Pi写一段Python脚本来查询数据库
• 这段脚本可以保存下来，在后续会话中复用

Pi提供了一个强大的扩展系统，允许：注册自定义工具、创建斜杠命令（slash commands）、渲染终端UI组件（进度条、数据表格等）、跨会话持久化状态。

会话树管理

Pi还有一个很实用的功能：会话树（Session Tree）。你可以把当前会话分支出去，在不同分支里测试不同的方案，然后在各个分支之间自由切换。这对于实验性开发特别有用。

为什么这样设计？

Pi的作者相信：给AI太多预制工具，反而限制了它的能力。不如给它最基础的4个工具，然后让它根据具体需求，自己写代码来解决问题。这样既灵活，又可控。

KEY INSIGHT:

这就是为什么OpenClaw选择Pi

不是因为它功能最多，而是因为它核心最纯粹，最容易掌控。

> Step_03.Pi Agent vs Claude Agent SDK：异同点对比

现在来到关键问题：Pi和Anthropic官方的Claude Agent SDK有什么区别？

相同点：都信奉"代码优先"

两者在核心理念上惊人地相似：**都相信LLM擅长写代码和运行代码，应该拥抱这个优势。**无论是Pi的4个基础工具，还是Claude Agent SDK的内置工具，核心都是让AI通过代码来完成任务。

不同点1：工具数量与扩展方式

这是最直观的区别。

Claude Agent SDK：8个内置工具
• read_file、write_file、edit_file - 文件操作三件套
• glob、grep - 文件搜索和内容搜索
• web_search、web_fetch - 联网搜索和抓取
• bash - 命令执行

Pi：4个核心工具 + Skills扩展系统
• Read、Write、Edit、Bash - 仅此4个
• 没有glob，没有grep，没有web_search
• 通过让AI自己写代码实现其他功能

打个比喻：
• Claude SDK像全家桶套餐，汉堡、薯条、可乐都给你配好了
• Pi像厨房原材料，面粉、鸡蛋、油给你，自己做

不同点2：MCP支持

这是一个重要的分歧点。

Pi：不支持MCP
• Pi的作者明确反对MCP（Model Context Protocol）
• 认为应该通过写代码扩展，而不是下载外部技能
• 哲学："自己写代码"更灵活、更可控

Claude Agent SDK：原生支持MCP
• 可以集成MCP服务器
• 可以使用社区的各种MCP工具
• 哲学："复用现成工具"更高效、更标准化

不同点3：Prompt Caching优化

这是Pi的一个巧妙设计。

💰 COST OPTIMIZATION:

Pi：极致利用Prompt Caching

由于Pi的系统提示词（system prompt）极短，只包含4个工具的定义，这意味着：
•缓存命中率极高：每次对话的system prompt几乎不变
•成本大幅降低：缓存的token不收费或收费极低
•响应更快：不需要重新处理大量system prompt

Claude Agent SDK的8个工具意味着更长的system prompt，包含更多的工具定义、参数说明、使用示例。虽然Claude SDK也支持Prompt Caching，但基础提示词更长，初次加载成本更高。

**实际影响：**对于长时间运行的Agent（比如OpenClaw在WhatsApp上24小时待命），Pi的缓存优化能显著降低成本。如果一天要处理1000次对话，Pi可能只需要缓存一次system prompt，而更长的提示词会消耗更多缓存空间和费用。

不同点4：多模型支持

Pi：模型无关，多提供商支持
• 支持：Anthropic (Claude)、OpenAI (GPT)、Google (Gemini)、xAI (Grok)、Groq、Cerebras、任何OpenAI兼容的API
• 可随时切换模型，甚至在一个会话中切换
• 优势：避免供应商锁定、成本优化、能力互补

Claude Agent SDK：专为Claude优化
• Anthropic官方为Claude模型打造
• 工具定义格式针对Claude优化
• 优势：深度优化 / 限制：难以多模型切换

不同点5：开发语言和运行环境

Pi：TypeScript + 终端UI
• 用TypeScript开发、主要运行在终端（TUI界面）
• 会话树管理（分支、切换、合并）
• 轻量级，内存占用小

Claude Agent SDK：Python + TypeScript
• 同时支持Python和TypeScript
• 可集成到Web应用、API服务
• 流式和批处理两种模式、与Claude Code共享核心架构

> Step_04.应该选择哪个？

这取决于你的需求：

选择Pi，如果你：
•追求成本优化：长期运行的Agent，想利用Prompt Caching降低费用
•喜欢极简设计：不需要内置的搜索、联网工具，愿意自己写代码
•需要多模型支持：想在Claude、GPT、Gemini之间切换
•深度定制：希望通过Skills精确控制Agent的能力边界
•是终端重度用户：习惯在命令行工作

选择Claude Agent SDK，如果你：
•追求开发效率：需要开箱即用的8个工具，不想自己写代码
•专注Claude生态：主要使用Claude模型，想要最佳优化
•需要Web集成：要把Agent集成到Web应用或API服务
•团队协作：需要成熟的Python/TypeScript SDK，便于团队开发
•企业级应用：追求稳定、经过实战检验的基础设施

💡 RULE OF THUMB:

一个简单的判断标准

如果你是OpenClaw这样的场景（24小时运行、高频对话、需要极致成本控制），Pi是更好的选择。

如果你是快速开发一个AI应用原型，需要联网搜索、文件搜索等功能，Claude SDK能让你更快上线。