OpenClaw爆火背后:一个9.7k Star的极简Agent如何击败大厂SDK?

0 阅读9分钟

一个9.7k Star的极简Agent,如何成为OpenClaw的底层引擎

如果你最近有上网,就一定注意到了一个现象级的项目:OpenClaw。这个项目在社交媒体上病毒式传播,你可能在新闻里见过它的各种名字——ClawdBot、MoltBot,或者最近统一叫的OpenClaw。

但很少有人知道:OpenClaw底层运行的,并不是大家熟悉的Claude Agent SDK或其他主流框架,而是一个叫**"Pi"**的小型编码助手(GitHub只有9.7k Star)。

为什么OpenClaw的创始人Peter不选择大厂的官方SDK,而是选择这个看起来很"极客"的小工具?Pi和Claude Agent SDK到底有什么区别?

文章结构图

> Step_01.先说答案:为什么OpenClaw选择Pi?

在解释Pi是什么之前,我们先直接回答这个核心问题——因为这能帮你更好地理解Pi的设计哲学。

分工明确:引擎与车身

OpenClaw的架构有个很棒的比喻:

**Pi提供"引擎":**模型抽象、推理循环、工具执行这些底层机制

**OpenClaw提供"车身和交通规则":**会话管理、实例发现、多平台连接

这种分工让两个项目各司其职,又能完美配合。如果用Claude Agent SDK,就像是用一辆完整的汽车去改装——很多你不需要的功能也得背着,想改造就得大动干戈。而Pi就像一个纯粹的引擎——你想怎么装车身就怎么装。

深度集成而非外部调用

这是关键的技术决策。OpenClaw并不是把Pi当作外部进程去调用(RPC方式),而是以SDK方式直接嵌入到自己的代码里。代码里直接导入Pi的包,通过createAgentSession()实例化会话,让Pi在进程内承担推理与工具循环。

PRO TIP:

这样做的好处

• OpenClaw可以对会话生命周期做系统级掌控
• 可以精确控制事件流、权限边界
• 可以整套替换Pi的工具链
• 不用依赖黑盒外部进程,出问题能定位

如果是RPC调用,就像是雇了个黑盒外包团队——你不知道他们内部怎么运作,出了问题也难排查。

核心越小越稳定

Pi的设计哲学是:核心极小,但能生长。这让OpenClaw可以:

1. 清空Pi的内置工具
2. 注入自己的完整工具链
3. 保持系统的稳定性和可审计性

在长时间运行的任务中(比如在WhatsApp上24小时待命的AI助手),这种设计不容易"自燃"——不会出现不可预测的行为。

看到这里你可能更好奇了:Pi到底是个什么样的框架,能让OpenClaw如此青睐?

> Step_02.Pi Agent:极简主义的编程助手

Pi是由开发者Mario Zechner创建的一个轻量级AI编程助手。如果用一句话概括它的设计哲学,那就是:少即是多

只有4个工具的"极简引擎"

Pi最大的特点是它的核心极其简单。它只提供4个基础工具:

•Read// 读取文件
•Write// 写入文件
•Edit// 编辑文件
•Bash// 执行命令

就这4个!相比其他AI助手动辄几十个内置工具,Pi的系统提示词(system prompt)可能是业界最短的。你可能会问:**这么少的工具够用吗?**这就是Pi设计的巧妙之处。

通过代码自我扩展

Pi的核心理念是:AI擅长写代码,那就让它通过写代码来扩展自己的能力。举个例子:

• 你不需要一个"查询数据库"的内置工具
• 你只需要让Pi写一段Python脚本来查询数据库
• 这段脚本可以保存下来,在后续会话中复用

Pi提供了一个强大的扩展系统,允许:注册自定义工具、创建斜杠命令(slash commands)、渲染终端UI组件(进度条、数据表格等)、跨会话持久化状态。

会话树管理

Pi还有一个很实用的功能:会话树(Session Tree)。你可以把当前会话分支出去,在不同分支里测试不同的方案,然后在各个分支之间自由切换。这对于实验性开发特别有用。

为什么这样设计?

Pi的作者相信:给AI太多预制工具,反而限制了它的能力。不如给它最基础的4个工具,然后让它根据具体需求,自己写代码来解决问题。这样既灵活,又可控。

KEY INSIGHT:

这就是为什么OpenClaw选择Pi

不是因为它功能最多,而是因为它核心最纯粹,最容易掌控

> Step_03.Pi Agent vs Claude Agent SDK:异同点对比

现在来到关键问题:Pi和Anthropic官方的Claude Agent SDK有什么区别?

相同点:都信奉"代码优先"

两者在核心理念上惊人地相似:**都相信LLM擅长写代码和运行代码,应该拥抱这个优势。**无论是Pi的4个基础工具,还是Claude Agent SDK的内置工具,核心都是让AI通过代码来完成任务。

不同点1:工具数量与扩展方式

这是最直观的区别。

Claude Agent SDK:8个内置工具
• read_file、write_file、edit_file - 文件操作三件套
• glob、grep - 文件搜索和内容搜索
• web_search、web_fetch - 联网搜索和抓取
• bash - 命令执行

Pi:4个核心工具 + Skills扩展系统
• Read、Write、Edit、Bash - 仅此4个
• 没有glob,没有grep,没有web_search
• 通过让AI自己写代码实现其他功能

打个比喻:
• Claude SDK像全家桶套餐,汉堡、薯条、可乐都给你配好了
• Pi像厨房原材料,面粉、鸡蛋、油给你,自己做

不同点2:MCP支持

这是一个重要的分歧点。

Pi:不支持MCP
• Pi的作者明确反对MCP(Model Context Protocol)
• 认为应该通过写代码扩展,而不是下载外部技能
• 哲学:"自己写代码"更灵活、更可控

Claude Agent SDK:原生支持MCP
• 可以集成MCP服务器
• 可以使用社区的各种MCP工具
• 哲学:"复用现成工具"更高效、更标准化

不同点3:Prompt Caching优化

这是Pi的一个巧妙设计。

💰 COST OPTIMIZATION:

Pi:极致利用Prompt Caching

由于Pi的系统提示词(system prompt)极短,只包含4个工具的定义,这意味着:
缓存命中率极高:每次对话的system prompt几乎不变
成本大幅降低:缓存的token不收费或收费极低
响应更快:不需要重新处理大量system prompt

Claude Agent SDK的8个工具意味着更长的system prompt,包含更多的工具定义、参数说明、使用示例。虽然Claude SDK也支持Prompt Caching,但基础提示词更长,初次加载成本更高。

**实际影响:**对于长时间运行的Agent(比如OpenClaw在WhatsApp上24小时待命),Pi的缓存优化能显著降低成本。如果一天要处理1000次对话,Pi可能只需要缓存一次system prompt,而更长的提示词会消耗更多缓存空间和费用。

不同点4:多模型支持

Pi:模型无关,多提供商支持
• 支持:Anthropic (Claude)、OpenAI (GPT)、Google (Gemini)、xAI (Grok)、Groq、Cerebras、任何OpenAI兼容的API
• 可随时切换模型,甚至在一个会话中切换
• 优势:避免供应商锁定、成本优化、能力互补

Claude Agent SDK:专为Claude优化
• Anthropic官方为Claude模型打造
• 工具定义格式针对Claude优化
• 优势:深度优化 / 限制:难以多模型切换

不同点5:开发语言和运行环境

Pi:TypeScript + 终端UI
• 用TypeScript开发、主要运行在终端(TUI界面)
• 会话树管理(分支、切换、合并)
• 轻量级,内存占用小

Claude Agent SDK:Python + TypeScript
• 同时支持Python和TypeScript
• 可集成到Web应用、API服务
• 流式和批处理两种模式、与Claude Code共享核心架构

> Step_04.应该选择哪个?

这取决于你的需求:

选择Pi,如果你:
追求成本优化:长期运行的Agent,想利用Prompt Caching降低费用
喜欢极简设计:不需要内置的搜索、联网工具,愿意自己写代码
需要多模型支持:想在Claude、GPT、Gemini之间切换
深度定制:希望通过Skills精确控制Agent的能力边界
是终端重度用户:习惯在命令行工作

选择Claude Agent SDK,如果你:
追求开发效率:需要开箱即用的8个工具,不想自己写代码
专注Claude生态:主要使用Claude模型,想要最佳优化
需要Web集成:要把Agent集成到Web应用或API服务
团队协作:需要成熟的Python/TypeScript SDK,便于团队开发
企业级应用:追求稳定、经过实战检验的基础设施

💡 RULE OF THUMB:

一个简单的判断标准

如果你是OpenClaw这样的场景(24小时运行、高频对话、需要极致成本控制),Pi是更好的选择

如果你是快速开发一个AI应用原型,需要联网搜索、文件搜索等功能,Claude SDK能让你更快上线

> EOF.结语

Pi Agent和Claude Agent SDK代表了AI编程助手的两种不同路径:

• Pi是极简主义的代表,相信少即是多,相信开发者应该掌控一切
• Claude Agent SDK是工程主义的代表,相信完备的工具和生产级的基础设施

没有绝对的好坏,只有适合与否。而OpenClaw选择Pi作为底层,恰恰说明了极简设计的魅力:一个核心精炼的引擎,可以成为更大系统的坚实基础。

无论选择哪个,重要的是理解它们的设计哲学,选择最适合自己项目的工具。毕竟,工具是死的,人是活的。AI时代的开发者,更需要的是理解这些工具背后的思想,而不是盲目追逐热点。

📦 相关资源:

Pi项目地址:github.com/badlogic/pi…

Claude Agent SDK文档:

platform.claude.com/docs/en/age…

OpenClaw项目:github.com/openclaw

🔗 往期推荐:

claude code skills

AI时代的产品经理

AI编程效率提升

Claude code全系列从小白到专家

技术趋势与行业观察

AI大模型热点追踪

clawdbot实战与玩法

📮 互动:

飞书社群开源知识库:

my.feishu.cn/wiki/PFJswU…

今天的文章就到这里啦,如果觉得不错,可以点个赞、在看、转发,三连支持我~

扫描下方图片中我的微信二维码备注"进群",拉你进社群一起交流学习!

Image