一个判断
25 年 11 月我有一个判断:Coding Agent 未来将会逐渐吞噬掉大部分的通用 Agent 市场。
当我 90% 的代码都是 Cursor 完成的时候,我意识到一件事——市面上大多数 Agent 帮用户完成的事情,本质上都能通过 Coding Agent 完成。
能读写文件、能执行 Shell 命令、能多步推理、能调用工具。这不就是一个通用 Agent 吗?那用户为什么不直接用 Coding Agent?
因为它被锁在 IDE 和终端里。你打开 Cursor,和它对话,关掉,它就消失了。不能接进飞书、不能嵌进产品、不能在群里协作。
把 Coding Agent 从终端里解救出来
GolemBot 做的事一句话:Free Your Coding Agent。
不碰智能层,只做连接层。Cursor、Claude Code、OpenCode、Codex——这四个引擎背后都是几百人的团队拿着几十亿融资在卷一件事:怎么让 Agent 更好地理解指令、调用工具、完成任务。
你自己从零搭一个 Agent,要做上下文管理、工具调度、prompt 工程、模型适配……就算做出来了,效果不如直接用 Cursor。
GolemBot 的思路:不重复造轮子,直接把最强的 Agent 拿来用。引擎变强,你自动变强。
三种用法
1. 接进 IM——团队的 24/7 AI 队友
六个平台:飞书、钉钉、企业微信、Slack、Discord、Telegram。golem.yaml 里填上 token,启动 gateway,bot 就上线了。
你在飞书群里 @bot 说「帮我看一下登录逻辑有没有安全问题」,它真的会去读你的代码文件、分析逻辑、给出修改建议——因为背后跑的就是完整的 Coding Agent,和你在终端里用的是同一个东西。
三种群聊策略:
- mention-only — 被 @到才说话,最省成本
- smart — bot 一直在旁听,觉得有价值才插嘴,会默默积累记忆
- always — 每条消息都回,适合专用小群
2. 嵌进产品——5 行代码拥有完整 Agent 能力
import { createAssistant } from 'golembot'
const bot = createAssistant({ dir: './my-bot' })
const stream = bot.chat('帮我分析一下最近的合同风险', {
sessionKey: `user-${userId}` // 多用户隔离
})
for await (const event of stream) {
if (event.type === 'text') sendToClient(event.content)
}
多用户会话隔离、会话持久化(重启不丢上下文)、引擎随时换(改一行配置)——GolemBot 把脏活全干了,你只关心产品逻辑。
3. 多 bot 群聊——让 Agent 们替你干活
一个飞书群里跑三个 GolemBot:@选题(追热点、挖选题)、@写手(写稿、改稿)、@数据(分析阅读数据、总结涨粉规律)。
主编在群里说「@选题 看看这周科技圈有什么热点」,选题 bot 给出三个方向,主编拍板后「@写手 按公众号风格出一篇初稿」。这时候数据 bot 没人 @它,但它在 smart 模式下一直旁听,主动插了一句:「上个月两篇 AI 科普完读率偏低,建议多用类比少用术语。」
全程在群里完成,每个 bot 还可以用不同引擎——写作用 Claude Code 文笔更好,数据分析用 Codex 跑得更快。
为什么不自己造 Agent
| GolemBot | 传统 AI 框架 | |
|---|---|---|
| AI 大脑 | Cursor / Claude Code(久经考验的编程 Agent) | 自己接 LLM API + 工具 |
| 搭建成本 | golembot init → 完成 | Chain、RAG、向量库、prompt 调优 |
| 自动升级 | Agent 变强 = 机器人变强,零代码改动 | 自己维护一切 |
| 引擎锁定 | 改一行配置换引擎 | 全部重写 |
快速开始
npm install -g golembot
golembot onboard # 交互式引导,十分钟跑起来
golembot gateway # 启动 IM + HTTP 服务
MIT 开源,TypeScript,约 1000 个单元测试。
- GitHub: github.com/0xranx/gole…
- 文档: 0xranx.github.io/golembot/
- npm: www.npmjs.com/package/gol…
如果你觉得还不错,欢迎 Star。