🐾 一、背景:为什么是现在?为什么是 CatPaw?
2024 年,Cursor 引领的 AI IDE 浪潮席卷全球,但它在国内面临三大痛点:
- 💸 成本高:$20/月订阅费 + 不透明的 Token 消耗;
- 🌐 网络不稳定:Claude 等模型访问受限,常需手动配置代理;
- 🇨🇳 中文支持弱:Prompt 理解偏差大,需反复调试。
美团选择“后发制人”:
✅ 内部已稳定运行 2 年(2023 年起以编辑器插件形态落地)
✅ 2025 年 11 月正式开放公测,推出独立产品——CatPaw
它不追求“重新发明轮子”,而是以 Cursor 为交互基底 + 国产化深度增强,走出一条务实、高效、开发者友好的技术路线。
▲ 左:CatPaw|右:Cursor|高度一致的交互逻辑,老用户零学习成本迁移
⚙️ 二、核心架构:双模式 Agent + 工具链闭环
CatPaw 的核心是 Ask / Agent 双模式,覆盖从轻量问答到全自动开发的全场景:
| 模式 | 行为 | 安全性 | 典型场景 |
|---|---|---|---|
| Ask | 只读问答,需手动 Apply 修改 | 🔒 高 | 代码解读、Bug 定位、方案咨询 |
| Agent | 自主执行:读/改文件、运行命令、查文档、调 API | ⚠️ 中(高危操作需确认) | 新建工程、全栈开发、自动化测试 |
Agent 模式背后是完整工具链闭环,当前内置 11 类原生工具:
📁 文件类:readFile / writeFile / createDir
🔍 代码类:grep / searchSymbol / findReferences
💻 终端类:runCommand(支持 auto-run 开关)
🌐 网络类:fetchURL / searchWeb
🧪 测试类:runTests / debug
更关键的是:支持 MCP(Model Context Protocol)扩展,例如 Chrome DevTools MCP 可实现“开发 → 启动 → 自动测试”无缝衔接。
📚 三、知识增强:@Docs 索引系统实战
CatPaw 复刻并优化了 Cursor 标志性的 @Docs 功能——让 AI 学会你的私有文档。
操作流程:
- 进入
Settings → Indexing & Docs; - 添加 URL 或本地文档(支持 Markdown/PDF);
- 等待小绿点 ✅
indexed提示生效; - 对话中
@doc_name即可引用知识。
✅ 实测:同时索引 CatPaw 官方文档 与 Cursor Docs,Agent 可精准对比异同。
随后在 Agent 模式下输入:
@CatPaw_Docs @Cursor_Docs 请对比二者在 Agent 能力上的异同,输出 Markdown 表格
Agent 使用 LongCat-Flash(美团自研编程特训模型)迅速生成结构化分析,输出质量极高:
🛠️ 四、开发者体验:那些“小而关键”的创新
4.1 自定义 Agent:你的专属编程搭档
在 Agent → Add Mode 中,可创建个性化 Agent:
- 指定模型(LongCat-Flash / GLM-4.6 / Qwen2.5-Coder);
- 勾选所需工具集(最小权限原则);
- 编写角色化 Prompt(如“你是资深 React 性能工程师”);
- 开启
auto-fix(自动修 Linter)或auto-run(自动执行终端命令)。
4.2 对话收藏:优质上下文的沉淀
❗ 行业首创:主流 AI IDE(包括 Cursor、Trae)均无此功能。
当多轮对话最终调优出理想结果,可 ⭐️ 收藏当前会话——后续在 History → Favorites 中快速复用。
💡 场景价值:团队知识复用、复杂问题解决方案归档、Prompt 模板沉淀。
4.3 内置单元测试 & 实时预览
- 测试集成:Agent 可一键生成/运行 Jest/Pytest,覆盖主流框架;
- 实时预览:Web 项目自动渲染,支持 点击元素 → Edit → Agent 修改,前端调试效率倍增。
4.4 内置系统prompt
你可以将会话中的固定内容配置为 System Prompt,CatPaw 会在每次侧边栏对话 和 Inline 对话开始时,自动将 System Prompt 发送给模型。
假设你是一名前端开发工程师,您可以将团队的代码规范添加到 System Prompt 中,这样 AI 模型在生成代码时,会自动遵循您的代码规范,确保代码风格的一致性。
🤖 五、模型策略:国产优先,开放兼容
CatPaw 当前支持三类模型接入:
| 类型 | 模型 | 说明 |
|---|---|---|
| 🐱 美团自研 | LongCat-Flash | 编程特训、低延迟、高吞吐,推荐首选 |
| 🏮 国产大厂 | GLM-4.6, Qwen2.5-Coder | 中文理解强,API 稳定 |
| 🔌 第三方 | OpenRouter(含 Claude 4.5)、Ollama、vLLM | 支持接入部分模型 |
⚠️ 当前限制:暂不支持完全自定义 endpoint(期待后续开放)。
🚀 六、实战:10 分钟从零开发「你画我猜」游戏
需求:
Next.js 前端绘图 + 后端调用 GLM-4.5V 多模态 API 识图 + 自动化测试
Agent 完整执行链路:
- 读取用户提供的
GLM-4.5V_API.md; create next-app,安装konva绘图库;- 编写
/api/guess/route.ts封装 GLM API; - 构建前端:画布 + 提交按钮 + 结果区;
npm run dev启动服务;- 调用 Chrome DevTools MCP,自动打开浏览器并截图验证。
✅ 全程 1 次对话完成(消耗 1 次额度),一次成功无返工。