又一个Cursor,美团发布首款AI IDE

87 阅读6分钟

🐾 一、背景:为什么是现在?为什么是 CatPaw?

2024 年,Cursor 引领的 AI IDE 浪潮席卷全球,但它在国内面临三大痛点:

  • 💸 成本高:$20/月订阅费 + 不透明的 Token 消耗;
  • 🌐 网络不稳定:Claude 等模型访问受限,常需手动配置代理;
  • 🇨🇳 中文支持弱:Prompt 理解偏差大,需反复调试。

美团选择“后发制人”:

内部已稳定运行 2 年(2023 年起以编辑器插件形态落地)
2025 年 11 月正式开放公测,推出独立产品——CatPaw

它不追求“重新发明轮子”,而是以 Cursor 为交互基底 + 国产化深度增强,走出一条务实、高效、开发者友好的技术路线。

CatPaw 与 Cursor 界面对比

▲ 左:CatPaw|右:Cursor|高度一致的交互逻辑,老用户零学习成本迁移


⚙️ 二、核心架构:双模式 Agent + 工具链闭环

CatPaw 的核心是 Ask / Agent 双模式,覆盖从轻量问答到全自动开发的全场景:

模式行为安全性典型场景
Ask只读问答,需手动 Apply 修改🔒 高代码解读、Bug 定位、方案咨询
Agent自主执行:读/改文件、运行命令、查文档、调 API⚠️ 中(高危操作需确认)新建工程、全栈开发、自动化测试

Agent 模式背后是完整工具链闭环,当前内置 11 类原生工具

📁 文件类:readFile / writeFile / createDir  
🔍 代码类:grep / searchSymbol / findReferences  
💻 终端类:runCommand(支持 auto-run 开关)  
🌐 网络类:fetchURL / searchWeb  
🧪 测试类:runTests / debug  

更关键的是:支持 MCP(Model Context Protocol)扩展,例如 Chrome DevTools MCP 可实现“开发 → 启动 → 自动测试”无缝衔接。

内置工具列表


📚 三、知识增强:@Docs 索引系统实战

CatPaw 复刻并优化了 Cursor 标志性的 @Docs 功能——让 AI 学会你的私有文档

操作流程

  1. 进入 Settings → Indexing & Docs
  2. 添加 URL 或本地文档(支持 Markdown/PDF);
  3. 等待小绿点 ✅ indexed 提示生效;
  4. 对话中 @doc_name 即可引用知识。

✅ 实测:同时索引 CatPaw 官方文档Cursor Docs,Agent 可精准对比异同。

Docs 设置界面
添加两个 Docs 并等待索引完成

随后在 Agent 模式下输入:

@CatPaw_Docs @Cursor_Docs 请对比二者在 Agent 能力上的异同,输出 Markdown 表格

Agent 使用 LongCat-Flash(美团自研编程特训模型)迅速生成结构化分析,输出质量极高:

Agent 生成的对比文档


🛠️ 四、开发者体验:那些“小而关键”的创新

4.1 自定义 Agent:你的专属编程搭档

Agent → Add Mode 中,可创建个性化 Agent:

  • 指定模型(LongCat-Flash / GLM-4.6 / Qwen2.5-Coder);
  • 勾选所需工具集(最小权限原则);
  • 编写角色化 Prompt(如“你是资深 React 性能工程师”);
  • 开启 auto-fix(自动修 Linter)或 auto-run(自动执行终端命令)。

自定义 Agent 配置页面


4.2 对话收藏:优质上下文的沉淀

行业首创:主流 AI IDE(包括 Cursor、Trae)均无此功能。

当多轮对话最终调优出理想结果,可 ⭐️ 收藏当前会话——后续在 History → Favorites 中快速复用。

收藏对话功能
收藏列表界面

💡 场景价值:团队知识复用、复杂问题解决方案归档、Prompt 模板沉淀。


4.3 内置单元测试 & 实时预览

  • 测试集成:Agent 可一键生成/运行 Jest/Pytest,覆盖主流框架;
  • 实时预览:Web 项目自动渲染,支持 点击元素 → Edit → Agent 修改,前端调试效率倍增。 游戏实测效果:“猫兔混合体”被 GLM-4.5V 正确识别

在这里插入图片描述

4.4 内置系统prompt

你可以将会话中的固定内容配置为 System Prompt,CatPaw 会在每次侧边栏对话 和 Inline 对话开始时,自动将 System Prompt 发送给模型。

假设你是一名前端开发工程师,您可以将团队的代码规范添加到 System Prompt 中,这样 AI 模型在生成代码时,会自动遵循您的代码规范,确保代码风格的一致性。

在这里插入图片描述


🤖 五、模型策略:国产优先,开放兼容

CatPaw 当前支持三类模型接入:

类型模型说明
🐱 美团自研LongCat-Flash编程特训、低延迟、高吞吐,推荐首选
🏮 国产大厂GLM-4.6, Qwen2.5-Coder中文理解强,API 稳定
🔌 第三方OpenRouter(含 Claude 4.5)、Ollama、vLLM支持接入部分模型

模型选择界面
支持的第三方渠道

⚠️ 当前限制:暂不支持完全自定义 endpoint(期待后续开放)。


🚀 六、实战:10 分钟从零开发「你画我猜」游戏

需求

Next.js 前端绘图 + 后端调用 GLM-4.5V 多模态 API 识图 + 自动化测试

Agent 完整执行链路

  1. 读取用户提供的 GLM-4.5V_API.md
  2. create next-app,安装 konva 绘图库;
  3. 编写 /api/guess/route.ts 封装 GLM API;
  4. 构建前端:画布 + 提交按钮 + 结果区;
  5. npm run dev 启动服务;
  6. 调用 Chrome DevTools MCP,自动打开浏览器并截图验证。

✅ 全程 1 次对话完成(消耗 1 次额度),一次成功无返工

Agent 执行过程日志

预览模式 + 元素级 Edit