GitHub Copilot Desktop 多 Agent 实测

94 阅读6分钟

前天打开电脑,发现 GitHub 悄悄放了个大招——Copilot Desktop App 技术预览版

不是 VS Code 插件更新,不是 Copilot Chat 换皮,是一个独立的原生桌面应用。重点是:它能同时跑多个 Agent,每个 Agent 有自己的 Git worktree 和分支,互不干扰。跑完还能自动 review、自动修 CI、自动合并 PR。

我花了一天时间折腾,说说真实体验。

三种 Agent 模式,不是一上来就全自动

打开 App 第一眼,界面比我想象的简洁。左边是 Inbox(统一收件箱,聚合你所有仓库的 issue 和 PR),中间是对话区,右边是 diff 预览和终端。

开一个新 Session 时,有三个模式可选:

模式干什么
Interactive你和 Agent 一步步协作,它会在需要你确认的地方暂停
PlanAgent 先出方案,你批准了再动手
Autopilot全自动,从规划到提 PR 一条龙

说实话,Autopilot 听着很爽,但现阶段我建议别对生产代码开这个。早期用户 Arnesen 在测评里直接说了——"还不敢在没有监督的情况下让它碰生产系统"。我自己试了几次,Agent 写的代码能用,但偏复杂,喜欢过度设计。一个简单的 bugfix,它能给你重构半文件。

不过 Plan 模式倒是意外的好用。让它先列个方案,你看看靠不靠谱,再让它改,省得写完再推倒重来。

多 Agent 并行——这个是真亮点

传统 AI 编程工具都是单线程:你让它干活,它干完一件才能干下一件。Copilot Desktop 不一样。

每个 Session 启动时,App 自动创建一个独立的 Git worktree 和分支。你可以同时开三个 Session:

  • Session 1:在 worktree A 里修 CI 错误
  • Session 2:在 worktree B 里加新功能
  • Session 3:在 worktree C 里重构老代码

三个 Agent 各干各的,不冲突。不用 stash,不用切分支,不用担心改乱了回不去。

# 实际上你在终端里看到的是这样的
# 每个 session 对应不同的 worktree
/home/my-project/.git-worktrees/session-abc123  # Session 1
/home/my-project/.git-worktrees/session-def456  # Session 2
/home/my-project/.git-worktrees/session-ghi789  # Session 3

这一点比 Claude Code 和 Codex CLI 都强。Claude Code 的 Agent Teams 是实验性功能,Codex CLI 目前还是一个 task 一个 agent。Copilot Desktop 是第一个把这做成开箱即用的。

对了,每个 Session 还能选不同的模型。左边用 Claude 写核心逻辑,右边用 GPT 写测试,第三个用 Gemini 搞文档——模型混搭,各取所长。

Agent Merge:自动修 CI + 自动合并 PR

这个功能是 Copilot Desktop 的杀手锏,其他工具暂时没有对标。

流程是这样的:

  1. 你在 App 里开启 Agent Merge
  2. Agent 读取 PR 内容,开始盯着 CI 跑
  3. CI 挂了?自动拉日志、分析原因、推修复代码
  4. 有合并冲突?自动 resolve
  5. Code review 有意见?自动处理
  6. CI 通过 + 所有检查绿灯 → 合并
  7. 合并完,Agent Merge 自动关闭

听起来像科幻片,但 GitHub 官方文档确实写了这些。我的实测体验是——简单 PR(比如文档修改、小 bugfix)确实能跑通。复杂 PR(涉及多文件重构的)CI 挂了之后 Agent 修了两轮还是挂,最后还是得自己上手。

另外有个小坑:如果你开了 GPG 签名,Agent 提交时会弹 passphrase 输入框。这意味着不是完全 hands-off。GitHub 文档把这归类为"Interactive 行为",说得还挺委婉的。

MCP 支持:原生接入,不用折腾

MCP(Model Context Protocol)这块,Copilot Desktop 做得比 Codex 好,和 Claude Code 打平手。

配置方式很简单。项目根目录放一个 .mcp.json

{
  "mcpServers": {
    "github": {
      "url": "https://api.githubcopilot.com/mcp/"
    },
    "cloudflare": {
      "url": "https://mcp.cloudflare.com/sse"
    }
  }
}

App 里也内置了一个 MCP Server 目录,一键搜索添加。GitHub 自家的 MCP Server 是预装好的,issue 管理、PR 操作、代码搜索都能直接用。

/mcp search 还能从注册表搜索安装新的 MCP Server(v1.0.49 实验性功能)。

Skills 系统:给 Agent 装上专业技能包

Skills 不是 slash commands,是 Agent 根据你的意图自动匹配加载的"技能包"。

# 从 awesome-copilot 仓库安装
gh skills install github/awesome-copilot brag-sheet

一个 Skill 就是一个文件夹:

.github/skills/
└── my-custom-skill/
    ├── SKILL.md          # 技能定义
    ├── references/       # 参考文档
    └── scripts/          # 自动化脚本

SKILL.md 里有触发条件("USE FOR:" 和 "DO NOT USE FOR:"),Agent 会根据你的 prompt 自动判断要不要加载这个 Skill。目前社区已经有 Azure SDK、Aspire 分布式应用、.NET MCP 开发等 Skills 可用。

和 Claude Code、Codex 怎么选?

对比项Copilot DesktopClaude CodeCodex CLI
界面原生 GUI终端 CLI终端 CLI
多 Agent 并行原生支持实验性不支持
自动合并 PRAgent Merge手动@Codex 标签
MCP 支持原生 + 目录.mcp.json不支持
模型选择多模型混搭仅 Anthropic仅 OpenAI
执行位置本地本地云端沙箱
价格$10-39/月$20/月起ChatGPT Plus 含
GitHub 深度集成原生通过 MCP原生

我的建议

  • 你的团队重度依赖 GitHub(issue + PR + Actions 一条龙)→ Copilot Desktop,没有悬念
  • 你需要深度代码推理、复杂重构 → Claude Code 的 1M context 依然是最强的
  • 你想要完全 hands-off,连电脑都不想开 → Codex 的云端沙箱 + @Codex 标签适合你

说白了,这三个工具不是互相替代的关系,更像是各有专长。我现在日常是 Claude Code 写代码 + Copilot Desktop 管 PR,双持。

安装踩坑实录

macOS

# 下载(选对应架构)
curl -L -o copilot-darwin-arm64.tar.gz \
  https://github.com/github/copilot-cli/releases/latest/download/copilot-darwin-arm64.tar.gz

# 解压
tar -xzf copilot-darwin-arm64.tar.gz

# 移到 PATH 里
sudo mv copilot /usr/local/bin/

第一次打开 macOS 可能弹安全提示,去"系统设置 → 隐私与安全性"里放行就行。

Linux

curl -L -o copilot-linux-x64.tar.gz \
  https://github.com/github/copilot-cli/releases/latest/download/copilot-linux-x64.tar.gz

tar -xzf copilot-linux-x64.tar.gz
sudo mv copilot /usr/local/bin/
sudo chmod +x /usr/local/bin/copilot

copilot  # 启动,浏览器里走 OAuth 认证

注意:org 管理员需要先在后台开启 Preview Features 和 Copilot CLI 权限,否则你登进去也用不了。这个坑我踩了半小时。

权限和访问门槛

目前 Copilot Desktop 处于技术预览阶段,访问门槛有点迷:

套餐能不能用
Copilot Free不能
Copilot Pro ($10/月)排队等邀请
Copilot Pro+ ($39/月)排队等邀请
Copilot Business ($19/人/月)可以,需要管理员开启
Copilot Enterprise ($39/人/月)可以,需要管理员开启

所以个人开发者目前基本得排队等。Business 和 Enterprise 用户可以直接用,但得说服管理员开权限。

还有一个隐患:2026 年 6 月 GitHub 要改成按 token 计费。Pro 用户每月 10额度,Business10 额度,Business 30,Enterprise $70。重度用 Agent 的话这个额度可能不太够——Agent 跑一轮就是几万 token。到时候实际成本可能会比现在高不少。

现阶段值不值得用?

技术预览版嘛,别指望它十全十美。我能列出一堆问题:

  • Pro/Pro+ 要排队,个人用户暂时摸不到
  • 有人在社区反馈 Pro+ 也会被 rate limit,用了 180 个请求就被限了
  • Agent 写的代码需要 review,别直接合并
  • 企业账号偶尔认证失败
  • 6 月改计费后成本不确定

但多 Agent 并行 + Agent Merge 这两个功能,方向是对的。AI 编程工具的竞争已经从"谁补全更准"升级到"谁能管好整个开发流程"了。GitHub 拿着自己最大的开发者生态入场,这个牌面确实大。

我自己的用法是:简单 issue 扔给 Autopilot 跑,复杂功能用 Plan 模式一步步来,PR 合并开 Agent Merge 但保持盯着。不指望它替我写代码,但当个不知疲倦的初级开发者用,已经挺香了。

你们试过了吗?多 Agent 并行这块,是噱头还是真有用?评论区聊聊。