一个人干五个人的活，我用了这三个GitHub开源工具2026年了，如果你还在跟AI一问一答地写代码，那你可能用了个寂寞。

2026年了，如果你还在跟AI一问一答地写代码，那你可能用了个寂寞。

我最近的开发方式彻底变了。

跟模型升级没关系，是配套的工具终于跟上了。

GitHub官方下场搞了个大动作，开源社区也冒出来一批狠货。

现在的AI编程，已经不是"你问它答"了。

你说个需求，它帮你组一个团队，自己干。

今天聊聊我最近在用的几个东西。

GitHub下场了

2月4号，GitHub悄悄放了个大招——Agents HQ。

简单说就是：你现在可以在同一个GitHub仓库里，同时使用Claude、Codex和Copilot三个AI。

没听错，三个AI agent，一个入口。

以前这三家是各打各的。

Copilot在编辑器里补全，Claude Code在终端里干活，Codex在自己的沙箱里跑。

现在GitHub说：别分了，都来我这。

具体怎么用？

进到任何一个已开启Agents的仓库，你会看到一个新的「Agents」标签页。

在Issue里指定assignee为Claude、Codex或Copilot。

它就自动开始干活，干完了给你提一个PR。

对，它会自己写代码、自己提PR、自己在PR里回复你的review意见。

最骚的操作是什么？

给同一个Issue同时分配三个Agent。

三个AI各自独立实现，你拿到三份不同的方案，挑最好的merge。

GitHub官方甚至给了个评价：

Claude倾向于先问清楚再动手，注重代码可维护性。Codex则是二话不说直接开干，速度快但可能需要更多review。

性格都不一样。

多Agent协作

能用吗？能用。好用吗？看场景。

简单bug修一个Agent就够。复杂功能开发，三个一起上，挑最好的那份merge。

谁能用？

Copilot Pro+（$39/月）和Enterprise用户。

GitHub网页、GitHub Mobile、VS Code都支持。

贵吗？$39一个月。值吗？你算算一个junior developer一个月多少钱。

GitHub这是要当AI编程界的瑞士啊——谁都能来，我提供场地。

记忆才是核心瓶颈

但光有Agent还不够。

用过Claude Code的人都知道一个痛点——它不记事。

每次开新session，上次聊了什么、改了哪些文件、踩了什么坑，全忘了。

你得重新解释一遍项目背景。

重新告诉它代码规范。

重新提醒它别碰那个有bug的模块。

烦不烦？太烦了。

claude-mem就是来解决这个问题的。

claude-mem

GitHub上stars飙到两万多，两天涨了3200，已经是Claude Code用户的标配了。

它就干一件事。

自动记录你跟Claude Code的每次对话，压缩成摘要，下次开session自动塞回去。

装上之后会怎样？

每次启动Claude Code，它会自动翻你的历史session。

找到跟当前项目相关的东西，悄悄塞给Claude。

你感觉不到它的存在，但Claude突然变得"懂你"了。

安装一行命令：

/plugin marketplace add thedotmack/claude-mem

技术上怎么做到的？

五个Hook卡在关键节点上。

开session时加载上下文，提问时补背景，工具调用后记观察，结束时压缩存档。

底层SQLite + ChromaDB混合搜索，关键词和语义检索都能用。

还有个我觉得挺妙的设计——渐进式披露。

不会一股脑把历史全塞给Claude。

先给精简索引（50-100 tokens），需要细节了再取完整内容（500-1K tokens）。

这个设计省了10倍token。

token节省设计

隐私安全吗？安全。所有数据存在本地 ~/.claude-mem/，不上传任何东西。

配置复杂吗？不复杂。一行命令装完，不用改任何设置。

还有个Web UI在 localhost:37777，可以可视化浏览所有记忆。

装上之后我再也没手动写过项目背景说明。

一个Claude不够，来一组

解决了记忆问题，下一个瓶颈是什么？

并行度。

Claude Code默认是单线程的——你给它一个任务，它干完了你再给下一个。

但现实中的项目哪是一个一个来的？

前端要改、API要写、数据库要迁移、测试要补。全堆在一起。

CCPM（Claude Code Project Manager）就是干这个的。

7.2K stars，思路很简单：GitHub Issues管任务，Git Worktrees隔环境，多个Claude同时干活。

怎么用？

第一步，写需求。 用 /pm:prd-new 命令，它会引导你通过对话把需求理清楚，生成一份PRD文档。

第二步，拆任务。/pm:epic-decompose 把PRD拆成一个个GitHub Issue，每个Issue都有详细的验收标准。

第三步，并行开干。/pm:issue-start 在一个独立的git worktree里启动一个Claude实例来干活。

关键来了。

你可以同时启动5-8个Claude实例，每个在自己的worktree里干活，互不冲突。

一个在写API，一个在搞前端组件，一个在写测试，一个在改数据库schema。

各干各的，最后merge。

CCPM并行开发

每个commit自动关联对应的Issue。

谁写的、为什么写、对应哪条需求，全查得到。

人和AI随时换手。AI干到一半你接手，你搭个框架让AI填细节，都行。

/pm:status 一敲，项目全貌就出来了。

谁在干什么、进度到哪了、有没有卡住，一屏搞定。

快吗？快。多快？以前一个人串行干一周的活，现在5个Agent并行，一天收工。

会冲突吗？不会。每个Agent在独立的worktree里，代码物理隔离。

质量行吗？每个PR都有commit记录和Issue关联。

review起来反而比人写的更清晰。

说实话，用了CCPM之后，我一个人的产出基本等于以前一个3-4人的小团队。

正确打开方式

工作流最佳实践

工具有了，怎么用才对？

几条这半年踩坑得来的经验。

先写spec再动手。

别一上来就让AI写代码。

花15分钟写清楚：输入是什么、输出是什么、哪些不要碰。

Google Chrome团队的Addy Osmani管这叫"15分钟瀑布流"。

先用AI迭代需求文档，再写代码。

我自己的体感，这一步做了，后面返工少一大半。

测试是放大器。

Addy Osmani在博文里提到：Anthropic内部，Claude Code的大量代码是Claude自己写的。

怎么做到的？靠测试。

写代码→跑测试→修bug→再跑测试。这个循环人跑一遍要半小时，AI跑一遍几分钟。

难吗？不难。有用吗？这么说吧——没有测试的AI编程，就是在裸奔。

频繁commit。

把每次commit当成游戏存档。

AI改出问题了？git revert 回去就行。

我现在基本每完成一个小功能就commit一次，有时候甚至每10分钟commit一次。

反正commit不要钱。

多模型交叉验证。

Claude擅长理解复杂代码。Codex速度快，适合快速原型。

Gemini多模态强。

一个模型卡住了？换一个。有时候Claude死活解不出的bug，扔给Gemini一下就通了。

模型也是有脾气的，有些活就是跟某个模型更对路。

CLAUDE.md是你最重要的文件。

在项目根目录放一个CLAUDE.md。

写清楚项目架构、代码规范、常见坑、你的偏好。

Claude Code每次启动都会读它。

相当于给AI一份永久的入职手册。

我的日常工作流

我现在每天干活基本是这样的：

1. 打开项目，CCPM自动同步GitHub Issues，claude-mem自动加载上下文

2. /pm:next 看今天该干什么

3. 分配3-5个独立任务给不同的Claude实例并行跑

4. 我自己处理需要人类判断的核心逻辑

5. Agent干完了提PR，我review+merge

6. 用GitHub Agents HQ给复杂PR指派Claude做code review

一个人，一台电脑，干5个人的活。

我没变强，是工具变强了。

写在最后

AI开发新范式

今年AI编程最大的变化，其实不是哪个模型又升级了。

是周边的基建终于能用了。

记忆、并行、多Agent协作、版本追溯。

以前这些得靠一个团队。

现在你一个人，配几个插件，就有了。

说句大实话——模型再强，你工作流拉胯，照样写不出什么东西。

上面说的这些工具全免费。

花半天配好，接下来一整年受益。

划算不划算，你自己说。

最后说一句

我是 Evan，每天追全球 AI 动态，用说人话的方式写出来。

如果上面的内容对你有帮助，真诚地希望你能点个关注。

这对我真的很重要。

对了，我有个AI交流群。

进群能干嘛？

• 我每天整理一份AI日报，你不用自己到处翻

• 新东西出了我会第一时间丢群里，大家一起聊

• 没广告，就图个信息互通

想进？点公众号主页 ==> 菜单栏「加群」