一个人干五个人的活,我用了这三个GitHub开源工具

0 阅读7分钟

2026年了,如果你还在跟AI一问一答地写代码,那你可能用了个寂寞。

封面

我最近的开发方式彻底变了。

跟模型升级没关系,是配套的工具终于跟上了。

GitHub官方下场搞了个大动作,开源社区也冒出来一批狠货。

现在的AI编程,已经不是"你问它答"了。

你说个需求,它帮你组一个团队,自己干。

今天聊聊我最近在用的几个东西。

GitHub下场了

2月4号,GitHub悄悄放了个大招——Agents HQ

简单说就是:你现在可以在同一个GitHub仓库里,同时使用Claude、Codex和Copilot三个AI。

没听错,三个AI agent,一个入口。

以前这三家是各打各的。

Copilot在编辑器里补全,Claude Code在终端里干活,Codex在自己的沙箱里跑。

现在GitHub说:别分了,都来我这。

具体怎么用?

进到任何一个已开启Agents的仓库,你会看到一个新的「Agents」标签页。

在Issue里指定assignee为Claude、Codex或Copilot。

它就自动开始干活,干完了给你提一个PR。

对,它会自己写代码、自己提PR、自己在PR里回复你的review意见。

最骚的操作是什么?

给同一个Issue同时分配三个Agent。

三个AI各自独立实现,你拿到三份不同的方案,挑最好的merge。

GitHub官方甚至给了个评价:

Claude倾向于先问清楚再动手,注重代码可维护性。Codex则是二话不说直接开干,速度快但可能需要更多review。

性格都不一样。

多Agent协作

能用吗?能用。好用吗?看场景。

简单bug修一个Agent就够。复杂功能开发,三个一起上,挑最好的那份merge。

谁能用?

Copilot Pro+($39/月)和Enterprise用户。

GitHub网页、GitHub Mobile、VS Code都支持。

贵吗?$39一个月。值吗?你算算一个junior developer一个月多少钱。

GitHub这是要当AI编程界的瑞士啊——谁都能来,我提供场地。

记忆才是核心瓶颈

但光有Agent还不够。

用过Claude Code的人都知道一个痛点——它不记事。

每次开新session,上次聊了什么、改了哪些文件、踩了什么坑,全忘了。

你得重新解释一遍项目背景。

重新告诉它代码规范。

重新提醒它别碰那个有bug的模块。

烦不烦?太烦了。

claude-mem就是来解决这个问题的。

claude-mem

GitHub上stars飙到两万多,两天涨了3200,已经是Claude Code用户的标配了。

它就干一件事。

自动记录你跟Claude Code的每次对话,压缩成摘要,下次开session自动塞回去。

装上之后会怎样?

每次启动Claude Code,它会自动翻你的历史session。

找到跟当前项目相关的东西,悄悄塞给Claude。

你感觉不到它的存在,但Claude突然变得"懂你"了。

安装一行命令:

/plugin marketplace add thedotmack/claude-mem 

技术上怎么做到的?

五个Hook卡在关键节点上。

开session时加载上下文,提问时补背景,工具调用后记观察,结束时压缩存档。

底层SQLite + ChromaDB混合搜索,关键词和语义检索都能用。

还有个我觉得挺妙的设计——渐进式披露

不会一股脑把历史全塞给Claude。

先给精简索引(50-100 tokens),需要细节了再取完整内容(500-1K tokens)。

这个设计省了10倍token

token节省设计

隐私安全吗?安全。所有数据存在本地 ~/.claude-mem/,不上传任何东西。

配置复杂吗?不复杂。一行命令装完,不用改任何设置。

还有个Web UI在 localhost:37777,可以可视化浏览所有记忆。

装上之后我再也没手动写过项目背景说明。

一个Claude不够,来一组

解决了记忆问题,下一个瓶颈是什么?

并行度。

Claude Code默认是单线程的——你给它一个任务,它干完了你再给下一个。

但现实中的项目哪是一个一个来的?

前端要改、API要写、数据库要迁移、测试要补。全堆在一起。

CCPM(Claude Code Project Manager)就是干这个的。

7.2K stars,思路很简单:GitHub Issues管任务,Git Worktrees隔环境,多个Claude同时干活。

怎么用?

第一步,写需求。 用 /pm:prd-new 命令,它会引导你通过对话把需求理清楚,生成一份PRD文档。

第二步,拆任务。/pm:epic-decompose 把PRD拆成一个个GitHub Issue,每个Issue都有详细的验收标准。

第三步,并行开干。/pm:issue-start 在一个独立的git worktree里启动一个Claude实例来干活。

关键来了。

你可以同时启动5-8个Claude实例,每个在自己的worktree里干活,互不冲突。

一个在写API,一个在搞前端组件,一个在写测试,一个在改数据库schema。

各干各的,最后merge。

CCPM并行开发

每个commit自动关联对应的Issue。

谁写的、为什么写、对应哪条需求,全查得到。

人和AI随时换手。AI干到一半你接手,你搭个框架让AI填细节,都行。

/pm:status 一敲,项目全貌就出来了。

谁在干什么、进度到哪了、有没有卡住,一屏搞定。

快吗?快。多快?以前一个人串行干一周的活,现在5个Agent并行,一天收工。

会冲突吗?不会。每个Agent在独立的worktree里,代码物理隔离。

质量行吗?每个PR都有commit记录和Issue关联。

review起来反而比人写的更清晰。

说实话,用了CCPM之后,我一个人的产出基本等于以前一个3-4人的小团队。

正确打开方式

工作流最佳实践

工具有了,怎么用才对?

几条这半年踩坑得来的经验。

先写spec再动手。

别一上来就让AI写代码。

花15分钟写清楚:输入是什么、输出是什么、哪些不要碰。

Google Chrome团队的Addy Osmani管这叫"15分钟瀑布流"。

先用AI迭代需求文档,再写代码。

我自己的体感,这一步做了,后面返工少一大半。

测试是放大器。

Addy Osmani在博文里提到:Anthropic内部,Claude Code的大量代码是Claude自己写的。

怎么做到的?靠测试。

写代码→跑测试→修bug→再跑测试。这个循环人跑一遍要半小时,AI跑一遍几分钟。

难吗?不难。有用吗?这么说吧——没有测试的AI编程,就是在裸奔。

频繁commit。

把每次commit当成游戏存档。

AI改出问题了?git revert 回去就行。

我现在基本每完成一个小功能就commit一次,有时候甚至每10分钟commit一次。

反正commit不要钱。

多模型交叉验证。

Claude擅长理解复杂代码。Codex速度快,适合快速原型。

Gemini多模态强。

一个模型卡住了?换一个。有时候Claude死活解不出的bug,扔给Gemini一下就通了。

模型也是有脾气的,有些活就是跟某个模型更对路。

CLAUDE.md是你最重要的文件。

在项目根目录放一个CLAUDE.md。

写清楚项目架构、代码规范、常见坑、你的偏好。

Claude Code每次启动都会读它。

相当于给AI一份永久的入职手册。

我的日常工作流

我现在每天干活基本是这样的:

1. 打开项目,CCPM自动同步GitHub Issues,claude-mem自动加载上下文

2. /pm:next 看今天该干什么

3. 分配3-5个独立任务给不同的Claude实例并行跑

4. 我自己处理需要人类判断的核心逻辑

5. Agent干完了提PR,我review+merge

6. 用GitHub Agents HQ给复杂PR指派Claude做code review

一个人,一台电脑,干5个人的活。

我没变强,是工具变强了。

写在最后

AI开发新范式

今年AI编程最大的变化,其实不是哪个模型又升级了。

周边的基建终于能用了

记忆、并行、多Agent协作、版本追溯。

以前这些得靠一个团队。

现在你一个人,配几个插件,就有了。

说句大实话——模型再强,你工作流拉胯,照样写不出什么东西。

上面说的这些工具全免费。

花半天配好,接下来一整年受益。

划算不划算,你自己说。

最后说一句

我是 Evan,每天追全球 AI 动态,用说人话的方式写出来。

如果上面的内容对你有帮助,真诚地希望你能点个关注

这对我真的很重要。


对了,我有个AI交流群

进群能干嘛?

• 我每天整理一份AI日报,你不用自己到处翻

• 新东西出了我会第一时间丢群里,大家一起聊

• 没广告,就图个信息互通

想进?点公众号主页 ==> 菜单栏「加群