2026年了,如果你还在跟AI一问一答地写代码,那你可能用了个寂寞。
我最近的开发方式彻底变了。
跟模型升级没关系,是配套的工具终于跟上了。
GitHub官方下场搞了个大动作,开源社区也冒出来一批狠货。
现在的AI编程,已经不是"你问它答"了。
你说个需求,它帮你组一个团队,自己干。
今天聊聊我最近在用的几个东西。
GitHub下场了
2月4号,GitHub悄悄放了个大招——Agents HQ。
简单说就是:你现在可以在同一个GitHub仓库里,同时使用Claude、Codex和Copilot三个AI。
没听错,三个AI agent,一个入口。
以前这三家是各打各的。
Copilot在编辑器里补全,Claude Code在终端里干活,Codex在自己的沙箱里跑。
现在GitHub说:别分了,都来我这。
具体怎么用?
进到任何一个已开启Agents的仓库,你会看到一个新的「Agents」标签页。
在Issue里指定assignee为Claude、Codex或Copilot。
它就自动开始干活,干完了给你提一个PR。
对,它会自己写代码、自己提PR、自己在PR里回复你的review意见。
最骚的操作是什么?
给同一个Issue同时分配三个Agent。
三个AI各自独立实现,你拿到三份不同的方案,挑最好的merge。
GitHub官方甚至给了个评价:
Claude倾向于先问清楚再动手,注重代码可维护性。Codex则是二话不说直接开干,速度快但可能需要更多review。
性格都不一样。
能用吗?能用。好用吗?看场景。
简单bug修一个Agent就够。复杂功能开发,三个一起上,挑最好的那份merge。
谁能用?
Copilot Pro+($39/月)和Enterprise用户。
GitHub网页、GitHub Mobile、VS Code都支持。
贵吗?$39一个月。值吗?你算算一个junior developer一个月多少钱。
GitHub这是要当AI编程界的瑞士啊——谁都能来,我提供场地。
记忆才是核心瓶颈
但光有Agent还不够。
用过Claude Code的人都知道一个痛点——它不记事。
每次开新session,上次聊了什么、改了哪些文件、踩了什么坑,全忘了。
你得重新解释一遍项目背景。
重新告诉它代码规范。
重新提醒它别碰那个有bug的模块。
烦不烦?太烦了。
claude-mem就是来解决这个问题的。
GitHub上stars飙到两万多,两天涨了3200,已经是Claude Code用户的标配了。
它就干一件事。
自动记录你跟Claude Code的每次对话,压缩成摘要,下次开session自动塞回去。
装上之后会怎样?
每次启动Claude Code,它会自动翻你的历史session。
找到跟当前项目相关的东西,悄悄塞给Claude。
你感觉不到它的存在,但Claude突然变得"懂你"了。
安装一行命令:
/plugin marketplace add thedotmack/claude-mem
技术上怎么做到的?
五个Hook卡在关键节点上。
开session时加载上下文,提问时补背景,工具调用后记观察,结束时压缩存档。
底层SQLite + ChromaDB混合搜索,关键词和语义检索都能用。
还有个我觉得挺妙的设计——渐进式披露。
不会一股脑把历史全塞给Claude。
先给精简索引(50-100 tokens),需要细节了再取完整内容(500-1K tokens)。
这个设计省了10倍token。
隐私安全吗?安全。所有数据存在本地 ~/.claude-mem/,不上传任何东西。
配置复杂吗?不复杂。一行命令装完,不用改任何设置。
还有个Web UI在 localhost:37777,可以可视化浏览所有记忆。
装上之后我再也没手动写过项目背景说明。
一个Claude不够,来一组
解决了记忆问题,下一个瓶颈是什么?
并行度。
Claude Code默认是单线程的——你给它一个任务,它干完了你再给下一个。
但现实中的项目哪是一个一个来的?
前端要改、API要写、数据库要迁移、测试要补。全堆在一起。
CCPM(Claude Code Project Manager)就是干这个的。
7.2K stars,思路很简单:GitHub Issues管任务,Git Worktrees隔环境,多个Claude同时干活。
怎么用?
第一步,写需求。 用 /pm:prd-new 命令,它会引导你通过对话把需求理清楚,生成一份PRD文档。
第二步,拆任务。/pm:epic-decompose 把PRD拆成一个个GitHub Issue,每个Issue都有详细的验收标准。
第三步,并行开干。/pm:issue-start 在一个独立的git worktree里启动一个Claude实例来干活。
关键来了。
你可以同时启动5-8个Claude实例,每个在自己的worktree里干活,互不冲突。
一个在写API,一个在搞前端组件,一个在写测试,一个在改数据库schema。
各干各的,最后merge。
每个commit自动关联对应的Issue。
谁写的、为什么写、对应哪条需求,全查得到。
人和AI随时换手。AI干到一半你接手,你搭个框架让AI填细节,都行。
/pm:status 一敲,项目全貌就出来了。
谁在干什么、进度到哪了、有没有卡住,一屏搞定。
快吗?快。多快?以前一个人串行干一周的活,现在5个Agent并行,一天收工。
会冲突吗?不会。每个Agent在独立的worktree里,代码物理隔离。
质量行吗?每个PR都有commit记录和Issue关联。
review起来反而比人写的更清晰。
说实话,用了CCPM之后,我一个人的产出基本等于以前一个3-4人的小团队。
正确打开方式
工具有了,怎么用才对?
几条这半年踩坑得来的经验。
先写spec再动手。
别一上来就让AI写代码。
花15分钟写清楚:输入是什么、输出是什么、哪些不要碰。
Google Chrome团队的Addy Osmani管这叫"15分钟瀑布流"。
先用AI迭代需求文档,再写代码。
我自己的体感,这一步做了,后面返工少一大半。
测试是放大器。
Addy Osmani在博文里提到:Anthropic内部,Claude Code的大量代码是Claude自己写的。
怎么做到的?靠测试。
写代码→跑测试→修bug→再跑测试。这个循环人跑一遍要半小时,AI跑一遍几分钟。
难吗?不难。有用吗?这么说吧——没有测试的AI编程,就是在裸奔。
频繁commit。
把每次commit当成游戏存档。
AI改出问题了?git revert 回去就行。
我现在基本每完成一个小功能就commit一次,有时候甚至每10分钟commit一次。
反正commit不要钱。
多模型交叉验证。
Claude擅长理解复杂代码。Codex速度快,适合快速原型。
Gemini多模态强。
一个模型卡住了?换一个。有时候Claude死活解不出的bug,扔给Gemini一下就通了。
模型也是有脾气的,有些活就是跟某个模型更对路。
CLAUDE.md是你最重要的文件。
在项目根目录放一个CLAUDE.md。
写清楚项目架构、代码规范、常见坑、你的偏好。
Claude Code每次启动都会读它。
相当于给AI一份永久的入职手册。
我的日常工作流
我现在每天干活基本是这样的:
1. 打开项目,CCPM自动同步GitHub Issues,claude-mem自动加载上下文
2. /pm:next 看今天该干什么
3. 分配3-5个独立任务给不同的Claude实例并行跑
4. 我自己处理需要人类判断的核心逻辑
5. Agent干完了提PR,我review+merge
6. 用GitHub Agents HQ给复杂PR指派Claude做code review
一个人,一台电脑,干5个人的活。
我没变强,是工具变强了。
写在最后
今年AI编程最大的变化,其实不是哪个模型又升级了。
是周边的基建终于能用了。
记忆、并行、多Agent协作、版本追溯。
以前这些得靠一个团队。
现在你一个人,配几个插件,就有了。
说句大实话——模型再强,你工作流拉胯,照样写不出什么东西。
上面说的这些工具全免费。
花半天配好,接下来一整年受益。
划算不划算,你自己说。
最后说一句
我是 Evan,每天追全球 AI 动态,用说人话的方式写出来。
如果上面的内容对你有帮助,真诚地希望你能点个关注。
这对我真的很重要。
对了,我有个AI交流群。
进群能干嘛?
• 我每天整理一份AI日报,你不用自己到处翻
• 新东西出了我会第一时间丢群里,大家一起聊
• 没广告,就图个信息互通
想进?点公众号主页 ==> 菜单栏「加群」