从30亿Token到全自治AGI:花一整天搭建 Refactor Agent,我彻底转向了知识库驱动的多 Agent 架构

0 阅读8分钟

因为刚从csdn迁移到本平台,会先搬运一些以前的文章,还请读者见谅~。~

烧了30亿+token,超10万+api调用次数养龙虾之后,我彻底转向以hermes为执行者的harness工程agi全自治架构

一个反直觉的事实:大型代码库泄露后,普通人拿到代码也束手无策——不是因为读不懂,而是因为重构本身比获取代码更难。数十万行代码、多语言混合、复杂依赖关系,你需要的不是更多的 AI 助手,而是一套系统化的方法论。这篇文章将展示我是如何用 15 个知识库模块、84 份技术文档、27,000+ 行重构指南 + Hermes 多 Agent 协作,从零构建出一个完整的 Refactor Agent 工程架构。

一、问题重构:为什么现有的 AI 编码工具不够用?

当我在研究如何处理"商业闭源项目泄露"这个假想场景时,我发现一个尴尬的事实:Aider、Plandex、MetaGPT、CrewAI 这些工具各自强大,但没有任何一个能独立完成完整的大型代码库重构任务

工具核心能力缺失环节
AiderRepo Map、Git 集成缺少系统化重构流程
PlandexPlan→Code→Review→Validate 四阶段无知识库支撑
MetaGPT角色模拟、SDLC执行精度不足
CrewAI角色分工、并行执行缺少代码验证机制

数据支撑:据 CSDN 2024 年底的 AI Coding 行业分析报告《AI Coding 最全图谱:Agent 将如何颠覆软件》指出,当前 AI coding 领域的主要瓶颈在于"企业中有庞大的 codebase、复杂的 engineering context,以及严格的安全合规要求"——这些问题不是单一工具能解决的(来源:CSDN博客,2024-12-25)。

具体案例:MetaGPT 的 GitHub 项目页面显示,它在协作软件工程基准上确实比基于聊天的多 Agent 系统表现更好,但其软件开发流程模拟仍然缺乏对"代码质量验证"和"重构边界控制"的支持(来源:MetaGPT GitHub README,知乎翻译版,2023-10-08)。


二、Refactor Agent 架构设计:借鉴四大工具的核心能力

我设计的 Refactor Agent 并不是重新发明轮子,而是吸收四者精华并补全缺失环节

Refactor Agent 架构
├── Skills(5 个核心技能)
│   ├── repo-map-skill          # 生成代码库地图(借鉴 Aider)
│   ├── task-decomposer-skill   # 任务分解(借鉴 Plandex)
│   ├── scope-guard-skill       # 范围守卫(防止越界修改)
│   ├── git-workflow-skill      # Git 安全网(自动提交/回滚)
│   └── code-validator-skill    # 代码验证(静态分析/测试/安全扫描)
├── Knowledge Base(15 个模块,84 个文件)
│   ├── 核心:best-practices, language-guides, design-patterns, refactoring-patterns
│   ├── 质量:testing-strategies, security-checklists, performance-tips, ci-cd
│   ├── 架构:legacy-code, microservices, api-design, data-migration
│   └── 工程:monitoring-observability, team-collaboration, tools-automation
└── 与 Hermes 协作:通过 delegation 路由自动分发重构任务

这里的核心洞察是:Aider 的 Repo Map 本质上解决的是"AI 对代码结构两眼一抹黑"的问题——你想让 AI 修改一个函数,但如果它不知道这个函数调用了另一个文件的类,给出的建议就会破坏现有抽象(来源:CSDN博客《Optimizing Aider的Repo Map for Large Codebases》,2026-04-02)。


三、最复杂的工程挑战:知识库填充

15 个模块、84 份文档、27,000+ 行内容——不可能手动写。我的解决方案:设计完整的提示词体系,让 Hermes 多 Agent 自动填充。

3.1 七份 Agent 任务书

我创建了 7 份 Agent 任务书,每份对应一个专业领域:

Agent负责模块专长领域
Agent-Abest-practices + language-guides语言特性、代码风格
Agent-Bdesign-patterns + refactoring-patterns设计模式、重构手法
Agent-Cperformance-tips + testing-strategies性能、测试
Agent-Dsecurity-checklists + ci-cd安全、DevOps
Agent-Elegacy-code + microservices遗留系统、架构
Agent-Fapi-design + data-migrationAPI、数据
Agent-Gmonitoring-observability + team-collaboration + tools-automation可观测性、协作

每份任务书包含:内容要求(理论说明 + 重构前/后代码对比 + 检查清单 + 常见陷阱)、质量标准(≥2个代码示例、≥5个检查项、≥3个陷阱警示)、输出格式(Markdown,中文编写,代码注释英文)。

3.2 协调执行机制

总协调员提示词负责:

  1. 读取主索引确认目录结构
  2. 运行验证脚本检查当前状态
  3. 启动 7 个子 Agent 并行工作
  4. 监控进度,处理内容冲突
  5. 质量验证(文件数、行数、代码示例覆盖率)
# 启动协调员
hermes agent --name "KB-Coordinator" --task-file hermes-coordinator.prompt

# 7 个 Agent 并行填充
hermes agent --name "KB-Languages" --task-file agent-a-languages.md
hermes agent --name "KB-Patterns" --task-file agent-b-patterns.md
# ... 共 7

3.3 三轮验证的实战数据

第一轮:完整性检查

  • 目标:50+ 文件,实际:84 个文件 ✅
  • 目标:5000+ 行,实际:27,427 行 ✅
  • 代码示例覆盖率:97.6%(82/84 文件)✅

第二轮:质量检查 发现 3 个文件内容偏薄(inline-method.md 79行、replace-temp-with-query.md 90行、extract-class.md 95行),手动补充完善后分别达到 207行、311行、354行。

第三轮:功能验证 验证 AGENTS.md 是否引用所有 15 个模块,发现 10 个未引用;验证 Skills 脚本是否完整,发现 4 个缺失。全部修复。


四、四个关键困难的根因与解决方案

困难 1:知识库内容冲突

问题:两个 Agent 同时填充不同模块,内容有重叠(如 design-patterns 和 refactoring-patterns 都涉及"策略模式")。

解决:在协调员提示词中明确规则——"指定主模块,其他模块引用"。design-patterns 作为策略模式主模块,refactoring-patterns 中只简要提及并链接到主模块。

困难 2:路径硬编码导致迁移困难

问题:初期脚本中硬编码了 /Users/wjj13/harness-knowledge/ 等本地路径。

解决

  1. 全面扫描所有硬编码路径
  2. 将核心数据迁移到 /Volumes/A/SOCIALMEDIA/knowledge_base/harness/
  3. 修改所有脚本和配置文件中的路径引用
  4. 验证 RAG 索引器和启动脚本在新路径下正常工作

困难 3:Skills 脚本缺失

问题:task-decomposer-skill 和 scope-guard-skill 只有 SKILL.md 文档,没有可执行脚本。

解决:创建了 4 个 Python 脚本:

  • decompose.py:解析重构规范,生成 8 步标准任务流
  • set-scope.py:扫描项目,定义允许/禁止修改的文件集合
  • verify-scope.py:检查 git diff,发现越界修改时告警
  • impact-analysis.py:基于 Repo Map 分析符号修改的影响范围

困难 4:Hermes 无法感知新增知识库

问题:AGENTS.md 只引用了 5 个知识库模块。

解决:重写 AGENTS.md,添加完整的 15 个模块列表及说明、知识库使用指南、Skills 使用命令示例、10 步重构工作流。


五、实战价值:当泄露发生时

假设某个商业闭源顶级项目的代码泄露了。你拿到代码后,Refactor Agent 的完整工作流如下:

第一步:生成 Repo Map

python3 skills/repo-map-skill/scripts/generate-map.py \
  --project /path/to/leaked-code \
  --output workspace/repo-map

了解代码结构:1159 个文件、3419 个类、20780 个函数。

第二步:分解重构任务

python3 skills/task-decomposer-skill/scripts/decompose.py \
  --spec workspace/refactor-spec.md \
  --output workspace/tasks.yaml

生成 8 个子任务,预估 13.25 小时,标记风险等级。

第三步:设置重构范围

python3 skills/scope-guard-skill/scripts/set-scope.py \
  --project /path/to/leaked-code \
  --include "src/core/**" \
  --exclude "src/legacy/**"

定义边界:允许修改 500 个文件,禁止修改 200 个文件。

第四步:查阅知识库

  • 语言特定指南 → language-guides/python-guide.md
  • 重构手法 → refactoring-patterns/extract-method.md
  • 安全审查 → security-checklists/pre-refactor-security.md
  • 性能优化 → performance-tips/python-performance.md

第五步:执行重构 Git 安全网自动提交,每次小改动后运行验证。

第六步:验证结果

python3 skills/code-validator-skill/scripts/code-validator.py \
  --project /path/to/leaked-code \
  --action all

语法检查、代码风格、单元测试、安全扫描全部通过。

最终:你拥有了一份经过重构、验证、安全的代码。是否开源?完全由你决定。


六、最终成果数据

维度数据
知识库模块15 个
知识库文件84 个
总行数27,427 行
代码示例覆盖率97.6%
检查清单覆盖率83.3%
覆盖语言Python, JavaScript, Go, Java, Rust, C++
重构模式30+ 种
设计模式23 种(GoF + 重构到模式)
Skills5 个(含 7 个可执行脚本)
Agent 任务书7 份

引用来源列表

  1. CSDN博客《AI Coding 最全图谱:Agent 将如何颠覆软件》 ,2024-12-25,URL: blog.csdn.net/m0_59163425…
  2. 知乎文章《MetaGPT:嵌入SOPs显著增强多智能体协作能力》 ,2024-01-25,URL: www.163.com/dy/article/…
  3. CSDN博客《Optimizing Aider的Repo Map for Large Codebases》 ,2026-04-02,URL: blog.csdn.net/weixin_2928…
  4. 知乎翻译文章《MetaGPT: Meta Programming for Multi-Agent Collaborative Framework》 ,2023-10-08,URL: zhuanlan.zhihu.com/p/659916401

这是一篇纯技术实战记录,所有数据来自本人亲身工程实践。更多关于 Hermes 多 Agent 协作、Refactor Agent 架构设计的细节,欢迎关注我的主页查看后续更新。

个人技术观察,具体行为以官方文档为准。