我让 10 个 AI Agent 并行审查代码,发现了人工 Review 从未抓到的 Bug

0 阅读3分钟

你的 Code Review 是不是也在"走过场"?

说个扎心的事实:大部分团队的 Code Review 都在走过场。

同事打开你的 PR,扫两眼,打个 "LGTM",合并。安全漏洞?没看到。性能问题?没注意。逻辑 Bug?谁在乎呢。

我做了一个工具来解决这个问题 —— RevHive,一个开源的多 Agent 代码审查系统。

10 个 AI Agent 各司其职

RevHive 的核心思路很简单:不是一个 AI 做所有事,而是 10 个专家各管一摊。

Agent职责
SecurityAgentSQL 注入、XSS、硬编码密钥、弱加密
PerformanceAgentN+1 查询、内存泄漏、算法复杂度
LogicAgent边界条件、异常处理、竞态条件
StyleAgent命名规范、代码格式、文档
RepoAgent设计模式、SOLID 原则、模块结构
RefactorAgent代码重构、增量迁移
FixAgent直接生成修复后的代码
TestAgent单元测试、边界测试、安全回归测试
DocAgentAPI 文档、架构文档、使用示例
Coordinator去重、冲突解决、风险评分

9 个 Agent 并行审查,Coordinator 汇总结果、去除重复、解决冲突、计算风险评分。

30 秒体验,不需要 API Key

pip install revhive-ai
revhive demo

跑完你会看到一个完整的审查报告,包括风险评分、严重程度分布、具体问题和修复建议。

真实审查长什么样

每次审查会输出一个 0-100 的风险评分

风险评分: 72/100 HIGH
CRITICAL x1   HIGH x3   MEDIUM x8   LOW x11

── 严重/高危问题 ──
[CRITICAL] 硬编码 AWS 密钥
  SecurityAgent · 第 42 行
  源码中发现 AWS 访问密钥,应移到环境变量。

[HIGH] SQL 注入(字符串拼接)
  SecurityAgent · 第 87 行
  用户输入直接拼接到 SQL 查询中。

[HIGH] 支付流程缺少错误处理
  LogicAgent · 第 156 行
  支付处理没有 try/catch,失败被静默吞掉。

[HIGH] 用户列表页 N+1 查询
  PerformanceAgent · 第 203 行
  在用户循环中查询订单,应使用 JOIN 或批量查询。

核心洞察:并行 + 专业化 = 更好的结果

单个 AI 可能只擅长安全或只擅长性能。但 10 个 Agent 并行运行,每个专注于自己的领域,结果明显更好。

而且 10 个 Agent 并行跑,总耗时跟单个 Agent 差不多 —— 这就是 LangGraph 工作流编排的威力。

自动审查每个 PR

安装 GitHub App,每个 PR 自动审查。或者用 GitHub Actions:

- name: Run RevHive Review
  env:
    LLM_API_KEY: ${{ secrets.LLM_API_KEY }}
    LLM_MODEL: deepseek-chat  # 每次审查约 ¥0.35
  run: revhive review --diff HEAD~1 --format markdown

支持的 LLM

提供商每次审查成本
DeepSeek~¥0.35
MiMo(小米)~¥0.35-1
通义千问(阿里)~¥0.35-0.7
GPT-4o~¥0.7-2
Claude Sonnet~¥1-3

DeepSeek 最便宜,每次 PR 审查不到 4 毛钱。

为什么做这个工具

  1. 中文 LLM 生态被忽视 —— 大部分代码审查工具只支持 OpenAI/Anthropic,国内开发者需要支持国产 LLM 的工具
  2. CLI 优先 —— 数据不出本地,BYOK(自带 API Key)
  3. Demo 模式 —— 不需要 API Key 就能体验完整流程,降低试用门槛

链接


如果觉得有用,去 GitHub 点个 Star 吧 —— 这是对独立开发者最大的鼓励。

有问题或建议,评论区见!