我做了一个多模型 Agent 终端工作台请大家品鉴

0 阅读5分钟

最近我一直在思考一个问题:AI 编程助手已经能写代码、解释报错、执行命令,但为什么在真实工程任务里,还是经常觉得“不够顺手”?

原因很简单:真实工程不是一次问答。

一个实际任务通常会包含:读代码、查文件、跑命令、改 patch、看测试、继续修、切模型、拆子任务、中断后恢复。单个聊天窗口很难把这些工程动作组织好。

所以我做了 AgentHub:一个面向真实工程任务的多模型、多工具、多 Agent 终端工作台。

它解决什么问题

普通 AI CLI 往往适合“问一个问题,改一个点”。但复杂一点的任务会马上暴露几个问题:

  • 上下文容易丢,重启或切模型后要重新解释;
  • 工具调用边界不清楚,shell、写文件、网络访问需要可控;
  • 不同模型适合不同任务,但工作流不统一;
  • 大文件重构、批量修复、文档清理这类任务需要拆分;
  • 子任务结果需要被主 Agent review,而不是各干各的;
  • 本地交互和自动化执行最好使用同一套运行时。

AgentHub 不是想再做一个聊天壳,而是把这些动作组织成工程工作流。

Codex 风格能力是底座

AgentHub 的基础体验接近 Codex 风格:在终端里打开一个工程目录,让 Agent 真正在仓库里工作。

它支持:

  • 以当前工作目录作为工程上下文;
  • 搜索和读取文件;
  • 执行 shell;
  • 应用 patch;
  • 根据测试结果继续修复;
  • 使用 tool-calls 分步骤完成任务;
  • 通过 approval policy 和 sandbox policy 控制风险;
  • 保存 thread,并通过 resume 从中断处继续。

也就是说,它不是纯聊天工具。它的目标是让 Agent 能在仓库里完成实际工程动作。

在 Codex 风格之上扩展多模型

真实使用中,不同模型的适用场景不一样。

例如:

  • 用一个模型做架构分析;
  • 用另一个模型做代码修改;
  • 用更便宜的模型跑批量子任务;
  • 用主 Agent 做最终 review 和提交前验证。

AgentHub 支持 OpenAI、Anthropic、GLM、DeepSeek 等 provider,并把它们适配到统一运行时。常用命令类似:

/provider
/providers
/model gpt-5.4 high

如果 provider 配置出错,它会显示当前 provider、模型、配置来源和最近一次异常,方便定位 API key、base_url、订阅、地区限制等问题。

会话恢复:长任务不用从头来

工程任务经常会被中断。比如重构到一半关了终端,或者第二天继续做。

AgentHub 支持 thread 持久化和恢复:

/resume <thread_id>
/resume_last
/resume_path <rollout_path>

恢复后,之前的可见上下文、工具结果、文件分析和任务进度可以继续使用。

这对长任务很重要。尤其是重构、测试修复、代码审计、文档整理这类任务,不能每次都让模型重新理解一遍。

多 Agent 和后台任务

复杂任务适合拆。

比如一个大文件拆分任务,可以这样推进:

  1. 主 Agent 先分析文件结构;
  2. 拆出几个独立子任务;
  3. 子 Agent 或后台任务分别处理;
  4. 主 Agent review diff;
  5. 跑最小测试门;
  6. 通过后提交。

AgentHub 提供 delegated agent 和 background teammate,典型命令包括:

/spawn_agent ...
/send_input <agent_id> <message>
/wait_agent <agent_id>
/close_agent <agent_id>
/background_teammate ...
/background_task_status <task_id>

这里的重点不是“并发越多越好”,而是主 Agent 负责把控质量,子 Agent 负责处理明确、可验证的局部任务。

插件化和工具层

AgentHub 内置统一工具层,包括:

  • shell 执行;
  • 文件读取和搜索;
  • patch 应用;
  • Web 搜索;
  • 网页抓取;
  • 浏览器自动化;
  • 图片查看;
  • 插件命令;
  • 后台任务控制。

同时它支持插件化,把业务能力放到插件里,而不是塞进主程序。

例如 GitHub 插件可以处理 issue、评论、label、workflow dispatch,以及审批后的写操作。后续也可以接入更多业务系统或团队内部工具。

安装方式

Linux/macOS 最简单是一行命令:

curl -fsSL https://raw.githubusercontent.com/hoteye/AgentHub/main/scripts/install_agenthub_cli.sh | bash

安装后运行:

agenthub-cli
agenthub-cli --headless --prompt "/provider"

Windows 用户可以从 Release 页面下载压缩包,解压后运行:

.\agenthub-cli.exe
.\agenthub-cli.exe --headless --prompt "/provider"

项目地址:github.com/hoteye/Agen…
Release:github.com/hoteye/Agen…

一个实际使用场景

假设我要重构一个 TUI 里的大文件。

以前的做法通常是:我先看代码,让 AI 给建议,再手动复制上下文,反复让它改。任务一长,上下文就散了。

使用 AgentHub 后,流程会更像工程协作:

  • 主 Agent 读取文件并分析结构;
  • 拆出具体的重构卡片;
  • 子任务分别处理 UI、状态、runtime、测试;
  • 主 Agent review 每个 diff;
  • 跑最小测试门;
  • 最后提交。

这类工作流才是我认为 AI 编程助手真正有价值的地方:不是只给答案,而是参与一个可恢复、可验证、可审计的工程过程。

总结

AgentHub 的定位可以概括为一句话:

一个面向真实工程任务的多模型、多工具、多 Agent 终端工作台。

它保留 Codex 风格的终端工程能力,同时扩展多 provider、多 tab、多子任务、插件和后台任务编排。

如果你只是偶尔问代码问题,一个普通聊天工具就够了。
如果你希望 AI 真正参与仓库级工程流程,AgentHub 这类工作台会更合适。