Hermes Agent 一周动态-2026-W21

0 阅读15分钟

日期范围: 2026-05-15 - 2026-05-21 摘要: 本周最大事件是 v0.14.0"基础版本"正式发布,808 commits、633 PRs、215位贡献者,新增 xAI Grok SuperGrok OAuth、OpenAI 兼容本地代理、x_search 工具、微软 Teams 全栈、PyPI 正式发布、冷启动提速 ~19 秒、浏览器 CDP 提速 180x;HN 出现一则关于版权争议 issue 的讨论;Gateway、Slack、Telegram 等组件本周出现多条活跃修复 PR。


W21 周报封面

版本发布

1. v0.14.0 — "The Foundation Release"(2026-05-16)

发布链接: v2026.5.16 时间: 2026-05-16 类型: Stable(Latest) 规模: 808 commits · 633 merged PRs · 1393 files changed · 165,061 insertions · 215 社区贡献者 关闭问题: 545 issues(含 12 P0 + 50 P1)

摘要: 迄今规模最大的版本,核心目标是"能在任何地方安装和运行,内置你实际想用的功能,剔除你用不上的"。主要亮点:xAI Grok SuperGrok OAuth 登入(grok-4.3 升至 1M context window)、hermes proxy OpenAI 兼容本地代理、x_search 推特搜索工具、微软 Teams 端对端接入、pip install hermes-agent 正式上线 PyPI、冷启动提速约 19 秒、browser CDP 速度提升 180x、LINE + SimpleX Chat 两大新平台(共 22 个平台)、跨会话 1h Claude prompt 缓存、/handoff 实时会话迁移、Telegram/Discord clarify 按钮 UI、原生 Windows 测试版。

核心特性:

  • xAI Grok via SuperGrok OAuth — 用 xAI 账号无需 API key 即可驱动 Grok 模型;grok-4.3 上下文窗口扩展至 100 万 token(PR #26534, #26664)
  • OpenAI 兼容本地代理 hermes proxy — 一行命令将 Claude Pro / ChatGPT Pro / SuperGrok 等 OAuth 提供商暴露为标准 OpenAI 接口,Codex CLI / Aider / Cline / Continue 均可直连(PR #25969)
  • x_search 推特搜索工具 — 内置 X 搜索,支持 OAuth 或 API key 鉴权,无需额外 skill(PR #26763)
  • 微软 Teams 端对端 — Graph 认证 + Webhook 监听 + Pipeline 插件运行时 + 投递全链路打通(PR #21922–#22024)
  • 安装去膨胀化 — Slack/Matrix/语音/图像生成等重型后端改为首次使用时懒安装;pip install hermes-agent 正式进入 PyPI(PR #24220, #25766, #26593)
  • 冷启动提速 ~19 秒 — 重型适配器延迟加载,模型目录优先读磁盘缓存,doctor 检查并行,hermes tools 从 14 秒降至 1.5 秒以内(PR #22138 等)
  • browser CDP 速度提升 180x — 复用持久 Chrome DevTools 连接(PR #23226)
  • 跨会话 1h Claude prompt 缓存 — Anthropic / OpenRouter / Nous Portal 下系统 prompt 跨 session 缓存 1 小时,重开会话更快更便宜(PR #23828)
  • /handoff 实时会话迁移 — 调试中途可将完整上下文切换到任意模型/人设/profile,不丢失任何内容(PR #23395)
  • LINE + SimpleX Chat — 新增两个平台,总计支持 22 个通讯平台(PR #23197, #26232)
  • Discord 历史消息回填 — 首次进入频道时自动读取历史,不再"从零开始"(PR #25984)
  • 原生 Windows 测试版 — Windows 首次作为一等公民平台支持

v0.14.0 核心功能亮点


活跃 Issues(2026-05-15 ~ 2026-05-21)

2. [Discussion] 心智孪生体:五层递进蒸馏记忆架构(#29549)

来源: Issue #29549 时间: 2026-05-21 状态: 进行中(讨论)

摘要: 社区用户 shaolin-cloud 提出一套从第一性原理出发的 Hermes Memory 进化架构,称为"心智孪生体",采用五层递进蒸馏模型(感知→工作→情节→语义→元认知),主张彻底重新设计现有记忆系统的存储与检索逻辑。这类大胆提案在 issue 区越来越常见,反映出社区对 Hermes memory 模块的高度关注。


3. [Bug] v0.14.x MiniMax 自定义 provider Vision 路由异常(#29542)

来源: Issue #29542 时间: 2026-05-21 优先级: P3 标签: type/bug, tool/vision, provider/minimax, area/config

摘要: v0.14.0 发布后出现的回归问题,使用 MiniMax 自定义 provider 时 vision 路由失效,图像分析任务无法正常调度。涉及 area/configtool/vision 组件,当前无已知 workaround,正在调查中。


4. [Bug] Claude Max OAuth token 每次请求返回 HTTP 400(#15080)

来源: Issue #15080 时间: 2026-04-24(本周持续活跃,2026-05-21 更新) 优先级: P1 标签: area/auth, provider/anthropic, type/bug

摘要: Claude Max 20x 订阅用户通过 ~/.claude/.credentials.json 中的 OAuth token 调用原生 Anthropic 端点时,每次请求均返回 HTTP 400。v0.14.0 已关闭大量 P1 issue,但此问题仍处于开放状态,是目前 auth 模块最高优先级的未解决 bug,影响订阅制用户直连 Anthropic 的正常使用。


5. [Show & Tell] hermes-memory-pgvector v0.3 — Postgres+pgvector 记忆插件(#29537)

来源: Issue #29537 时间: 2026-05-20 标签: comp/plugins, tool/memory, type/feature

摘要: 社区开发者 andreab67 发布 hermes-memory-pgvector v0.3,作为 drop-in Postgres + pgvector 记忆提供者插件。可替换默认记忆后端,利用向量索引实现语义搜索,对需要大规模长期记忆的场景有明显优势,安装一行命令即可切换。


6. [Bug] approval.py gateway 自动拒绝模式泄露警告文本到 agent 输出(#29511)

来源: Issue #29511 时间: 2026-05-20 优先级: P2 标签: comp/gateway, comp/tools, type/bug

摘要: 在 gateway 模式下启用 auto-deny 时,approval.py 将"DANGEROUS COMMAND"警告文本直接输出到 agent 的可见响应中,导致下游消费者(Slack/Discord bot 等)接收到污染的输出内容。这是 v0.14.0 后 gateway 组件的回归问题,目前有临时 workaround(关闭 auto-deny),对生产部署影响较大。


7. [Feature] Gateway 支持在单进程内将 chat/thread 消息路由到不同 Hermes profiles(#29535)

来源: Issue #29535 时间: 2026-05-20 优先级: P3 标签: comp/gateway, area/config, type/feature

摘要: 用户希望在单个 gateway 进程中根据 channel/thread 类型将消息路由到不同的 Hermes profile,而无需为每个 profile 启动独立的 gateway 实例。这是多租户/多角色部署场景下的核心需求,与已有的 Multi-Role Auto-Routing issue #5143 有重叠,本周被重新提及。


8. [Setup] Discord gateway 配置需要手动编辑 .env/config.yaml — 体验差(#29534)

来源: Issue #29534 时间: 2026-05-20 优先级: P3 标签: comp/cli, comp/gateway, platform/discord, type/feature

摘要: Discord gateway 的初始化仍然要求用户手动编辑 .envconfig.yaml,没有 interactive setup wizard 引导。v0.14.0 已经极大改善了安装体验,但 Discord bot 部署路径仍是摩擦最多的环节之一,社区普遍希望与 hermes setup 向导集成。


活跃 PRs(2026-05-15 ~ 2026-05-21)

9. fix(runtime): preserve named user provider identity(#29548)

来源: PR #29548 时间: 2026-05-21 优先级: P2 标签: area/config, comp/cli, type/bug

摘要: 修复 runtime 中命名 provider 的用户身份信息在某些路径下被丢失的问题(2 tasks done,6 条评论)。P2 优先级,与 provider 身份验证链路相关,预计近期合并。


10. fix: Telegram DM topics 新消息路由到已有 session(#29546)

来源: PR #29546 时间: 2026-05-21 优先级: P2 标签: comp/gateway, platform/telegram, type/bug

摘要: 修复 Telegram "All Messages" 主题中的新 DM topics 被错误路由到旧 session 的问题(标记为 duplicate,另有相关 PR),属于 gateway session dispatch 层的 bug,在多 topic 群组中尤为明显。


11. fix(deps): align aiohttp pins with lazy Slack deps(#29538)

来源: PR #29538 时间: 2026-05-21 优先级: P2 标签: dependencies, platform/slack, type/bug

摘要: v0.14.0 引入懒加载依赖机制后,aiohttp 的版本约束与 Slack 适配器的延迟安装路径不兼容,导致 Slack gateway 在特定环境下安装失败。此 PR 对齐两侧 pin 版本(15/19 tasks 完成)。


12. fix(slack): surface Block Kit content in fetched thread context(#29541)

来源: PR #29541 时间: 2026-05-21 优先级: P2 标签: comp/gateway, platform/slack, type/bug

摘要: 修复 Slack gateway 在获取消息线程上下文时丢失 Block Kit 内容(富文本、按钮、交互组件)的问题,导致 agent 无法感知消息的完整结构。这是 Slack 平台用户反映较多的感知能力缺失问题。


13. feat(gateway): persistent busy queue with file-backed storage(#28937)

来源: PR #28937 时间: 2026-05-19 优先级: P2 标签: comp/gateway, type/feature

摘要: 为 gateway 新增文件持久化的繁忙队列,解决进程重启后正在处理的任务丢失的问题。对需要高可靠性的生产部署(如 Slack/Discord bot)有重要意义,特别是处理大型代码库任务时崩溃恢复能力的提升。


14. feat(web): route GitHub and X URLs in web_extract(#29487)

来源: PR #29487 时间: 2026-05-20 优先级: P3 标签: comp/tools, tool/web, type/feature

摘要: 扩展 web_extract 工具,识别 GitHub 和 X (Twitter) URL 时自动路由到专用提取逻辑(而非通用 HTML 抓取),提高这两个平台内容的解析质量。与本周上线的 x_search 工具形成互补,共 7 条评论,进度 68%。


15. feat(cli): add provider validation harness(#29540)

来源: PR #29540 时间: 2026-05-21 优先级: P3 标签: comp/cli, type/feature

摘要: 在 CLI 中新增 provider 连接验证框架,允许用户在正式使用前快速验证所有配置的 provider 是否可达、鉴权是否有效。配合 v0.14.0 的多 provider OAuth 扩展,有效减少配置排错难度。


社区动态

16. HN:Nous Research 编辑 issue 删除抄袭指控(#10232)

来源: Hacker News — item #48187581 时间: 2026-05-19 热度: 7 pts / 0 评论

摘要: Hacker News 出现一篇标题为"Nous Research edits GitHub issue to remove plagiarism claims about Hermes Agent"的帖子,链接至 issue #10232。原帖子似乎包含关于 Hermes Agent 与其他项目的代码相似性争议,随后被编辑或内容变更。目前 HN 讨论量极低(0 评论),尚无法判断事件全貌,值得持续关注。


17. Reddit:v0.14.0 发布后社区评测热潮

来源: r/LocalLLaMA — Tried every Hermes Agent alternative 时间: 2026-05-19 热度: 0 票 / 47 评论

摘要: 一篇对比评测帖"Tried every Hermes Agent alternative so you don't have to (2026 roundup)"引发 47 条评论,显示社区对当前 AI agent 框架格局仍有大量讨论需求。另有用户分享 Qwen3.6-35B + Hermes Agent 在 NVIDIA DGX Spark 的优化经验(34 票 / 24 评论),反映本地部署社区围绕 v0.14.0 重新活跃。


待跟踪事项(carry-over 状态更新)

事项上期状态本周状态备注
Gateway 内存泄漏 _evict_cached_agent (#25315, P1)未解决未解决v0.14.0 未提及此修复
Cron CLI 创建任务静默不触发 (#25295, P1)未解决未解决v0.14.0 P1 closures 未见此 issue
Anthropic base_url 重复 /v1(#24877/#24873/#24876, P2)3 PR 待合并可能已关闭v0.14.0 633 PRs 合并,P2 大量清理,待确认
Gemini-3-Flash 并行 tool_call JSON 丢弃 (#25333)未解决未解决无相关更新
Hindsight + 切换模型触发 IndexError (#25325, P3)未解决未解决低优先级,暂无更新
Windows 系统代理导致 502 (#25319, P2)未解决可能改善v0.14.0 引入 Native Windows beta,代理处理可能有变化
Discord 自由回复线程行为 (#12304)已合并,观察中正常本周无新报告

数据概览

维度数据
GitHub Stars约 159,665(+约 2,000 本周,v0.14.0 发布带动)
GitHub Forks25,923
开放 Issues4,399
开放 PRs8,119 open / 14,399 closed
本周版本发布1 次 stable(v0.14.0)
v0.14.0 合并 PRs633 个
v0.14.0 贡献者215 人
HN 热度1 篇(7 pts,争议性话题)
Reddit r/LocalLLaMA3 条相关帖子,最热 47 评论
本周核心主题v0.14.0 Foundation Release、Gateway 增强、平台接入扩展

hermes-memory-pgvector v0.3 深度分析

多 Agent 记忆方案对比

背景:它解决了什么问题?

作者 andreab67 运营一套 7个专职 minion 的 ops 编排栈(marketing / sales / trading / morning-report / intraday-sre / intraday-cloud / incident),跑在单台 VM 上。核心痛点是:现有所有内置或第三方记忆后端在多 agent 并发写入场景下都有结构性缺陷:

方案缺陷
内置 memory 工具写到本地 MEMORY.md/USER.md,多个 minion 在同一主机上相互覆写;跨主机没有共享存储
Honcho功能全,但记忆热路径中有 LLM 调用(deriver + dialectic),高并发下产生重试风暴、embed 队列积压、gateway↔Honcho 循环依赖
Holographic轻量,但底层是 SQLite,多 minion 并发写容易锁冲突
Mem0 / Hindsight / Supermemory 等需要付费云或 LLM 介入写路径,两者均不可接受

核心缺口:一个能给内置 memory 模型提供持久化、多租户、语义可检索后端的纯存储层,不在热路径引入 LLM。


技术架构

each minion
  → X-Hermes-Session-Key: <theme>   ← 每个 minion 设置自己的主题标签
  → hermes-agent gateway
  → pgvector plugin
      ├── memory_entries             ← 镜像内置 MEMORY.md / USER.md,按主题隔离
      └── conversations              ← 每轮有效对话,语义可检索

关键设计决策:

  1. 存储层,不是记忆模型 — agent 继续使用原有 memory(action='add', ...) 工具,插件通过 on_memory_write 钩子透明镜像写入,agent 不需要学习新接口。

  2. 记忆热路径无 LLM — 写入路径只做向量嵌入(数学运算),没有推导(deriver)、辩证(dialectic)、"dream cycle"等流程,Honcho 的失效模式在设计上不可能发生。

  3. AsyncWriter + psycopg_poolon_memory_write 钩子微秒级返回,实际嵌入+写入在后台 daemon 线程异步完成,不阻塞 agent 循环。队列满则丢弃并发出一次警告,DB 宕机则记录日志并跳过,任何异常都不向上冒泡。

  4. 每 minion 主题隔离,按需跨主题检索X-Hermes-Session-Key: marketing 写入的记忆默认只对 marketing minion 可见;需要时 recall_memory(query, scope='all') 可跨主题搜索。

  5. 管理员/运行时权限分离 — DDL(建表/建索引)用超级用户一次性执行;运行时用户只有 DML 权限,启动时仅做 schema 存在性校验,若 migration 未运行则抛明确的 SchemaNotApplied 错误,不在生产重启时偷偷跑迁移。

数据库结构(v0.3 主要 API):

钩子/工具行为
initialize()验证 schema,开启连接池,批量导入已有 MEMORY.md/USER.md
on_memory_write(action, target, content, meta)镜像 add/replace/remove 写入 memory_entries
sync_turn(user, assistant, session_id)捕获有效对话轮次(≥40字符,过滤"ok"/"thanks"/"continue"等无效回复)写入 conversations
prefetch(query)当前主题下语义最近的 Top-K memory_entries,自动注入上下文
recall_memory(query, scope, target, limit)Agent 可主动调用的跨主题记忆检索工具
recall_conversation(query, scope, limit)Agent 可主动调用的历史对话检索工具,scope ∈ {current, session, all, <theme>}

Roadmap(M1-M6)

从 ROADMAP.md 梳理的演进路径:

  • M1(v0.1 已完成) — 共享存储 + 每 agent 主题,基础 HNSW 索引
  • M2(v0.3 部分) — 会话历史捕获(conversations 表),recall_conversation 工具,boilerplate 过滤
  • M3(规划中) — 从历史聊天记录批量导入;v0.3.1 将新增 per-theme allowlist 防止错误 session key 静默创建新主题
  • M4-M6(远期) — 跨 minion 知识合成,记忆过期策略,multi-host 分片部署

社区反馈评估

现状:插件发布于 2026-05-20,Discussion #1 有 1 个 upvote(作者自己),0 回复;主仓库 issue #29537 无评论,维护者 alt-glitch 在发布后约 13 分钟内打上了 P3/comp/plugins/tool/memory/type/feature 标签——这是项目组收到、归档,但暂未分配优先级的典型处理方式。

信号解读:

  • 正面:维护者快速响应并分类(不是无人理会);作者声称已在真实 7-minion 生产栈运行数月,有实际验证;技术设计方向(无 LLM 热路径、per-agent 隔离)与 Hermes Agent 社区讨论中的核心诉求高度吻合。
  • 局限:目前社区互动量极低,可能因为 Discussions 在主仓库关闭,Show & Tell 渠道摩擦较大;插件处于非常早期阶段(作者一人);M3 以后的路线图还停留在规划层面。
  • 适用门槛:需要自建 Postgres + pgvector 实例 + 配置 embedding endpoint,对纯托管用户或不熟悉 Postgres 运维的用户门槛较高。

总结:这是一个定向性强、设计务实的社区插件,填补了多 agent 专职部署场景下记忆隔离的真实空白。v0.3 本身功能完整,值得运行多 agent 编排的团队关注。但受制于发布时间短、社区讨论渠道受限,短期内进入主仓库的可能性低,更可能以独立插件形式演进。

本周 Gateway 修复聚焦