Hermes v0.13 大更新:使命必达

0 阅读7分钟

你让 AI "帮我调研一下新能源汽车市场,整理一份报告",它开始干活,搜索资料、访问网页、记录笔记...然后突然卡住了,或者跑偏了,最后给你一堆半成品。

这就是 AI 代理的通病:开始很热情,但很难坚持到底

Hermes Agent 最新版本 v0.13.0(代号"The Tenacity Release",坚韧版)就是来解决这个问题的。这个版本的核心主题只有一个:让 AI 代理能够完成它开始的任务

Github:

github.com/NousResearc…

一句话说清楚:v0.13.0 带来了什么?

这个版本相当于给 Hermes Agent 装上了"任务必达"系统:多代理协作看板保证任务不遗漏,目标锁定防止跑偏,会话恢复不怕中断

简单说,你的 AI 代理现在更像一个靠谱的团队成员,而不是一个容易分心的临时工。

与上一版本对比

特性v0.12.0v0.13.0
多代理协作✅ 看板系统
目标锁定✅ /goal 命令
视频理解✅ video_analyze
声音克隆✅ xAI 语音
国际化部分✅ 7 种语言
会话恢复✅ 自动恢复
安全加固基础✅ 8 个 P0 修复

重磅特性一:多代理看板(Multi-agent Kanban)

这是什么?

想象你有一个项目看板,上面贴着各种任务卡片。现在不是你在拖动这些卡片,而是多个 AI 代理在协作完成它们

这就是 Multi-agent Kanban——一个持久的多代理任务板,你可以把任务丢上去,让多个 Hermes 代理工人去认领、执行、交接、完成。

为什么重要?

以前的 AI 代理是"单兵作战",一个代理干所有事。但复杂任务往往需要分工:有的负责搜索,有的负责分析,有的负责写作。

多代理看板让这一切自动化:任务在看板上流转,代理之间自动交接,系统还会监控进度。

可靠性保障

这个看板不是简单的任务列表,它有一套完整的"可靠性机制"。心跳检测让每个代理定期报告"我还活着,正在干活";僵尸检测发现代理卡住了就自动回收任务;重试预算让任务失败自动重试但有限度,不会无限循环;幻觉门检测到代理在"胡说八道"就自动纠正或转交。简单说,这是一个真正能把任务做完的 AI 团队。

重磅特性二:目标锁定(/goal)

这是什么?

你有没有发现,和 AI 对话几轮后,它经常会忘记最初要做什么?你让它"写一篇关于 Python 的教程",聊着聊着它开始教你 JavaScript 了。

/goal 命令就是来解决这个问题的。它把目标"锁"在代理的记忆里,无论对话多少轮,代理都不会忘记最初的目标。

怎么工作?

当你输入 /goal 写一篇 Python 入门教程,面向零基础读者,代理会把这个目标作为第一优先级。即使在对话中你问了很多旁支问题,当你说"继续"时,它还是会回到写教程的主线上。这就像是给 AI 装了一个"指南针",不管走多远,都知道方向在哪里。

重磅特性三:视频理解(video_analyze)

这是什么?

以前 AI 只能看文字和图片,现在它能看视频了。

新的 video_analyze 工具让 Hermes Agent 可以原生理解视频内容。你丢给它一个 YouTube 链接或本地视频文件,它能总结视频讲了什么、提取关键信息和时间戳、回答关于视频内容的问题。

适用场景

比如"帮我总结一下这个 30 分钟的技术演讲"、"从这段产品演示视频中提取所有功能点"、"这个教程视频的第 15 分钟讲了什么?"这类需求都能搞定。

目前支持 Gemini 和兼容的多模态模型。

重磅特性四:声音克隆(xAI Custom Voices)

这是什么?

Hermes Agent 现在支持 xAI 的自定义语音合成,包括声音克隆。什么意思?你可以录制一段自己的声音,让 AI 用你的声音说话,或者克隆任何授权的声音。

应用场景

这个特性可以用来制作个性化的语音助手、生成带特定音色的播客内容,或者为视障用户创建熟悉的语音交互。

重磅特性五:国际化支持

支持哪些语言?

Hermes Agent 现在会说 7 种语言了:中文、日语、德语、西班牙语、法语、乌克兰语、土耳其语。不仅是界面翻译,连文档网站都支持中文(zh-Hans)了。

为什么重要?

对于非英语用户来说,能用母语和 AI 交互大大降低了使用门槛。特别是中文支持,对国内用户来说简直是刚需。

重磅特性六:Google Chat 支持

这是什么?

Hermes Agent 现在支持第 20 个消息平台——Google Chat。

你可以在 Google Chat 里直接@Hermes Agent,让它帮你搜索资料、分析数据、生成报告、执行各种任务。

平台生态

从 Discord、Slack、Telegram,到微信、QQ、飞书,再到现在的 Google Chat,Hermes Agent 的平台支持已经非常全面。不管你的团队用什么沟通工具,都能接入这个 AI 助手。

重磅特性七:会话恢复

这是什么?

以前的痛点:网关重启、服务更新、网络中断...对话就断了,一切从头开始。

现在 Hermes Agent 支持会话自动恢复。无论什么原因导致中断,当服务恢复后,对话会自动续上,就像什么都没发生一样。

适用场景

服务器维护后自动恢复、/update 命令重启后无缝衔接、配置文件热更新不丢失上下文,这些场景都受益。

重磅特性八:安全加固

修复了哪些安全问题?

这个版本关闭了 8 个 P0 级安全漏洞。敏感信息脱敏现在默认开启,API 密钥、密码等不会泄露;Discord 权限修复防止跨服务器私信绕过(CVSS 8.1);WhatsApp 陌生人过滤默认拒绝陌生人消息;TOCTOU 窗口修复解决了 auth.json 和 MCP OAuth 的竞态条件问题;浏览器 SSRF 防护防止访问云元数据服务;Cron 注入防护扫描组装技能内容的提示注入;调试日志脱敏hermes debug share 上传时自动脱敏。简单说,这个版本默认更安全了。

版本数据一览

这次更新规模不小:版本号 v0.13.0 (v2026.5.7),代号 The Tenacity Release(坚韧版),代码提交 864 次,合并 PR 588 个,修改文件 829 个,新增代码 128,366 行,关闭 Issue 282 个(包括 13 个 P0、36 个 P1),社区贡献者 295 位。

快速升级指南

升级到最新版本

# 如果你用 pip 安装
pip install -U hermes-agent

# 如果你用 Docker
docker pull nousresearch/hermes-agent:latest

# 如果你从源码安装
git pull origin main
pip install -e .

新功能尝鲜

试试多代理看板

/kanban create "市场调研项目"

锁定目标

/goal 完成 Q2 销售数据分析报告

分析视频

/video_analyze https://youtube.com/watch?v=xxx

适合谁升级?

强烈推荐升级

  • 需要 AI 完成复杂、多步骤任务的用户
  • 使用多代理协作场景的团队
  • 对安全性有较高要求的企业用户
  • 需要视频分析能力的创作者

可以观望

  • 只使用基础聊天功能的个人用户
  • 当前版本运行稳定的生产环境(建议测试后再升级)

Github:

github.com/NousResearc…

总结:AI 代理的"成年礼"

Hermes Agent v0.13.0 不只是一个功能更新,更像是 AI 代理的"成年礼"。

它解决了 AI 代理最大的痛点——无法坚持到底。通过多代理看板、目标锁定、会话恢复等机制,现在的 Hermes Agent 更像一个靠谱的团队成员,而不是一个容易分心的临时工。

如果说之前的 AI 代理是"试试看",那么从这个版本开始,你可以真正"托付任务"了。


关注

如果这篇文章对你有帮助,欢迎点赞、在看、转发三连。我们会持续跟进 Hermes Agent 的最新动态,分享更多 AI 代理的实战经验。