
你让 AI "帮我调研一下新能源汽车市场,整理一份报告",它开始干活,搜索资料、访问网页、记录笔记...然后突然卡住了,或者跑偏了,最后给你一堆半成品。
这就是 AI 代理的通病:开始很热情,但很难坚持到底。
Hermes Agent 最新版本 v0.13.0(代号"The Tenacity Release",坚韧版)就是来解决这个问题的。这个版本的核心主题只有一个:让 AI 代理能够完成它开始的任务。
Github:
一句话说清楚:v0.13.0 带来了什么?
这个版本相当于给 Hermes Agent 装上了"任务必达"系统:多代理协作看板保证任务不遗漏,目标锁定防止跑偏,会话恢复不怕中断。
简单说,你的 AI 代理现在更像一个靠谱的团队成员,而不是一个容易分心的临时工。
与上一版本对比
| 特性 | v0.12.0 | v0.13.0 |
|---|---|---|
| 多代理协作 | ❌ | ✅ 看板系统 |
| 目标锁定 | ❌ | ✅ /goal 命令 |
| 视频理解 | ❌ | ✅ video_analyze |
| 声音克隆 | ❌ | ✅ xAI 语音 |
| 国际化 | 部分 | ✅ 7 种语言 |
| 会话恢复 | ❌ | ✅ 自动恢复 |
| 安全加固 | 基础 | ✅ 8 个 P0 修复 |
重磅特性一:多代理看板(Multi-agent Kanban)
这是什么?
想象你有一个项目看板,上面贴着各种任务卡片。现在不是你在拖动这些卡片,而是多个 AI 代理在协作完成它们。
这就是 Multi-agent Kanban——一个持久的多代理任务板,你可以把任务丢上去,让多个 Hermes 代理工人去认领、执行、交接、完成。
为什么重要?
以前的 AI 代理是"单兵作战",一个代理干所有事。但复杂任务往往需要分工:有的负责搜索,有的负责分析,有的负责写作。
多代理看板让这一切自动化:任务在看板上流转,代理之间自动交接,系统还会监控进度。
可靠性保障
这个看板不是简单的任务列表,它有一套完整的"可靠性机制"。心跳检测让每个代理定期报告"我还活着,正在干活";僵尸检测发现代理卡住了就自动回收任务;重试预算让任务失败自动重试但有限度,不会无限循环;幻觉门检测到代理在"胡说八道"就自动纠正或转交。简单说,这是一个真正能把任务做完的 AI 团队。
重磅特性二:目标锁定(/goal)
这是什么?
你有没有发现,和 AI 对话几轮后,它经常会忘记最初要做什么?你让它"写一篇关于 Python 的教程",聊着聊着它开始教你 JavaScript 了。
/goal 命令就是来解决这个问题的。它把目标"锁"在代理的记忆里,无论对话多少轮,代理都不会忘记最初的目标。
怎么工作?
当你输入 /goal 写一篇 Python 入门教程,面向零基础读者,代理会把这个目标作为第一优先级。即使在对话中你问了很多旁支问题,当你说"继续"时,它还是会回到写教程的主线上。这就像是给 AI 装了一个"指南针",不管走多远,都知道方向在哪里。
重磅特性三:视频理解(video_analyze)
这是什么?
以前 AI 只能看文字和图片,现在它能看视频了。
新的 video_analyze 工具让 Hermes Agent 可以原生理解视频内容。你丢给它一个 YouTube 链接或本地视频文件,它能总结视频讲了什么、提取关键信息和时间戳、回答关于视频内容的问题。
适用场景
比如"帮我总结一下这个 30 分钟的技术演讲"、"从这段产品演示视频中提取所有功能点"、"这个教程视频的第 15 分钟讲了什么?"这类需求都能搞定。
目前支持 Gemini 和兼容的多模态模型。
重磅特性四:声音克隆(xAI Custom Voices)
这是什么?
Hermes Agent 现在支持 xAI 的自定义语音合成,包括声音克隆。什么意思?你可以录制一段自己的声音,让 AI 用你的声音说话,或者克隆任何授权的声音。
应用场景
这个特性可以用来制作个性化的语音助手、生成带特定音色的播客内容,或者为视障用户创建熟悉的语音交互。
重磅特性五:国际化支持
支持哪些语言?
Hermes Agent 现在会说 7 种语言了:中文、日语、德语、西班牙语、法语、乌克兰语、土耳其语。不仅是界面翻译,连文档网站都支持中文(zh-Hans)了。
为什么重要?
对于非英语用户来说,能用母语和 AI 交互大大降低了使用门槛。特别是中文支持,对国内用户来说简直是刚需。
重磅特性六:Google Chat 支持
这是什么?
Hermes Agent 现在支持第 20 个消息平台——Google Chat。
你可以在 Google Chat 里直接@Hermes Agent,让它帮你搜索资料、分析数据、生成报告、执行各种任务。
平台生态
从 Discord、Slack、Telegram,到微信、QQ、飞书,再到现在的 Google Chat,Hermes Agent 的平台支持已经非常全面。不管你的团队用什么沟通工具,都能接入这个 AI 助手。
重磅特性七:会话恢复
这是什么?
以前的痛点:网关重启、服务更新、网络中断...对话就断了,一切从头开始。
现在 Hermes Agent 支持会话自动恢复。无论什么原因导致中断,当服务恢复后,对话会自动续上,就像什么都没发生一样。
适用场景
服务器维护后自动恢复、/update 命令重启后无缝衔接、配置文件热更新不丢失上下文,这些场景都受益。
重磅特性八:安全加固
修复了哪些安全问题?
这个版本关闭了 8 个 P0 级安全漏洞。敏感信息脱敏现在默认开启,API 密钥、密码等不会泄露;Discord 权限修复防止跨服务器私信绕过(CVSS 8.1);WhatsApp 陌生人过滤默认拒绝陌生人消息;TOCTOU 窗口修复解决了 auth.json 和 MCP OAuth 的竞态条件问题;浏览器 SSRF 防护防止访问云元数据服务;Cron 注入防护扫描组装技能内容的提示注入;调试日志脱敏让 hermes debug share 上传时自动脱敏。简单说,这个版本默认更安全了。
版本数据一览
这次更新规模不小:版本号 v0.13.0 (v2026.5.7),代号 The Tenacity Release(坚韧版),代码提交 864 次,合并 PR 588 个,修改文件 829 个,新增代码 128,366 行,关闭 Issue 282 个(包括 13 个 P0、36 个 P1),社区贡献者 295 位。
快速升级指南
升级到最新版本
# 如果你用 pip 安装
pip install -U hermes-agent
# 如果你用 Docker
docker pull nousresearch/hermes-agent:latest
# 如果你从源码安装
git pull origin main
pip install -e .
新功能尝鲜
试试多代理看板:
/kanban create "市场调研项目"
锁定目标:
/goal 完成 Q2 销售数据分析报告
分析视频:
/video_analyze https://youtube.com/watch?v=xxx
适合谁升级?
强烈推荐升级:
- 需要 AI 完成复杂、多步骤任务的用户
- 使用多代理协作场景的团队
- 对安全性有较高要求的企业用户
- 需要视频分析能力的创作者
可以观望:
- 只使用基础聊天功能的个人用户
- 当前版本运行稳定的生产环境(建议测试后再升级)
Github:
总结:AI 代理的"成年礼"
Hermes Agent v0.13.0 不只是一个功能更新,更像是 AI 代理的"成年礼"。
它解决了 AI 代理最大的痛点——无法坚持到底。通过多代理看板、目标锁定、会话恢复等机制,现在的 Hermes Agent 更像一个靠谱的团队成员,而不是一个容易分心的临时工。
如果说之前的 AI 代理是"试试看",那么从这个版本开始,你可以真正"托付任务"了。
关注
如果这篇文章对你有帮助,欢迎点赞、在看、转发三连。我们会持续跟进 Hermes Agent 的最新动态,分享更多 AI 代理的实战经验。