调查时间: 2026年5月29日
GitHub: tinyhumansai/openhuman
出品方: TinyHumans AI(独立团队,非大厂背景)
一、产品定位
“Your Personal AI super intelligence: Private, Simple and extremely powerful.”
OpenHuman 是一个开源桌面 AI 助手,以“个人记忆系统”为核心差异化卖点。标语直击行业痛点:
“Every model in the world shares the same fundamental limitation: they are stateless.”
它认为所有 LLM 都是“瞬时记忆”——你打完 prompt,上下文消失。OpenHuman 要做的事:把 AI 的记忆从“便利贴”升级为“Obsidian 知识库”。
| 特性 | 描述 |
|---|---|
| 定位 | 个人 AI 超智能体,记忆驱动的主动 Agent |
| 目标用户 | 技术用户 + 追求个人数据自主的高净值用户 |
| 运行环境 | 桌面端(Windows/macOS/Linux)+ 未来移动端 |
| 核心能力 | 118+ 服务集成、Memory Tree、Obsidian 式 Wiki、Voice/Meet 机器人 |
| 收费模式 | 统一订阅(一个订阅包含所有模型,自动路由) |
| 开源 | GPLv3 |
二、核心能力
2.1 Memory Tree(记忆树)
这是 OpenHuman 的灵魂能力:
- 数据源:118+ 服务 OAuth 接入(Gmail、GitHub、Slack、Notion、Stripe、Calendar、Drive、Linear、Jira 等)
- 处理流程:数据 → 确定性 pipeline → canonical Markdown,≤3k-token 块,打分 → 折叠进 per-source / per-topic / per-day 总结树
- 存储:SQLite 在本地,
.md文件同步到 Obsidian 可读的 Vault - 特点:记忆透明可读,用户可直接用 Obsidian 打开/编辑/手动链接(“You can’t trust a memory you can’t read”)
- 自动刷新:每 20 分钟无感抓取新数据,Agent 始终有“明天的上下文”
2.2 Obsidian Wiki 记忆层
和 Karpathy 的 obsidian-wiki 理念一脉相承:
- AI 推理用的同一批 chunks,直接落盘成
.md文件 - 用户可以用 Obsidian 手工补充、链接、标签
- 本地 SQLite + Markdown 双写,隐私与可编辑兼得
2.3 118+ 服务集成
通过 Composio 连接层实现一键 OAuth,官方声称“无需手动配 API Key”。覆盖:
- 邮件:Gmail
- 代码:GitHub、GitLab
- 办公:Notion、Slack、Linear、Jira、Stripe
- 日历:Google Calendar
- 云盘:Google Drive
- 等……
⚠️ 注意:托管模式(默认)下,OAuth 握手和工具调用通过 OpenHuman 后端代理。如需完全自控,可配置自己的 Composio API Key(direct mode),但部分实时 Webhook 触发需要自行托管。
2.4 TokenJuice 智能压缩
将 HTML 转为 Markdown、长 URL 缩短、工具输出去重压缩,通过规则叠加实现:
- CJK、emoji 逐字保留,不被误删
- 实测压缩率最高可达 80%
- 让“扫描半年邮件”这类操作的 token 成本降至个位数美元
2.5 自动模型路由
根据 hint 标签自动选择最优模型:
| Hint | 模型类型 | 场景 |
|---|---|---|
| hint:reasoning | 前沿大模型 | 复杂推理、深度分析 |
| hint:fast | 便宜快速模型 | 简单查询、快速响应 |
| vision | 视觉模型 | 图片理解 |
底层通过 OpenHuman 后端统一订阅,用户无感知切换。
2.6 Voice + 实时吉祥物
- STT 输入:语音指令
- TTS 输出:ElevenLabs 声音
- 吉祥物口型同步:桌面 mascot 实时唇形
- Google Meet 实时代理:作为真实参会者加入会议,转录存入 Memory Tree,可语音发言
2.7 内置工具集(开箱即用)
- 文件系统、Git、lint、测试、grep
- 浏览器控制、计算机控制
- Cron 调度、记忆工具
- 子 Agent 协同(spawn sub-agents)
- Web 搜索、网页抓取
三、技术架构
3.1 技术栈
| 层级 | 技术 |
|---|---|
| 核心语言 | Rust |
| 桌面框架 | Tauri + Chromium Embedded Framework (CEF) |
| 前端 | React + Tailwind CSS + TypeScript |
| 记忆存储 | SQLite(本地) |
| 文档格式 | Markdown(Obsidian 兼容) |
| 连接层 | Composio(OAuth 集成) |
| 本地 AI | Ollama / LM Studio(可选) |
| 订阅模式 | 统一后端托管订阅 |
3.2 代码结构
openhuman/
├── src/ # Rust 核心
│ ├── core/ # Agent、dispatch、memory、auth、socketio、event_bus
│ ├── api/ # API 层
│ └── rpc/ # RPC 协议
├── app/ # TypeScript 前端
│ ├── src/ # React 组件
│ ├── src-tauri/ # Tauri 原生壳(Rust)
│ └── src-tauri-mobile/
├── e2e/ # 端到端测试
└── packages/ # 工作区共享包
3.3 安装方式
| 平台 | 安装方式 |
|---|---|
| macOS | brew tap tinyhumansai/core && brew install openhuman |
| Linux (Debian/Ubuntu) | Signed apt repo(推荐) |
| Linux (Arch) | AUR: yay -S openhuman-bin |
| Windows | Signed .msi / .exe installer |
| 通用 | .dmg / .AppImage / .deb 直接下载 |
⚠️ 已知问题:AppImage 在 Wayland 和 Arch 上可能崩溃(#2463),推荐 Debian/Ubuntu 用户使用
.deb包。
四、版本与社区
| 指标 | 数据 |
|---|---|
| 最新版本 | v0.56.0(2026-05-27发布) |
| Stars | 29,229 |
| Forks | 2,759 |
| 主要贡献者 | senamakel(926次提交)、graycyrus、M3gA-Mind、oxoxDev |
| 成立时间 | 2026-02-18(距今约3个月) |
| 语言 | Rust |
| 许可证 | GPLv3 |
| Open Issues | 142 |
| 多语言 README | 英/中/日/韩/德 5 种 |
| 荣誉 | Product Hunt TOP 3,Trendshift TOP 1 repository |
发布节奏:平均每 2-3 天一个版本(v0.54 2026-05-19 → v0.56 2026-05-27),开发极为活跃。
五、竞品对比分析
5.1 一句话总结
| 产品 | 定位 |
|---|---|
| OpenHuman | 记忆驱动的个人 AI 超智能体,本地持久记忆 + 主动 Agent |
| Marvis | 操作系统级本地 AI 助手,帮人操作电脑/手机,面向普通用户 |
| OpenClaw | 将任意网站/应用转化为 CLI 工具,浏览器自动化,开发者工作流 |
| Hermes | Agent 运行时框架,调度工具、记忆、技能系统的执行引擎 |
| Claude Code | 专业编程助手,读代码库、写文件、执行终端命令、深度 IDE 集成 |
| OpenAI Codex | 编程 Copilot,嵌入开发流程的代码补全与生成工具 |
5.2 核心定位对比
| 面向用户 | 运行环境 | 核心任务 | 开源 | |
|---|---|---|---|---|
| OpenHuman | 技术用户 + 高隐私需求 | 桌面端(Win/Mac/Linux) | 个人记忆中枢 + 主动 Agent | ✅ GPLv3 |
| Marvis | 普通用户 | PC/手机/微信 | 操作系统操作 + 文件理解 | ❌ 腾讯闭源 |
| OpenClaw | 开发者 | 本地 CLI + 浏览器 | 网站→CLI 转化 + 浏览器自动化 | ✅ |
| Hermes | 技术用户 / 开发者 | 本地/服务器 | 任务编排 + 跨平台 Bot | ✅ |
| Claude Code | 专业开发者 | 终端 / IDE / 桌面 | 编程任务全自动闭环 | ❌ Anthropic SaaS |
| Codex | 开发者 | GitHub Copilot / API | 代码补全 / 生成 / 审查 | ❌ OpenAI SaaS |
5.3 能力矩阵
| 能力 | OpenHuman | Marvis | OpenClaw | Hermes | Claude Code | Codex |
|---|---|---|---|---|---|---|
| 持久记忆(本地) | ✅ Memory Tree + Obsidian | ✅ 本地模式 | ✅ 知识库 | ⚠️ 外部对接 | ❌ | ❌ |
| 118+ 服务集成 | ✅ OAuth 直连 | ❌ | ❌ | ⚠️ via 技能 | ❌ | ❌ |
| 操作电脑/手机 | ❌ | ✅ 系统级 | ❌ | ❌ | ❌ | ❌ |
| 浏览器自动化 | ❌ | ❌ | ✅ Chrome DevTools | ⚠️ via 技能 | ❌ | ❌ |
| 编程任务 | ⚠️ 弱 | ❌ | ❌ | ✅ via subagent | ✅ 核心能力 | ✅ 代码生成 |
| 文件理解 | ✅ 文档/图片 | ✅ Word/Excel/PPT/PDF | ✅ 知识库检索 | ✅ via tools | ✅ 深度读代码库 | ✅ 代码文件 |
| 多平台消息 | ❌ | ❌ | ❌ | ✅ 飞书/微信/Telegram | ❌ | ❌ |
| Voice / 视频会议 | ✅ Meet 机器人 | ❌ | ❌ | ⚠️ via 技能 | ❌ | ❌ |
| 自动模型路由 | ✅ 内置(订阅制) | ✅ DeepSeek/混元 | ✅ | ✅ 多 provider | ❌ | ❌ |
| 定时任务 / Cron | ✅ | ❌ | ❌ | ✅ | ❌ | ❌ |
| Skills / 工作流 | ⚠️ Subconscious Loop | ❌ | ❌ | ✅ 完善技能系统 | ❌ | ❌ |
| Token 压缩 | ✅ TokenJuice(80%) | ❌ | ❌ | ❌ | ❌ | ❌ |
| Obsidian 兼容 | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ |
| 隐私模式 | ✅ 完全本地 | ✅ 本地模式(需开启) | 部署自控 | 部署自控 | API 模式可选 | API 模式 |
⚠️ 说明:Hermes 的“飞书/微信/Telegram”能力来自技能/插件扩展,并非核心功能;OpenClaw 的“多平台”指浏览器自动化而非 IM 消息聚合。
5.4 技术架构对比
| 架构模式 | 本地部署 | 模型 | 语言 | |
|---|---|---|---|---|
| OpenHuman | Rust/Tauri 桌面 + Composio | ✅ 完全本地 + 可选托管 | 任意(统一订阅路由) | Rust + TypeScript |
| Marvis | 操作系统 Agent + 本地大模型 | ✅ 需安装客户端 | DeepSeek V4 + 混元 | 未公开 |
| OpenClaw | CLI 工具 + 浏览器自动化 | ✅ 本地运行 | 任意(适配器机制) | TypeScript |
| Hermes | Python Agent 运行时 + 工具调度器 | ✅ 完全自托管 | 任意 provider | Python |
| Claude Code | 单一编程 CLI 工具(SaaS) | ❌ | Claude 5 Sonnet | Python |
| Codex | IDE 插件 + API(SaaS) | ❌ | GPT-4o / o3 | Rust |
5.5 典型使用场景
OpenHuman — 个人数据中枢 + 主动记忆
- “帮我回顾过去一个月里,所有邮件中提到的项目里程碑”
- “整理 Obsidian 笔记,按主题生成本周知识摘要”
- “明早 8 点前给我一份 Google Calendar 上所有会议的摘要”
Marvis — 日常生活 + 轻办公
- “帮我整理桌面上的文档,按项目分类”
- “把这份合同的关键条款提取出来”
- “下周去上海的旅行攻略怎么样?”
OpenClaw — 浏览器自动化 + CLI 开发
- 将飞书文档页面转化为命令行接口操作
- 自动化网页数据抓取
- 浏览器多标签页批量管理
Hermes — 个人 AI 工作流自动化
- “每天早上 8 点给我发一份 A 股强势股筛选”
- “把网页内容总结后发到飞书知识库”
- 管理多平台消息、调度子任务
Claude Code — 专业编程闭环
- “帮我重构这个模块,添加单元测试”
- “解释这段代码,列出潜在 bug”
- 直接在代码库里工作,写文件、执行 git、跑测试
六、关键差异总结
6.1 各产品独特价值
| 产品 | 独特价值 |
|---|---|
| OpenHuman | 记忆透明可编辑、Obsidian 兼容、主动 Agent(无感刷新)、TokenJuice 压缩 80%、Google Meet 实时代理 |
| Marvis | 唯一一个直接操控操作系统的 AI——装在电脑里就能“帮你用电脑”,面向普通用户;硬件门槛较高(16GB)是主要限制 |
| OpenClaw | 浏览器自动化 + 将任意网站转化为 CLI 工具,开发者工作流利器 |
| Hermes | 任务执行 + 工具调度 + 个人 AI 工作流自动化,Skills 生态成熟,跨平台消息 |
| Claude Code | 纯编程 Agent,能独立完成多步骤编程任务闭环,深度 IDE 集成 |
| Codex | 坐在旁边的编程搭档,实时代码补全和建议,GitHub 原生嵌入 |
6.2 选型决策树
用户是普通用户,需要“帮我操作电脑”?
├── 是 → Marvis(系统级操作,门槛:6核+16GB)
└── 否 →
用户需要“记住我的一切,主动在后台思考”?
├── 是 → OpenHuman(Memory Tree + Obsidian + Auto-fetch)
└── 否 →
用户是程序员,需要“代码任务全自动闭环”?
├── 是 → Claude Code(深度 IDE 集成,Anthropic SaaS)
└── 否 →
用户需要“将任意网站转化为命令行工具”?
├── 是 → OpenClaw(浏览器自动化,开发者专属)
└── 否 →
用户需要“跨平台 Bot 编排 + 定时任务 + Skills 工作流”?
├── 是 → Hermes(Agent 执行引擎,完全自托管)
└── 否 →
以上都不是?
└── → 需要进一步明确需求
七、六大 AI Agent 趋势预测
以下预测基于各产品当前定位、社区活跃度、技术架构和市场竞争格局综合推演。预测为个人观点,存在不确定性。
7.1 各产品定位总结
| 产品 | 当前定位 | Stars | 最近更新 |
|---|---|---|---|
| OpenClaw | 个人 AI 助手(Any OS/Any Platform) | 375,287 ⭐ | 2026-05-28 |
| Hermes | NousResearch 开源 Agent 运行时 | 171,510 ⭐ | — |
| Claude Code | 终端编程 Agent | 127,308 ⭐ | 2026-05-28 |
| Codex | GitHub 内嵌编程 Copilot | 86,613 ⭐ | 2026-05-28 |
| OpenHuman | 记忆驱动个人 AI 超智能体 | 29,229 ⭐ | 2026-05-27 |
| Marvis | OS 级本地 AI 助手(腾讯闭源) | —(闭源) | — |
7.2 OpenHuman 趋势预测
短期(1年内): 凭借 GPLv3 开源、Rust 架构和 Obsidian 记忆层,OpenHuman 会吸引一批技术用户和隐私主义者,成为“个人 AI 数据中枢”赛道的标杆。其 TokenJuice + Auto-fetch 的组合让“低成本大记忆”成为可能,对高信息量用户有强烈吸引力。Product Hunt TOP 3 的光环和快速迭代(每2-3天一个版本)表明团队在认真做产品。
中期(1-3年): OpenHuman 最大的挑战是商业化。当前统一订阅模式依赖 OpenHuman 后端(OAuth 代理、模型路由),这意味着“本地部署”并非完全自由,仍受制于云端服务。一旦订阅费用过高或隐私丑闻爆发,社区可能 fork 出纯本地版本(类似 TrueNAS vs NAS)。如果能搞定消费级用户的认知门槛(目前主要在技术圈传播),有机会像 Obsidian 一样从小众工具变成主流。
核心变量: 118+ 集成的体验稳定性、TokenJuice 的实际压缩效果、吉祥物 Meta 在 Meet 中的真实体验价值。
预测结论: 未来3年将保持“技术圈 cult favorite”地位,不会有爆发性增长,但会成为“个人记忆 AI”的事实标准(类似 Obsidian 在笔记领域的地位)。
7.3 Marvis 趋势预测
短期(1年内): 腾讯的资源和分发能力是最大优势——微信小程序 + PC 客户端 + 手机端的多端覆盖,让 Marvis 可以快速下沉到普通用户。16GB 内存门槛会随硬件迭代自然降低(2027年主流 PC 预期 32GB)。腾讯元宝和 Marvis 的协同效应值得关注——前者是“对话 AI”,后者是“操作 AI”,两个产品覆盖不同场景。
中期(1-3年): Marvis 的威胁来自隐私信任。腾讯是中国公司,隐私条款虽承诺本地模式,但“本地模式不等于完全离线”是客观事实。对隐私敏感的企业用户会选择 Marvis 的本地模式而非云端,这限制了腾讯数据变现的空间。但如果腾讯能证明“数据不出设备”,有机会在企业市场打开局面。
核心变量: 腾讯 AI 战略优先级(是否把 Marvis 作为核心产品?)、收费模式是否透明、硬件门槛能否降低。
预测结论: 在中国国内会有一席之地,但受限于 Windows 16GB 门槛和腾讯的企业属性,全球化可能性低。腾讯 AI 产品矩阵(元宝 + Marvis + IMA + 文档AI)的协同是关键。
7.4 OpenClaw 趋势预测
当前最大变量: Stars 37.5万,是这份榜单里最高的一个,但 GitHub 描述是“personal AI assistant”而 README 实际是 CLI 工具,存在明显的定位落差。这说明 OpenClaw 在早期借用了“AI assistant”的概念红利,但实际产品力和品牌力存在错位。
短期(1年内): OpenClaw 的核心价值在于将任意网站转化为 CLI 这一差异化能力,在技术用户中有强需求。浏览器自动化 + 多适配器架构的组合让开发者在工作流中有极高灵活性。如果团队能持续维护(目前仍在活跃更新),会成为开发者工具链中的常驻组件。
中期(1-3年): OpenClaw 面临的最大挑战是价值锚点模糊。当 Claude Code 这样专注编程的 Agent 和 OpenHuman 这样专注记忆的 Agent 都在抢占用户心智时,“通用的网站→CLI 转换工具”听起来不够聚焦。如果 OpenClaw 能在特定垂直场景(电商、社交媒体管理、数据采集)找到突破口,可能复制“Figma 从设计工具中胜出”的路径。
核心变量: 产品定位是否收窄(成为“网站自动化 CLI 第一名”而不是“通用 AI 助手”)、团队商业化策略、社区活跃度能否维持。
预测结论: 长期看好,但需要更清晰的定位。37.5万 Stars 是历史积累,如何将流量转化为付费用户是核心挑战。
7.5 Hermes 趋势预测
当前最大变量: Hermes( NousResearch/hermes-agent,171,510 ⭐)是唯一一个以“框架/引擎”为核心定位的产品,其他5个都是直接面向用户的终端产品。这意味着 Hermes 的价值通过下游用户间接体现,而非直接服务用户。
短期(1年内): Hermes 的 Skills 生态和跨平台 Bot 能力(飞书/微信/Telegram)在特定垂直场景(跨境电商运营、品牌社交媒体管理、有多平台消息需求的企业)中有不可替代的价值。“定时任务 + 跨平台消息 + Skills 工作流”的组合对运营人员友好。
中期(1-3年): Hermes 面临两个方向的竞争——垂直化(Marvis/OpenHuman 直接解决终端用户问题,Hermes 变成“底层基础设施”)和平台化(OpenClaw/Claude Code 凭借更强的品牌和资金切入同类场景)。Hermes 必须在“深化技能生态”和“降低使用门槛”之间找到平衡。
核心变量: Skills 生态的丰富程度(更多飞书/微信/Telegram 高级技能)、是否有商业化案例、能否吸引开发者社区而非只有用户。
预测结论: 未来会分化成两条路——要么成为“企业 AI 自动化基础设施”(在幕后提供服务),要么被更垂直的产品收购/整合。独立长大的可能性中等。
7.6 Claude Code 趋势预测
当前最大变量: Anthropic 的 Claude 系列模型能力在编码场景中处于绝对领先地位,这让 Claude Code 成为“编程 Agent”的事实标准。Stars 12.7万,紧随 OpenClaw 和 Codex 之后,但 Claude Code 是纯编程工具,OpenClaw 是通用助手,所以实际影响力和渗透率比 Stars 显示的更高。
短期(1年内): Claude Code 会继续深化 IDE 集成(Cursor、VS Code、JetBrains 全家桶),成为“AI 编程体验”的事实标准。Sonnet 4 的性价比和 Opus 4 的深度推理能力形成高低搭配,覆盖从简单补全到复杂重构的全场景。Anthropic 的订阅模式让 Claude Code 可以直接变现,无需广告。
中期(1-3年): Claude Code 的威胁是上下文长度竞争。当 GPT-5 和 Gemini Ultra 的上下文窗口扩展到 10M token 时,Codex 可以做整代码库的深度理解,Claude Code 的“深度读代码库”优势会被削弱。但 Anthropic 的模型能力提升会让这个差距保持可接受范围。
核心变量: Anthropic 模型升级节奏、Claude Code 是否引入记忆系统(让 Agent 能跨项目记住用户偏好)、是否推出 Team/Enterprise 版本。
预测结论: 编程 Agent 领域的绝对领导者,未来3年会保持这个地位。除非 Anthropic 被严重战略失误或 OpenAI Codex 实现颠覆性突破,否则 Claude Code 的位置稳固。
7.7 OpenAI Codex 趋势预测
当前最大变量: Codex 深度嵌入 GitHub(Copilot)的产品链中,这是它最大的优势——每天有数百万开发者在使用,却不知道自己用的是 Codex。从 Stars 8.6万来看,Copilot 的品牌认知远超 Codex 这个底层模型的名字认知。
短期(1年内): Codex 作为 OpenAI 的编程载体,会随 GPT-4o / o3 的升级同步提升能力。但 OpenAI 当前面临政策监管、竞争加剧、收入压力等多重挑战,Codex 的优先级可能被稀释。更关键的是:OpenAI 的战略是“平台化”而非“垂直化”,Codex 最终可能变成 GPT 能力的编程场景展示,而非独立产品。
中期(1-3年): GitHub Copilot 的付费墙和 Claude Code 的崛起会形成两极——Copilot 靠 GitHub 生态保持装机量,Claude Code 靠体验深度赢得专业开发者。Codex 在中间夹着,既没有 Copilot 的渠道,也没有 Claude Code 的深度,定位最尴尬。
核心变量: OpenAI 是否会将 Codex 品牌彻底统一到 Copilot 下、Copilot 订阅费上涨空间、OpenAI 能否保持模型性能领先。
预测结论: 未来3年会逐渐被“GitHub Copilot”品牌吞噬,Codex 作为模型/品牌的独立性会下降,最终变成幕后的模型层。OpenAI 不会放弃编程场景,但会用 Copilot 而非 Codex 作为前台品牌。
八、更新日志
| 日期 | 更新内容 |
|---|---|
| 2026-05-29 | 初次调查完成,基于 GitHub API + 官网文档 |
报告基于 GitHub(Stars / Fork / Language / License / commits)、官网文档(GitBook)、README 内容综合整理。数据截至 2026-05-29。