OpenHuman 深度调研报告OpenHuman 是一个开源桌面 AI 助手，以“个人记忆系统”为核心差异化卖点。Yo

调查时间： 2026年5月29日

官网： tinyhumans.ai/openhuman

GitHub： tinyhumansai/openhuman

出品方： TinyHumans AI（独立团队，非大厂背景）

一、产品定位

“Your Personal AI super intelligence: Private, Simple and extremely powerful.”

OpenHuman 是一个开源桌面 AI 助手，以“个人记忆系统”为核心差异化卖点。标语直击行业痛点：

“Every model in the world shares the same fundamental limitation: they are stateless.”

它认为所有 LLM 都是“瞬时记忆”——你打完 prompt，上下文消失。OpenHuman 要做的事：把 AI 的记忆从“便利贴”升级为“Obsidian 知识库”。

特性	描述
定位	个人 AI 超智能体，记忆驱动的主动 Agent
目标用户	技术用户 + 追求个人数据自主的高净值用户
运行环境	桌面端（Windows/macOS/Linux）+ 未来移动端
核心能力	118+ 服务集成、Memory Tree、Obsidian 式 Wiki、Voice/Meet 机器人
收费模式	统一订阅（一个订阅包含所有模型，自动路由）
开源	GPLv3

二、核心能力

2.1 Memory Tree（记忆树）

这是 OpenHuman 的灵魂能力：

数据源：118+ 服务 OAuth 接入（Gmail、GitHub、Slack、Notion、Stripe、Calendar、Drive、Linear、Jira 等）
处理流程：数据 → 确定性 pipeline → canonical Markdown，≤3k-token 块，打分 → 折叠进 per-source / per-topic / per-day 总结树
存储：SQLite 在本地，.md 文件同步到 Obsidian 可读的 Vault
特点：记忆透明可读，用户可直接用 Obsidian 打开/编辑/手动链接（“You can’t trust a memory you can’t read”）
自动刷新：每 20 分钟无感抓取新数据，Agent 始终有“明天的上下文”

2.2 Obsidian Wiki 记忆层

和 Karpathy 的 obsidian-wiki 理念一脉相承：

AI 推理用的同一批 chunks，直接落盘成 .md 文件
用户可以用 Obsidian 手工补充、链接、标签
本地 SQLite + Markdown 双写，隐私与可编辑兼得

2.3 118+ 服务集成

通过 Composio 连接层实现一键 OAuth，官方声称“无需手动配 API Key”。覆盖：

邮件：Gmail
代码：GitHub、GitLab
办公：Notion、Slack、Linear、Jira、Stripe
日历：Google Calendar
云盘：Google Drive
等……

⚠️ 注意：托管模式（默认）下，OAuth 握手和工具调用通过 OpenHuman 后端代理。如需完全自控，可配置自己的 Composio API Key（direct mode），但部分实时 Webhook 触发需要自行托管。

2.4 TokenJuice 智能压缩

将 HTML 转为 Markdown、长 URL 缩短、工具输出去重压缩，通过规则叠加实现：

CJK、emoji 逐字保留，不被误删
实测压缩率最高可达 80%
让“扫描半年邮件”这类操作的 token 成本降至个位数美元

2.5 自动模型路由

根据 hint 标签自动选择最优模型：

Hint	模型类型	场景
hint:reasoning	前沿大模型	复杂推理、深度分析
hint:fast	便宜快速模型	简单查询、快速响应
vision	视觉模型	图片理解

底层通过 OpenHuman 后端统一订阅，用户无感知切换。

2.6 Voice + 实时吉祥物

STT 输入：语音指令
TTS 输出：ElevenLabs 声音
吉祥物口型同步：桌面 mascot 实时唇形
Google Meet 实时代理：作为真实参会者加入会议，转录存入 Memory Tree，可语音发言

2.7 内置工具集（开箱即用）

文件系统、Git、lint、测试、grep
浏览器控制、计算机控制
Cron 调度、记忆工具
子 Agent 协同（spawn sub-agents）
Web 搜索、网页抓取

三、技术架构

3.1 技术栈

层级	技术
核心语言	Rust
桌面框架	Tauri + Chromium Embedded Framework (CEF)
前端	React + Tailwind CSS + TypeScript
记忆存储	SQLite（本地）
文档格式	Markdown（Obsidian 兼容）
连接层	Composio（OAuth 集成）
本地 AI	Ollama / LM Studio（可选）
订阅模式	统一后端托管订阅

3.2 代码结构

openhuman/
├── src/              # Rust 核心
│   ├── core/         # Agent、dispatch、memory、auth、socketio、event_bus
│   ├── api/          # API 层
│   └── rpc/          # RPC 协议
├── app/              # TypeScript 前端
│   ├── src/          # React 组件
│   ├── src-tauri/    # Tauri 原生壳（Rust）
│   └── src-tauri-mobile/
├── e2e/              # 端到端测试
└── packages/         # 工作区共享包

3.3 安装方式

平台	安装方式
macOS	brew tap tinyhumansai/core && brew install openhuman
Linux (Debian/Ubuntu)	Signed apt repo（推荐）
Linux (Arch)	AUR: yay -S openhuman-bin
Windows	Signed .msi / .exe installer
通用	.dmg / .AppImage / .deb 直接下载

⚠️ 已知问题：AppImage 在 Wayland 和 Arch 上可能崩溃（#2463），推荐 Debian/Ubuntu 用户使用 .deb 包。

四、版本与社区

指标	数据
最新版本	v0.56.0（2026-05-27发布）
Stars	29,229
Forks	2,759
主要贡献者	senamakel（926次提交）、graycyrus、M3gA-Mind、oxoxDev
成立时间	2026-02-18（距今约3个月）
语言	Rust
许可证	GPLv3
Open Issues	142
多语言 README	英/中/日/韩/德 5 种
荣誉	Product Hunt TOP 3，Trendshift TOP 1 repository

发布节奏：平均每 2-3 天一个版本（v0.54 2026-05-19 → v0.56 2026-05-27），开发极为活跃。

五、竞品对比分析

5.1 一句话总结

产品	定位
OpenHuman	记忆驱动的个人 AI 超智能体，本地持久记忆 + 主动 Agent
Marvis	操作系统级本地 AI 助手，帮人操作电脑/手机，面向普通用户
OpenClaw	将任意网站/应用转化为 CLI 工具，浏览器自动化，开发者工作流
Hermes	Agent 运行时框架，调度工具、记忆、技能系统的执行引擎
Claude Code	专业编程助手，读代码库、写文件、执行终端命令、深度 IDE 集成
OpenAI Codex	编程 Copilot，嵌入开发流程的代码补全与生成工具

5.2 核心定位对比

	面向用户	运行环境	核心任务	开源
OpenHuman	技术用户 + 高隐私需求	桌面端（Win/Mac/Linux）	个人记忆中枢 + 主动 Agent	✅ GPLv3
Marvis	普通用户	PC/手机/微信	操作系统操作 + 文件理解	❌ 腾讯闭源
OpenClaw	开发者	本地 CLI + 浏览器	网站→CLI 转化 + 浏览器自动化	✅
Hermes	技术用户 / 开发者	本地/服务器	任务编排 + 跨平台 Bot	✅
Claude Code	专业开发者	终端 / IDE / 桌面	编程任务全自动闭环	❌ Anthropic SaaS
Codex	开发者	GitHub Copilot / API	代码补全 / 生成 / 审查	❌ OpenAI SaaS

5.3 能力矩阵

能力	OpenHuman	Marvis	OpenClaw	Hermes	Claude Code	Codex
持久记忆（本地）	✅ Memory Tree + Obsidian	✅ 本地模式	✅ 知识库	⚠️ 外部对接	❌	❌
118+ 服务集成	✅ OAuth 直连	❌	❌	⚠️ via 技能	❌	❌
操作电脑/手机	❌	✅ 系统级	❌	❌	❌	❌
浏览器自动化	❌	❌	✅ Chrome DevTools	⚠️ via 技能	❌	❌
编程任务	⚠️ 弱	❌	❌	✅ via subagent	✅ 核心能力	✅ 代码生成
文件理解	✅ 文档/图片	✅ Word/Excel/PPT/PDF	✅ 知识库检索	✅ via tools	✅ 深度读代码库	✅ 代码文件
多平台消息	❌	❌	❌	✅ 飞书/微信/Telegram	❌	❌
Voice / 视频会议	✅ Meet 机器人	❌	❌	⚠️ via 技能	❌	❌
自动模型路由	✅ 内置（订阅制）	✅ DeepSeek/混元	✅	✅ 多 provider	❌	❌
定时任务 / Cron	✅	❌	❌	✅	❌	❌
Skills / 工作流	⚠️ Subconscious Loop	❌	❌	✅ 完善技能系统	❌	❌
Token 压缩	✅ TokenJuice（80%）	❌	❌	❌	❌	❌
Obsidian 兼容	✅	❌	❌	❌	❌	❌
隐私模式	✅ 完全本地	✅ 本地模式（需开启）	部署自控	部署自控	API 模式可选	API 模式

⚠️ 说明：Hermes 的“飞书/微信/Telegram”能力来自技能/插件扩展，并非核心功能；OpenClaw 的“多平台”指浏览器自动化而非 IM 消息聚合。

5.4 技术架构对比

	架构模式	本地部署	模型	语言
OpenHuman	Rust/Tauri 桌面 + Composio	✅ 完全本地 + 可选托管	任意（统一订阅路由）	Rust + TypeScript
Marvis	操作系统 Agent + 本地大模型	✅ 需安装客户端	DeepSeek V4 + 混元	未公开
OpenClaw	CLI 工具 + 浏览器自动化	✅ 本地运行	任意（适配器机制）	TypeScript
Hermes	Python Agent 运行时 + 工具调度器	✅ 完全自托管	任意 provider	Python
Claude Code	单一编程 CLI 工具（SaaS）	❌	Claude 5 Sonnet	Python
Codex	IDE 插件 + API（SaaS）	❌	GPT-4o / o3	Rust

5.5 典型使用场景

OpenHuman — 个人数据中枢 + 主动记忆

“帮我回顾过去一个月里，所有邮件中提到的项目里程碑”
“整理 Obsidian 笔记，按主题生成本周知识摘要”
“明早 8 点前给我一份 Google Calendar 上所有会议的摘要”

Marvis — 日常生活 + 轻办公

“帮我整理桌面上的文档，按项目分类”
“把这份合同的关键条款提取出来”
“下周去上海的旅行攻略怎么样？”

OpenClaw — 浏览器自动化 + CLI 开发

将飞书文档页面转化为命令行接口操作
自动化网页数据抓取
浏览器多标签页批量管理

Hermes — 个人 AI 工作流自动化

“每天早上 8 点给我发一份 A 股强势股筛选”
“把网页内容总结后发到飞书知识库”
管理多平台消息、调度子任务

Claude Code — 专业编程闭环

“帮我重构这个模块，添加单元测试”
“解释这段代码，列出潜在 bug”
直接在代码库里工作，写文件、执行 git、跑测试

六、关键差异总结

6.1 各产品独特价值

产品	独特价值
OpenHuman	记忆透明可编辑、Obsidian 兼容、主动 Agent（无感刷新）、TokenJuice 压缩 80%、Google Meet 实时代理
Marvis	唯一一个直接操控操作系统的 AI——装在电脑里就能“帮你用电脑”，面向普通用户；硬件门槛较高（16GB）是主要限制
OpenClaw	浏览器自动化 + 将任意网站转化为 CLI 工具，开发者工作流利器
Hermes	任务执行 + 工具调度 + 个人 AI 工作流自动化，Skills 生态成熟，跨平台消息
Claude Code	纯编程 Agent，能独立完成多步骤编程任务闭环，深度 IDE 集成
Codex	坐在旁边的编程搭档，实时代码补全和建议，GitHub 原生嵌入

6.2 选型决策树

用户是普通用户，需要“帮我操作电脑”？
├── 是 → Marvis（系统级操作，门槛：6核+16GB）
└── 否 →

用户需要“记住我的一切，主动在后台思考”？
├── 是 → OpenHuman（Memory Tree + Obsidian + Auto-fetch）
└── 否 →

用户是程序员，需要“代码任务全自动闭环”？
├── 是 → Claude Code（深度 IDE 集成，Anthropic SaaS）
└── 否 →

用户需要“将任意网站转化为命令行工具”？
├── 是 → OpenClaw（浏览器自动化，开发者专属）
└── 否 →

用户需要“跨平台 Bot 编排 + 定时任务 + Skills 工作流”？
├── 是 → Hermes（Agent 执行引擎，完全自托管）
└── 否 →

以上都不是？
└── → 需要进一步明确需求

七、六大 AI Agent 趋势预测

以下预测基于各产品当前定位、社区活跃度、技术架构和市场竞争格局综合推演。预测为个人观点，存在不确定性。

7.1 各产品定位总结

产品	当前定位	Stars	最近更新
OpenClaw	个人 AI 助手（Any OS/Any Platform）	375,287 ⭐	2026-05-28
Hermes	NousResearch 开源 Agent 运行时	171,510 ⭐	—
Claude Code	终端编程 Agent	127,308 ⭐	2026-05-28
Codex	GitHub 内嵌编程 Copilot	86,613 ⭐	2026-05-28
OpenHuman	记忆驱动个人 AI 超智能体	29,229 ⭐	2026-05-27
Marvis	OS 级本地 AI 助手（腾讯闭源）	—（闭源）	—

7.2 OpenHuman 趋势预测

短期（1年内）： 凭借 GPLv3 开源、Rust 架构和 Obsidian 记忆层，OpenHuman 会吸引一批技术用户和隐私主义者，成为“个人 AI 数据中枢”赛道的标杆。其 TokenJuice + Auto-fetch 的组合让“低成本大记忆”成为可能，对高信息量用户有强烈吸引力。Product Hunt TOP 3 的光环和快速迭代（每2-3天一个版本）表明团队在认真做产品。

中期（1-3年）： OpenHuman 最大的挑战是商业化。当前统一订阅模式依赖 OpenHuman 后端（OAuth 代理、模型路由），这意味着“本地部署”并非完全自由，仍受制于云端服务。一旦订阅费用过高或隐私丑闻爆发，社区可能 fork 出纯本地版本（类似 TrueNAS vs NAS）。如果能搞定消费级用户的认知门槛（目前主要在技术圈传播），有机会像 Obsidian 一样从小众工具变成主流。

核心变量： 118+ 集成的体验稳定性、TokenJuice 的实际压缩效果、吉祥物 Meta 在 Meet 中的真实体验价值。

预测结论： 未来3年将保持“技术圈 cult favorite”地位，不会有爆发性增长，但会成为“个人记忆 AI”的事实标准（类似 Obsidian 在笔记领域的地位）。

7.3 Marvis 趋势预测

短期（1年内）： 腾讯的资源和分发能力是最大优势——微信小程序 + PC 客户端 + 手机端的多端覆盖，让 Marvis 可以快速下沉到普通用户。16GB 内存门槛会随硬件迭代自然降低（2027年主流 PC 预期 32GB）。腾讯元宝和 Marvis 的协同效应值得关注——前者是“对话 AI”，后者是“操作 AI”，两个产品覆盖不同场景。

中期（1-3年）： Marvis 的威胁来自隐私信任。腾讯是中国公司，隐私条款虽承诺本地模式，但“本地模式不等于完全离线”是客观事实。对隐私敏感的企业用户会选择 Marvis 的本地模式而非云端，这限制了腾讯数据变现的空间。但如果腾讯能证明“数据不出设备”，有机会在企业市场打开局面。

核心变量： 腾讯 AI 战略优先级（是否把 Marvis 作为核心产品？）、收费模式是否透明、硬件门槛能否降低。

预测结论： 在中国国内会有一席之地，但受限于 Windows 16GB 门槛和腾讯的企业属性，全球化可能性低。腾讯 AI 产品矩阵（元宝 + Marvis + IMA + 文档AI）的协同是关键。

7.4 OpenClaw 趋势预测

当前最大变量： Stars 37.5万，是这份榜单里最高的一个，但 GitHub 描述是“personal AI assistant”而 README 实际是 CLI 工具，存在明显的定位落差。这说明 OpenClaw 在早期借用了“AI assistant”的概念红利，但实际产品力和品牌力存在错位。

短期（1年内）： OpenClaw 的核心价值在于将任意网站转化为 CLI 这一差异化能力，在技术用户中有强需求。浏览器自动化 + 多适配器架构的组合让开发者在工作流中有极高灵活性。如果团队能持续维护（目前仍在活跃更新），会成为开发者工具链中的常驻组件。

中期（1-3年）： OpenClaw 面临的最大挑战是价值锚点模糊。当 Claude Code 这样专注编程的 Agent 和 OpenHuman 这样专注记忆的 Agent 都在抢占用户心智时，“通用的网站→CLI 转换工具”听起来不够聚焦。如果 OpenClaw 能在特定垂直场景（电商、社交媒体管理、数据采集）找到突破口，可能复制“Figma 从设计工具中胜出”的路径。

核心变量： 产品定位是否收窄（成为“网站自动化 CLI 第一名”而不是“通用 AI 助手”）、团队商业化策略、社区活跃度能否维持。

预测结论： 长期看好，但需要更清晰的定位。37.5万 Stars 是历史积累，如何将流量转化为付费用户是核心挑战。

7.5 Hermes 趋势预测

当前最大变量： Hermes（ NousResearch/hermes-agent，171,510 ⭐）是唯一一个以“框架/引擎”为核心定位的产品，其他5个都是直接面向用户的终端产品。这意味着 Hermes 的价值通过下游用户间接体现，而非直接服务用户。

短期（1年内）： Hermes 的 Skills 生态和跨平台 Bot 能力（飞书/微信/Telegram）在特定垂直场景（跨境电商运营、品牌社交媒体管理、有多平台消息需求的企业）中有不可替代的价值。“定时任务 + 跨平台消息 + Skills 工作流”的组合对运营人员友好。

中期（1-3年）： Hermes 面临两个方向的竞争——垂直化（Marvis/OpenHuman 直接解决终端用户问题，Hermes 变成“底层基础设施”）和平台化（OpenClaw/Claude Code 凭借更强的品牌和资金切入同类场景）。Hermes 必须在“深化技能生态”和“降低使用门槛”之间找到平衡。

核心变量： Skills 生态的丰富程度（更多飞书/微信/Telegram 高级技能）、是否有商业化案例、能否吸引开发者社区而非只有用户。

预测结论： 未来会分化成两条路——要么成为“企业 AI 自动化基础设施”（在幕后提供服务），要么被更垂直的产品收购/整合。独立长大的可能性中等。

7.6 Claude Code 趋势预测

当前最大变量： Anthropic 的 Claude 系列模型能力在编码场景中处于绝对领先地位，这让 Claude Code 成为“编程 Agent”的事实标准。Stars 12.7万，紧随 OpenClaw 和 Codex 之后，但 Claude Code 是纯编程工具，OpenClaw 是通用助手，所以实际影响力和渗透率比 Stars 显示的更高。

短期（1年内）： Claude Code 会继续深化 IDE 集成（Cursor、VS Code、JetBrains 全家桶），成为“AI 编程体验”的事实标准。Sonnet 4 的性价比和 Opus 4 的深度推理能力形成高低搭配，覆盖从简单补全到复杂重构的全场景。Anthropic 的订阅模式让 Claude Code 可以直接变现，无需广告。

中期（1-3年）： Claude Code 的威胁是上下文长度竞争。当 GPT-5 和 Gemini Ultra 的上下文窗口扩展到 10M token 时，Codex 可以做整代码库的深度理解，Claude Code 的“深度读代码库”优势会被削弱。但 Anthropic 的模型能力提升会让这个差距保持可接受范围。

核心变量： Anthropic 模型升级节奏、Claude Code 是否引入记忆系统（让 Agent 能跨项目记住用户偏好）、是否推出 Team/Enterprise 版本。

预测结论： 编程 Agent 领域的绝对领导者，未来3年会保持这个地位。除非 Anthropic 被严重战略失误或 OpenAI Codex 实现颠覆性突破，否则 Claude Code 的位置稳固。

7.7 OpenAI Codex 趋势预测

当前最大变量： Codex 深度嵌入 GitHub（Copilot）的产品链中，这是它最大的优势——每天有数百万开发者在使用，却不知道自己用的是 Codex。从 Stars 8.6万来看，Copilot 的品牌认知远超 Codex 这个底层模型的名字认知。

短期（1年内）： Codex 作为 OpenAI 的编程载体，会随 GPT-4o / o3 的升级同步提升能力。但 OpenAI 当前面临政策监管、竞争加剧、收入压力等多重挑战，Codex 的优先级可能被稀释。更关键的是：OpenAI 的战略是“平台化”而非“垂直化”，Codex 最终可能变成 GPT 能力的编程场景展示，而非独立产品。

中期（1-3年）： GitHub Copilot 的付费墙和 Claude Code 的崛起会形成两极——Copilot 靠 GitHub 生态保持装机量，Claude Code 靠体验深度赢得专业开发者。Codex 在中间夹着，既没有 Copilot 的渠道，也没有 Claude Code 的深度，定位最尴尬。

核心变量： OpenAI 是否会将 Codex 品牌彻底统一到 Copilot 下、Copilot 订阅费上涨空间、OpenAI 能否保持模型性能领先。

预测结论： 未来3年会逐渐被“GitHub Copilot”品牌吞噬，Codex 作为模型/品牌的独立性会下降，最终变成幕后的模型层。OpenAI 不会放弃编程场景，但会用 Copilot 而非 Codex 作为前台品牌。

八、更新日志

日期	更新内容
2026-05-29	初次调查完成，基于 GitHub API + 官网文档

报告基于 GitHub（Stars / Fork / Language / License / commits）、官网文档（GitBook）、README 内容综合整理。数据截至 2026-05-29。