比你更懂你自己:开源第二大脑 Omi

0 阅读6分钟

开了一整天的会,回头想总结重点,却发现脑子里一片空白。看了几十页文档,真正记住的没几句。跟客户聊了半天,事后想复盘,却想不起具体说了什么。

你的大脑不是硬盘,它天生就不擅长存储。

它擅长思考、创造、联想,但让你准确回忆三天前某个会议的细节?抱歉,做不到。

今天介绍的 Omi,就是来解决这个问题的。它是一个开源的 AI 第二大脑,能看到你在看什么、听到你在说什么,然后帮你记住一切。

Github:

github.com/BasedHardwa…

什么是 Omi

Omi 的 slogan 很有意思:"A 2nd brain you trust more than your 1st"(一个比你第一大脑更可靠的第二大脑)。

简单说,它在后台默默运行,实时捕获你的屏幕内容和对话语音,然后自动转录成文字、生成摘要、提取行动项。你可以随时问它"昨天跟张总聊了什么"、"上周那个方案的关键点是什么",它都能告诉你。

这个项目已经被 30 多万专业人士使用,而且完全开源免费。

它能做什么

屏幕捕获 —— 你在电脑上看了什么,它都知道。浏览网页、看文档、写代码、做设计,所有屏幕活动都会被记录。

对话录音 —— 会议、电话、面对面聊天,它都能录下来。不是偷偷录,是明确告诉你"我在记录"。

实时转录 —— 语音直接转成文字,准确率很高。支持多种语言,中英文混合也没问题。

智能摘要 —— 不用你自己整理笔记,它自动帮你提炼重点。一个小时的会议,它给你总结成三段话。

行动项提取 —— 更重要的是,它能从对话中提取"待办事项"。比如"下周一前把报告发给李经理",它会自动识别并提醒你。

AI 对话 —— 你可以跟它聊天,基于它记录的内容。"帮我找找上周提到的那个预算数字"、"总结一下这周的会议主题",就像跟一个知道你一切的助手对话。

多平台覆盖:在哪都能用

Omi 不是只能在电脑上用的工具,它覆盖了几乎所有场景。

桌面端 —— macOS 应用,捕获屏幕和电脑音频。适合办公、学习、编程。

手机端 —— iOS 和 Android 都有,捕获手机上的活动和通话。

可穿戴设备 —— 这是 Omi 的特色。他们有开源的硬件设备,比如 Omi 项链和 Omi Glass 智能眼镜。

Omi 项链 —— 挂在脖子上,24 小时连续录音。开会、聊天、讲座,全程记录。充一次电能用一整天。

Omi Glass —— 开发者套件,基于 ESP32-S3,带摄像头和麦克风。不仅能录音,还能拍照、录像,记录你看到的一切。

这些硬件都是开源的,你可以自己买零件组装,也可以直接买成品。

隐私怎么保障

听到"全天候录音",你可能会有顾虑:我的隐私怎么办?

Omi 的设计是本地优先。录音和转录先在本地处理,只有你明确授权的内容才会同步到云端。而且项目是开源的,代码公开,你可以自己审查它有没有偷偷上传数据。

另外,它支持本地部署。如果你特别在意隐私,可以把后端跑在自己的服务器上,数据完全自己掌控。

快速开始

Omi 的安装很简单,一条命令就能跑起来:

git clone https://github.com/BasedHardware/omi.git && cd omi/desktop && ./run.sh --yolo

这条命令会:

  1. 克隆代码仓库
  2. 构建 macOS 应用
  3. 连接云端后端
  4. 启动应用

不需要配置文件,不需要设置凭证,不需要本地后端。只要你的电脑满足以下条件:

  • macOS 14 或更高版本
  • Xcode(包含 Swift 和代码签名工具)
  • Node.js

注意:目前桌面端只支持 macOS,Windows 和 Linux 用户暂时只能用移动端或自己编译。

完整安装(本地开发)

如果你想本地部署后端,或者想二次开发,可以用完整安装方式:

第一步,安装系统依赖:

xcode-select --install
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh

第二步,克隆并配置:

git clone https://github.com/BasedHardware/omi.git
cd omi/desktop
cp Backend-Rust/.env.example Backend-Rust/.env

第三步,构建运行:

./run.sh

详细的环境变量配置可以参考 desktop/README.md。

移动端安装

手机端的安装也很简单:

cd app
bash setup.sh ios     # 安装 iOS 版本
bash setup.sh android # 安装 Android 版本

需要提前装好 Flutter 开发环境。

技术架构

Omi 的技术栈很现代,前后端分离,支持多种接入方式。

桌面端 —— Swift + SwiftUI 做界面,Rust 写后端服务。Rust 负责高性能的音频处理和本地计算。

移动端 —— Flutter 框架,一套代码同时支持 iOS 和 Android。

后端 —— Python + FastAPI,部署在 Firebase 上。负责转录、摘要、AI 对话等云端计算。

硬件 —— Omi 项链用 nRF 芯片和 Zephyr 实时操作系统,Omi Glass 用 ESP32-S3。

SDK —— 提供了 React Native、Swift、Python 三种 SDK,方便开发者集成到自己的应用里。

适合谁用

知识工作者 —— 每天开会、看文档、处理大量信息的人。Omi 帮你记住一切,解放大脑。

学生 —— 上课听讲、课后复习。不用疯狂记笔记,专注理解,事后问 Omi 要重点。

内容创作者 —— 采访、调研、灵感收集。所有素材自动归档,随时检索。

开发者 —— 开源项目,可以自己部署、二次开发。想做一个个性化的 AI 助手?Omi 是很好的起点。

Github:

github.com/BasedHardwa…

写在最后

Omi 代表了一种新的工作方式:让 AI 帮你记忆,让你的大脑专注于思考。

我们的大脑本来就不该用来存储海量信息,它应该用来创造、决策、解决复杂问题。Omi 就是那个帮你分担记忆负担的第二大脑。

而且它是开源的。你可以免费使用,可以查看所有代码,可以自己部署,可以二次开发。30 多万人已经验证了它的价值。

如果你想要一个永远不会忘记事情的 AI 助手,Omi 值得一试。


关注

如果这篇文章对你有帮助,欢迎点赞、收藏、转发。我会持续分享实用的 AI 工具和技术教程,关注我,一起探索 AI 的无限可能。