月省 1400 块,我把 Claude Code 搬进了 Obsidian,还让它跑在了自己的 Mac 上
发布时间:2026-05-13
标签:#Obsidian #ClaudeCode #本地大模型 #AI工作流 #知识管理 #省钱攻略
先说一个场景。
上周我在 Obsidian 里写笔记,顺手打了个 @ 引用了 5 篇之前写过的技术笔记,然后跟 AI 说了一句:"帮我把这 5 篇的要点整理成一份学习路线图。"
30 秒后,一篇结构完整、带有层级分类的学习路线笔记自动出现在了我的 Vault 里。
全程离线、零 API 费用、没联网。 一切跑在我自己的 Mac 上。
我盯着屏幕看了三秒钟,心里只有一个念头:我这台 Mac 以前是不是白买了?
之前那篇《2026 年最强编程神器 Codex,接入本地大模型免费运行》很多读者问:"能不能用在 Obsidian 里?"今天就是答案。这也是我继《Claude Code + llama.cpp + Qwen 3.6 打造最强本地 AI 系统》之后的升级版——这次更简单,不用折腾 llama.cpp,普通用户也能 10 分钟搞定。
一、三个各自为王的工具,为什么凑在一起就炸了?
这件事的核心,是三个工具的"天作之合"。
Obsidian:你的第二大脑
Obsidian 我用了快两年了,真心觉得它是 2026 年最好的知识管理工具,没有之一。
它的核心优势很简单:所有数据都是本地的 Markdown 文件。 你的笔记、你的想法、你的知识图谱,100% 在你自己的硬盘上。不依赖任何云服务,不害怕任何公司倒闭。
双向链接、图谱视图、强大的插件生态——Obsidian 早就超越了"笔记软件"的范畴,它是一个可无限扩展的知识操作系统。
但它一直缺了一件事:AI。
你可以装聊天插件跟 AI 对话,但那只是"问答"。真正的痛点是——你的 AI 读不到你的笔记,你的笔记也进不了 AI 的上下文。 两者各自为政,知识管理的最后一公里始终跨不过去。
直到 Claudian 出现。
Claude Code:2026 年最强的 AI Agent
如果说 ChatGPT 是一个"问答机器人",那 Claude Code 就是一个能自主行动的超级员工。
你给它一个任务:"把这几个文件读一下,总结成一份报告,存到指定文件夹。"它不是给你一段文字回复——它是真的去读文件、真的去写文件、真的去创建文件夹。全程自主,不需要你一步一步指挥。
这就是 Agent 和聊天机器人的本质区别:一个只会说话,一个能干活。
但 Claude Code 的定价让人肉疼:
- Plus 版 $20/月,有严格的额度限制,重度用两天就超标
- Pro 版 $200/月(约 1400 人民币),才能无限制使用
- 国内还要解决网络问题,
api.anthropic.com直连基本不可能
功能极强,但门槛极高。 对于大多数知识管理用户来说,这个价格就是为了"写笔记"付的,完全不成比例。
本地大模型:你 Mac 里沉睡的巨兽
这里要说一件大多数人不知道的事。
你桌面上的那台 Mac,本身就是一台 AI 超级计算机。
Apple Silicon 的 GPU 性能被严重低估了。M2/M3/M4 系列芯片,配合苹果的 MLX 框架,能在本地流畅运行 27B 级别的大模型。什么意思?就是跟 Claude、GPT-4o 同一量级的模型,直接跑在你自己的 Mac 上。
完全免费、完全离线、完全私密。你的数据不用离开本机,你的想法不用经过任何第三方的服务器。
但之前的问题是——本地大模型只能打开个网页窗口聊天。它没有 Agent 能力,不能读写文件,不能自主行动。 一头被困在笼子里的猛兽。
三者组合 = 核弹级效果
现在,把这三样东西拼在一起:
Obsidian(你的知识库) ←→ Claudian(Agent 引擎) ←→ oMLX(本地大模型)
- Obsidian 提供上下文——你的所有笔记、知识图谱、双向链接
- Claudian 提供行动力——Claude Code 的 Agent 引擎,能读文件、写文件、执行多步任务
- oMLX 提供大脑——本地运行的 27B 大模型,免费、离线、无限调用
三者缺一不可。
单有 Obsidian + 本地模型,只能聊天,没有 Agent 能力。
单有 Obsidian + Claude Code,有 Agent 但要用云端 API,贵还要翻墙。
单有 Claude Code + 本地模型,能干活但没有知识库上下文。
三者组合在一起,才是真正的"私人 AI 助理"——读得懂你的笔记,干得了活,还免费。
二、搭建流程:三个部件,逐一就位
说实话,整个搭建过程比我预期的简单太多。下面按顺序走。
部件 1:Obsidian
如果你还没装 Obsidian,去官网下载就行,Mac/Windows/Linux 全平台支持,免费用。
这一步应该没人卡住。你已经看到这篇文章了,大概率已经有了。
部件 2:oMLX —— 唤醒 Mac 的沉睡算力
oMLX 是基于苹果 MLX 框架的本地大模型推理服务器。一句话总结:苹果官方框架 + OpenAI 兼容接口 + 一键启动。
安装就两条命令:
pip install omlx
omlx serve
启动后,浏览器打开 http://localhost:8000,看到模型列表和管理后台,就成功了。
关键提示:
- 24GB+ 内存的 Mac,推荐跑 27B 量化模型(如 Qwen3.6-27B-4bit),能力接近 GPT-4o
- 16GB 内存,跑 7B-14B 模型,日常够用
- 8GB 内存及以下,建议直接看第三方 API 方案,本地跑体验较差
不知道怎么选模型?可以参考我之前写的《2026 本地大模型横评:Qwen 3.5、Gemma 4、GLM-5.1》,帮你理清各型号的差异。
首次启动会自动下载模型(约 14GB),下载完就存在本机了,以后不占网络。
除了 oMLX,Ollama、LM Studio、llama.cpp 等部署工具怎么选?我之前写过一篇《本地部署 AI 大模型横评》,从 10 个维度做了对比,可以帮你找到最适合自己的方案。
部件 3:Claudian —— 把 Claude Code 塞进 Obsidian
Claudian 是 Claude Code 的 Obsidian 嵌入式版本。装上它,你的 Obsidian 就拥有了 Claude Code 的全部 Agent 能力。
但它还没上架 Obsidian 官方插件市场,需要通过一个叫 BRAT 的工具安装:
第 1 步:Obsidian 设置 → 社区插件 → 浏览 → 搜索 "BRAT" → 安装并启用
第 2 步:进入 BRAT 设置 → 点击 "Add beta plugin" → 输入插件 ID github.com/YishenTu/cl… → 点击 Add plugin
第 3 步:返回社区插件列表 → 找到 Claudian → 启用
搞定。左侧边栏会出现 Claudian 的面板图标。
整个过程大概 3 分钟。
三、关键一步:把它们连起来
三个部件都就位了,现在要做最后一件事——让 Claudian 通过本地大模型跑起来。
这里有一个关键的技术细节,直接决定了你的体验是天壤之别。
为什么不能直接连?
oMLX 提供的是 OpenAI 格式 的 API 接口。
Claudian 的 Agent 引擎期望的是 Anthropic Claude 格式 的 API 接口。
两者看起来都是 JSON,但内部结构完全不同——尤其是 工具调用(tool calling) 的格式,差异更大。
如果你直接把 Claudian 连到 oMLX 的 8000 端口,聊天功能能用,但 Agent 的工具调用会出问题。 也就是说,Claudian 最核心的"自主行动"能力会被削弱。
解决方案:一个 126 行的代理
我的方案是部署一个轻量代理(Node.js 写的,总共 126 行代码),夹在 Claudian 和 oMLX 之间:
Claudian ──→ 代理(port 4003) ──→ oMLX(port 8000)
↑ Claude 格式 ↑ 格式翻译 ↑ OpenAI 格式
代理做的事情很简单:
- 接收 Claudian 的 Claude 格式请求
- 翻译成 OpenAI 格式,转发给 oMLX
- 把 oMLX 的响应翻译回 Claude 格式,返回给 Claudian
Claudian 完全不知道自己用的是本地模型。 它以为自己在跟 Anthropic 的服务器通信,行为跟原生 Claude 完全一致。Agent 的所有功能——读写文件、工具调用、多步推理——全部正常工作。
核心配置
Vault 根目录下创建一个 .env.local 文件:
ANTHROPIC_BASE_URL=http://127.0.0.1:4003
ANTHROPIC_API_KEY=你的oMLX密钥
然后在 Claudian 设置里选择 claude provider,模型选 haiku。
对,就两行配置。
一键启动
oMLX 和代理可以整合成一个启动脚本,核心逻辑如下:
# 启动 oMLX 大模型服务
nohup omlx serve --model-dir ~/omlx-models --port 8000 &
# 启动格式代理
nohup env OMLX_PROXY_PORT=4003 OMLX_API_KEY=你的密钥 \
node omlx_anthropic_proxy.mjs &
echo "✅ oMLX + Claude 代理已就绪"
双击运行,两个服务自动在后台启动。日常使用完全无感。
完整的安装教程和两套方案的详细对比,我已经整理成了一篇完整文档,文章末尾会放链接。
四、装完之后,你能干什么?
这才是重头戏。
场景 1:让 AI 读你的笔记
在 Claudian 的对话框里输入 @,可以引用你 Vault 里的任何笔记。
"参考 @2026年Q1复盘 这篇笔记,帮我写一份 Q2 的计划。"
AI 会真正去读取那篇笔记的内容,基于你的实际数据来写计划。不是泛泛而谈,而是基于你的知识输出。
这是普通聊天插件做不到的——它们看不到你的笔记。
场景 2:让 AI 帮你写笔记
"帮我写一篇关于 Obsidian 插件开发的笔记,参考我之前写过的 @Codex教程 那篇的风格。"
AI 会读取参考笔记,分析你的写作风格,然后直接生成一篇新笔记,自动保存到你的 Vault 里。 你只需要审核和微调。
场景 3:一句话,多步任务
"把我技术笔记文件夹里所有关于 Docker 的笔记找出来,提取要点,整理成一份学习路线图,存成新笔记。"
Agent 会自动执行以下步骤:
- 扫描文件夹,找到所有相关笔记
- 逐篇阅读,提取核心要点
- 按逻辑组织成学习路线
- 创建新笔记文件,写入 Vault
你只需要说一句人话,剩下的全自动完成。
场景 4:永远在线的私人 AI
飞机上、地铁里、信号差的酒店、断网的山里——你的 AI 助理永不掉线。
不需要网络,不需要 API 额度,不需要翻墙。你的 Mac 在,你的 AI 就在。
我第一次在飞机上用这个组合写笔记的时候,旁边座位的人凑过来问:"你没开飞行模式吗?这都能联网?"
我说:"不需要联网。"
他看了我五分钟。
如果你想打造更完整的离线 AI 全家桶——聊天、生图、知识库全部本地运行,可以参考我之前写的《2026 本地 AI 末日堡垒:llama.cpp + ComfyUI + OpenWebUI 多模态全家桶》。
场景 5:隐私 100% 安全
你的笔记里可能有商业计划、可能有客户信息、可能有你还没准备好公开的想法。
用云端 API 的时候,这些数据会经过第三方的服务器。不管对方说什么"我们不保存数据",数据离开了你的设备,你就失去了控制权。
本地方案下,你的笔记、你的对话、你的想法,全部在本地完成。不经过任何外部服务器,不产生任何网络请求。
这不是"更安全",这是根本不存在隐私风险。
五、算一笔账
| 项目 | 传统方案 | 本地方案 |
|---|---|---|
| AI 订阅费 | $200/月(≈1400 元) | 0 元 |
| 网络工具 | 必需(额外成本) | 不需要 |
| 年费用 | ≈16,800 元 | 0 元 |
| 隐私风险 | 数据过云端 | 100% 本地 |
| 离线可用 | 不行 | 随时可用 |
| 硬件成本 | 任意设备 | Mac(已购,沉没成本) |
一年省 1.68 万。还更安全、更自由、永不掉线。
而且你用来跑这套组合的 Mac,本来就是你要买的。这不是额外成本,这是让已有的硬件发挥最大价值。
六、说几句大实话
本地 27B 量化模型的能力,大约相当于云端 GPT-4o 的 80-85% 。
日常写笔记、整理知识、辅助创作、读写文件——完全够用,体验丝滑。
差距主要体现在:
- 极其复杂的逻辑推理,本地模型偶尔会"跑偏"
- 超长上下文(10 万 token 以上),本地模型的注意力会下降
- 某些垂直领域的专业知识,云端旗舰模型确实更深
但反过来想:85% 的能力,0 元/月,vs 100% 的能力,1400 元/月。
对于知识管理这个场景,85% 就是 100%。你不需要让 AI 帮你设计火箭发动机,你需要的是它能读懂你的笔记、帮你整理思路、写出像样的初稿。这件事,本地 27B 模型做得非常好。
而且它是免费的。你可以无限试用,写废了重来,不心疼。
没有 Mac?没关系。我之前写过一篇《3000 元老电脑跑起 35B 大模型》,3000 块的二手 Windows 电脑也能流畅跑 35B 模型,效果不差。
最后说两句
2026 年了,我们终于到了一个节点:每个人都能拥有属于自己的私人 AI 助理。
不需要等 OpenAI 降价。
不需要等国内出平替。
不需要把数据交给第三方。
你需要的算力,早就在你桌上了。
Obsidian 给了你一个知识管理的容器。
Claude Code 给了一个能自主行动的 Agent 引擎。
本地大模型给了一个免费、离线、私密的大脑。
三者组合在一起,就是 2026 年最强的个人 AI 工作流。
自由、免费、私密。还要什么自行车?
你在用什么设备跑本地大模型?Mac 还是 Windows?配置过程中遇到什么问题?欢迎在评论区留言交流。
如果觉得这篇文章帮到了你,欢迎点赞 + 关注,后续会持续更新这套组合的进阶玩法。