月省 1400 块，我把 Claude Code 搬进了 Obsidian，还让它跑在了自己的 Mac 上月省 1400

月省 1400 块，我把 Claude Code 搬进了 Obsidian，还让它跑在了自己的 Mac 上

发布时间：2026-05-13
标签：#Obsidian #ClaudeCode #本地大模型 #AI工作流 #知识管理 #省钱攻略

先说一个场景。

上周我在 Obsidian 里写笔记，顺手打了个 @ 引用了 5 篇之前写过的技术笔记，然后跟 AI 说了一句："帮我把这 5 篇的要点整理成一份学习路线图。"

30 秒后，一篇结构完整、带有层级分类的学习路线笔记自动出现在了我的 Vault 里。

全程离线、零 API 费用、没联网。 一切跑在我自己的 Mac 上。

我盯着屏幕看了三秒钟，心里只有一个念头：我这台 Mac 以前是不是白买了？

之前那篇《2026 年最强编程神器 Codex，接入本地大模型免费运行》很多读者问："能不能用在 Obsidian 里？"今天就是答案。这也是我继《Claude Code + llama.cpp + Qwen 3.6 打造最强本地 AI 系统》之后的升级版——这次更简单，不用折腾 llama.cpp，普通用户也能 10 分钟搞定。

一、三个各自为王的工具，为什么凑在一起就炸了？

这件事的核心，是三个工具的"天作之合"。

Obsidian：你的第二大脑

Obsidian 我用了快两年了，真心觉得它是 2026 年最好的知识管理工具，没有之一。

它的核心优势很简单：所有数据都是本地的 Markdown 文件。 你的笔记、你的想法、你的知识图谱，100% 在你自己的硬盘上。不依赖任何云服务，不害怕任何公司倒闭。

双向链接、图谱视图、强大的插件生态——Obsidian 早就超越了"笔记软件"的范畴，它是一个可无限扩展的知识操作系统。

但它一直缺了一件事：AI。

你可以装聊天插件跟 AI 对话，但那只是"问答"。真正的痛点是——你的 AI 读不到你的笔记，你的笔记也进不了 AI 的上下文。 两者各自为政，知识管理的最后一公里始终跨不过去。

直到 Claudian 出现。

Claude Code：2026 年最强的 AI Agent

如果说 ChatGPT 是一个"问答机器人"，那 Claude Code 就是一个能自主行动的超级员工。

你给它一个任务："把这几个文件读一下，总结成一份报告，存到指定文件夹。"它不是给你一段文字回复——它是真的去读文件、真的去写文件、真的去创建文件夹。全程自主，不需要你一步一步指挥。

这就是 Agent 和聊天机器人的本质区别：一个只会说话，一个能干活。

但 Claude Code 的定价让人肉疼：

Plus 版 $20/月，有严格的额度限制，重度用两天就超标
Pro 版 $200/月（约 1400 人民币），才能无限制使用
国内还要解决网络问题，api.anthropic.com 直连基本不可能

功能极强，但门槛极高。 对于大多数知识管理用户来说，这个价格就是为了"写笔记"付的，完全不成比例。

本地大模型：你 Mac 里沉睡的巨兽

这里要说一件大多数人不知道的事。

你桌面上的那台 Mac，本身就是一台 AI 超级计算机。

Apple Silicon 的 GPU 性能被严重低估了。M2/M3/M4 系列芯片，配合苹果的 MLX 框架，能在本地流畅运行 27B 级别的大模型。什么意思？就是跟 Claude、GPT-4o 同一量级的模型，直接跑在你自己的 Mac 上。

完全免费、完全离线、完全私密。你的数据不用离开本机，你的想法不用经过任何第三方的服务器。

但之前的问题是——本地大模型只能打开个网页窗口聊天。它没有 Agent 能力，不能读写文件，不能自主行动。 一头被困在笼子里的猛兽。

三者组合 = 核弹级效果

现在，把这三样东西拼在一起：

Obsidian（你的知识库） ←→ Claudian（Agent 引擎） ←→ oMLX（本地大模型）

Obsidian 提供上下文——你的所有笔记、知识图谱、双向链接
Claudian 提供行动力——Claude Code 的 Agent 引擎，能读文件、写文件、执行多步任务
oMLX 提供大脑——本地运行的 27B 大模型，免费、离线、无限调用

三者缺一不可。

单有 Obsidian + 本地模型，只能聊天，没有 Agent 能力。
单有 Obsidian + Claude Code，有 Agent 但要用云端 API，贵还要翻墙。
单有 Claude Code + 本地模型，能干活但没有知识库上下文。

三者组合在一起，才是真正的"私人 AI 助理"——读得懂你的笔记，干得了活，还免费。

二、搭建流程：三个部件，逐一就位

说实话，整个搭建过程比我预期的简单太多。下面按顺序走。

部件 1：Obsidian

如果你还没装 Obsidian，去官网下载就行，Mac/Windows/Linux 全平台支持，免费用。

obsidian.md

这一步应该没人卡住。你已经看到这篇文章了，大概率已经有了。

部件 2：oMLX —— 唤醒 Mac 的沉睡算力

oMLX 是基于苹果 MLX 框架的本地大模型推理服务器。一句话总结：苹果官方框架 + OpenAI 兼容接口 + 一键启动。

安装就两条命令：

pip install omlx
omlx serve

启动后，浏览器打开 http://localhost:8000，看到模型列表和管理后台，就成功了。

关键提示：

24GB+ 内存的 Mac，推荐跑 27B 量化模型（如 Qwen3.6-27B-4bit），能力接近 GPT-4o
16GB 内存，跑 7B-14B 模型，日常够用
8GB 内存及以下，建议直接看第三方 API 方案，本地跑体验较差

不知道怎么选模型？可以参考我之前写的《2026 本地大模型横评：Qwen 3.5、Gemma 4、GLM-5.1》，帮你理清各型号的差异。

首次启动会自动下载模型（约 14GB），下载完就存在本机了，以后不占网络。

除了 oMLX，Ollama、LM Studio、llama.cpp 等部署工具怎么选？我之前写过一篇《本地部署 AI 大模型横评》，从 10 个维度做了对比，可以帮你找到最适合自己的方案。

部件 3：Claudian —— 把 Claude Code 塞进 Obsidian

Claudian 是 Claude Code 的 Obsidian 嵌入式版本。装上它，你的 Obsidian 就拥有了 Claude Code 的全部 Agent 能力。

但它还没上架 Obsidian 官方插件市场，需要通过一个叫 BRAT 的工具安装：

第 1 步：Obsidian 设置 → 社区插件 → 浏览 → 搜索 "BRAT" → 安装并启用

第 2 步：进入 BRAT 设置 → 点击 "Add beta plugin" → 输入插件 ID github.com/YishenTu/cl… → 点击 Add plugin

第 3 步：返回社区插件列表 → 找到 Claudian → 启用

搞定。左侧边栏会出现 Claudian 的面板图标。

整个过程大概 3 分钟。

三、关键一步：把它们连起来

三个部件都就位了，现在要做最后一件事——让 Claudian 通过本地大模型跑起来。

这里有一个关键的技术细节，直接决定了你的体验是天壤之别。

为什么不能直接连？

oMLX 提供的是 OpenAI 格式 的 API 接口。
Claudian 的 Agent 引擎期望的是 Anthropic Claude 格式 的 API 接口。

两者看起来都是 JSON，但内部结构完全不同——尤其是 工具调用（tool calling） 的格式，差异更大。

如果你直接把 Claudian 连到 oMLX 的 8000 端口，聊天功能能用，但 Agent 的工具调用会出问题。 也就是说，Claudian 最核心的"自主行动"能力会被削弱。

解决方案：一个 126 行的代理

我的方案是部署一个轻量代理（Node.js 写的，总共 126 行代码），夹在 Claudian 和 oMLX 之间：

Claudian ──→ 代理(port 4003) ──→ oMLX(port 8000)
  ↑ Claude 格式         ↑ 格式翻译        ↑ OpenAI 格式

代理做的事情很简单：

接收 Claudian 的 Claude 格式请求
翻译成 OpenAI 格式，转发给 oMLX
把 oMLX 的响应翻译回 Claude 格式，返回给 Claudian

Claudian 完全不知道自己用的是本地模型。 它以为自己在跟 Anthropic 的服务器通信，行为跟原生 Claude 完全一致。Agent 的所有功能——读写文件、工具调用、多步推理——全部正常工作。

核心配置

Vault 根目录下创建一个 .env.local 文件：

ANTHROPIC_BASE_URL=http://127.0.0.1:4003
ANTHROPIC_API_KEY=你的oMLX密钥

然后在 Claudian 设置里选择 claude provider，模型选 haiku。

对，就两行配置。

一键启动

oMLX 和代理可以整合成一个启动脚本，核心逻辑如下：

# 启动 oMLX 大模型服务
nohup omlx serve --model-dir ~/omlx-models --port 8000 &

# 启动格式代理
nohup env OMLX_PROXY_PORT=4003 OMLX_API_KEY=你的密钥 \
  node omlx_anthropic_proxy.mjs &

echo "✅ oMLX + Claude 代理已就绪"

双击运行，两个服务自动在后台启动。日常使用完全无感。

完整的安装教程和两套方案的详细对比，我已经整理成了一篇完整文档，文章末尾会放链接。

四、装完之后，你能干什么？

这才是重头戏。

场景 1：让 AI 读你的笔记

在 Claudian 的对话框里输入 @，可以引用你 Vault 里的任何笔记。

"参考 @2026年Q1复盘这篇笔记，帮我写一份 Q2 的计划。"

AI 会真正去读取那篇笔记的内容，基于你的实际数据来写计划。不是泛泛而谈，而是基于你的知识输出。

这是普通聊天插件做不到的——它们看不到你的笔记。

场景 2：让 AI 帮你写笔记

"帮我写一篇关于 Obsidian 插件开发的笔记，参考我之前写过的 @Codex教程那篇的风格。"

AI 会读取参考笔记，分析你的写作风格，然后直接生成一篇新笔记，自动保存到你的 Vault 里。 你只需要审核和微调。

场景 3：一句话，多步任务

"把我技术笔记文件夹里所有关于 Docker 的笔记找出来，提取要点，整理成一份学习路线图，存成新笔记。"

Agent 会自动执行以下步骤：

扫描文件夹，找到所有相关笔记
逐篇阅读，提取核心要点
按逻辑组织成学习路线
创建新笔记文件，写入 Vault

你只需要说一句人话，剩下的全自动完成。

场景 4：永远在线的私人 AI

飞机上、地铁里、信号差的酒店、断网的山里——你的 AI 助理永不掉线。

不需要网络，不需要 API 额度，不需要翻墙。你的 Mac 在，你的 AI 就在。

我第一次在飞机上用这个组合写笔记的时候，旁边座位的人凑过来问："你没开飞行模式吗？这都能联网？"

我说："不需要联网。"

他看了我五分钟。

如果你想打造更完整的离线 AI 全家桶——聊天、生图、知识库全部本地运行，可以参考我之前写的《2026 本地 AI 末日堡垒：llama.cpp + ComfyUI + OpenWebUI 多模态全家桶》。

场景 5：隐私 100% 安全

你的笔记里可能有商业计划、可能有客户信息、可能有你还没准备好公开的想法。

用云端 API 的时候，这些数据会经过第三方的服务器。不管对方说什么"我们不保存数据"，数据离开了你的设备，你就失去了控制权。

本地方案下，你的笔记、你的对话、你的想法，全部在本地完成。不经过任何外部服务器，不产生任何网络请求。

这不是"更安全"，这是根本不存在隐私风险。

五、算一笔账

项目	传统方案	本地方案
AI 订阅费	$200/月（≈1400 元）	0 元
网络工具	必需（额外成本）	不需要
年费用	≈16,800 元	0 元
隐私风险	数据过云端	100% 本地
离线可用	不行	随时可用
硬件成本	任意设备	Mac（已购，沉没成本）

一年省 1.68 万。还更安全、更自由、永不掉线。

而且你用来跑这套组合的 Mac，本来就是你要买的。这不是额外成本，这是让已有的硬件发挥最大价值。

六、说几句大实话

本地 27B 量化模型的能力，大约相当于云端 GPT-4o 的 80-85% 。

日常写笔记、整理知识、辅助创作、读写文件——完全够用，体验丝滑。

差距主要体现在：

极其复杂的逻辑推理，本地模型偶尔会"跑偏"
超长上下文（10 万 token 以上），本地模型的注意力会下降
某些垂直领域的专业知识，云端旗舰模型确实更深

但反过来想：85% 的能力，0 元/月，vs 100% 的能力，1400 元/月。

对于知识管理这个场景，85% 就是 100%。你不需要让 AI 帮你设计火箭发动机，你需要的是它能读懂你的笔记、帮你整理思路、写出像样的初稿。这件事，本地 27B 模型做得非常好。

而且它是免费的。你可以无限试用，写废了重来，不心疼。

没有 Mac？没关系。我之前写过一篇《3000 元老电脑跑起 35B 大模型》，3000 块的二手 Windows 电脑也能流畅跑 35B 模型，效果不差。

最后说两句

2026 年了，我们终于到了一个节点：每个人都能拥有属于自己的私人 AI 助理。

不需要等 OpenAI 降价。
不需要等国内出平替。
不需要把数据交给第三方。

你需要的算力，早就在你桌上了。

Obsidian 给了你一个知识管理的容器。
Claude Code 给了一个能自主行动的 Agent 引擎。
本地大模型给了一个免费、离线、私密的大脑。

三者组合在一起，就是 2026 年最强的个人 AI 工作流。

自由、免费、私密。还要什么自行车？

你在用什么设备跑本地大模型？Mac 还是 Windows？配置过程中遇到什么问题？欢迎在评论区留言交流。

如果觉得这篇文章帮到了你，欢迎点赞 + 关注，后续会持续更新这套组合的进阶玩法。