月省 1400 块,我把 Claude Code 搬进了 Obsidian,还让它跑在了自己的 Mac 上

0 阅读12分钟

月省 1400 块,我把 Claude Code 搬进了 Obsidian,还让它跑在了自己的 Mac 上

发布时间:2026-05-13
标签:#Obsidian #ClaudeCode #本地大模型 #AI工作流 #知识管理 #省钱攻略


Free_Local_Claude_for_Mac_page1_img1.png

先说一个场景。

上周我在 Obsidian 里写笔记,顺手打了个 @ 引用了 5 篇之前写过的技术笔记,然后跟 AI 说了一句:"帮我把这 5 篇的要点整理成一份学习路线图。"

30 秒后,一篇结构完整、带有层级分类的学习路线笔记自动出现在了我的 Vault 里。

全程离线、零 API 费用、没联网。 一切跑在我自己的 Mac 上。

Free_Local_Claude_for_Mac_page2_img1.png

我盯着屏幕看了三秒钟,心里只有一个念头:我这台 Mac 以前是不是白买了?

之前那篇《2026 年最强编程神器 Codex,接入本地大模型免费运行》很多读者问:"能不能用在 Obsidian 里?"今天就是答案。这也是我继《Claude Code + llama.cpp + Qwen 3.6 打造最强本地 AI 系统》之后的升级版——这次更简单,不用折腾 llama.cpp,普通用户也能 10 分钟搞定。


一、三个各自为王的工具,为什么凑在一起就炸了?

这件事的核心,是三个工具的"天作之合"。

Free_Local_Claude_for_Mac_page3_img1.png

Obsidian:你的第二大脑

Free_Local_Claude_for_Mac_page4_img1.png

Obsidian 我用了快两年了,真心觉得它是 2026 年最好的知识管理工具,没有之一。

它的核心优势很简单:所有数据都是本地的 Markdown 文件。 你的笔记、你的想法、你的知识图谱,100% 在你自己的硬盘上。不依赖任何云服务,不害怕任何公司倒闭。

双向链接、图谱视图、强大的插件生态——Obsidian 早就超越了"笔记软件"的范畴,它是一个可无限扩展的知识操作系统

但它一直缺了一件事:AI。

你可以装聊天插件跟 AI 对话,但那只是"问答"。真正的痛点是——你的 AI 读不到你的笔记,你的笔记也进不了 AI 的上下文。 两者各自为政,知识管理的最后一公里始终跨不过去。

直到 Claudian 出现。

Claude Code:2026 年最强的 AI Agent

Free_Local_Claude_for_Mac_page5_img1.png

如果说 ChatGPT 是一个"问答机器人",那 Claude Code 就是一个能自主行动的超级员工

你给它一个任务:"把这几个文件读一下,总结成一份报告,存到指定文件夹。"它不是给你一段文字回复——它是真的去读文件、真的去写文件、真的去创建文件夹。全程自主,不需要你一步一步指挥。

这就是 Agent 和聊天机器人的本质区别:一个只会说话,一个能干活。

但 Claude Code 的定价让人肉疼:

  • Plus 版 $20/月,有严格的额度限制,重度用两天就超标
  • Pro 版 $200/月(约 1400 人民币),才能无限制使用
  • 国内还要解决网络问题,api.anthropic.com 直连基本不可能

功能极强,但门槛极高。 对于大多数知识管理用户来说,这个价格就是为了"写笔记"付的,完全不成比例。

本地大模型:你 Mac 里沉睡的巨兽

Free_Local_Claude_for_Mac_page6_img1.png

这里要说一件大多数人不知道的事。

你桌面上的那台 Mac,本身就是一台 AI 超级计算机。

Apple Silicon 的 GPU 性能被严重低估了。M2/M3/M4 系列芯片,配合苹果的 MLX 框架,能在本地流畅运行 27B 级别的大模型。什么意思?就是跟 Claude、GPT-4o 同一量级的模型,直接跑在你自己的 Mac 上。

完全免费、完全离线、完全私密。你的数据不用离开本机,你的想法不用经过任何第三方的服务器。

但之前的问题是——本地大模型只能打开个网页窗口聊天。它没有 Agent 能力,不能读写文件,不能自主行动。 一头被困在笼子里的猛兽。

三者组合 = 核弹级效果

Free_Local_Claude_for_Mac_page7_img1.png

现在,把这三样东西拼在一起:

Obsidian(你的知识库) ←→ Claudian(Agent 引擎) ←→ oMLX(本地大模型)
  • Obsidian 提供上下文——你的所有笔记、知识图谱、双向链接
  • Claudian 提供行动力——Claude Code 的 Agent 引擎,能读文件、写文件、执行多步任务
  • oMLX 提供大脑——本地运行的 27B 大模型,免费、离线、无限调用

三者缺一不可。

单有 Obsidian + 本地模型,只能聊天,没有 Agent 能力。
单有 Obsidian + Claude Code,有 Agent 但要用云端 API,贵还要翻墙。
单有 Claude Code + 本地模型,能干活但没有知识库上下文。

三者组合在一起,才是真正的"私人 AI 助理"——读得懂你的笔记,干得了活,还免费。


二、搭建流程:三个部件,逐一就位

说实话,整个搭建过程比我预期的简单太多。下面按顺序走。

Free_Local_Claude_for_Mac_page8_img1.png

部件 1:Obsidian

如果你还没装 Obsidian,去官网下载就行,Mac/Windows/Linux 全平台支持,免费用。

obsidian.md

这一步应该没人卡住。你已经看到这篇文章了,大概率已经有了。

部件 2:oMLX —— 唤醒 Mac 的沉睡算力

oMLX 是基于苹果 MLX 框架的本地大模型推理服务器。一句话总结:苹果官方框架 + OpenAI 兼容接口 + 一键启动。

安装就两条命令:

pip install omlx
omlx serve

启动后,浏览器打开 http://localhost:8000,看到模型列表和管理后台,就成功了。

关键提示:

  • 24GB+ 内存的 Mac,推荐跑 27B 量化模型(如 Qwen3.6-27B-4bit),能力接近 GPT-4o
  • 16GB 内存,跑 7B-14B 模型,日常够用
  • 8GB 内存及以下,建议直接看第三方 API 方案,本地跑体验较差

不知道怎么选模型?可以参考我之前写的《2026 本地大模型横评:Qwen 3.5、Gemma 4、GLM-5.1》,帮你理清各型号的差异。

首次启动会自动下载模型(约 14GB),下载完就存在本机了,以后不占网络。

除了 oMLX,Ollama、LM Studio、llama.cpp 等部署工具怎么选?我之前写过一篇《本地部署 AI 大模型横评》,从 10 个维度做了对比,可以帮你找到最适合自己的方案。

部件 3:Claudian —— 把 Claude Code 塞进 Obsidian

Claudian 是 Claude Code 的 Obsidian 嵌入式版本。装上它,你的 Obsidian 就拥有了 Claude Code 的全部 Agent 能力。

但它还没上架 Obsidian 官方插件市场,需要通过一个叫 BRAT 的工具安装:

第 1 步:Obsidian 设置 → 社区插件 → 浏览 → 搜索 "BRAT" → 安装并启用

第 2 步:进入 BRAT 设置 → 点击 "Add beta plugin" → 输入插件 ID github.com/YishenTu/cl… → 点击 Add plugin

第 3 步:返回社区插件列表 → 找到 Claudian → 启用

搞定。左侧边栏会出现 Claudian 的面板图标。

整个过程大概 3 分钟。


三、关键一步:把它们连起来

Free_Local_Claude_for_Mac_page9_img1.png

三个部件都就位了,现在要做最后一件事——让 Claudian 通过本地大模型跑起来。

这里有一个关键的技术细节,直接决定了你的体验是天壤之别。

为什么不能直接连?

oMLX 提供的是 OpenAI 格式 的 API 接口。
Claudian 的 Agent 引擎期望的是 Anthropic Claude 格式 的 API 接口。

两者看起来都是 JSON,但内部结构完全不同——尤其是 工具调用(tool calling) 的格式,差异更大。

如果你直接把 Claudian 连到 oMLX 的 8000 端口,聊天功能能用,但 Agent 的工具调用会出问题。 也就是说,Claudian 最核心的"自主行动"能力会被削弱。

解决方案:一个 126 行的代理

我的方案是部署一个轻量代理(Node.js 写的,总共 126 行代码),夹在 Claudian 和 oMLX 之间:

Claudian ──→ 代理(port 4003) ──→ oMLX(port 8000)
  ↑ Claude 格式         ↑ 格式翻译        ↑ OpenAI 格式

代理做的事情很简单:

  1. 接收 Claudian 的 Claude 格式请求
  2. 翻译成 OpenAI 格式,转发给 oMLX
  3. 把 oMLX 的响应翻译回 Claude 格式,返回给 Claudian

Claudian 完全不知道自己用的是本地模型。 它以为自己在跟 Anthropic 的服务器通信,行为跟原生 Claude 完全一致。Agent 的所有功能——读写文件、工具调用、多步推理——全部正常工作。

核心配置

Vault 根目录下创建一个 .env.local 文件:

ANTHROPIC_BASE_URL=http://127.0.0.1:4003
ANTHROPIC_API_KEY=你的oMLX密钥

然后在 Claudian 设置里选择 claude provider,模型选 haiku

对,就两行配置。

一键启动

oMLX 和代理可以整合成一个启动脚本,核心逻辑如下:

# 启动 oMLX 大模型服务
nohup omlx serve --model-dir ~/omlx-models --port 8000 &

# 启动格式代理
nohup env OMLX_PROXY_PORT=4003 OMLX_API_KEY=你的密钥 \
  node omlx_anthropic_proxy.mjs &

echo "✅ oMLX + Claude 代理已就绪"

双击运行,两个服务自动在后台启动。日常使用完全无感。

完整的安装教程和两套方案的详细对比,我已经整理成了一篇完整文档,文章末尾会放链接。


四、装完之后,你能干什么?

这才是重头戏。

场景 1:让 AI 读你的笔记

Free_Local_Claude_for_Mac_page10_img1.png

在 Claudian 的对话框里输入 @,可以引用你 Vault 里的任何笔记。

"参考 @2026年Q1复盘 这篇笔记,帮我写一份 Q2 的计划。"

AI 会真正去读取那篇笔记的内容,基于你的实际数据来写计划。不是泛泛而谈,而是基于你的知识输出

这是普通聊天插件做不到的——它们看不到你的笔记。

场景 2:让 AI 帮你写笔记

"帮我写一篇关于 Obsidian 插件开发的笔记,参考我之前写过的 @Codex教程 那篇的风格。"

AI 会读取参考笔记,分析你的写作风格,然后直接生成一篇新笔记,自动保存到你的 Vault 里。 你只需要审核和微调。

场景 3:一句话,多步任务

"把我技术笔记文件夹里所有关于 Docker 的笔记找出来,提取要点,整理成一份学习路线图,存成新笔记。"

Agent 会自动执行以下步骤:

  1. 扫描文件夹,找到所有相关笔记
  2. 逐篇阅读,提取核心要点
  3. 按逻辑组织成学习路线
  4. 创建新笔记文件,写入 Vault

你只需要说一句人话,剩下的全自动完成。

场景 4:永远在线的私人 AI

Free_Local_Claude_for_Mac_page11_img1.png

飞机上、地铁里、信号差的酒店、断网的山里——你的 AI 助理永不掉线。

不需要网络,不需要 API 额度,不需要翻墙。你的 Mac 在,你的 AI 就在。

我第一次在飞机上用这个组合写笔记的时候,旁边座位的人凑过来问:"你没开飞行模式吗?这都能联网?"

我说:"不需要联网。"

他看了我五分钟。

如果你想打造更完整的离线 AI 全家桶——聊天、生图、知识库全部本地运行,可以参考我之前写的《2026 本地 AI 末日堡垒:llama.cpp + ComfyUI + OpenWebUI 多模态全家桶》。

场景 5:隐私 100% 安全

你的笔记里可能有商业计划、可能有客户信息、可能有你还没准备好公开的想法。

用云端 API 的时候,这些数据会经过第三方的服务器。不管对方说什么"我们不保存数据",数据离开了你的设备,你就失去了控制权。

本地方案下,你的笔记、你的对话、你的想法,全部在本地完成。不经过任何外部服务器,不产生任何网络请求。

这不是"更安全",这是根本不存在隐私风险。


五、算一笔账

Free_Local_Claude_for_Mac_page12_img1.png

项目传统方案本地方案
AI 订阅费$200/月(≈1400 元)0 元
网络工具必需(额外成本)不需要
年费用≈16,800 元0 元
隐私风险数据过云端100% 本地
离线可用不行随时可用
硬件成本任意设备Mac(已购,沉没成本)

一年省 1.68 万。还更安全、更自由、永不掉线。

而且你用来跑这套组合的 Mac,本来就是你要买的。这不是额外成本,这是让已有的硬件发挥最大价值。


六、说几句大实话

Free_Local_Claude_for_Mac_page13_img1.png

本地 27B 量化模型的能力,大约相当于云端 GPT-4o 的 80-85%

日常写笔记、整理知识、辅助创作、读写文件——完全够用,体验丝滑。

差距主要体现在:

  • 极其复杂的逻辑推理,本地模型偶尔会"跑偏"
  • 超长上下文(10 万 token 以上),本地模型的注意力会下降
  • 某些垂直领域的专业知识,云端旗舰模型确实更深

但反过来想:85% 的能力,0 元/月,vs 100% 的能力,1400 元/月。

对于知识管理这个场景,85% 就是 100%。你不需要让 AI 帮你设计火箭发动机,你需要的是它能读懂你的笔记、帮你整理思路、写出像样的初稿。这件事,本地 27B 模型做得非常好。

而且它是免费的。你可以无限试用,写废了重来,不心疼。

没有 Mac?没关系。我之前写过一篇《3000 元老电脑跑起 35B 大模型》,3000 块的二手 Windows 电脑也能流畅跑 35B 模型,效果不差。


最后说两句

Free_Local_Claude_for_Mac_page14_img1.png

2026 年了,我们终于到了一个节点:每个人都能拥有属于自己的私人 AI 助理。

不需要等 OpenAI 降价。
不需要等国内出平替。
不需要把数据交给第三方。

你需要的算力,早就在你桌上了。

Obsidian 给了你一个知识管理的容器。
Claude Code 给了一个能自主行动的 Agent 引擎。
本地大模型给了一个免费、离线、私密的大脑。

三者组合在一起,就是 2026 年最强的个人 AI 工作流。

自由、免费、私密。还要什么自行车?


你在用什么设备跑本地大模型?Mac 还是 Windows?配置过程中遇到什么问题?欢迎在评论区留言交流。

如果觉得这篇文章帮到了你,欢迎点赞 + 关注,后续会持续更新这套组合的进阶玩法。