Karpathy 昨天发了条推,9100 万浏览量,就一句话的核心意思:
你的知识库不该只是仓库,它应该是编译器。
我看完之第一反应是:说得对,但怎么做?
他给了一条线:Raw Data → LLM Compiled Wiki → Q&A → File Outputs → Feedback。五个环节,看着简单,真做起来全是坑。
所以今天我自己搭了一套。从装软件到跑通全流程,花了大概两小时。下面我把整个过程讲一遍,你跟着做也能搭出来。
Karpathy 到底在说什么
先聊聊为什么这条推火了。
大部分人做知识管理是这样的:看到好文章,存。好观点,存。值得写的选题,存。存完之后感觉很踏实,像把东西留住了。
但真到写东西的时候呢?资料一大堆,能直接拿来用的几乎没有。文件夹很满,脑子还是空的。
Karpathy 点出来的问题是:卡点不在输入,在中间那道工序。
你囤了一百篇文章,没有人帮你把这些文章压缩成"一句话结论 + 三个可写角度 + 两条金句"。你每次想写东西,还是得从头翻、从头读、从头想。
他说的"编译"就是这个意思:让 LLM 帮你把原始资料加工成可以直接调用的半成品。
这个思路我觉得非常对。但光有思路没用,得落地。
我是怎么搭的
先说我的环境:一台 Windows 笔记本日常用,一台 Linux 服务器跑 AI。你也可以用 Mac + 云服务器,逻辑一样。
工具选择
-
Obsidian(知识库前端,装在电脑上)
-
Syncthing(开源同步工具,两台设备之间自动双向同步)
-
AI 助手(我用的 OpenClaw + GPT-5.4,你用 Claude、Cursor 也行)
为什么用 Syncthing?因为它不走云盘,两台设备直连同步,延迟很低,而且免费开源。你在 Windows 上存一篇文章,几秒钟后 Linux 服务器上就有了。反过来也一样。
知识库结构
在 Obsidian 里建五个文件夹:
00 Inbox/ → 收集箱,文章先扔这里
10 Research Raw/ → 重要的原始材料
20 Research Compiled/ → AI 编译后的主题卡(核心产出)
30 Topics/ → 选题建议和可视化
40 Drafts/ → 文章草稿
这五层对应 Karpathy 那条线:00 和 10 是 Raw Data,20 是 Compiled Wiki,30 和 40 是 Output。
搭建步骤
Obsidian 很简单,下载装好,新建一个 Vault,选个路径就行。装个 Web Clipper 插件,以后浏览网页时一键保存文章到 Inbox。
Syncthing 稍微多一步。两台设备都装上,打开 Web 界面(127.0.0.1:8384),互相添加对方的 Device ID,然后把 Obsidian 的 Vault 文件夹设为共享文件夹。Linux 那边我设的路径是 /root/vaults/potter-jarvis/,Windows 这边是 D:\obsidian\potter\Jarvis。配好之后建个测试文件验证一下,两边都能看到就成了。
AI 编译是关键环节。我给 AI 设了一个主题卡模板,大概长这样:
# 主题卡:[标题]
> 编译自:[来源] | 编译时间:YYYY-MM-DD
## 一句话结论
[不超过 20 字]
## 核心内容
[500-1000 字的结构化整理]
## 对我的价值
- 公众号选题方向
- 个人可以怎么用
## 金句
[可直接引用的句子]
## 可行动项
- [ ] 马上能做的
- [ ] 这周可以做的
你跟 AI 说"编译这篇文章",它读完原文,按这个模板输出一张主题卡。保存到 20 Research Compiled/,Syncthing 自动同步回你的电脑。
日常使用是什么样的
真正跑起来之后,日常操作其实很简单:
你浏览网页看到好文章,用 Web Clipper 一键保存到 Inbox。Syncthing 同步到服务器。你跟 AI 说一句"编译一下 Inbox 里的新文章",几分钟后主题卡就出现在你的 Obsidian 里了。
我今天拿 Dan Koe 的 HUMAN 3.0 系列试了一下:一篇长文 + 一篇知识库 + 一个 YouTube 视频,三份素材,AI 编译成三张主题卡,总共花了大概 15 分钟。如果我自己读、做笔记、整理要点,至少一个半小时。
但重点不只是快。
重点是编译之后,这些素材变成了可以直接用的东西。我打开主题卡,"公众号选题方向"那栏直接列了 4 个角度,金句也摘好了,行动项也列了。我要写文章的时候,不用再回头翻原文,主题卡就是我的工作台。
这就是 Karpathy 说的"编译"的体感。以前知识库是你偶尔回去翻的储物柜,现在它是你每天写东西时打开的工具箱。
这套东西好在哪,坑在哪
先说好的。
积累真的会滚雪球。 每天编译两三篇文章,一个月下来就是六七十张主题卡。半年后你有四百多张,想写什么话题,搜一下主题卡就有素材。这种"越用越厚"的感觉,是传统收藏夹给不了的。
双向同步体验很好。 你不用在 Windows 和 Linux 之间手动搬文件,也不用开浏览器登什么网盘。Syncthing 在后台自己跑,你甚至感觉不到它存在。Obsidian 就是你唯一的入口。
AI 编译省的是最累的那段。 读文章其实不累,累的是"读完之后把有用的东西提炼出来"。AI 帮你做了这一步,你只需要花两分钟扫一眼主题卡,确认没遗漏就行。
再说坑的。
搭建门槛不低。 Syncthing 要两台设备互相配对,Linux 服务器你得会基本操作,AI 编译要配置 prompt。如果你从没碰过命令行,这两小时可能变六小时。
不是零成本。 AI 编译一篇文章大概 $0.01-0.03,一个月正常用下来几块钱,不算多但也不是免费的。如果你用自己的服务器,还有服务器的成本。
需要你养成习惯。 工具搭好了不用等于没搭。你得真的每天花十分钟把新文章扔进去、编译一下。三天打鱼两天晒网的话,知识库还是会变成另一个吃灰的文件夹。
编译质量取决于你的 prompt。 模板设计得好,主题卡很好用;设计得不好,生成一堆正确但没用的废话。这东西需要调几次才能找到适合自己的版本。
谁该试试,谁别折腾
如果你是内容创作者,每周要写好几篇文章 ,强烈建议搭一套。编译后的主题卡会成为你的选题素材库,写东西的时候不用再从零开始想。
如果你是知识工作者,每天要读大量资料做判断 ,也值得试。编译过的主题卡比收藏原文有用得多,因为结论和行动项已经提炼出来了。
如果你一个月才读两三篇文章 ,没必要。用浏览器书签加个笔记软件就够了,搭这套系统是拿大炮打蚊子。
如果你完全不碰技术 ,可以等更简单的方案。现在已经有些 Obsidian 插件能在本地做类似的事,虽然没这么完整,但门槛低很多。
说到底,Karpathy 那个"知识库是编译器"的思路,核心价值在于一个转变:从"存了再说"变成"存了就编译,编译了就能用"。
工具可以是 Obsidian + Syncthing,也可以是 Notion + 插件,甚至可以是飞书 + AI。形式不重要,重要的是你的知识库里,有多少东西是被加工过的、拿出来就能用的。
如果答案是"很少",那不管你存了多少资料,本质上还是在开仓库。