收藏了200条再也没打开?我用AI + Obsidian搭建了一套自动知识库

3 阅读9分钟

从"收藏了就忘"到"AI自动整理、主动推送、帮我写文章"——一个技术管理者的知识库搭建实录。

先说结论

我的知识库现在能做这些事:

  • 发一条链接给AI,30秒后自动生成摘要、打标签、入库
  • 积累的知识卡片互相双链关联,打开图谱就能看到知识网络
  • 每周AI根据知识库自动推荐写作主题,生成初稿,我润色就能发
  • 遇到问题直接问AI,它从知识库里检索回答,带来源引用

这一切的底层是一套我摸索了两个月的方法论,叫 CODE-K。这篇文章是我的完整复盘。

一、我是怎么"沦落"到需要知识库的

我是做AI产品的技术管理者,每天信息轰炸:

  • 微信群里甩过来的技术文章,"先收藏"
  • 刷抖音看到AI工具测评,"以后试试"
  • 开会时老板提到的行业报告,"得找来看看"
  • 看书/听播客觉得有用的观点,"这个好"

结果呢?浏览器收藏夹攒了200多个链接,微信"收藏"列表 infinite scroll,Notion里建了十几个分类文件夹,每个里面不超过3条内容。

最扎心的一次:开会时需要引用一个AI行业的市场数据,我记得"前两天看过",但翻了半小时没找到。最后用搜索引擎重新查的。

那一刻我意识到:收藏不等于拥有,整理不等于掌握。

如果你也有类似的经历,这篇文章可能帮到你。

二、我的核心认知转变

在讲具体方法之前,先说一个认知:

❌ 知识管理 = 整理得更好(更多文件夹、更细的分类) ✅ 知识管理 = 随时能用上、需要时找得到、积累出复利

基于这个认知,我设计了四个步骤,每一步都围绕"用"来设计。

三、CODE-K四步法

CODE来自Tiago Forte的《Building a Second Brain》,我加了K(Knowledge-oriented),针对"有AI助手"的场景做了改造。

C - Capture(捕获):零阻力入库

核心原则:收集阶段不判断价值,先存再说。

我的实际操作:

  1. 看到有价值的内容(链接/视频/文档)→ 转发给AI助手
  2. AI自动完成L1加工:抓取全文 → 生成摘要 → 提取关键词 → 打标签 → 标注来源和可信度
  3. 存入"收件箱",不需要分类

整个过程大概30秒。我只需要做一个判断:"这个值不值得留。"

举个例子:我发一个GitHub项目链接给AI,30秒后收到这样的摘要:

Agent架构设计(来源:GitHub官方文档 | 可信度:A) Agent由LLM、工具、记忆、规划四大组件构成,按模式可分为ReAct、Plan-Execute、反射式三种选型。适合评估AI产品架构和设计多Agent系统时参考。

和传统做法的区别: 以前我收藏一个链接就结束了,再也没有然后。现在AI帮我做了"信息消化"的第一步——至少我知道这条内容讲了什么。

O - Organize(组织):按用途分类

踩过的坑: 我一开始按主题分文件夹——技术/产品/方法论/通用。很快崩溃了:

  • "Claude Code实战进阶"放技术还是工具?
  • "AI产品开发5阶段"放产品还是方法论?
  • "第一性原理"放方法论还是通用?

我的方案: 用Area标签代替物理文件夹,只分5类,按"什么时候会用到"来分:

标签一句话查找场景
AI原理这是什么?需要理解技术本质时
开发工具怎么用?需要动手配置时
产品方法怎么做产品?需要方法论指导时
行业趋势市场怎么样?需要做决策时
基础设施环境怎么搭?需要排障时

最有效的改进是卡片命名。 从"来源导向"改为"用途导向":

  • Harness Engineering实战框架(看了不知道干嘛)
  • 多Agent工程化:7角色7步骤协作框架(内容+用途一目了然)

这个改动效果巨大。现在打开知识库,扫一眼文件名就知道每张卡片是干什么的。

D - Distill(提炼):回答"所以呢?"

这是区别于其他方法论的核心步骤。

大多数知识库的卡片只是"信息"——客观记录了某个概念/工具/方法。但信息不等于知识。信息是"Agent有四大组件",知识是"所以你的产品到底该不该用Agent架构"。

每张知识卡片我强制要求三个固定章节:

💡 一句话总结 — 不看全文也知道核心价值。比如:"Agent不是给大模型套个壳就叫Agent,核心是让大模型能自主调用工具、记忆上下文、规划多步任务。"

🎯 适用场景 — 具体到实际工作,不是"适合所有读者"这种废话。比如:"评估AI产品是不是真Agent时、跟老板解释为什么套壳方案不可行时。"

⚠️ 常见误区 — 这是最有价值的部分。大多数知识的用处不是教你会什么,而是帮你避坑。比如:"以为接入API + 加个Prompt就是Agent。实际上没有工具调用和规划能力的只是增强版聊天机器人。"

这三个章节让卡片从"存了再看"变成"扫一眼就知道有没有用"。

E - Express(表达):知识必须被使用才有价值

最大的坑: 我的知识库运行了两个月,积累了30张卡片,但从来没有"使用"过它们。和收藏夹里的200条链接没有本质区别。

所以我建立了三路输出:

每周主题文章(核心输出)

每周五,AI根据知识库内容推荐3个写作候选主题,我选一个,周末出初稿,我审阅润色。这篇文章就是Express的产物。

知识推送(被动输出)

新卡片入库时,AI自动匹配我当前在做的事情。如果强关联,推送一句话摘要。比如我在做AI能力平台项目时,入库了一张"模型评测选型"卡片,AI立刻推送:"新卡片可能对你有用——评测基准与选型决策"。

每周知识速递(主动输出)

每周一早上,AI推送一份速递——上周各领域新增了什么要点,3分钟看完。

输出类型不限于写文章,还包括给团队的培训PPT、支撑项目立项的方案文档等。

四、AI做了什么,人做了什么

这是和其他知识管理方法最大的区别——AI是执行者,人是决策者。

AI做的:

  • 抓取文章全文、提取视频字幕、转PDF(信息采集)
  • 生成摘要、提取关键词、打标签(L1加工)
  • 搜索知识库、匹配关联卡片(检索推送)
  • 基于知识库内容生成文章初稿(Express辅助)

人做的:

  • 判断信息是否值得保留(价值判断)
  • 写💡🎯⚠️提炼章节(价值提炼——AI可以辅助但不能替代,因为需要结合个人经验)
  • 审阅文章初稿,加入个人观点("人味")
  • 决定知识库的整体方向和节奏

一句话:机械化工作交给AI,价值判断留给人。

五、踩坑清单

坑1:分类洁癖 花了很多时间纠结"这张卡片放哪个分类"。后来发现Area标签+用途命名已经解决了问题,物理目录只是为了打开时不至于太杂。别在分类上花超过10%的精力。

坑2:追求完美 想等知识库"建好了"再开始输出。结果永远"没建好"。正确做法:先跑起来,边用边优化。"别在修路上花太多时间,多跑车。"

坑3:照搬方法论 Zettelkasten要求每天写90张卡片,CODE要求手动高亮→批注→摘要。对有AI助手的场景,这些都可以简化。取各方法论的核心思想(原子化、输出闭环、用途导向),用自己的节奏执行。

坑4:卡片重命名后双链断裂 改了文件名,但其他卡片里的引用没同步更新,Obsidian图谱一下全散了。后来写了脚本批量修复。教训:批量改动一定要同步更新关联引用。

坑5:收件箱素材污染图谱 收件箱里有几十个"摘要.md"文件,全部出现在知识图谱里,看起来像一锅粥。解决办法:在Obsidian设置中把收件箱排除出图谱视图。

六、动手清单

如果你也想开始搭建,建议按这个顺序:

  1. 选工具:Obsidian(免费+双链+图谱),够用了
  2. 先跑C和D:收集10条信息,提炼成3-5张带💡🎯⚠️的卡片,感受效果
  3. 别纠结分类:先全放一个文件夹,超过20张再考虑分目录
  4. 有AI助手就尽早让它参与L1加工:这是最大的效率提升点
  5. 强制自己输出:每周写一段总结,比"收藏了再也没看"强100倍
  6. 接受不完美:前两个月会有很多不顺畅的地方,坚持"边用边改"

当前效果

运行两个月的数据:

  • 30张知识卡片,每张都有💡🎯⚠️,打开就能用
  • 卡片间全部有双链连接,0个孤立节点
  • 知识图谱清晰展示各领域之间的关联
  • 每周主题文章+知识推送+每周速递,三路输出已跑通
  • L1加工完全自动,30秒一条;L2提炼人机协作;Express AI出稿我润色

以前找一个资料要翻10分钟,现在问AI一句话出结果。以前学了就忘,现在每周有输出倒逼我回顾。以前知识是碎片的,现在有图谱让我看到全局。

后记

CODE-K v1.0还在迭代中。卡片在增长,分类在调整,Express的节奏还没有完全稳定。

但核心原则不会变:知识管理的目的不是"存更多",而是"用得上、说得出"。

如果这篇文章对你有启发,或者你也在搭自己的知识库,欢迎交流。


本文基于CODE-K方法论两个月实践总结。工具:Obsidian + AI助手(OpenClaw部署)。