跟着Karpathy从零搭建爆火的个人AI知识库

0 阅读9分钟

跟着Karpathy从零搭建爆火的个人AI知识库

为什么这件事值得关注?

前特斯拉AI总监、OpenAI创始成员Andrej Karpathy,最近在推特上分享了一件事:他用AI搭建个人知识库,结果两天内吸引了千万人围观。

他说:"我最近发现一件非常有用的事——用LLM为各种研究主题建立个人知识库。这样一来,我最近的大部分token使用量更多地用于处理内容,而不是编写或修改代码。"

简单来说,这位AI大神发现:与其让AI帮你写代码,不如让AI帮你整理知识

为什么?因为在这个信息爆炸的时代,我们每天都在产生和接收大量信息,但很少有时间去整理和消化。AI知识库就是来解决这个问题的——它像一个24小时不休息的图书管理员,帮你收集、整理、关联所有知识。

核心思路:简单到不可思议

Karpathy的方法简单得令人惊讶:

不要分散,要集中。

不要把笔记分散在各种应用里(Notion、印象笔记、备忘录、微信收藏...),而是全扔进一个文件夹。然后让AI把这些材料整理成个人维基——生成摘要、把内容关联起来、整理文章。

这个方法不需要:

  • ❌ 特殊软件
  • ❌ 数据库
  • ❌ 复杂的配置

只需要:文件夹 + 文本文件 + AI

五步搭建你的AI知识库

第一步:三个文件夹,两分钟搭好

打开你的电脑,在任意位置创建一个项目文件夹。在里面创建三个子文件夹:

my-knowledge-base/
├── raw/      # 你的源材料 - 文章、笔记、截图
├── wiki/     # AI写入整理后内容的地方
└── outputs/  # AI生成的答案、报告和研究

就这么简单。这就是整个知识库的基础设施。

这三个文件夹的分工:

  • raw/:你的"杂物间",什么都往里扔,不用整理
  • wiki/:AI的"工作室",它在这里帮你整理出条理
  • outputs/:你的"成果库",存放AI生成的答案和报告

第二步:不用整理,什么都往里扔

大多数人在这里卡住了。他们创建了文件夹,然后盯着空空如也的raw/目录,不知道该放什么。

答案是:什么都往里扔。

  • 把文章复制粘贴成.md或.txt文件
  • 截图和图表直接保存
  • 从你现在用的任何应用里导出笔记
  • 会议记录、研究论文、项目文档
  • 还有那些囤了几个月的书签,统统扔进去

关键原则:别整理、别重命名、别清理,这些活儿都是AI的。

Karpathy的原话是:"超级简单,完全扁平"。没有数据库,没有插件,就是一个告诉AI规则的文本文件。

第三步:让AI自动把网页存进来(可选但推荐)

手动复制粘贴太麻烦?可以用工具自动化。

Vercel Labs发布的agent-browser是一个免费的命令行工具,让你的AI Agent操控实际的Chrome浏览器。GitHub上26K+星标。

安装:

npm install -g agent-browser
agent-browser setup

使用:

agent-browser open https://some-article-you-want.com
agent-browser get text "article"

AI打开页面,抓取文章文本,你把它导入到raw/里的文件。

这个工具的优势:

  • 能处理JavaScript动态加载的网站
  • 能处理需要登录才能看的内容
  • 能处理带交互式图表的研究论文
  • 比Playwright MCP省82%的token

用在知识库上,流程很简单:看到想要的文章,跟AI说一声「把这个URL抓下来存到raw/」,agent-browser就搞定了。

第四步:给AI一份说明书,让它知道怎么干

这是大多数人会跳过的部分,别跳过

在项目根目录创建一个叫CLAUDE.md的文件(或AGENTS.md或README.md)。这个文件让AI知道你的知识库是干什么的、该怎么整理。

这是一个你现在就可以复制的起始模板:

# 知识库 Schema

## 这是什么
一个关于 [你的主题] 的个人知识库。

## 如何组织
- raw/ 包含未处理的源材料。永远不要修改这些文件。
- wiki/ 包含整理后的维基。完全由AI维护。
- outputs/ 包含生成的报告、答案和分析。

## 维基规则
- 每个主题在wiki/中有自己的.md文件
- 每个维基文件以一段摘要开头
- 使用[[topic-name]]格式链接相关主题
- 在wiki/中维护一个INDEX.md,列出每个主题及一行描述
- 当添加新的原始源时,更新相关的维基文章

## 我的兴趣点
[列出3-5个你希望这个知识库关注的方向]

Karpathy自己也说了,他的AGENTS.md里的schema "超级简单,完全扁平"。

这个文件相当于给AI写一份你这个知识库专用的说明书。告诉它:

  • 这是什么知识库?
  • 文件怎么组织?
  • 整理时遵循什么规则?
  • 你关注什么主题?

第五步:一条指令,AI把笔记编成维基

打开Claude Code(或Cursor,或任何能读取文件的AI编码工具),打开你的项目文件夹,然后说:

"读取raw/中的所有内容。然后按照CLAUDE.md中的规则在wiki/中编译一个维基。先创建INDEX.md,列出所有主题,然后为每个主题创建维基页面。使用[[链接]]连接相关概念。"

AI会:

  1. 读取raw/中的所有文件
  2. 理解内容,提取关键信息
  3. 在wiki/中创建INDEX.md(目录)
  4. 为每个主题创建维基页面
  5. 用[[链接]]把相关概念关联起来

然后你就可以问AI问题了:

  • "总结一下[[机器学习]]的核心概念"
  • "对比[[监督学习]]和[[无监督学习]]"
  • "基于我的知识库,写一份关于XX的报告"

这个方法为什么有效?

1. 降低了认知负担

传统的知识管理方法要求你先整理再存储,这增加了认知负担。Karpathy的方法反其道而行:先存储,让AI帮你整理

你不需要在保存文章时就想好它属于哪个分类,只需要扔进去,AI会帮你找到它和其他内容的关联。

2. 利用了AI的关联能力

人脑擅长记忆,但不擅长建立海量信息之间的关联。AI正好相反——它可以快速扫描所有内容,找到你没想到的关联。

比如,你可能忘了三个月前读过一篇关于"注意力机制"的文章,但AI记得,并且能在你问"Transformer"时把两者关联起来。

3. 越用越好用

传统笔记应用是"死"的——你放进去什么,它就保存什么。AI知识库是"活"的——随着你添加更多内容,AI能建立更多关联,生成更深度的洞察。

Karpathy说:"之后越用越好用。"

适用场景:谁适合用这个方法?

✅ 适合的人

研究人员

  • 需要跟踪大量文献
  • 需要跨论文建立概念关联
  • 需要快速生成文献综述

内容创作者

  • 需要收集素材和灵感
  • 需要整理竞品分析
  • 需要生成内容大纲

终身学习者

  • 学习多个领域的知识
  • 需要建立知识体系
  • 想要一个"第二大脑"

项目经理

  • 需要整理项目文档
  • 需要跟踪会议记录
  • 需要生成项目报告

❌ 不适合的人

追求即时满足的人

  • 这个方法需要持续投入,不是一次性设置
  • 知识库的价值随着时间积累,不是立竿见影

已经有完善知识管理体系的人

  • 如果你已经有Notion/Obsidian等成熟体系,且运转良好,没必要迁移

只需要简单笔记的人

  • 如果你只是偶尔记点笔记,用手机备忘录就够了

进阶技巧:让知识库更强大

1. 定期维护

建议每周花15分钟:

  • 把新收集的素材扔进raw/
  • 让AI更新wiki/
  • 检查INDEX.md是否完整

2. 多主题知识库

如果你有多个不相关的研究主题(比如"机器学习"和"投资理财"),建议创建多个知识库,每个有自己的CLAUDE.md。

3. 结合其他工具

  • Obsidian:用Obsidian打开wiki/文件夹,享受图谱视图
  • Zotero:把论文先导入Zotero,再导出到raw/
  • Readwise:把高亮内容自动同步到raw/

4. 自动化收集

除了agent-browser,还可以:

  • 用IFTTT把喜欢的文章自动发送到指定邮箱,再自动保存到raw/
  • 用浏览器插件一键保存网页内容
  • 用Alfred或Raycast创建快捷指令

常见问题解答

Q:我的数据安全吗? A:这个方法的数据完全存储在你的本地电脑,不会上传到云端(除非你使用云同步工具)。AI处理时也只是读取本地文件。

Q:需要付费吗? A:基础方法完全免费。agent-browser是免费的,Claude Code有免费额度。只有调用AI API时可能需要付费(取决于你的使用量)。

Q:可以用其他AI工具吗? A:可以。Claude Code、Cursor、GitHub Copilot Chat等任何能读取文件的AI工具都可以。

Q:中文内容支持好吗? A:支持。AI处理中文内容没有障碍,链接语法[[主题名]]也支持中文。

Q:手机能用吗? A:知识库本身在手机上看不了(因为是本地文件)。但你可以:

  • 用云同步(iCloud/OneDrive/Dropbox)在手机上访问
  • 或者把outputs/里的报告导出到手机阅读

总结

Karpathy的AI知识库方法,核心就三点:

  1. 简单:三个文件夹,一个说明书,搞定
  2. 实用:AI帮你整理,你只管扔素材
  3. 有效:越用越好用,建立真正的知识体系

在这个信息过载的时代,重要的不是收集信息,而是建立信息之间的关联。AI知识库就是帮你做这件事的。

如果你也感到被信息淹没,不妨试试这个方法。从今天开始,创建一个文件夹,把第一篇素材扔进去。

记住Karpathy的话:"超级简单,完全扁平。"


快速开始清单

  • 创建my-knowledge-base/文件夹
  • 创建raw/、wiki/、outputs/三个子文件夹
  • 创建CLAUDE.md,填写你的知识库规则
  • 把第一篇素材扔进raw/
  • 用AI生成第一份wiki
  • 问AI第一个问题,体验魔法

关注

如果觉得这篇文章对你有帮助,随手点个赞、在看、转发三连吧~如果想第一时间收到推送,也可以给我个星标⭐。谢谢你看我的文章,我们下次再见。