告别收藏夹吃灰:我开源了一个能「读懂」内容的 AI 超级知识库

0 阅读7分钟

你有没有过这样的时刻?

  • 刷到一篇深度好文,点个收藏,然后……再也没有然后。
  • 小红书/抖音上看到干货截图,存了几百张,想找时翻到手软。
  • 想用 Notion / Obsidian 搭建知识库,但手动整理太累,坚持三天就放弃。
  • 想向 AI 提问自己收藏的内容,却要复制粘贴,上下文还得自己拼。

收藏 = 吃灰,几乎是所有信息焦虑者的共同痛点。

于是我从零开发了一个开源项目 —— Everything Capture

它不是一个简单的「网页收藏」工具,而是一个带 AI 大脑的个人知识管理平台。你可以把它想象成:Pocket + Notion + ChatGPT,而且是开源的,数据全在你本地。

GitHub 项目地址(欢迎 Star):GitHub.com/agentenatal…

Screenshot 2026-03-30 at 21.58.50.png

知识库主页面展示

一句话介绍

Everything Capture —— 个人内容收藏与知识管理工具。

  • 前端网站 / 手机网页 一键采集任何链接和文本
  • 免费自动提取正文、下载媒体(图片/视频)、OCR 识别图片文字语音转文字(视频字幕/音频)
  • 内置 AI 助手,可对收藏库进行问答、摘要、整理、导出
  • 支持 Docker / 本地源码运行

技术栈亮点:Python FastAPI 后端 + 纯前端 SPA + SQLite FTS5 全文搜索 + OpenAI 兼容 AI(也可以接入本地模型)+ macOS Vision OCR + mlx-whisper 本地语音转文字。

核心功能:不止于「收藏」

1. 多端采集,无感保存

  • 手机快捷指令:在 Safari 分享菜单中调用,URL 推送到后端,后台自动提取。
  • 手机网页采集页:一个轻量 PWA,手动粘贴链接或文本,可配置。
  • 支持大量平台:微信公众号、小红书、抖音、普通网页……都有专门的解析器。

Screenshot 2026-03-30 at 22.02.39.png

前端一键采集

2. 智能内容提取,媒体全下载

  • 正文提取:trafilatura + BeautifulSoup,准确率高于大多数「阅读模式」。
  • 图片/视频下载:自动下载文章内嵌图片、视频封面,yt-dlp 支持抖音/YouTube 等复杂站点。
  • OCR 文字识别:调用 macOS Vision 框架,提取图片中的文字和二维码链接。
  • 视频字幕 & 语音转文字:自动提取内嵌字幕,或调用 mlx-whisper(本地运行,无需联网)将视频语音转为文字,繁体自动转简体。
  • 所有媒体文件保存在本地 media/ 目录,可随时导出。

3. AI 助手:你收藏库的智能管家

内置 AI 对话界面(支持 Chat 和 Agent 两种模式):

  • Chat 模式:普通问答,可引用当前阅读的条目和整个知识库。
  • Agent 模式:拥有工具调用能力,可以:
    • 搜索收藏库中的条目
    • 按语义整理内容到文件夹
    • 自动打标签
    • 批量导出为 ZIP
    • 同步到 Notion / Obsidian
    • 执行沙盒命令(安全受限,如 git clone、下载文件、解压等)
    • 长期记忆:记住你的偏好、分类习惯、常用术语(例如「我的项目」会自动展开为具体项目名)

Screenshot 2026-03-30 at 21.57.08.png 阅读器Sidebar里的AI,边读边问

Screenshot 2026-03-30 at 22.07.23.png AI对话界面,为你归纳总结

Screenshot 2026-03-30 at 22.07.09.png Agent 模式,帮你操作。

所有 AI 操作都有权限开关,你可以决定是否允许 AI 管理文件夹、执行命令等,敏感操作(如系统命令)需要用户逐条审批

4. 知识库与知识图谱

  • 自动读取你本地的 Obsidian Vault,将 Markdown 笔记纳入检索范围。
  • 内置 TF-IDF + Cosine Similarity 检索算法,支持语义扩展。
  • 前端提供知识图谱视图:节点是你的收藏条目和笔记,边表示内容相似度,可以直观看到信息之间的关联。

5. 文件夹 + 标签 + 页面笔记 + 高亮

  • 文件夹:支持两层嵌套,可拖拽排序。
  • 页面笔记:为每个条目单独写笔记,可关联 AI 对话消息。
  • 阅读器高亮:在阅读模态框中选中文字添加高亮(黄/绿/蓝/红),并可附带笔记。

技术特色:为什么我选择这样造轮子

1. 数据完全本地,隐私可控

所有数据(数据库、媒体文件、AI 记忆、加密密钥)默认存储在 ~/Library/Application Support/Everything Capture(macOS)或自定义目录。数据库是 SQLite WAL 模式,全文搜索使用 FTS5 trigram,支持中文。不上传任何用户数据到我的服务器,只有你自己配置的 AI API key(如 OpenAI / 本地模型)会通过网络调用。

2. 纯前端 SPA,无框架依赖

前端没有用 React/Vue,而是原生 HTML/CSS/JS,代码全部内联在一个 index.HTML 中,通过模块化的 app-*.js 组织。启动时只需一个静态文件服务器(与后端同端口),打包后整个前端不到 1MB。加载极快,资源占用低

3. 桌面应用打包(macOS)【正在开发】

使用 PyInstaller 将后端 + 前端打包为 .app,内置 Python 运行环境和所有依赖。用户下载 DMG 安装后,双击即可运行,无需安装 Python 或任何命令行。桌面版还注册了 LaunchAgent 开机自启,后端进程常驻,资源占用极低(空闲时 CPU ~0%,内存 ~150MB)。

4. AI Agent 沙盒安全设计

AI 调用工具时,所有可能产生副作用的操作(下载文件、执行脚本、git clone)都在沙盒目录exports/)内运行,命令白名单限制(lscatgitcurl 等),禁止 rm -rf /sudo 等危险指令。系统级命令(如 openPython)需要用户在弹窗中逐条批准,并有 10 分钟过期机制。

5. 组件系统

支持可插拔组件,例如 local-transcription 组件提供了 mlx-whisper 本地语音转文字环境(macOS ARM64 专用)。组件可通过远程 manifest 自动安装更新,也可以内置在桌面应用中。


对比同类工具:Everything Capture 的独特定位

工具采集正文提取媒体下载AI 问答本地知识库开源桌面应用数据自托管
Pocket✅(付费)
Instapaper
Raindrop.io
Omnivore✅(旧版)✅(自部署)
Notion Web Clipper✅(需手动)
Obsidian
Everything Capture✅(Agent + 记忆)✅(含 Obsidian)✅(macOS)

总结:Everything Capture 是目前唯一一个同时具备以下特性的开源工具:总结:Everything Capture 是目前唯一一个同时具备以下特性的开源工具:

  • 多端采集 + 强大正文提取 + 媒体下载
  • AI 助手(对话 + 工具调用 + 长期记忆)
  • 本地知识库(支持 Obsidian 集成)
  • 桌面应用打包(macOS,无需命令行)
  • 数据完全自托管,无厂商锁定

适用人群

  • 知识工作者 / 研究员 / 学生:收集大量资料,需要快速检索和 AI 辅助分析。
  • 开发者:想自托管一个知识管理工具,或学习 FastAPI + AI Agent 实现。
  • 效率爱好者:喜欢折腾 Obsidian / Notion,希望自动化内容采集和整理。
  • 注重隐私的你们:不愿意把数据交给 Notion / Evernote 等云端服务。

一行命令行代码一键部署?

没错,将下面的代码复制到命令行即可开始。

curl -O https://raw.githubusercontent.com/agentenatalie/everything-capture/main/setup.sh && bash setup.shDocker 部署(即将支持)

浏览器访问 http://localhost:8000 即可使用。


项目现状与未来计划

  • 当前状态:核心功能已完成。
  • 近期计划
    • 发布 Windows 版本(PyInstaller + 跨平台兼容性调整)
    • 增加全文搜索高亮、高级筛选
    • 支持更多 AI 模型(如 Ollama 一键接入)
    • 完善手机端口采集/App开发(iOS/Android 原生采集器)
  • 欢迎贡献:代码开源,Issue / PR 均欢迎。尤其需要前端优化、Windows 打包、更多平台提取器。

写在最后

开发 Everything Capture 的初衷很简单:我自己需要一个真正能「消化」收藏内容的工具

市面上的稍后阅读工具只能「存」,不能「懂」。而 Notion/Obsidian 虽然强大,但手动整理成本太高。AI 爆发后,我觉得是时候把「收藏」和「智能」结合起来了。

如果你也有类似困扰,不妨试试这个工具。如果觉得有用,点个 Star 就是对我最大的支持

欢迎在评论区提问、提建议,我会一一回复。

GitHub 地址:GitHub.com/agentenatal…
项目落地页:agentenatalie.GitHub.io/everything-…(可在这里查看详细截图和视频演示)

让信息不再吃灰,让 AI 帮你消化。