从公众号到全网收藏：OpenClaw 如何把碎片信息统一进知识库从公众号到全网收藏：OpenClaw 如何把碎片信息统一

从公众号到全网收藏：OpenClaw 如何把碎片信息统一进知识库

公众号、任意网页、小红书收藏、RSS 订阅……散落各处，用时找不到。本文记录如何用 OpenClaw 把多源信息统一沉淀到本地，配合 AI 随时检索调用。

日常会遇到几个常见场景：

最近用 OpenClaw 搭了一套自动化链路，把这些散落的内容统一沉淀到本地知识库，配合 AI 随时检索。核心做了三件事：

所有内容都落在本地目录（默认 ~/knowledge_base/），统一文件夹 + 索引体系——不是散落在各个 App 收藏夹里，而是可检索、可追溯的资料池。

备份或跨机器协作时，把整个目录推到 GitHub 即可。OpenClaw 里的 AI 可以按路径读文件、做问答和调用工具。

分了几套知识库，各自一套分类目录和关键词（自动归类用）：

分类可按需调整，打开配置改关键词即可，改完立即生效。

目前以图文/偏文字为主。视频类内容（小红书视频、B站视频）需要另做转写/字幕处理，是下一个阶段。

上一版只支持公众号（mp.weixin.qq.com），用 Playwright 抽正文再分类建索引。

升级后的 kb_collector 改成了统一页面抓取模块：

不是所有站点都能 100% 成功——登录墙、强反爬会影响抓取；公开可读、结构正常的页面成功率最高。对日常读文章、做主题调研已经够用。

抓取成功后按配置路由写入对应知识库，README 索引 + 原文可追溯。

另一个痛点是收藏 ≠ 入库：

关键思路：先批量把笔记"拉出来、结构化"，再决定哪些值得长期进知识库。不是一股脑全塞进库。

信息过载场景：

rss_daily 的核心思路：

RSS 负责「不漏更新」，AI 负责「读得完、抓重点」

它们是一条 输入 → 结构化沉淀 → 再被 AI 利用 的流水线。

最值得投资的可能不是更长的系统提示词，而是把「能稳定落盘」的链路和工具先搭好。工具会迭代，但「能存、能找、能喂给 AI」这一层逻辑不会过时。

首发于公众号：智码探路