LLM wiki 知识库的最新实现,支持维基百科方式可视化展示

21 阅读5分钟

image.png

CyberMe: 由 LLM Agent 维护的可视化知识库

CyberMe 是一个由 LLM Agent 维护的通用知识库框架,可用于个人、团队或企业知识库。它把原始资料、结构化 Wiki 和 Agent 工作规则放在同一个仓库里,让知识库像代码库一样被持续维护;同时提供类似维基百科的可视化浏览体验,自动维护词条之间的双向链接,并内置中文和英文界面。

github.com/hzw1199/Cyb…

核心理念:

Obsidian 是 IDE,LLM 是程序员,Wiki 是代码库。

快速开始

  1. 在 Obsidian Web Clipper 中先配置下方 Front Matter 模板,确保保存到 raw/ 的 Markdown 都带有来源、类型、裁剪时间和处理状态
  2. 使用 Obsidian Web Clipper 将网页文章转为 Markdown,并保存到 raw/articles/。论文放入 raw/papers/,代码片段放入 raw/code/,暂时无法分类的资料放入 raw/_inbox/
  3. 在 Obsidian 中把图片下载到本地:在 Settings → Files and links 中将 "Attachment folder path" 设置为固定目录(例如 raw/articles/media/),再在 Settings → Hotkeys 中为 "Download attachments for current file" 绑定快捷键;裁剪文章后触发该快捷键,把远程图片保存到本地,方便 LLM 后续单独读取图片获得上下文
  4. 打开支持读写文件的 LLM Agent(例如 Cursor、Claude Code),让它读取 CLAUDE.md 中的 Schema 和流程约定
  5. 对新资料执行 Ingest,让 Agent 将原文整理为 wiki/ 中的概念页、主题页和分析页
  6. 直接向 Agent 提问,让它基于已有 Wiki 回答,而不是每次从零检索
  7. 定期执行 Lint,让 Agent 检查矛盾、断链、孤立页面和缺失概念

所有 raw/ 下的 Markdown 文件必须包含以下 Front Matter:

---
source: "来源 URL"
type: article          # article | paper | repository | transcript | screenshot
clipped_at: "2026-04-05"
status: unprocessed    # unprocessed | ingested | error
title: "文章标题"
tags: []
---

Obsidian Web Clipper 示例

使用 Obsidian Web Clipper 将网页保存为 Markdown 时,可以在侧边栏确认 sourcetypeclipped_atstatustitle 等字段,然后保存到对应目录:

image.png

Ingest 与 Query 示例

向 Agent 发起 Ingest 请求,指定需要录入的 raw/articles/ 原文:

image.png

Agent 会读取 wiki/index.md 和原文,创建或更新概念条目、索引和日志,并在最后输出处理报告:

image.png

之后可以直接向 Agent 提问,它会先读取 wiki 索引和相关条目,再基于已有知识库回答:

image.png

目录结构

CyberMe/
├── CLAUDE.md              # Agent 工作规则和 Wiki Schema
├── visualize/             # 前端可视化应用
├── raw/                   # 原始资料
│   ├── articles/          # 文章类资料
│   │   └── media/         # 文章引用的图片、视频、附件
│   ├── papers/            # 论文类资料
│   ├── code/              # 代码片段类资料
│   └── _inbox/            # 待整理资料
└── wiki/                  # Agent 维护的知识库
    ├── concepts/          # 概念和实体条目
    ├── topics/            # 主题综述和长文分析
    ├── analyses/          # Query 产出的分析页
    ├── index.md           # 内容索引
    └── log.md             # 时间线日志

raw/ 和 wiki/ 通常包含私有资料、团队资料或企业内部资料,默认不提交到公开仓库。

核心约定

CLAUDE.md 是这个框架的核心。它规定了 Agent 在任何操作前必须先读取 wiki/index.md,再判断当前任务属于操作管理、Ingest、Batch Ingest、Lint 还是知识查询。

所有 Wiki 页面都使用 Markdown 和 YAML front matter:

---
aliases: [别名1, 别名2]
related: [相关概念1, 相关概念2]
sources: [raw/articles/xxx.md]
created_at: "2026-04-05"
updated_at: "2026-04-05"
---

正文中使用 Obsidian 风格的 [[双向链接]] 连接概念。

常用指令

在支持读写文件的 LLM Agent 中打开仓库后,可以直接用自然语言操作:

请录入 raw/articles/xxx.md
把 raw/ 里未录入的资料列出来
批量 ingest raw/ 中未录入的资料
某个概念是什么意思?
对 wiki 做一次质检

Agent 会根据 CLAUDE.md 自动维护 wiki/index.mdwiki/log.md、概念页之间的交叉引用,以及 raw 文件的 ingest 状态。

前端可视化

visualize/ 是 CyberMe 的前端可视化应用,用来把 wiki/ 中的 Markdown 知识库渲染成可浏览的网站。

它支持中文和英文两种界面语言:首次打开时会根据浏览器语言自动选择,之后也可以通过页面右上角的语言按钮手动切换,选择会保存在浏览器本地。

它提供两种视图:

  • Wiki 页面:以类 Wikipedia 的样式浏览 concepts、topics、analyses 和 log
  • Galaxy 页面:把概念、主题、分析页渲染成 3D 力导向知识图谱

可视化示例

Wiki 首页会展示知识库概览、主题、概念、分析数量和最近内容:

image.png

可以通过搜索框快速定位概念、主题和分析页:

image.png

概念页展示定义、详细解释、相关链接和条目信息:

image.png

分析页用于保存 Query 过程中沉淀出的长文分析:

image.png

时间线日志按时间记录 ingest、query 和 lint 操作:

image.png

Galaxy 页面把知识库渲染成可交互的 3D 知识图谱:

image.png

启动方式:

cd visualize
npm install
npm run dev

开发服务会读取仓库根目录下的 wiki/,并在 Wiki 文件变化后自动刷新。

构建静态站点:

cd visualize
npm run build
npm run preview

构建产物输出到 visualize/dist/。构建时会把当前 wiki/ 内容和 wiki-manifest.json 一起复制到产物目录,适合部署到 GitHub Pages、Cloudflare Pages、nginx 等静态托管服务。

适合场景

  • 长期维护个人、团队或企业知识库
  • 把收藏文章沉淀为可查询的概念网络
  • 用 Obsidian 浏览由 Agent 整理出的双链 Wiki
  • 让 LLM 基于已有知识库回答问题并沉淀分析