本月初,安德烈·卡帕西发布了一篇刷屏文章《LLM 知识库》,在文中他分享了自己为各类研究领域搭建知识库的完整流程……
本月初,安德烈·卡帕西发布了一篇刷屏文章,题为大语言模型知识库,详细讲解了如何为各类研究方向搭建专属知识库。
这套方法非常适合为产品搭建专属知识库,因此本文将带你实操,借助该方法搭建产品调研数据知识库。
为什么要使用这套方法?
选择该方案的核心原因在于:它能让人工智能像拥有完整记忆的真人一样,在处理数据时全程聚焦、记忆留存。
你或许会质疑:“等等,那 NotebookLM 呢?”
产品设计师专属 NotebookLM 用法
NotebookLM 是谷歌推出的一款极具潜力却常常被低估的免费 AI 工具。顾名思义……
uxplanet.org](uxplanet.org/notebooklm-…)
NotebookLM 的核心短板在于对话内容临时失效。使用 NotebookLM 时,对话结束后相关知识便会失效(补充说明:虽然该工具支持保存对话记录,但核心问题在于其数据处理逻辑——它只会为回答问题临时调取数据,对话结束后便不再留存上下文信息)。反观卡帕西的方案,能够让知识持续积累,如同银行存款复利增长。
知识库搭建流程
知识库的载体就是一套维基文档。这套维基由文件夹结构下的多份 .md 格式独立文档组成。
知识库的搭建与使用分为三大核心步骤:
1
数据录入:将原始资料(文章、论文、代码仓库、数据集、图片等)存入 raw/ 原始文件夹,再通过 Claude Code 自动编译生成标准化维基文档。
•
借助编辑器实时预览维基内容
•
可将 Obsidian 作为前端编辑工具,统一查看原始资料、编译后的维基文档以及可视化分析图表。
•
问答交互检索:
•
依托 Claude Code 针对知识库内容发起提问。在产品调研场景中,可快速定位调研盲区,从而补充调研资料、完善内容缺口。
最终生成的维基目录结构如下:
•
raw/ 文件夹:存放项目相关原始资料文件(PDF、文档等),为只读目录,Claude Code 仅读取该文件夹内容,不会做任何修改。
•
wiki/ 文件夹:存放 AI 二次加工整理后的结构化数据。Claude Code 会读取原始目录内容,完成解析梳理后统一归档至该目录。
•
CLAUDE.md:定义 Claude Code 处理数据时需遵循的规则配置文件。你也可在该文件中自定义 raw/ 文件夹的数据规范,为 AI 提供更清晰的上下文指引。
单套维基项目的目录结构示意。
下文将结合真实项目案例,完整演示整套落地流程。
安德烈·卡帕西知识库维基方案的优缺点
该方案具备三大核心优势:
1
上手门槛极低
•
仅需五分钟即可完成项目知识库搭建,无需专业技术能力,也不用部署复杂工具。只需安装配置 Obsidian 与 Claude Code,即可快速投入数据使用。
•
使用成本低廉
•
相较于调研知识库常用的语义检索 RAG 方案(长期开销高昂),卡帕西方案的核心消耗仅为大模型令牌。无持续算力与存储附加费用,且令牌消耗效率极高,大幅降低长期使用成本。
•
大模型深度理解数据关联与规律
•
AI 会全面解析原始资料,自动构建知识图谱,串联各类零散数据信息。
但该方案存在一处明显短板:扩展性有限。
适配中小型项目场景(实测可稳定支撑 300 份以内文件、百万字以内内容),一旦数据体量持续扩增,AI 处理成本会大幅上升。
如何为特定产品搭建专属知识维基
全新知识维基的搭建流程简单易懂,无需安装额外依赖库。只需将安德烈·卡帕西的专属提示词(查看原版提示词)输入 Claude Code,剩余工作均可交由 AI 自动完成。
本文以我自研的 SaaS 项目「Roxy」为例实操演示,这是一款安全漏洞分析工具,当前核心目标是确定产品最优定价模式。为此需要开展全面市场调研,全程由 Claude Code 辅助落地。
完整搭建共分为五步:
第一步:安装 Obsidian 并新建项目
Obsidian 是一款免费的本地知识库搭建工具,需提前下载安装至本地设备。
Obsidian 专业数据分析工具。
安装完成后,新建专属知识库仓库,并自定义本地存储路径。
第二步:在 Claude Code 中打开项目并输入初始化提示词
在 Obsidian 创建新项目后,通过搭载 Claude Code 的代码编辑器(本文使用 VSCode)打开项目根目录。
使用 VSCode 编辑器打开项目目录。
接下来是整套流程中相对复杂的环节:复制这份原版提示词:
复制安德烈·卡帕西公开的原版提示词。
将原版提示词与以下补充指令一同粘贴至 Claude Code 输入框:
[安德烈·卡帕西 原版提示词]
你将担任大语言模型维基智能助手,严格落地我提出的搭建规则。
分步执行操作:创建包含规范规则的 CLAUDE.md 配置文件、
生成索引文档 index.md 与日志文档 log.md、
定义全局文件夹命名规范,并完成首次数据录入示范。
后续所有交互操作,均严格遵循既定文档规范执行。
Claude Code 会自动执行配置初始化,按照指令生成对应项目文件并更新目录结构。配置完成后,工具会提示你录入第一份原始资料。
第三步:向 Claude Code 录入首批原始资料
本次录入一份 2026 年 SaaS 行业定价现状分析 PDF 报告,内容详实、多维度深度解析行业定价规则。
待录入的原版行业分析报告。
将下载完成的 PDF 报告存入项目 raw/ 原始文件夹(注意直接存放至根目录,无需放入下属 assets 子文件夹)。
将报告文件存入项目 raw 子目录。
随后输入指令,让 Claude Code 完成资料解析录入:
我已将报告 hy_SaaS-und-AI-Pricing-Report_2026_ENG.pdf 存入原始文件夹。
请解析并录入该文件
指令 Claude Code 解析录入目标报告。
第四步:查看数据录入处理结果
资料解析过程中,Claude Code 会根据内容属性自动生成多份 .md 文档,梳理核心概念与关键实体,清晰串联各类数据关联。本次操作共生成 4 个核心概念文档、若干实体文档,并同步更新 index.md、log.md、CLAUDE.md 三大配置文档,同步录入新增资料信息。
在 Obsidian 中打开当前项目,即可查看自动生成的知识图谱可视化图表,能够快速聚焦细分研究方向,例如 2026 年 SaaS 定价区间、主流定价模式、最优定价策略等。同时,维基文档内会自动标注交叉引用与原始资料溯源链接,查阅更便捷。
借助 Obsidian 生成的知识图谱,直观梳理数据关联,快速深挖细分研究领域内容。
第五步:精准识别调研内容缺口
AI 驱动的调研知识库核心优势,在于可通过自定义指令,定向分析内容完善度。
举例说明:我需要为自研 SaaS 安全漏洞分析工具 Roxy 设计定价方案,因此需要判断现有资料是否足以支撑决策落地。
向 Claude Code 输入以下提问指令:
我需要为自研 SaaS 产品 Roxy 设计完善的定价方案,
该产品为自动化安全漏洞分析工具。
请结合现有知识库资料,评估当前信息是否足以支撑定价决策落地
以下为工具返回的分析结果:
Claude Code 生成的内容缺口分析回复。
如图所示,当前录入的报告仅能覆盖 30% 的决策所需信息,仍需补充大量调研资料填补内容缺口。该知识库方案支持持续迭代,可随时向 raw/ 文件夹新增行业资料,通过指令让 AI 同步更新维基文档,持续完善调研体系。
-------------------------------------------------------------