RAG启示录：当你的概念验证系统开始“回嘴”本文通过一个从伪造文档到构建检索增强生成（RAG）原型的过程，展示了如何对文

“Hello, world!”

在重构之前、在领域模型之前、在我甚至不知道循环依赖是什么之前，有那么一个时刻。就是你那个临时拼凑的原型恰好完成了你希望它做的事，你意识到自己可能摸到了某种门道的时刻。

让我回到五月下旬，那时 Piper Morgan 还只是一个想法和几份合成文档。

搭建环境：装到你成功为止

Claude 虚构了一些通用的“产品文档”——其实只是一些编造的需求文档、一个虚构的 API 规范，以及一个假想的项目路线图。完全是凭空捏造。就像为一部关于产品管理的电影写剧本（一部无聊的电影）。

不过，你并不需要真实数据就能看到机器如何处理数据，你只需要数据。假数据也是数据。

计划很简单：

将这些假文档分块
用 OpenAI 将其嵌入
存入向量数据库
看看能否得到有意义的答案

这就是所谓的 RAG——检索增强生成。用大白话讲就是“先找到相关的东西，然后让 AI 用它来回答问题”。这并不算革命性（这个项目里没有任何东西是革命性的……） CSD0tFqvECLokhw9aBeRqtxmKc+KsJMT487DD/zRAwGqMAtUDi1hlyQAl+iI5t+DWa+abPXGIzrjU+laMLiDdvEZz6tkGr0HVspl0hHRdLB06EzXFhRdgZNFNJYAZtdra2JJCIdktM+lXGk26reodOkKSWi8/YBt4T+h00gHvyo=