RAG启示录:当你的概念验证系统开始“回嘴”

4 阅读1分钟

“Hello, world!”

在重构之前、在领域模型之前、在我甚至不知道循环依赖是什么之前,有那么一个时刻。就是你那个临时拼凑的原型恰好完成了你希望它做的事,你意识到自己可能摸到了某种门道的时刻。

让我回到五月下旬,那时 Piper Morgan 还只是一个想法和几份合成文档。

搭建环境:装到你成功为止

Claude 虚构了一些通用的“产品文档”——其实只是一些编造的需求文档、一个虚构的 API 规范,以及一个假想的项目路线图。完全是凭空捏造。就像为一部关于产品管理的电影写剧本(一部无聊的电影)。

不过,你并不需要真实数据就能看到机器如何处理数据,你只需要数据。假数据也是数据。

计划很简单:

  • 将这些假文档分块
  • 用 OpenAI 将其嵌入
  • 存入向量数据库
  • 看看能否得到有意义的答案

这就是所谓的 RAG——检索增强生成。用大白话讲就是“先找到相关的东西,然后让 AI 用它来回答问题”。这并不算革命性(这个项目里没有任何东西是革命性的……) CSD0tFqvECLokhw9aBeRqtxmKc+KsJMT487DD/zRAwGqMAtUDi1hlyQAl+iI5t+DWa+abPXGIzrjU+laMLiDdvEZz6tkGr0HVspl0hHRdLB06EzXFhRdgZNFNJYAZtdra2JJCIdktM+lXGk26reodOkKSWi8/YBt4T+h00gHvyo=