RAG从入门到精通系列3：Routing（路由）RAG（Retrieval Augmented Generation，检

LLM（Large Language Model，大型语言模型）是一个功能强大的新平台，但它们并不总是使用与我们的任务相关的数据或者是最新的数据进行训练。

RAG（Retrieval Augmented Generation，检索增强生成）是一种将 LLM 与外部数据源（例如私有数据或最新数据）连接的通用方法。它允许 LLM 使用外部数据来生成其输出。

要想真正掌握 RAG，我们需要学习下图所示的技术（技巧）：

我们从《RAG从入门到精通系列2：Query Translation（查询翻译）》中学习了 Query Translation，在本文中我们将进入下一个节点：Routing（路由）。

Routing 是指根据用户的查询内容，智能地选择最适合的检索路径或推理逻辑，以更高效地获取答案。这种动态选择的过程在多数据源、多检索器或多任务场景下尤为重要，能够显著提升系统的性能和准确性。

Routing 在 RAG 中的实现类型：****

Logical Routing

首先我们定义了 python_docs、js_docs 和 golang_docs 这三个数据源：

通过使用 with_structured_output，你可以将模型的生成结果格式化成特定的结构化数据格式（如 JSON 或字典）。

然后我们定义了一个根据用户问题中的编程语言选择数据源的 prompt：

最后我们组成了一个 router chain：

router 可以根据用户问题中的编程语言自动选择数据源。

我们可以写一个简单的路由函数来选择数据源：

Semantic Routing

比如我们可以写两个用于回答不同领域（物理和数学）问题的 Prompt：

然后我们的 Prompt 路由函数 prompt_router 根据用户的问题和每个 Prompt 的语义相似程度（在这里是余弦相似度）选择合适的 Prompt。

GitHub 链接：

github.com/realyinchen…

原文地址：https://mp.weixin.qq.com/s/4IOMT5JaL9flv6dbZjif4g

RAG从入门到精通系列3：Routing（路由）