LangGraph构建Ai智能体-9-RAG概念前言 LangGraph中的代理检索增强生成（RAG）全称为Agenti

前言

LangGraph中的代理检索增强生成（RAG）全称为Agentic Retrieval-Augmented Generation

简单来说，RAG 就像是给大型语言模型（LLM）装了一个“外挂”，让它能够用到最新的、相关的或者私密的信息，从而更好地回答问题。这个技术特别适合问答机器人、客服系统，还有那些需要针对特定数据提供见解的场景。

LLM 虽然很厉害，但它有个“知识截止日期”，之后的知识就不知道了。RAG 就是通过检索机制，从提前整理好的数据里找到有用的信息，然后结合 LLM 的能力，生成针对用户问题的答案。

RAG 主要有两个关键部分：

具体来说，RAG 需要完成两个主要流程：

总之，RAG 就是让 LLM 能够更好地利用外部信息，更聪明地回答问题。

什么是嵌入（Embeddings）？

嵌入是一种把复杂的数据（比如单词、句子）转换成一组数字的方法。这些数字就像一个“代码”，能够把数据的意思或者特征“打包”起来，让机器更容易理解。你可以把它想象成把单词、短语或者文档变成机器能处理的数字形式，但同时尽量保留它们本来的意思。

比如说，在自然语言处理（NLP）里，一个单词嵌入可以把“cat”（猫）这个词变成一个数字向量，让它在数字空间里离“kitten”（小猫）或者“dog”（狗）这样的词更近，因为它们意思相近，而不是因为它们拼写相似。

嵌入是什么样的？

一个单词或短语的嵌入看起来可能是一串数字，比如：

[0.32, -0.45, 1.67, 0.25, -0.09, ... , -0.65]

这个向量里的每一个数字都代表了一个“维度”，用来捕捉这个词意思的一个独特方面。这些数字是根据嵌入的训练数据得出来的。

对我们来说，这只是一串数字，但对机器来说，这串数字就像是一个“小包裹”，里面装着这个词的意思，而且这个表示方式很紧凑，很有意义。

简单来说，这些嵌入各有各的“拿手活”，选择哪种取决于你要解决的问题！