RAG 每日一技（八）：连接大脑！为RAG定制强大的Prompt辛苦检索的上下文，LLM却视而不见，还在一本正经地胡说八

前情回顾

兄弟们，坚持到今天太不容易了！回顾一下我们的旅程：从文本分块、向量化、存储索引，再到检索和精排，我们已经完整地构建了RAG系统中“R”（Retrieval）部分的坚实基础。现在我们手上已经能源源不断地获取与用户问题高度相关的“黄金上下文”。

万事俱备，只欠东风。这“东风”，就是如何将我们辛苦得来的上下文，连同用户的问题，一起“喂”给大语言模型（LLM），让它生成最终的答案。

你可能会想：“这还不简单？直接 上下文 + 问题 丢给模型不就行了？”

如果你真这么想，那就大错特错了！一个粗糙、未经设计的Prompt，是导致RAG系统失败（如模型产生幻觉、答非所问）的最主要原因之一。

今天，我们就来学习这门“与AI对话的艺术”，为我们的RAG系统量身定制一个强大、可靠的Prompt。

为什么简单的“上下文+问题”是灾难？

一个未经设计的、天真的Prompt（例如 f"{context}\n\n{question}"），至少会引发两个严重问题：

模型产生幻觉（Hallucination）：LLM拥有海量的内置知识。当你给它的指令不够明确时，它很可能会“自由发挥”，忽略你提供的上下文，转而用它自己“认为”正确的、但可能已过时或不准确的知识来回答。这就完全违背了我们使用RAG的初衷。
答案不可控：如果上下文中恰好没有问题的答案，一个天真的Prompt可能会诱导模型“硬着头皮”编造一个答案出来，而不是诚实地承认“我不知道”。这在需要高度事实准确性的场景（如客服、医疗咨询）中是致命的。

因此，我们需要一个像“法律条文”一样严谨的Prompt模板，来约束和引导模型的行为。

一个强大RAG Prompt的四大核心要素

一个好的RAG Prompt模板，通常包含以下四个部分，缺一不可：

角色指令 (Instruction/Role)：明确告知LLM它需要扮演的角色，以及它必须遵守的核心规则。这是整个Prompt的基调。
上下文 (Context)：清晰地将我们检索到的文档片段呈现给模型，并用明确的分隔符（如 --- 或XML标签）将其与其它部分隔离开。
约束与后备规则 (Constraints & Fallback)：这是保证系统可靠性的关键。明确指示模型，当上下文中找不到答案时应该怎么做。
问题 (Question)：呈现用户的原始问题。

下面，就是一个可以直接套用的、非常强大的Prompt模板：

你是一个专业、严谨的问答助手。

请严格根据下面提供的“上下文”来回答用户的“问题”。
不要依赖你自己的任何先验知识。
如果“上下文”中没有足够的信息来回答“问题”，请直接回复“根据提供的资料，我无法回答您的问题。”。
绝不允许编造、杜撰答案。

---
上下文:
{context}
---
问题:
{question}
---

请根据以上规则，生成你的回答：

剖析一下这个模板的精妙之处：

“严格根据...不要依赖...”：强力约束，命令模型关闭自己的知识库，只做“阅读理解”。
“如果...请直接回复...”：提供了明确的“不知道”路径，有效抑制幻觉。
“绝不允许编造...”：再一次用强硬的语气加固规则。
--- 分隔符：让模型清晰地知道哪部分是上下文，哪部分是问题，避免混淆。

上手实战：用Prompt驱动完整的问答流程

现在，我们来模拟一下完整的端到-端（E2E）流程。假设我们已经有了前面几章构建的检索器（retriever）和精排器（reranker）。

# 这是一个模拟的LLM调用函数
# 在实际应用中，你会对接OpenAI, Anthropic, 或本地模型的API
def call_llm(prompt):
    print("--- 发送给LLM的完整Prompt ---")
    print(prompt)
    print("--- LLM的回答 ---")
    # 这里我们手动模拟LLM的回答来演示
    if "Homebrew" in prompt and "Mac" in prompt:
        return "要在macOS上安装Python，您可以使用Homebrew。首先打开终端，然后输入命令 'brew install python'。"
    elif "FAISS是什么" in prompt and "ChromaDB" in prompt:
        # 模拟上下文中没有答案的情况
        return "根据提供的资料，我无法回答您的问题。"
    else:
        return "模拟回答..."

# 1. 定义我们的Prompt模板
PROMPT_TEMPLATE = """
你是一个专业、严谨的问答助手。

请严格根据下面提供的“上下文”来回答用户的“问题”。
不要依赖你自己的任何先验知识。
如果“上下文”中没有足够的信息来回答“问题”，请直接回复“根据提供的资料，我无法回答您的问题。”。
绝不允许编造、杜撰答案。

---
上下文:
{context}
---
问题:
{question}
---

请根据以上规则，生成你的回答：
"""

# 2. 模拟一个检索函数 (在真实场景中，它会查询ChromaDB并经过Re-ranker)
def retrieve_context(query):
    if "Mac" in query:
        return "要在macOS上安装Python，推荐使用Homebrew。首先打开终端，输入命令 'brew install python' 即可。"
    if "FAISS" in query:
        return "ChromaDB是一个对开发者友好的向量数据库。" # 这个上下文中没有FAISS的定义
    return ""

# 场景A：上下文中包含答案
query_a = "Mac电脑怎么安装Python？"
context_a = retrieve_context(query_a)
final_prompt_a = PROMPT_TEMPLATE.format(context=context_a, question=query_a)
response_a = call_llm(final_prompt_a)
print(response_a + "\n")


# 场景B：上下文中不包含答案
query_b = "FAISS是什么？"
context_b = retrieve_context(query_b)
final_prompt_b = PROMPT_TEMPLATE.format(context=context_b, question=query_b)
response_b = call_llm(final_prompt_b)
print(response_b)

通过这两个场景的对比，你可以清晰地看到，一个设计良好的Prompt模板，是如何像“紧箍咒”一样引导着LLM，让它既能“知之为知之”，也能“不知为不知”，从而成为一个可靠的助手。

总结与预告

今日小结：

Prompt工程是连接RAG检索端与生成端的桥梁，对最终答案的质量起决定性作用。

一个好的RAG Prompt必须包含清晰的指令、严格的约束和明确的后备规则，以抑制模型幻觉。

**“只根据上下文回答”和“如果不知道就说不知道”**是构建可靠RAG系统的两条黄金法则。

太棒了！我们终于从零开始，亲手构建并打通了一个完整的RAG系统的所有核心环节。从数据处理到生成答案，你已经掌握了全流程的基础。

但是，一个新的、更深层次的问题浮现了：

我们的RAG系统现在能跑了，但它的效果到底好不好？我们怎么去量化地评估它的性能？当我想优化它时（比如换一个Embedding模型，或者调整Prompt），我怎么知道我的改动是让它变好了还是变坏了？

明天预告：RAG 每日一技（九）：我的RAG效果好吗？浅谈RAG的评估框架与指标

“没有度量，就没有改进”。明天，我们将进入RAG的进阶篇——评估（Evaluation）。我们将学习如何科学地评价一个RAG系统的好坏，了解业界常用的评估框架（如Ragas）和核心评估指标，让你拥有用数据说话、持续优化系统的能力！