轻松上手 Tigris:构建高性能向量搜索应用

30 阅读2分钟

轻松上手 Tigris:构建高性能向量搜索应用

引言

在构建现代应用时,高效的搜索功能尤其重要。Tigris 作为一个开源的无服务器 NoSQL 数据库和搜索平台,可以显著简化这种构建。它通过消除管理多个工具的基础设施复杂性,让开发者专注于创建出色的应用。本篇文章将带您了解如何使用 Tigris 作为您的向量存储(VectorStore)。

主要内容

准备工作

在开始之前,您需要:

  1. 一个 OpenAI 账户。
  2. 一个免费的 Tigris 账户。注册后,创建一个名为 vectordemo 的项目,并记录您项目所在区域的 URI、clientIdclientSecret。这些信息可在项目的 Application Keys 部分找到。

安装依赖

首先让我们安装所需的 Python 包:

%pip install --upgrade --quiet  tigrisdb openapi-schema-pydantic langchain-openai langchain-community tiktoken

环境变量配置

接下来,首先将 OpenAI 和 Tigris 的凭证加载到环境变量中:

import getpass
import os

os.environ["OPENAI_API_KEY"] = getpass.getpass("OpenAI API Key:")
os.environ["TIGRIS_PROJECT"] = getpass.getpass("Tigris Project Name:")
os.environ["TIGRIS_CLIENT_ID"] = getpass.getpass("Tigris Client Id:")
os.environ["TIGRIS_CLIENT_SECRET"] = getpass.getpass("Tigris Client Secret:")

初始化 Tigris 向量存储

加载测试数据集并初始化向量存储:

from langchain_community.document_loaders import TextLoader
from langchain_community.vectorstores import Tigris
from langchain_openai import OpenAIEmbeddings
from langchain_text_splitters import CharacterTextSplitter

# 加载测试文档
loader = TextLoader("../../../state_of_the_union.txt")
documents = loader.load()

# 文本分割
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
docs = text_splitter.split_documents(documents)

# 初始化嵌入
embeddings = OpenAIEmbeddings()

# 使用API代理服务提高访问稳定性
vector_store = Tigris.from_documents(docs, embeddings, index_name="my_embeddings")

代码示例

实现相似性搜索:

# 相似性搜索示例
query = "What did the president say about Ketanji Brown Jackson"
found_docs = vector_store.similarity_search(query)
print(found_docs)

# 带分数的相似性搜索
query = "What did the president say about Ketanji Brown Jackson"
result = vector_store.similarity_search_with_score(query)
for doc, score in result:
    print(f"document={doc}, score={score}")

常见问题和解决方案

  • API 访问不稳定问题:由于某些地区网络限制,建议使用 API 代理服务以提高访问的稳定性。
  • 数据同步延迟:在进行大量数据操作时,可能会遇到同步延迟,建议分批次进行操作。

总结和进一步学习资源

通过本文的讲解,您已经学会了如何使用 Tigris 来构建高性能的向量搜索应用。Tigris 消除了基础设施管理的复杂性,让您可以专注于应用程序的功能开发。

进一步学习资源:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---