[Google Cloud SQL 与 Langchain 集成:SQL Server 的实践指南]

79 阅读2分钟

引言

在现代应用开发中,借助 AI 技术增强数据库应用已变得越来越重要。Google Cloud SQL 为开发者提供了强大且易用的托管关系数据库服务,其中包括 SQL Server 引擎。在这篇文章中,我们将探讨如何使用 Google Cloud SQL for SQL Server 结合 Langchain 实现文档的保存、加载和删除。

主要内容

开始之前的准备工作

为了顺利操作,首先你需要:

  • 创建一个 Google Cloud 项目。
  • 启用 Cloud SQL Admin API。
  • 创建一个 Cloud SQL for SQL Server 实例以及数据库。
  • 为数据库添加一个 IAM 用户(可选)。

📦 安装所需库

使用 Langchain 的 Google Cloud SQL MSSQL 包:

%pip install --upgrade --quiet langchain-google-cloud-sql-mssql

🔐 Google Cloud 认证设置

需要在笔记本中对 Google Cloud 进行认证:

from google.colab import auth
auth.authenticate_user()

☁ 配置 Google Cloud 项目

确保你的项目 ID 设置正确:

PROJECT_ID = "my-project-id"  # @param {type:"string"}
!gcloud config set project {PROJECT_ID}

💡 启用 API 服务

启用 Cloud SQL Admin API:

!gcloud services enable sqladmin.googleapis.com

代码示例

初始化数据库连接和表

from langchain_google_cloud_sql_mssql import MSSQLEngine

engine = MSSQLEngine.from_instance(
    project_id=PROJECT_ID,
    region=REGION,          # 使用API代理服务提高访问稳定性
    instance=INSTANCE,      # 使用API代理服务提高访问稳定性
    database=DATABASE,
    user=DB_USER,
    password=DB_PASS,
)

# 初始化表
engine.init_document_table(TABLE_NAME, overwrite_existing=True)

保存和加载文档

from langchain_core.documents import Document
from langchain_google_cloud_sql_mssql import MSSQLDocumentSaver, MSSQLLoader

# 保存示例文档
test_docs = [
    Document(page_content="Apple Granny Smith 150 0.99 1", metadata={"fruit_id": 1}),
    Document(page_content="Banana Cavendish 200 0.59 0", metadata={"fruit_id": 2}),
]
saver = MSSQLDocumentSaver(engine=engine, table_name=TABLE_NAME)
saver.add_documents(test_docs)

# 加载文档
loader = MSSQLLoader(engine=engine, table_name=TABLE_NAME)
docs = loader.lazy_load()
for doc in docs:
    print("Loaded documents:", doc)

删除文档

loader = MSSQLLoader(engine=engine, table_name=TABLE_NAME)
docs = loader.load()
print("Documents before delete:", docs)
saver.delete(docs)
print("Documents after delete:", loader.load())

常见问题和解决方案

  1. 连接问题:由于网络限制,连接 Cloud SQL 可能会不稳定。可以使用 API 代理服务来提高连接的稳定性。
  2. 权限问题:如果遇到权限不足的错误,确保已为项目和数据库正确配置 IAM 权限。
  3. 数据一致性问题:在大量数据操作时,可能需要实现额外的事务管理逻辑。

总结和进一步学习资源

通过本文的介绍,你应该能够使用 Google Cloud SQL for SQL Server 和 Langchain 高效地管理文档数据。为了深入了解,请查看这些资源:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力! ---END---