利用Google Cloud SQL与SQL Server构建Langchain应用

34 阅读2分钟

引言

在现代应用中,结合AI技术的数据库服务正变得越来越重要。Google Cloud SQL是一种全托管的关系数据库服务,支持SQL Server等数据库引擎。本文将介绍如何利用Google Cloud SQL的Langchain集成,使用MSSQLLoader和MSSQLDocumentSaver来保存、加载和删除Langchain文档。

主要内容

设置Google Cloud环境

在开始之前,确保您已经完成以下步骤:

  1. 创建Google Cloud项目
  2. 启用Cloud SQL Admin API
  3. 创建Cloud SQL for SQL Server实例
  4. 创建数据库
  5. (可选)添加IAM数据库用户

配置连接

使用MSSQLEngine配置与Cloud SQL数据库的连接池。首先,安装必要的库:

%pip install --upgrade --quiet langchain-google-cloud-sql-mssql

然后,通过以下代码创建连接池:

from langchain_google_cloud_sql_mssql import MSSQLEngine

engine = MSSQLEngine.from_instance(
    project_id=PROJECT_ID,   # Google Cloud项目ID
    region=REGION,           # Cloud SQL实例区域
    instance=INSTANCE,       # Cloud SQL实例名称
    database=DATABASE,       # 数据库名称
    user=DB_USER,            # 数据库用户
    password=DB_PASS         # 数据库密码
)

初始化表

初始化表以存储Langchain文档:

engine.init_document_table(TABLE_NAME, overwrite_existing=True)

保存和加载文档

保存文档:

from langchain_core.documents import Document
from langchain_google_cloud_sql_mssql import MSSQLDocumentSaver

test_docs = [
    Document(page_content="Apple Granny Smith 150 0.99 1", metadata={"fruit_id": 1}),
    # 更多文档
]

saver = MSSQLDocumentSaver(engine=engine, table_name=TABLE_NAME)
saver.add_documents(test_docs)

加载文档:

from langchain_google_cloud_sql_mssql import MSSQLLoader

loader = MSSQLLoader(engine=engine, table_name=TABLE_NAME)
docs = loader.lazy_load()
for doc in docs:
    print("Loaded documents:", doc)

常见问题和解决方案

  • 网络访问问题:由于某些地区的网络限制,开发者可能需要考虑使用API代理服务来提高访问稳定性。

  • 权限问题:确保IAM用户具备访问数据库的适当权限。

总结和进一步学习资源

本文介绍了如何使用Google Cloud SQL与SQL Server结合Langchain实现文档的保存、加载和删除操作。要深入学习,请参考以下资源:

参考资料

  1. Google Cloud SQL Documentation
  2. Langchain GitHub Repository

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---