# 如何使用 Google Vertex AI Search 构建智能搜索引擎
## 引言
在现代企业环境中,快速、智能的搜索解决方案对于提升生产力和客户体验至关重要。Google 的 Vertex AI Search 提供了一种强大的方式来创建生成式 AI 驱动的搜索引擎,以帮助企业高效管理和检索信息。本文将详细介绍如何配置和使用 Vertex AI Search,以及其背后的技术原理。
## 主要内容
### 什么是 Google Vertex AI Search?
Google Vertex AI Search 是 Google Cloud 提供的机器学习平台的一部分。它利用 Google 搜索技术,比如语义搜索,来帮助企业快速构建 AI 驱动的搜索引擎。这些技术能够理解用户查询的意图,并在内容中推断出关系,比传统的关键词搜索更准确。
### 配置 Vertex AI Search
为使用 Vertex AI Search,需要安装相关的 Python 包:
```shell
%pip install -qU langchain-google-community google-cloud-discoveryengine
接下来,您需要创建一个搜索引擎并填充非结构化数据存储。请依据 Vertex AI Search 入门指南 来设置 Google Cloud 项目和 Vertex AI Search。
设置访问权限
通过 Google Cloud Console 创建一个非结构化数据存储,并用示例 PDF 文档进行填充。确保使用 Cloud Storage (无元数据) 选项进行设置。
使用 Vertex AI Search Retriever
使用 VertexAISearchRetriever 类来访问搜索服务 API:
from langchain_google_community import VertexAISearchRetriever
PROJECT_ID = "<YOUR PROJECT ID>" # 请设置为您的项目 ID
LOCATION_ID = "<YOUR LOCATION>" # 请设置为您的数据存储位置
DATA_STORE_ID = "<YOUR DATA STORE ID>" # 请设置为您的数据存储 ID
retriever = VertexAISearchRetriever(
project_id=PROJECT_ID,
location_id=LOCATION_ID,
data_store_id=DATA_STORE_ID,
max_documents=3,
)
query = "What are Alphabet's Other Bets?"
result = retriever.invoke(query)
for doc in result:
print(doc)
配置不同类型数据的检索
非结构化数据
实现提取性回答:
retriever = VertexAISearchRetriever(
project_id=PROJECT_ID,
location_id=LOCATION_ID,
data_store_id=DATA_STORE_ID,
max_documents=3,
get_extractive_answers=True,
)
result = retriever.invoke(query)
for doc in result:
print(doc)
结构化数据和网站数据
也支持结构化数据和网站数据的高级索引配置。
代码示例
以下是一个完整的代码示例,展示如何使用 Vertex AI Search 检索非结构化数据:
from langchain_google_community import VertexAISearchRetriever
PROJECT_ID = "<YOUR PROJECT ID>" # 请设置为您的项目 ID
LOCATION_ID = "<YOUR LOCATION>" # 请设置为您的数据存储位置
DATA_STORE_ID = "<YOUR DATA STORE ID>" # 请设置为您的数据存储 ID
retriever = VertexAISearchRetriever(
project_id=PROJECT_ID,
location_id=LOCATION_ID,
data_store_id=DATA_STORE_ID,
max_documents=3,
get_extractive_answers=True,
)
query = "What are Alphabet's Other Bets?"
result = retriever.invoke(query)
for doc in result:
print(doc)
常见问题和解决方案
-
API 访问限制: 在某些地区访问 API 可能受到限制,此时可以考虑使用 API 代理服务 来提高访问稳定性。
-
认证问题: 确保在 Google Cloud Console 中正确配置了应用默认凭据。
总结和进一步学习资源
Google Vertex AI Search 提供了一种高效、智能的方式来实现生成式 AI 搜索。本文介绍了基本的使用方法和配置,为您在企业环境中实现智能搜索提供了一种可行的解决方案。
进一步学习资源
参考资料
- Vertex AI Search 官方文档
- Langchain Google 社区库
如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!
---END---