[提高检索精度的新方法：命题检索的探索与实现]引言在现代信息检索中，检索精度对效率和效果至关重要。本文将探讨一种新的多

引言

在现代信息检索中，检索精度对效率和效果至关重要。本文将探讨一种新的多向量索引策略，即命题检索（Propositional Retrieval），帮助开发者提升信息检索系统的性能。

命题检索是Chen等人在Dense X Retrieval研究中提出的创新方法。其核心思想是生成去上下文化的“命题”，这些命题可以通过向量化提升检索精度。具体实现是通过将复杂文本分解为易于理解和处理的命题单元。

在此实例中，使用RecursiveUrlLoader对学术论文进行索引，所有检索信息存储在本地。存储层的配置可以在storage.py中进行修改。

首先，需要设置环境变量OPENAI_API_KEY以访问OpenAI的GPT-3.5和Embeddings类。

运行以下命令创建索引：

poetry install
poetry run python propositional_retrieval/ingest.py

下面的示例展示如何在项目中使用命题检索包：

pip install -U langchain-cli

langchain app new my-app --package propositional-retrieval

对于已有项目，可以运行：

langchain app add propositional-retrieval

在server.py文件中添加以下代码：

from propositional_retrieval import chain

add_routes(app, chain, path="/propositional-retrieval")

如果已经在目录中，可以通过以下命令启动LangServe实例：

langchain serve

from langserve.client import RemoteRunnable

runnable = RemoteRunnable("http://localhost:8000/propositional-retrieval")

命题检索通过创新的方式提升了检索精度，为信息检索领域提供了新的思路。建议进一步阅读Chen等人的论文《Dense X Retrieval: What Retrieval Granularity Should We Use?》以深入理解其理论基础。

如果这篇文章对你有帮助，欢迎点赞并关注我的博客。您的支持是我持续创作的动力！

---END---