使用Ontotext GraphDB和LLMs进行自然语言到SPARQL查询的探索

179 阅读3分钟
# 使用Ontotext GraphDB和LLMs进行自然语言到SPARQL查询的探索

## 引言

在图数据库和知识发现工具中,Ontotext GraphDB因其支持RDF和SPARQL而广受欢迎。近年来,随着大语言模型(LLMs)的发展,将自然语言查询(NLQ)转换为SPARQL变得越来越可行。这篇文章将带你深入了解如何利用大语言模型将自然语言查询转化为SPARQL查询,从而提升Ontotext GraphDB的查询体验。

## 主要内容

### GraphDB LLM功能概述

GraphDB支持一些与大语言模型相关的功能,包括:
- **GPT查询**:使用知识图谱数据生成自然语言文本、列表或表格。
- **查询解释和结果翻译**:对查询进行解释、总结、重述或翻译。
- **检索-GraphDB连接器**:将知识图谱实体索引到矢量数据库。
- **与图对话**:使用定义的KG实体索引进行简单的聊天机器人交互。

### 设置环境

要启动本地的GraphDB实例,你需要安装Docker,并使用Docker镜像运行GraphDB。可以通过克隆GitHub库 `langchain-graphdb-qa-chain-demo` 来设置Docker Compose。这会自动将Star Wars数据集加载到GraphDB中。

```bash
git clone https://github.com/langchain/graphdb-qa-chain-demo
cd langchain-graphdb-qa-chain-demo
docker build --tag graphdb .
docker compose up -d graphdb

访问GraphDB Workbench的地址为 http://localhost:7200/sparql

设定工作环境

如果使用conda,请创建并激活新环境,然后安装必要的库:

conda create -n graph_ontotext_graphdb_qa python=3.9.18
conda activate graph_ontotext_graphdb_qa
pip install jupyter==1.0.0 openai==1.6.1 rdflib==7.0.0 langchain-openai==0.0.2
pip install langchain>=0.1.5

启动Jupyter Notebook:

jupyter notebook

指定本体

为了能够生成SPARQL,LLM需要知道知识图谱的模式(即本体)。可以通过以下方式提供:

  • 使用 query_ontology 参数指定CONSTRUCT查询以获取本体信息。
  • 使用 local_file 参数指定本地RDF本体文件。

以下是一个示例:

from langchain_community.graphs import OntotextGraphDBGraph

graph = OntotextGraphDBGraph(
    query_endpoint="http://localhost:7200/repositories/langchain",
    local_file="/path/to/langchain_graphdb_tutorial/starwars-ontology.nt",  # 指定本地文件路径
)

问题回答示例

借助OntotextGraphDBQAChain,我们可以针对数据集进行自然语言问题回答。

import os
from langchain.chains import OntotextGraphDBQAChain
from langchain_openai import ChatOpenAI

os.environ["OPENAI_API_KEY"] = "sk-***"  # 设置OpenAI API密钥

chain = OntotextGraphDBQAChain.from_llm(
    ChatOpenAI(model_name="gpt-4-1106-preview"),
    graph=graph,
    verbose=True,
)

result = chain.invoke({"question": "Tatooine的气候是什么?"})
print(result)

常见问题和解决方案

  1. SPARQL生成错误:如果LLM生成的SPARQL查询有语法错误,可以通过SPARQL Fix提示进行修正。
  2. 查询结果为空:当返回结果为空时,LLM应告知无法回答问题。

总结和进一步学习资源

本文介绍了如何使用Ontotext GraphDB和大语言模型将自然语言查询转化为SPARQL。有关更多信息,推荐阅读Ontotext的官方文档和LangChain的集成文档。

参考资料

  • Ontotext GraphDB官方文档
  • LangChain文档
  • Docker官方文档

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

---END---