【大模型】GraphRAG入门GraphRAG是什么？ GraphRAG（Graph Retrieval-Augment

GraphRAG是什么？

GraphRAG（Graph Retrieval-Augmented Generation）是一种结合了知识图谱（Knowledge Graph）与检索增强生成（RAG）的技术，旨在提升大语言模型（LLM）在复杂问答、知识推理等任务中的准确性和可解释性。

传统RAG的局限

GraphRAG优势

GraphRAG挑战

问题：“爱因斯坦获得诺贝尔奖的研究领域与哪些技术发明有关联？”

1、图谱构建：从文献中提取实体（爱因斯坦、诺贝尔奖、光电效应、激光技术）及关系（爱因斯坦-研究->光电效应、光电效应-应用->激光技术）。

2、图检索：定位“爱因斯坦→诺贝尔奖→光电效应→激光技术”的路径。

3、生成答案：LLM结合子图和原始文本描述，生成：“爱因斯坦因光电效应获诺贝尔奖，该理论后来成为激光技术的基础。”

底层数据频繁更新时，GraphRAG 可以用，但必须把“图模式”做成：

否则，每一次高频更新都会触发:

把“变”与“不变”拆开

数据特征	举例	在图里？	存储形态	更新频率
静态骨架	公司、产品、人、品牌、地理、法规条款	✅ 主图（冷图）	图数据库（Neo4j/TigerGraph）	天/周级
准静态关系	股权结构、隶属、上下游、合作、位于、属于	✅ 主图	同上	天/周级
快速属性	股价、库存、PV、UV、评分、物流状态	❌ 迁出	KV/RDB/时序库（Redis、Postgres、Influx）	秒/分钟级
临时事件	订单、支付、传感器读数、日志	❌ 迁出	事件流（Kafka）+ 物化视图	毫秒级

查询链路：图给上下文，外表给实时值

===>用户问题：

“X 公司当前股价是多少？它的最大股东 Y 上周减持后，还持有多少比例？”

===>检索&召回步骤：

1、图查询（只读，毫秒级）

MATCH (c:Company{name:'X'})<-[h:HOLD]-(y:Shareholder{name:'Y'})
RETURN h.ratio as last_ratio, h.lastUpdate as ratio_ts

→ 拿到“最近一次记录的持股比例 12 %，上周三更新”。

2、外部 KV 查（Redis）

GET x_stock_price → 18.42 USD

3、Prompt 拼装

已知：  
- X 公司实时股价 18.42 USD（来源：交易所，更新时间 14:30:05）。  
- 根据知识图谱，Y 最近一次披露的持股比例为 12%，披露日 2025-09-17。  
请回答用户问题……

4、LLM 生成答案

关键点

GraphRAG 不怕“数据变”，就怕“把变得太快的数据塞进图”。

把图当“稳定骨架”，把快变数据当“外挂血条”，就能在频繁更新的场景里既享受图谱的多跳推理，又不被实时写入拖垮。