Graph RAG 知识图谱增强检索指南

一句话总结：Graph RAG 在向量检索基础上引入 知识图谱（实体 + 关系），擅长回答需要多跳推理的问题，如「A 公司的供应商 B 的合规风险有哪些？」。

传统 RAG vs Graph RAG

1. 文档解析 → 实体抽取（人、组织、产品、法规）
2. 关系抽取 → 构建知识图谱（Neo4j / NebulaGraph）
3. 用户 Query → 实体识别 + 关系路径查询
4. 图谱子图 + 向量检索结果 → 合并上下文
5. LLM 生成答案

✅ 适合 Graph RAG：

❌ 不适合 Graph RAG：

Microsoft GraphRAG 开源方案：

适合：全局性问题（「公司所有产品的合规风险总结」）

第一阶段：传统 RAG（4~8 周上线）
第二阶段：评估多跳 query 占比（> 20% 则考虑 Graph RAG）
第三阶段：增量构建知识图谱，Hybrid 检索

Graph RAG 比传统 RAG 准确率提升多少？ 多跳推理场景提升 20~40%；简单 FAQ 场景几乎无差异。

知识图谱怎么构建？ LLM 自动抽取（准确率 80~85%）+ 人工校验关键实体。Microsoft GraphRAG 提供端到端工具链。

用什么图数据库？ Neo4j（生态成熟）、NebulaGraph（国产、性能好）、PostgreSQL + AGE 扩展（已有 PG 的团队）。