一句话总结:Graph RAG 在向量检索基础上引入 知识图谱(实体 + 关系),擅长回答需要多跳推理的问题,如「A 公司的供应商 B 的合规风险有哪些?」。
传统 RAG vs Graph RAG
| 维度 | 传统 RAG | Graph RAG |
|---|---|---|
| 索引方式 | 文档块向量 | 向量 + 实体关系图 |
| 擅长问题 | 「XX 是什么?」 | 「A 和 B 什么关系?」 |
| 多跳推理 | ❌ 弱 | ✅ 强 |
| 构建成本 | 低 | 中高 |
| 维护成本 | 低 | 中(图谱需更新) |
Graph RAG 工作流程
1. 文档解析 → 实体抽取(人、组织、产品、法规)
2. 关系抽取 → 构建知识图谱(Neo4j / NebulaGraph)
3. 用户 Query → 实体识别 + 关系路径查询
4. 图谱子图 + 向量检索结果 → 合并上下文
5. LLM 生成答案
适用场景
✅ 适合 Graph RAG:
- 供应链关系查询(供应商-产品-合规)
- 法规关联分析(法条之间的引用关系)
- 组织架构与权限查询
- 医学知识(疾病-症状-药物关系)
❌ 不适合 Graph RAG:
- 简单 FAQ(传统 RAG 足够)
- 文档内容频繁变化(图谱维护成本高)
- 数据量小(< 1000 篇文档,ROI 不高)
微软 GraphRAG 方案
Microsoft GraphRAG 开源方案:
- Community Detection:文档聚类为社区
- Community Summary:每个社区生成摘要
- Global Search:跨社区全局检索
- Local Search:社区内精细检索
适合:全局性问题(「公司所有产品的合规风险总结」)
泽衍科技实践建议
第一阶段:传统 RAG(4~8 周上线)
第二阶段:评估多跳 query 占比(> 20% 则考虑 Graph RAG)
第三阶段:增量构建知识图谱,Hybrid 检索
常见问题
Graph RAG 比传统 RAG 准确率提升多少? 多跳推理场景提升 20~40%;简单 FAQ 场景几乎无差异。
知识图谱怎么构建? LLM 自动抽取(准确率 80~85%)+ 人工校验关键实体。Microsoft GraphRAG 提供端到端工具链。
用什么图数据库? Neo4j(生态成熟)、NebulaGraph(国产、性能好)、PostgreSQL + AGE 扩展(已有 PG 的团队)。