1 GraphRAG到底是什么?

GraphRAG是由Microsoft推出的一个基于知识图谱的RAG解决方案。本质上就是综合运用知识图谱中节点、连接关系以及子图的信息构建出来的信息检索方案。

2 Pipeline

GraphRAG-pipline

2.1 Indexing阶段

第一步:源文档划分Chunks
第二步:从Chunks中提取实体
第三步:实体总结
第四步:社区总结
第五步:全图总结

2.2 Query阶段

第六步:从社区总结中获取社区回答
第七步:从社区回答到全局回答

3 优缺点

3.1 优点

  • 综合了关键的节点信息,使得模型的回答具备可解释性

3.2 缺点

  • 性能一般,建议多点部署
  • 无法方便地增、删、改知识。如果执行这些操作,需要重建整个知识图谱。此issue正在由团队解决。

4 总结

GraphRAG采用了知识图谱来辅助生成回答,极大提高了模型回答的可解释性。但是,这个solution还是需要根据知识图谱生成子社区的文字总结,本质上还是text-based的解法。而且若真的落地,还需考虑性能的问题。

4 相关链接

GraphRAG论文:https://arxiv.org/pdf/2404.16130
GraphRAG Survey:https://arxiv.org/abs/2408.08921