白话RAG(一):GraphRAG
1 GraphRAG到底是什么?
GraphRAG是由Microsoft推出的一个基于知识图谱的RAG解决方案。本质上就是综合运用知识图谱中节点、连接关系以及子图的信息构建出来的信息检索方案。
2 Pipeline
2.1 Indexing阶段
第一步:源文档划分Chunks
第二步:从Chunks中提取实体
第三步:实体总结
第四步:社区总结
第五步:全图总结
2.2 Query阶段
第六步:从社区总结中获取社区回答
第七步:从社区回答到全局回答
3 优缺点
3.1 优点
- 综合了关键的节点信息,使得模型的回答具备可解释性
3.2 缺点
- 性能一般,建议多点部署
- 无法方便地增、删、改知识。如果执行这些操作,需要重建整个知识图谱。此issue正在由团队解决。
4 总结
GraphRAG采用了知识图谱来辅助生成回答,极大提高了模型回答的可解释性。但是,这个solution还是需要根据知识图谱生成子社区的文字总结,本质上还是text-based的解法。而且若真的落地,还需考虑性能的问题。
4 相关链接
GraphRAG论文:https://arxiv.org/pdf/2404.16130
GraphRAG Survey:https://arxiv.org/abs/2408.08921
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 RandIdea!