前言
Microsoft GraphRAG论文的学习笔记。
Operating System: Ubuntu 22.04.4 LTS
信息
论文题目:From Local to Global: A Graph RAG Approach to Query-Focused Summarization
发表年份:2024
论文地址:https://arxiv.org/abs/2404.16130
pdf 地址:https://arxiv.org/pdf/2404.16130
个人学习笔记:
- https://github.com/yanfeng98/paper-is-all-you-need/blob/main/papers/00046-GraphRAG.pdf
- https://cdn.jsdelivr.net/gh/yanfeng98/paper-is-all-you-need/papers/00046-GraphRAG.pdf
内容
摘要
使用检索增强生成(RAG)从外部知识源检索相关信息使大型语言模型(LLM)能够回答私人和/或以前看不见的文档集合上的问题。然而,RAG无法回答针对整个文本语料库的全局问题,例如“数据集中的主题是什么?”,因为这本质上是一个以查询为中心的摘要(QFS)任务,而不是一个明确的检索任务。与此同时,先前的QFS方法无法扩展到典型RAG系统索引的文本数量。为了结合这些对比方法的优势,我们提出了一种Graph RAG方法来在私人文本语料库上进行问题回答,该方法根据用户问题的普遍性和要引用的源文本的数量进行扩展。我们的方法使用LLM分两个阶段构建基于图的文本索引:首先从源文档中导出实体知识图,然后为所有密切相关的实体组预先生成社区摘要。给定一个问题,每个社区摘要用于生成部分响应,然后在对用户的最终响应中再次汇总所有部分响应。对于100万令牌范围内数据集上的一类全局感知问题,我们展示了Graph RAG在生成答案的全面性和多样性方面导致了对原始RAG基线的实质性改进。https://aka.ms/graphrag 即将推出基于Python的全球和本地Graph RAG方法的开源实现。
结语
第二百九十六篇博文写完,开心!!!!
今天,也是充满希望的一天。