발표에 대한 feedback 페이지
발표자는 간략히 발표내용에 대해 작성
Purpose
- Retrieval-Augmented Generation (RAG) 기법을 그래프 기반으로 확장한 GraphRAG 구조에 대한 survey
- GraphRAG의 핵심 구성 요소를 쿼리 처리, 검색, 조직화, 생성로 나누어 분석하고 기존의 문서,지식 그래프와 달리 그래프 형태의 외부 지식을 효과적으로 통합하는 여러가지 방법을 제시함
- 도메인별 적용 사례와 도전과제, 향후 연구 방향을 제안
Introduction
- 기존 RAG는 주로 텍스트 형태의 외부 지식을 검색해 LLM에 제공하지만 그래프 구조의 데이터(ex, knowledge graph, document graph, reasoning & planning graph 등)는 “그래프”라는 구조적 특성이 있어 기존 RAG로는 한계가 있음
- GraphRAG는 이런 한계를 극복하고 그래프 형태의 지식을 활용해 더 정확하고 설명 가능한 응답을 생성할 수 있도록 함
- 본 논문은 GraphRAG의 아키텍처를 분석하고 각 구성 요소별 기법에 대해 도메인별 사례와 방법을 정리하였음
Background
- RAG는 LLM의 한계(문맥 길이, 최신성, 정확성 등)를 극복하기 위해 외부 지식을 검색해 응답 품질을 높임
- graph data의 장점: 문서 간 관계, 의미론적 연결, 추론 가능성 등을 내포한 데이터 표현으로 RAG와 결합 시 강력한 정보 제공 가능
- GraphRAG는 이러한 배경 위에서 출발하여 그래프의 구조적 정보와 LLM의 언어 생성 능력을 결합
Method
- GraphRAG는 크게 4가지 핵심 모듈로 구성됨
- Query Processor: 질의 전처리 및 엔터티/관계 추출을 통해 그래프 기반 검색에 적합한 형태로 변환
- Retriever: 그래프에서 관련 정보(노드, 경로, 서브그래프 등)를 검색함
검색 방식에 따라 traversal 기반, sub graph 기반, GNN 기반, hueristic 기반 등으로 구분
- Organizer: 검색된 정보를 LLM 입력에 적합하도록 조직화
(ex, 텍스트화, 트리플 나열, 서브그래프 요약 등)
- Generator: LLM 또는 GNN+LLM 조합을 활용해 최종 응답 생성
- 이 외에 도메인별로 문서 그래프, 지식 그래프, 계획 그래프 등에서의 응용과 데이터셋/툴도 소개