Tech · 검색/지식관리

키워드 검색의 한계와 Graph-RAG

주식회사 줄갭 · 2026-06-21 · 6분 읽기
키워드 검색의 한계와 Graph-RAG

과거에 비슷한 상황을 어떻게 판단했는지 찾고 싶을 때, 대부분의 검색은 단어가 똑같이 적힌 문서만 찾아줍니다. 정작 필요한 것은 '말은 다르지만 같은 상황'인데 말이죠. Graph-RAG는 바로 그 간극을 메우기 위한 기술입니다.

키워드 검색이 과거 판단을 못 찾는 이유

키워드 검색은 입력한 단어와 글자가 일치하는 문서를 찾습니다. 빠르고 정확하지만, 같은 상황을 다른 말로 적은 기록은 놓칩니다. '납기 지연'으로 검색하면 '일정이 밀렸다', '출하가 늦어졌다'고 적힌 과거 판단은 걸리지 않습니다.

  • 표현이 다르면 못 찾는다 — 동의어·줄임말·현장 용어에 취약
  • 맥락을 모른다 — 단어는 맞아도 상황이 전혀 다를 수 있다
  • 관계를 못 본다 — '이 결정이 저 프로젝트 때문에 나왔다'는 연결을 못 따라간다
키워드 검색 vs Graph-RAG
키워드 검색단어 일치맥락 모름관계 못 봄Graph-RAG의미로 검색(RAG)관계로 연결(그래프)근거 추적 가능vs
단어가 아니라 '의미와 관계'로 과거 판단을 찾는다.

RAG — 의미로 찾아 답을 만든다

RAG(검색증강생성, Retrieval-Augmented Generation)는 질문과 문서를 모두 '벡터'라는 숫자 표현으로 바꿔 의미가 가까운 것을 찾는 방식입니다. 글자가 아니라 뜻으로 검색하기 때문에 '납기 지연'과 '출하가 늦어졌다'를 비슷한 것으로 인식합니다. 찾아온 근거를 바탕으로 AI가 답을 생성하므로, 학습하지 않은 우리 회사 내부 기록에도 답할 수 있고 환각(없는 사실을 지어내는 현상)도 줄어듭니다.

다만 기본 RAG는 데이터를 '흩어진 텍스트 조각'으로만 봅니다. 조각 하나하나는 잘 찾지만, 여러 판단이 어떻게 얽혀 있는지 — 어떤 결정이 어떤 사건에서 비롯됐는지 — 같은 관계는 보지 못합니다.

Graph-RAG — 관계까지 따라가는 검색

Graph-RAG는 텍스트에서 핵심 개체(사람·프로젝트·결정·근거)와 그들 사이의 관계를 뽑아 지식그래프로 엮은 뒤, 이 구조를 검색에 활용합니다. 마이크로소프트 리서치는 이렇게 LLM이 만든 지식그래프를 활용하면 복잡한 정보를 다룰 때 답변의 근거 추적(출처 증명)과 품질이 크게 좋아진다고 보고했습니다.

  • 개체를 점(node), 관계를 선(edge)으로 표현해 '왜·어떻게 연결됐는지'를 따라간다
  • 흩어진 조각이 아니라 연결된 맥락 전체를 끌어와 답한다
  • 근거의 출처를 추적할 수 있어 신뢰도가 높다
하이브리드 검색 스택
키워드정확한 용어 매칭벡터(RAG)의미 기반 유사 검색그래프(Graph-RAG)판단·근거·프로젝트 관계 탐색
세 층을 결합해 '비슷한 상황의 과거 판단'에 도달한다.

과거 판단 검색에 Graph-RAG가 맞는 이유

현장의 판단은 결코 혼자 존재하지 않습니다. 어떤 결정은 특정 프로젝트, 특정 거래처, 과거의 또 다른 결정과 얽혀 있습니다. 키워드 검색은 이 사슬을 못 따라가고, 기본 RAG는 의미는 잡되 관계는 놓칩니다. Graph-RAG는 의미 검색과 관계 검색을 합쳐 '비슷한 상황에서, 무엇과 연결된, 어떤 판단이었나'를 통째로 가져옵니다. 이것이 과거 판단을 다시 쓰는 데 핵심입니다.

자주 묻는 질문

RAG와 Graph-RAG는 무엇이 다른가요?

RAG는 의미가 가까운 텍스트 조각을 벡터로 찾아옵니다. Graph-RAG는 거기에 더해 개체들 사이의 관계를 지식그래프로 엮어, 흩어진 조각이 아니라 연결된 맥락 전체를 검색합니다.

키워드 검색은 이제 필요 없나요?

아닙니다. 정확한 코드·품번처럼 글자가 정확히 일치해야 하는 검색에는 키워드가 여전히 유용합니다. 그래서 실무에서는 키워드·의미·관계 검색을 함께 쓰는 하이브리드 방식이 효과적입니다.

출처 · 참고자료

  1. Project GraphRAG — Microsoft Research
  2. GraphRAG: Unlocking LLM discovery on narrative private data — Microsoft Research
  3. What is Retrieval-Augmented Generation (RAG)? — Google Cloud