과거 유사 판단을 '관계'로 찾는다는 것

현장에서 가장 값진 한마디는 '예전에 비슷한 일 있지 않았나요?'입니다. 하지만 그 '비슷함'을 단어가 아니라 의미와 관계로 찾아낼 수 있어야, 과거의 판단이 진짜로 도움이 됩니다.
'비슷하다'는 단어가 같다는 뜻이 아니다
유사 사례 검색에서 가장 흔한 오해는 '같은 단어가 들어간 기록'을 비슷한 사례로 여기는 것입니다. 그러나 현장의 두 상황은 쓰는 말이 전혀 달라도 본질이 같을 수 있고, 같은 단어를 써도 맥락이 완전히 다를 수 있습니다. 진짜 유사함은 표현이 아니라 의미와 관계의 닮음입니다.
벡터 의미검색 — 뜻이 가까운 것을 찾는다
벡터 의미검색은 문장을 '임베딩'이라는 숫자 좌표로 바꿔, 좌표가 가까운(=뜻이 가까운) 기록을 찾습니다. 의미가 비슷하면 단어가 달라도 가까이 모이기 때문에, '협력사 품질 이슈로 라인을 멈췄다'와 '외주 불량 때문에 가동 중단'을 같은 부류로 인식합니다. 키워드 검색이 놓치는 동의어·현장 용어·줄임말 문제를 넘어서는 출발점입니다.
- 글자가 아니라 의미의 거리로 유사도를 잰다
- 표현이 달라도 본질이 같으면 가까이 모인다
- 다만 의미만으로는 '어떤 프로젝트·결정과 얽혔는지'까지는 알 수 없다
관계로 좁힌다 — 그래프가 더하는 정밀함
의미가 가까운 후보를 찾은 다음, 관계 정보로 한 번 더 좁히면 정밀도가 올라갑니다. 같은 거래처, 같은 공정, 같은 결정에서 파생된 판단인지 — 이런 연결은 지식그래프가 답합니다. '비슷한 뜻'을 벡터가, '연결된 맥락'을 그래프가 책임지는 분업입니다. 둘을 합치면 단순히 닮은 글이 아니라 '같은 상황 줄기에서 나온 판단'을 끌어올 수 있습니다.
이것이 사례기반추론(CBR)이다
이 방식은 인공지능의 오래된 원리인 사례기반추론(CBR, Case-Based Reasoning)과 정확히 맞닿아 있습니다. CBR은 새 문제를 만나면 가장 비슷한 과거 사례를 찾아(Retrieve), 그 해법을 가져와(Reuse), 현재 상황에 맞게 고친 뒤(Revise), 결과를 다시 저장합니다(Retain). 이 네 단계가 돌수록 사례 창고가 풍부해지고 검색은 더 똑똑해지는 자기강화 순환입니다. 과거 유사 판단 검색의 본질이 바로 이 순환입니다.
- Retrieve — 가장 비슷한 과거 판단을 찾는다
- Reuse — 그 판단을 현재 상황에 가져온다
- Revise — 지금 맥락에 맞게 다듬는다
- Retain — 새 판단을 다시 자산으로 쌓는다
자주 묻는 질문
벡터 검색만 있으면 충분하지 않나요?
벡터 검색은 '의미가 비슷한' 후보를 잘 찾지만, 그 판단이 어떤 프로젝트·거래처·결정과 얽혔는지는 모릅니다. 관계까지 보려면 지식그래프를 함께 써서 정밀도를 높여야 합니다.
사례기반추론(CBR)은 오래된 개념 아닌가요?
원리는 오래됐지만 지금도 유효합니다. 과거에 부족했던 '의미로 비슷한 사례 찾기'를 벡터 임베딩이, '관계로 좁히기'를 지식그래프가 채워주면서 현장에서 실제로 작동하는 방식이 되었습니다.
출처 · 참고자료
- Case-Based Reasoning (CBR): Definition & Guide — Giva
- What is Case-Based Reasoning (CBR)? — TechTarget
- Retrieval-Augmented Generation (RAG) — Pinecone