목차

1️⃣ 검색 (Retrieval)

RAG의 가장 중요한 단계로, LLM이 정확한 정보 출처를 찾아 환각 현상을 해결하는 핵심 과정이다.

🔹 검색(Retrieval)의 핵심 목표

🔹 RAG의 검색 과정

image.png

  1. 사용자 질문을 벡터(임베딩)로 변환
  2. 문서 데이터도 동일한 방식으로 벡터화
  3. 벡터 유사도 검색 수행

🔹 검색 성능을 결정하는 주요 요소

  1. 임베딩 모델 선택

    🔹 주요 임베딩 모델 비교

    오픈 소스 여부 기업 모델 최대 입력 길이(토큰)
    ❌ Closed Source OpenAI text-embedding-3-small / large / ada-002 8,191
    ❌ Closed Source Cohere embed-english-v3.0 / embed-multilingual-v3.0 512
    ✅ Open Source Mistral SFR-Embedding-Mistral 32,769
    ✅ Open Source Voyage AI voyage-lite-02-instruct 4,000
    ✅ Open Source MS, Contextual AI, 홍콩대 GritLM-7B 32,768

    🔹 임베딩 모델 선택 시 고려해야 할 점

  2. 검색 문서의 형태

2️⃣ 증강 (Augmentation)

검색된 정보를 LLM에 전달하기 위해 사용자의 질문과 검색된 문서를 하나의 프롬프트로 조합하는 과정.