목차

Reference

Vector Stores란?


🤖 LLM에서는 왜 Vector Store가 필요할까?

LLM은 사람이 쓴 질문을 이해하고, 그 질문과 ‘의미상’ 비슷한 문서를 찾는 게 핵심이에요.

예를 들어:

사용자가 “집에서 라떼 만드는 법 알려줘”라고 질문하면

Vector Store는 “홈메이드 커피 레시피” 같은 문서도 찾아줘요. (의미는 비슷하니까!)

근데 RDB는 이런 게 불가능해요.

"라떼"라는 단어가 정확히 있어야 검색돼요. 의미는 몰라요.

즉, 키워드 검색이 아닌 의미 기반의 검색 가능하기 때문에 사용!

Vector Store의 작동 원리

  1. 벡터 저장: 문서나 텍스트 단위를 임베딩 모델을 통해 고차원 벡터로 변환하여 저장
  2. 유사도 검색: 쿼리 텍스트도 같은 임베딩 모델로 벡터화한 후, 저장된 벡터들과 유사도 계산
  3. 최근접 이웃 검색: 코사인 유사도나 유클리드 거리 등의 지표를 사용해 가장 유사한 벡터 식별
  4. 결과 반환: 가장 유사도가 높은 문서나 텍스트 조각을 검색 결과로 반환