목차
Reference
Vector Stores란?
- 임베딩된 벡터를 효율적으로 저장하고 검색할 수 있게 해주는 특수한 데이터베이스
🤖 LLM에서는 왜 Vector Store가 필요할까?
LLM은 사람이 쓴 질문을 이해하고, 그 질문과 ‘의미상’ 비슷한 문서를 찾는 게 핵심이에요.
예를 들어:
사용자가 “집에서 라떼 만드는 법 알려줘”라고 질문하면
Vector Store는 “홈메이드 커피 레시피” 같은 문서도 찾아줘요. (의미는 비슷하니까!)
근데 RDB는 이런 게 불가능해요.
→ "라떼"
라는 단어가 정확히 있어야 검색돼요. 의미는 몰라요.
즉, 키워드 검색이 아닌 의미 기반의 검색 가능하기 때문에 사용!
Vector Store의 작동 원리
- 벡터 저장: 문서나 텍스트 단위를 임베딩 모델을 통해 고차원 벡터로 변환하여 저장
- 유사도 검색: 쿼리 텍스트도 같은 임베딩 모델로 벡터화한 후, 저장된 벡터들과 유사도 계산
- 최근접 이웃 검색: 코사인 유사도나 유클리드 거리 등의 지표를 사용해 가장 유사한 벡터 식별
- 결과 반환: 가장 유사도가 높은 문서나 텍스트 조각을 검색 결과로 반환