개요RAG는 LLM과 벡터 DB를 함께 활용해, 컨텍스트 길이 한계로 인한 LLM의 성능 저하를 보완하는 아키텍처다. 현재 CS 관련 업무를 진행하면서, RAG의 기반이 되는 벡터 DB에 어떤 형태로 데이터를 저장하는 것이 가장 효과적인지에 대해 GPT와 함께 얘기 나눠봤다. 실험한 데이터 구성 방식은 크게 세 가지질문만 저장답변만 저장질문 + 답변 함께 저장이 세 가지 방식 중 어떤 구성이 실제로 가장 좋은 성능을 내는지 비교·검증해보았다.vector search대부분의 튜토리얼/가이드 구조는 아래처럼 되어있다.KB(문서/가이드/FAQ)를 chunk로 나눔각 chunk(= “답이 들어있는 텍스트 조각”)를 임베딩 → 벡터DB에 저장유저 질문이 오면:질문을 임베딩이 벡터를 쿼리로 해서 “가장 비슷한 ch..