검색 증강 생성 (RAG)
관련 문서를 가져와 모델에 넣어, 답이 학습 데이터가 아니라 당신의 데이터에 근거하게 하는 기법.
검색 증강 생성(RAG)은 기본 문제를 풉니다. 모델은 학습한 것만 알고 그 지식은 고정되고 일반적입니다. RAG는 질의 시점에 자체 문서에서 관련 텍스트를 가져와 프롬프트에 넣어, 답이 당신의 데이터에 근거하게 합니다.
RAG 파이프라인은 몇 단계입니다. 문서를 청크로 나누고, 각 청크를 임베딩으로 바꾸고, 벡터 인덱스에 저장하고, 질의 시점에 질문과 가장 가까운 청크를 찾아 모델에 전달합니다. 답의 품질은 적절한 청크를 검색하는 데 크게 달려 있어, 많은 RAG 시스템에서 검색 품질이 모델보다 중요합니다.
검색 라이브러리로 시작한 LlamaIndex의 주특기입니다. 에이전트 프레임워크는 RAG를 여러 도구 중 하나로 더합니다. 에이전트가 언제 검색할지, 무엇을 찾을지, 결과를 어떻게 쓸지 정합니다. RAG를 에이전트 루프와 결합하면 매 턴 무작정 검색하는 대신 무엇을 찾아야 하는지 추론하게 됩니다.