200===Dev Language/RAG

RAG(Retrieval-Augmented Generation)와 문맥 검색의 마법 🎩

블로글러 2024. 11. 4. 12:34

안녕하세요! 오늘은 AI가 더 똑똑하게 정보를 찾고 이해하는 방법인 RAG와 문맥 검색(Contextual Retrieval)에 대해 알아볼게요.

RAG가 뭔가요? 🤔

RAG는 마치 도서관 사서와 비슷해요!

  • 사서(RAG)가 방대한 책들(지식 베이스) 중에서
  • 여러분의 질문에 관련된 내용을 찾아서
  • AI에게 전달해주는 똑똑한 시스템입니다

작동 방식 💫

  1. 지식 쪼개기

    • 긴 문서를 작은 조각으로 나눔
    • 마치 책을 章, 節 단위로 나누는 것처럼!
  2. 벡터 변환

    • 텍스트를 숫자로 변환 (임베딩)
    • 마치 책의 내용을 좌표로 표현하는 것!
  3. 검색과 활용

    • 질문이 들어오면 관련 내용을 찾아서
    • AI에게 전달하여 답변 생성

기존 RAG의 문제점은? 😢

예시 상황:
Q: "ACME 회사의 2023년 2분기 매출 성장률은?"
A: "회사의 매출은 전 분기 대비 3% 증가했습니다."
  • 이 답변만 보면 어떤 회사인지
  • 언제의 데이터인지 알 수 없죠!
  • 이런 걸 "문맥 손실" 이라고 해요

문맥 검색으로 해결하기! ✨

문맥 검색이란?

정보 조각에 배경 설명을 추가하는 마법같은 기술이에요!

변경 전: "회사의 매출은 전 분기 대비 3% 증가했습니다."

변경 후: "이 내용은 ACME 회사의 2023년 2분기 실적 보고서에서 
발췌했으며, 이전 분기 매출은 3억 1400만 달러였습니다. 
회사의 매출은 전 분기 대비 3% 증가했습니다."

장점 🌟

  1. 정확도 향상

    • 검색 실패율 49% 감소
    • 재순위화(Reranking) 적용 시 67% 감소
  2. 더 똑똑한 답변

    • 필요한 맥락을 모두 파악
    • 정확하고 구체적인 답변 가능
  3. 비용 효율적

    • Claude의 프롬프트 캐싱 활용
    • 백만 토큰당 약 $1.02로 처리 가능

실제 활용 예시 📱

# 문맥 추가하기
original = "매출이 3% 증가했습니다."
with_context = """
이 내용은 ACME 2023 Q2 보고서의 일부입니다.
이전 분기 매출: 3억 1400만 달러
현재 내용: 매출이 3% 증가했습니다.
"""

도입 시 고려사항 ⚠️

  1. 청크 크기 설정

    • 너무 크면: 처리 비효율
    • 너무 작으면: 문맥 부족
  2. 임베딩 모델 선택

    • Gemini나 Voyage 추천
    • 용도에 맞는 모델 선택 필요
  3. 맞춤형 문맥화

    • 산업이나 분야에 맞는
    • 특별한 용어나 배경 추가 가능

마치며 🎁

문맥 검색은 AI가 더 정확하고 유용한 답변을 제공하도록 도와주는 혁신적인 기술이에요. 마치 AI에게 안경을 씌워준 것처럼, 더 선명하게 정보를 볼 수 있게 해줍니다!


더 궁금하신 점 있으시다면 댓글로 남겨주세요! 😊

728x90