정책 초기화란? 🤔정책 초기화는 AI 모델이 효과적으로 문제를 해결할 수 있도록 기본적인 능력을 갖추는 과정입니다. 마치 아이가 학교에 가기 전 기본적인 지식을 쌓는 것과 같죠!정책 초기화의 3가지 핵심 단계 🚀1. 사전 훈련 (Pre-training)사전 훈련 과정├── 웹 데이터 학습│ ├── 대규모 텍스트 데이터 수집│ └── 자기 지도 학습 수행├── 기본 언어 이해력 개발│ ├── 문맥 파악 능력│ └── 패턴 인식 능력└── 기초 지식 습득 ├── 일반 상식 ├── 도메인 지식 └── 언어 패턴2. 지침 미세 조정 (Instruction Fine-tuning)미세 조정 과정├── 인간 지침 학습│ ├── 명령어 이해│ └── 의도 파악├── 응답 생성 ..