검색이란? 🤔검색은 o1 모델이 주어진 문제에 대한 최적의 답을 찾아가는 과정입니다. 마치 체스 선수가 다음 수를 고민하면서 여러 가능성을 검토하는 것과 같죠!검색의 두 가지 핵심 단계 🌟1. 훈련 시간 검색 (Training Time Search)훈련 시간 검색 구조├── 트리 검색 기술│ ├── Best-of-N 검색│ │ ├── 다중 후보 생성│ │ └── 최적 답변 선택│ ├── 빔 검색 (Beam Search)│ │ ├── 확률 기반 가지치기│ │ └── 병렬 처리 최적화│ └── MCTS (Monte Carlo Tree Search)│ ├── 선택 → 확장 → 시뮬레이션 → 역전파│ └── 탐색-활용 균형 조정└── 외부 지침 활..