CI 환경 최적화: ollama 대안 찾기 & llama3.2 3B보다 더 낮은 성능 모델 최적화

1. ollama 대안 찾기 => ollama가 CI 환경에서 돌리기는 버겁다고 해서 llama.cpp 등 더 최적화&경량화할 방법을 찾아야함
2. llama3.2 3B보다 더 낮은 성능 모델 최적화 => 3B도 가벼운 편은 아니여서 mistral이나 더 가벼운 다국어 모델을 써야할 것