복잡한 회사 매뉴얼(한국어) 등을 RAG로 밀어 넣고 업무 bot처럼 사용할려고,

여러 오픈 모델들을 한국어 튜닝 시도하고 있습니다.


고수분들 덕분에 한국어 튜닝된 다양한 llm을 테스트해 보고 있습니다.

특히, 한국어 vocab 추가하고 fine-tuning하는데 eeve 같은 방법을 적용해도 여전히 부족함이 있네요.

영어 만큼 충분히 성능이 나오지 않아서 고민입니다.


한국어 fine-tuning에 참조할 만한 사례나 논문, 자료가 있을까요?

미리 감사드립니다!