안녕하세요. 제가 막 튜닝해서 실험하는 중인데 사진과 같이 외계어를 뱉는 상황에는 보통 어떤 부분이 문제가 되는지 알고 싶습니다.


저는 모델 저장이나 로드가 잘못되었나를 추정중입니다만.. 여러분의 고견을 구합니다 ㅜㅜ


파인튜닝모델과 원본이랑 merge과정을 거치지 않고 모델 저장을 한 것이 원인일까요? ㅠㅠ


아니면 데이터 훈련할 때


prompt, chosen, reject 맞출려고 reject를 ' ' empty string으로 훈련한게 혹시 원인이 될까요.. 

원본 데이터에 reject가 없었고 제가 사용하는 오픈소스 fine-tuning 라이브러리 ORPO가 저 데이터 형식을 요구해서요.. ㅠㅠ