라마3 70B를 순정을 양자화 해서 구동하려하는데 양자화 4배랑 8배랑 성능차이가 큰가요??