라마3 70B 구동 - Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3500명 알림수신 173명 @바바리맨

제한없는 언어모델을 위한 채널

질문 라마3 70B 구동

추천 0 비추천 0 댓글 6 조회수 968 작성일 2024-05-19 23:35:34

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/alpaca/106637636

라마3 70B를 순정을 양자화 해서 구동하려하는데 양자화 4배랑 8배랑 성능차이가 큰가요??

댓글 [6] 글쓰기

ㅇㅇ (210.91)

2024-05-20 00:17:32 삭제 수정 답글

라마3 70b 정도면 제대로 4bit 양자화할시 좋은 성능이지만 한국어 능력은 기대하면 안됨.
제일 큰 문제는 양자화를 잘못하거나 템플레이트 잘못 박아넣고 질문 넣으면 이상한 대답이 나옴

펼쳐보기▼

2024-05-20 01:56:08 답글

조언 감사합니다!

펼쳐보기▼

2024-05-20 01:51:35 답글

바로 밑에 양자화별 성능표 있어요. Q5-K-M까지는 양자화 안한거랑 큰 성능차 없어 보이네요.
https://arca.live/b/alpaca/106368094

펼쳐보기▼

2024-05-20 01:56:14 답글

감사합니다!

펼쳐보기▼

ㅇㅇ (218.145)

2024-05-20 09:26:05 삭제 수정 답글

혹시 라마3 70b을 양자화 했을 때, 예상 되는 인프라 구성이 어떻게 될까요?

펼쳐보기▼

2024-05-20 10:12:13 답글

3090TI 2개입니다. 총 48GB

펼쳐보기▼

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 30957913

공지 Ai 언어모델 로컬 채널 이용규정

바바리맨 2023.04.18 6220

공지 뉴비에게 도움 되는 글 모음

바바리맨 2023.04.18 28222

공지 언어모델 관련 정보취득 /무료체험 가능 사이트

바바리맨 2023.04.18 9317

공지 여러분의 학습에 도움을 줄 수 있는 하드웨어 지원

바바리맨 2023.08.01 5386

공지 신문고

바바리맨 2023.04.18 2341

숨겨진 공지 펼치기(1개)

4334 일반 sglang 좋네요 [1]

감별사 2024.06.11 142 4

4333 일반 VRAM 이 부족하면 RAM 에 모델에 필요한 메모리를 할당하는 방법도 있나요? [4]

ovp 2024.06.11 189 0

4332 일반 Qwen2 72B 라이센스 GPT4o 물어봄 [1]

zzzzz5 2024.06.11 351 2

4331 질문 공부하다가 궁금한게 생겨서 질문드립니다 [1]

ㅇㅇ 2024.06.11 178 0

4330 일반 눕질문) ollama 에서 70b모델 돌리고 싶은데 가능할까요? [7]

ㅇㅇ (121.150) 2024.06.11 326 0

4329 일반 병렬로 처리 하는 방법이 있을까요? [11]

ㅇㅇ (106.101) 2024.06.11 362 2

4328 일반 젬마2를 내놔 [2]

ㅇㅇ 2024.06.10 341 3

4327 일반 TRPG NPC(AI)들과의 프리토킹에 적합한 모델은? [2]

다시마주먹밥 2024.06.10 283 1

4326 일반 mi300x 나 mi300a 써보신분 계실까요? [8]

ㅇㅇ (223.38) 2024.06.10 292 1

4325 일반 CONTEXT를 주어주고 질문 할때 답변 오류 현상 [9]

ㅇㅇ (106.101) 2024.06.10 215 0

4324 질문 arc a770 2대 이상으로 구성하신 분 계실까요? [8]

bedovyy 2024.06.10 335 1

4323 질문 Llama 70b mac 인퍼런스 [7]

ㅇㅇ (118.235) 2024.06.10 384 0

4322 질문 Inference용 PC 구성 질문입니다 [24]

ㅇㅇ (1.247) 2024.06.10 406 1

4321 질문 뉴비 질문이 있습니다. [8]

tokai 2024.06.10 277 1

4320 정보 [ver 1.1] 회사에서 LLM 으로 뭐해보라고 지시가 내려왔을때 먼저 참고해볼만한 글 [14]

hkhk 2024.06.10 1229 25

4319 일반 karpathy GPT-2 4시간 유튜브 강의. [4]

zzzzz5 2024.06.10 419 6

4318 일반 openai GPT는 정말 눅눅해질까? [5]

oo 2024.06.10 538 0

4317 스터디 qwen2 소개 - Part II 강화학습 단계에서 머징기법의 활용 (Feat. deccp) [4]

hkhk 2024.06.09 740 20

4316 스터디 qwen2 소개 (Feat. 논문 3개 분석 - Part I) [10]

hkhk 2024.06.09 1179 47

4315 일반 vllm, aphrodite 그리고 sglang (RadixAttention) [3]

감별사 2024.06.09 369 10

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.