Ai 언어모델 로컬 채널

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3500명 알림수신 173명 @바바리맨

제한없는 언어모델을 위한 채널

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 질문 정보 학습 자료 자작모델 스터디 공지 운영 공모

번호 제목

작성자 작성일 조회수 추천

603 정보 axolotl 레이어 얼리는 문제관련 버그 해결 방법 공유 [8]

DopeorNope 2024.01.13 749 14

602 정보 내 로컬 컴퓨터에 copilot 같은 코딩 조수를 깔아보자 (feat. ollama + continue.dev) [9]

hkhk 2024.01.08 2188 14

601 정보 엔비디아 48Gb VRAM 14080 CUDA 탑재한 5880 발표 [9]

그래요 2024.01.08 912 7

600 정보 i9-10940x(28스레드, 3.3GHz)로 여러 모델 돌려봄 [1]

iau 2024.01.06 518 5

599 정보 Microsoft PHI-2 모델의 라이센스가 MIT라이센스로 바뀌었다고 합니다 [6]

hkhk 2024.01.06 752 8

598 정보 기존 토큰과 확장된 토큰에 대해서 특정 레이어의 특정 토큰들만 얼리거나 학습률을 차등화하기 [8]

hkhk 2024.01.05 944 7

597 정보 [수정] 영어외의 외국어 모델에서 토큰확장은 추천하지 않는다 [14]

hkhk 2024.01.04 757 4

596 정보 GPT4 와 Mistral-7B 를 이용해서 쓸만한 텍스트 엠베딩 모델 만들기 [10]

hkhk 2024.01.02 2290 17

595 정보 Gemini Pro를 이용한 text reviser [2]

ㅇㅇ (182.221) 2023.12.31 958 11

594 정보 GPU 부담 경감: 메모리 오프로딩으로 가능해진 고성능 모델 실행 [3]

엔피 2023.12.31 860 7

593 정보 새벽 폭주글 MOE에 대한 고찰 및 실험 일기장 [7]

DopeorNope 2023.12.30 1431 15

592 정보 데이터 오염에서 완벽하게 안전한 리더보드 [1]

ㅇㅇ 2023.12.29 593 4

591 정보 논문)self-attention은 2 제곱량의 메모리가 필요하지 않다. [7]

ㅎ헤ㅔ헤헤헤 2023.12.28 506 6

590 정보 지금 핫한 OLLAMA를 사용해보자 [5]

와이크리스 2023.12.28 1554 4

589 정보 solar 10.7b 모델의 구현원리에 대한 업스테이지의 논문 발표 [17]

hkhk 2023.12.27 1614 30

588 정보 gemini pro 벤치마크 성능 비교(with gpt, mixtral) [1]

wickout 2023.12.26 800 3

587 정보 RTX 4090에서 11 t/s로 175b 모델 실행하는 방법:PowerInfer [5]

ㅇㅇ 2023.12.21 1321 12

586 정보 뉴비들은 우바부가 대신 LM Studio를 사용해보는 게 어떠심? [12]

itis 2023.12.21 1392 1

585 정보 ssd를 이용해서 메모리 요구량을 낮추는 방법이 떴었네요? [3]

serina 2023.12.20 601 9

584 정보 학습료 지불하란 문체부 가이드 라인 나옴 [18]

Wellspring 2023.12.20 867 1

전체글 개념글