구독자 3500명
알림수신 173명
제한없는 언어모델을 위한 채널
최근
최근 방문 채널
최근 방문 채널
번호
제목
작성일
조회수
추천
603
정보
axolotl 레이어 얼리는 문제관련 버그 해결 방법 공유
[8]
749
14
602
정보
내 로컬 컴퓨터에 copilot 같은 코딩 조수를 깔아보자 (feat. ollama + continue.dev)
[9]
2188
14
601
정보
엔비디아 48Gb VRAM 14080 CUDA 탑재한 5880 발표
[9]
912
7
600
정보
i9-10940x(28스레드, 3.3GHz)로 여러 모델 돌려봄
[1]
518
5
599
정보
Microsoft PHI-2 모델의 라이센스가 MIT라이센스로 바뀌었다고 합니다
[6]
752
8
598
정보
기존 토큰과 확장된 토큰에 대해서 특정 레이어의 특정 토큰들만 얼리거나 학습률을 차등화하기
[8]
944
7
597
정보
[수정] 영어외의 외국어 모델에서 토큰확장은 추천하지 않는다
[14]
757
4
596
정보
GPT4 와 Mistral-7B 를 이용해서 쓸만한 텍스트 엠베딩 모델 만들기
[10]
2290
17
595
정보
Gemini Pro를 이용한 text reviser
[2]
958
11
594
정보
GPU 부담 경감: 메모리 오프로딩으로 가능해진 고성능 모델 실행
[3]
860
7
593
정보
새벽 폭주글 MOE에 대한 고찰 및 실험 일기장
[7]
1431
15
592
정보
데이터 오염에서 완벽하게 안전한 리더보드
[1]
593
4
591
정보
논문)self-attention은 2 제곱량의 메모리가 필요하지 않다.
[7]
506
6
590
정보
지금 핫한 OLLAMA를 사용해보자
[5]
1554
4
589
정보
solar 10.7b 모델의 구현원리에 대한 업스테이지의 논문 발표
[17]
1614
30
588
정보
gemini pro 벤치마크 성능 비교(with gpt, mixtral)
[1]
800
3
587
정보
RTX 4090에서 11 t/s로 175b 모델 실행하는 방법:PowerInfer
[5]
1321
12
586
정보
뉴비들은 우바부가 대신 LM Studio를 사용해보는 게 어떠심?
[12]
1392
1
585
정보
ssd를 이용해서 메모리 요구량을 낮추는 방법이 떴었네요?
[3]
601
9
584
정보
학습료 지불하란 문체부 가이드 라인 나옴
[18]
867
1