뉴스
구독자 3448명 알림수신 170명
제한없는 언어모델을 위한 채널
전체글 개념글
최근 최근 방문 채널
    최근 방문 채널
      번호 제목
      작성자 작성일 조회수 추천
      4154 일반 [lmsys] Llama-3-70B가 잘하는 것과 못하는 것 [4]
      982 6
      4153 일반 왜 임베딩 벡터는 이렇게 고차원이 되었을까 [6]
      697 0
      4152 질문 하루에 3000만토큰 쯤 쓰는데 로컬로 .. [22]
      935 1
      4151 일반 exllamav2가 최고라고 생각했었는데 vllm은 어떤가요? [7]
      524 0
      4150 질문 BERT에 관련하여 [3]
      514 0
      4149 일반 gemma를 ollama에서 서빙을 하려 합니다. [3]
      503 0
      4148 질문 llama.cpp로 양자화할때 에러가 뜨는데 무슨 문제려나요 [2]
      302 0
      4147 질문 Deepspeed 사용하는 방법 아시나요? [18]
      628 0
      4146 일반 코딩 llm 자주 사용함? [23]
      1087 2
      4145 자료 IBM에서 아파치2 라이센스로 코딩모델 출시 [5]
      331 2
      4144 일반 호기심에 번역한거 비교해봄 [12]
      778 1
      4143 스터디 트랜스포머도 깊게 생각을 하려면 메모장이 필요해요 - Vision Transformers Need Registers [21]
      1308 42
      4142 스터디 디퓨전 모델이 학습하는 원리 - 어디까지 암기이고 어디부터 학습일까? - 디퓨전 모델은 정말 이해를 하고서 이미지를 만드는걸까? [12]
      1328 40
      4141 질문 업무 목적으로 한국어 튜닝해서 사용하시는 분 계신가요? [7]
      696 0
      4140 일반 (구글x서울디지털재단)2024 서울 프롬프톤(AI 프롬프트엔지니어링 해커톤) 참가자 모집(기간 연장, ~5.15) [9]
      1045 11
      4139 일반 A100 40GB로 llama3 70B 구동은 되는지? [3]
      775 2
      4138 일반 ms가 500b 모델을 학습중이라고 합니다 [3]
      500 3
      4137 질문 베이스라인 모델 선정 방법
      350 0
      4136 일반 판매자 정보 실수 - 4060ti 16gb dual 또는 3way 를 위한 핫딜 정보 [11]
      770 5
      4135 질문 vllm 활용 추론 관련해서 질문드립니다. [10]
      564 0
      전체글 개념글
      Keyword search form input