code 13b instruct на вот такой машине — Out Of Memory.
CUDA Device Name: NVIDIA RTX A6000
CUDA Device Total Memory [GB]: 51.041271808
С квантизацией 4bit влазит в 6 гигов. С квантизацией 8бит уже на 48GB не грузит. Очень странно.
Для загрузки использую стандартную HF
model = AutoModelForCausalLM.from_pretrained(model_id,
device_map=DEVICE_MAP,
local_files_only=LOAD_FROM_LOCAL,
use_cache=False,
)
https://huggingface.co/spaces/Vokturz/can-it-run-llm
На 48гб помещается 70б в 4бит
Странно. Почему-то у меня с Out of Memory вываливается на48GB.
13б без квантизации влазит в 48Гб. Попробуй обновить либы
Обсуждают сегодня