Всем привет Пробую saiga2 70b на двух 4090 через llama.cpp получается 17.4 токена в с. Это нормально или мало ? Смущает, что загрузка только по 50-55%... Это потому что перва...