llm (без дообучения), можно ли компенсировать качество гпу их количеством?
В квантизации + tensor parallel все хорошо будет
tensor parallel поможет если у вас n rtx3060
Через pcie можно
Не. Я же и говорю, что поможет)
Обсуждают сегодня