ранг матриц для LoRA под конкретную модель? Очевидно, что кто-то уже ставил эксперименты по зависимости качества модели на разных тасках для конкретных моделей от ранга матриц, но я не могу их найти (скроее всего не то ищу, буду рад совету 😁️️️️️️ )
LoRA не очень чувствительна к рангу. Я бы сказал правило буравчика тут использовать 16 если у вас небольшой датасет и использовать 64 если большой.
Обсуждают сегодня