Всем привет! Делаю сравнение русскоязычных LLM. Подскажите, пожалуйста, какое железо подойдёт для fine tuning saiga2 версий 7b, 13b и 70b соответственно, а также для ruGPT-3-...
Всем привет! Знает ли кто-нибудь на каких датасетах была обучена модель Mistral-7B? Или возможно у кого-то есть гипотезы по этому поводу? Читал блогпост и карточку с HF, нигде...
@YallenGusev Добрый вечер! Из вашего доклада на датафесте заметил, что на датасете rcb saiga_7b даёт метрики лучше, чем saiga_13b, также на других датасетах saiga_7b не сильно...
Всем привет! Подскажите, пожалуйста, какое железо подойдёт для fine tuning saiga2 версий 7b, 13b и 70b соответственно?
Всем привет! Кто-нибудь знает, можно ли развернуть LLAMA-2 на node.js?