текстов - по 200 на класс, 10 классов (примерно 2к сэмплов всего)
подскажите по своему опыту, пожалуйста:
1. Я правильно понимаю, что все еще неплохая идея - зафайнтюнить какой-нибудь русскоязычный берт?
2. Если первое да - посоветуйте, пожалуйста, модель, что посмотреть кроме дефолтной bert-base-multilingual-cased
3. Если не берт, какой бы вы выбрали хороший бейзлайн для таких малых данных?
Спасибо!
Файнтюнить нет, можно обучить логрег/svm/... на эмбеддингах русского берта
Хотя можно, иногда получается на 2к тюнить
Обсуждают сегодня