Всем привет, обучал руберт, руроберту и xlm для бин классификации

Question

Всем привет, обучал руберт, руроберту и xlm для бин классификации

(12к предложений, ≈2,5к - первый класс, ≈9,5 - второй), и андерсэмплил, и оверсемплил, но всего 60% точности, f1≈45%
данные очень разные, сокращения одних и тех же слов могут сильно разниться

подскажите пожалуйста, что лучше использовать для получения своих эмбедингов? (есть еще 4 миллиона неразмеченных предложений)

#nlp #programming #russian

0

31.07.2022

2 ответов

34 просмотра

Emil Z Автор вопроса

Игорь Тарлинский
А если попробовать топ частых сокращений разворачи...

попробую тоже, а как лучше сопоставлять сокращениям их полную форму?

0

31.07.2022

Игорь Тарлинский · Accepted Answer

Игорь Тарлинский

А если попробовать топ частых сокращений разворачивать в полные слова? Вроде должно стать лучше с контекстом

0

31.07.2022

170 похожих чатов

Всем привет, обучал руберт, руроберту и xlm для бин классификации

2 ответов

Похожие вопросы