Коллеги, всем привет о классификации текстов от абзаца до страницы, медиана

Question

Коллеги, всем привет о классификации текстов от абзаца до страницы, медиана

750 слов, текстов мало (750 сэмплов). Бинарная, соотношение целевого класса к прочему 1:2 (примерно треть "единичек").
- погонял логрег + тфидф, победили 2, 3 - граммы без чистки и нормализации текста, но F1 всего 0.72 (плохая точность при сносной полноте);
- попробовал USE и простые модели, метрика сильно просела.

Подскажите, какие бы вы дальнейшие эксперименты поставили?
Уйти в фичё инжиниринг? Попробовать другие эмбеддинги для текста? Очень хочется подтянуть F1.

#nlp #programming #russian

0

09.08.2022

1 ответов

52 просмотра

Dani El-Ayyass · Accepted Answer

Dani El-Ayyass

Если очень хочется именно F1, то есть его гладкая аппроксимация, которую можно явно максимизировать в процессе обучения

0

09.08.2022

170 похожих чатов

Коллеги, всем привет о классификации текстов от абзаца до страницы, медиана

1 ответов

Похожие вопросы