спросить
предсказываю 4 класса по очень коротким текстам
сейчас рок 0.93, а ф1 взвешенная 0.76, начальник недоволен и просит подтянуть метрики))
я точно знаю, что в данных много шума, а именно - плохая разметка. Насколько плохая - сложно оценить, давал человеку, грубо говоря, получилось что вплоть до трети размечено плохо (это грубая оценка).
вопросов два: реально ли в среднем случае, несмотря на грязь данных, дотянуть метрики до отличных? (0.9 например для точности и полноты)
вообще "нормально" ли продолжать работу с данными зная, что в разметке много ошибок, или как ДС, господи простите, я должен стоять на "переразметке"
Я бы вернулся к "чертежной доске" и сделал бы нормальную разметку. Это и есть "подтянуть метрики"
Обсуждают сегодня