полученного, то достоверна ли модель ?
В общем случае все модели достоверны, но большинство их них бесполезны, при этом андерсэмплинг довольно отстойный метод, попробуйте лучше SMOTE.
Почему если этот метод отстойный он существует (?) Мм..зачем его используют ?
Ну, это моё мнение, основанное на тезисе: выкидывая данные мы теряем информацию. А используют его, потому что он очевидный и лёгкий, я думаю.
Вопрос по SMOTE...можно его использовать для текстовых данных?
Я не знаю, поскольку я работал с текстовыми данными один раз в жизни.
Da конечно, читаю щас про эту статью
https://medium.com/@satishkorapati/dealing-with-imbalanced-dataset-for-multi-class-text-classification-having-multiple-categorical-2a43fc8de009
Обсуждают сегодня