и чёт не сильно хорошо выходит. AUC максимум 0.85 получается. Данные представляют из себя 500 строк. Один столбец лэйблов из нулей и единиц. И ещё примерно 16000 столбцов фич, тоже из нулей и единиц. То есть походу one-hot encode применялся к данным. Я пробовал применять PCA к фичам, Over-Sampling для лэйблов и все возможные классификаторы, но чёт не получается нормально поднять точность. Кто-нибудь может посоветовать что ещё можно сделать?
все возможные классификаторы - может надо еще с гиперпараметрами поиграть?
С чего вы делаете вывод, что auc 0.85 это мало?
Обсуждают сегодня