в каждой строке 20 float и в конце 0 или 1. Еденичек сильно меньше. На глаз есть некоторые зависимости, но не для всех столбцов. Пробовал леса, линейную регрессию и knn после нормализации. Везде итоговая точность на уровне 55-65%. Есть ли смысл соваться в dl?
Попробуй градиентный бустинг: catboost / lightgbm / xgboost
Точность смотреть неактуально тут. Смотри лучше полный репорт на глаз, будет куда понятнее
если видишь на глаз - попробуй описать "вручную" алгоритмом: если так то так если так то так. Возможно то что ты видишь на глаз - частность (учитывая 700K данных - вряд ли ты видишь правильно всю картинку). Если оно будет хоть как-то работать - значит можно копать дальше.
Обсуждают сегодня