меня все категориальные. Признаков 7, при OneHotEncoding'e я получил 48 признаков, записей у меня ~5000 тысяч. Какой алгоритм мне лучше использовать? Подойдёт ли лог рег или XGBoost, может что-то ещё? Ещё стоит ли мне понижать размерность на разбитых фичах? И стоит ли мне удалять признаки, у которых распределение таргета близко к 50 на 50?
А почему потестить не хочешь?
5 тысяч или 5 миллионов?
Обсуждают сегодня