dataset 130 перемеенных, и весь preprocessing процесс я уже сделал. Вопрос - что делать дальше - какую модель вырать для многофакторной таблицы, или как понять какие переменные мне выкинуть?
А задача какая стоит? классификация, регрессия? Кластеризация? Понижение размерности? Если регрессия — почитай про L2 регуляризация и отбор признаков с помощь lasso регрессии. Текстов в сети с примером кода дофигища. Вообще для начала определись с задачей.
Обсуждают сегодня